chromosome 6, 7 & 8 unmapped contigs b678da02.txt 0002 8 0003 13 0005 8 0006 9 0010 13 0030 3 0045 13 0049 3 Date: Monday, 3/11/2002 Time: 17:33 c0053.txt chrblob_0053|2001.10.15|GENOMIC|Sanger FEATURES Location CDS 1093..1884 /gene="chrblob_0053.glm_1|24oct01" /note="(protein coding) 49% identity to rifin PFB1005w - malaria parasite (Plasmodium falciparum)" /codon_start=1 ORIGIN watson strand 1 GGACATATAT TTTGTATTGT AATAATAAAT ATATTTTTTT AATACTTTGT 51 AATATATTTG TACAAGGGAG AAGTAATAAT ATGAGGGCCA GTAATAACAT 101 AGATAAATTA GAGAGAAACG TAAACGTACA ACAAATATTA GAACAAAAAA 151 AAAAAAAATT ATGAAAATAA CCAAATTTAA TTATTTTTTT TACTATTATT 201 TAAATTTTTT TTTTTATATC ATATATTATG ATATAATATG TTTGTATTTA 251 ATTTTTTTAT ATAATAGTAA TGATACAAGG TTTCTGTTGG GATATTTATT 301 ACCTGCATAT ATGTTATAAT AAGTTCTAAT ATATGTATTT TACATCTTTT 351 ACAAATATTA CTGTACACAT TTTCATATAA TTTAAAAAGT AAATATAAAC 401 ATGTTTTTTA TTGTAACTAC ACATTTACTT GTTATTAACA TGTATAAAAA 451 TAAAAAAATA AAAAGTAAAA AAGAAAAAAA ATTATTATTA CAATTTATGA 501 TATGACATAA GATTATATTT CATTAGAAAT ACAAATTCAA AATTATAAAT 551 AATATTGAAA TGTTTTATTA TATTATTTTT TTTTAAAATT TAATTAATTA 601 ATTATTTATT TTTTTTTTTT TGTGTTTTAA ATAAAAAAGC AAATATGGAT 651 CCAGTAAAAA AATATATATT TACATAAAGG GAAAATAATC GTGTATTATA 701 TTATAAGGCT ATATAAAAAT TTTAGTTTAA GCATAATTAA TTTATTTACA 751 AAATAAAATA AGGTATTATA TTTTAAATTA ATTATATGTA TAATCATAAA 801 ATAATATACG AATAACAATA AAA start chrblob_0053.glm_1|24oct01 vbc stevor note read through taa at 1972 exon 1 824 ATG AAA GTT CAC TGC TAT AAC ATA TTA 851 TTA TTT TCT TTT ACA TTA ATT ATA TTG TTA TTA TCA CCA TCG CAG intron GTATG 901 GATATAATAA CCATTATTAT AACAATATAA TATTTATATA TATAAAATAA 951 TCTACATATA AATATCACAT ATATATATCA CCATTTTTTA TAG exon 2 GTA AAT A 1001 AC CAA ATG AAC CAT TAC AAT ACA GCC AAT ATG AAA AAC ACA GAA CCA ATA 1051 AAA TCA TAT AGA TCA TTA TGC*TAA*TGT GAA CTA TAT ACT TCC ATG TAT GA 1101 T GAT GAC CCA GAA ATG AAA GAA ATA ATG CAC GAT TTT GAT CGA CAA ACA T 1151 CA CAA CGT TTT GAA GAA TAC AAT GAA CGT ATG AAC AAA AAC AGA CAA AAA 1201 TGT AGA GAA CAA TGT GAT AAA GAT ATA CAA GAA ATT ATT GCA AAA GAT AA 1251 A ATC CAA AAA TCA TTA GCA GTA AAA GTG GAA AAA GGT TGT CTT AGG TGT G 1301 GG TGT GGG TTA GGA GGT GTT GCA GCA GGT GTT GGA ATA TTC GGT GCA TTG 1351 GGT ACT TAT GGT TGG AAA ATC GCT GCG ACA GCT ATG GCT TAT GAA ACT GC 1401 T AAG CAA GCT GTT ATT CAA GCA GGT ATA GAT GCA GCC ATT GCA CAA ATA A 1451 AA ATA AAA CAT ATT TTT AAA GCT TTA TCT AAT ATA ACA TTG TCA AAT TTC 1501 ATT AAT GAA TCA AAT TAT AAT ACT ATC GAT GGT CTT TTT AAT GCT ATT AT 1551 G AAT GCT ATC CAT TCA ACT AAA AAC ACA TGT CCA AAT TAC AAT GGC CCT A 1601 TG TAT CGA GTG TGT AAT GGT ATA GTA ACT GCT AGG AAT ACG TGG CTT GAT 1651 GAC ATT GTA GAA GCC GGT ACA AAA GCT TCT GTT GAG AAA ATC ACA GCT GT 1701 T GAA GCT GAT GAA CTT GTT AAG GTA ACA GCT ACA GTT TCC AAT GCG TAC A 1751 GC GCA ATT GGT TAC TCT GTA ACT GTC ATA TTG ATT ATA GTT TTG GTT ATG 1801 ATA ATA ATT TAT TTA ATT TTA CTT TAT GGA CGA AAA AAA AAA ATG AAT AA 1851 A AAA CTA CAA TAC ACA AAA TTA TTA AAT CAA TAA* 1884 stop chrblob_0053.glm_1|24oct01 ATATAT GGTTTCATGA 1901 TATTAAATTC AATTTAATGT TTTTTGAATT TAAGATTTTA AAAAAAAGGA 1951 TATTATGATA ATTATATTTT GATAACATTA TATTTTTTTT TGCTATAATT 2001 TTTGTTTTTG TTTATTGTTA TGTCGTTACT AAATTATTTA ATTAATAATT 2051 ATTTATTATT TTTTAGTGAA ACGAGTGTAA TTTATATATA CTTTTTTAAT 2101 TAAAATTATA TATATATATA TATATATATA TATATATATA TACATATTTA 2151 TTTATTTATA ATACATTCTT TAAGAACACC TTGTAACATA TATATTAAAA 2201 AATTTTATAT AAAATAATAT GTAATGGAAT ATATTATAGA ATAAATATAT 2251 TATATTATTA ATCCTATGTT GATATATTAT TTAAAATTTA ATTATATTTA 2301 TATAAATTAA TATAAATAAA TATAATTGTA ATTAATAACA TTTAACTTTA 2351 TCATTTTATC TTTATAATAT ATATAATAAA TATTTATTAT TACCTTACAT 2401 TACAATATCA TGTGTAATAT AAAATGTTAA GTTAATTATT TTTTATCTTC 2451 TTTCTTTTTA TAATTTCCCT TTTAATAAAA TAGAATATGT GTATTATTAC 2501 AGAACAAATA TAAATATATA TATATATAAT TTGTATAATA TACCAACTAC 2551 AAAATTATTT TCGACACGAC ATATCGATAT ATCGAATTAT CAACACATGA 2601 CAATATAATA AAAATGAATT AACCTAATTG TACAATAAAT ATTATTATAA 2651 AATAGTAACA ATATATTATA TATTATAATT ATAATTCTAT TATAATAATA 2701 ATATTCATAT GATATACTTT ATATTATACT ATTTTAATGC ATATAATTAA 2751 TATAATATGA AATGTAAAAC AATATATGAA TATTAATAAT TTATGAACTA 2801 TTAAAAATAA ACATATATAT AGTTTATGTA TTCTATTTAT ATATGTTTAT 2851 AAAACGTTTA TTATTATTAT TCTCTTTATT ATAAAATTGT AGTAATTATT 2901 ATAAGATTAT TTTTAAAAAG TATATCATTA AGATGACTAT GATTATAATA 2951 TAATAATACT ATTAATTTGT TATGTATTGT ACAAATGATA TATGATATTT 3001 CGTATATATA GATATGAT // crick strand 3018 ATCATATC TATATATACG 3000 AAATATCATA TATCATTTGT ACAATACATA ACAAATTAAT AGTATTATTA 2950 TATTATAATC ATAGTCATCT TAATGATATA CTTTTTAAAA ATAATCTTAT 2900 AATAATTACT ACAATTTTAT AATAAAGAGA ATAATAATAA TAAACGTTTT 2850 ATAAACATAT ATAAATAGAA TACATAAACT ATATATATGT TTATTTTTAA 2800 TAGTTCATAA ATTATTAATA TTCATATATT GTTTTACATT TCATATTATA 2750 TTAATTATAT GCATTAAAAT AGTATAATAT AAAGTATATC ATATGAATAT 2700 TATTATTATA ATAGAATTAT AATTATAATA TATAATATAT TGTTACTATT 2650 TTATAATAAT ATTTATTGTA CAATTAGGTT AATTCATTTT TATTATATTG 2600 TCATGTGTTG ATAATTCGAT ATATCGATAT GTCGTGTCGA AAATAATTTT 2550 GTAGTTGGTA TATTATACAA ATTATATATA TATATATTTA TATTTGTTCT 2500 GTAATAATAC ACATATTCTA TTTTATTAAA AGGGAAATTA TAAAAAGAAA 2450 GAAGATAAAA AATAATTAAC TTAACATTTT ATATTACACA TGATATTGTA 2400 ATGTAAGGTA ATAATAAATA TTTATTATAT ATATTATAAA GATAAAATGA 2350 TAAAGTTAAA TGTTATTAAT TACAATTATA TTTATTTATA TTAATTTATA 2300 TAAATATAAT TAAATTTTAA ATAATATATC AACATAGGAT TAATAATATA 2250 ATATATTTAT TCTATAATAT ATTCCATTAC ATATTATTTT ATATAAAATT 2200 TTTTAATATA TATGTTACAA GGTGTTCTTA AAGAATGTAT TATAAATAAA 2150 TAAATATGTA TATATATATA TATATATATA TATATATATA TATAATTTTA 2100 ATTAAAAAAG TATATATAAA TTACACTCGT TTCACTAAAA AATAATAAAT 2050 AATTATTAAT TAAATAATTT AGTAACGACA TAACAATAAA CAAAAACAAA 2000 AATTATAGCA AAAAAAAATA TAATGTTATC AAAATATAAT TATCATAATA 1950 TCCTTTTTTT TAAAATCTTA AATTCAAAAA ACATTAAATT GAATTTAATA 1900 TCATGAAACC ATATAT "chrblob_0053.glm_1|24oct01" 1884 TTAT TGATTTAATA ATTTTGTGTA TTGTAGTTTT 1850 TTATTCATTT TTTTTTTTCG TCCATAAAGT AAAATTAAAT AAATTATTAT 1800 CATAACCAAA ACTATAATCA ATATGACAGT TACAGAGTAA CCAATTGCGC 1750 TGTACGCATT GGAAACTGTA GCTGTTACCT TAACAAGTTC ATCAGCTTCA 1700 ACAGCTGTGA TTTTCTCAAC AGAAGCTTTT GTACCGGCTT CTACAATGTC 1650 ATCAAGCCAC GTATTCCTAG CAGTTACTAT ACCATTACAC ACTCGATACA 1600 TAGGGCCATT GTAATTTGGA CATGTGTTTT TAGTTGAATG GATAGCATTC 1550 ATAATAGCAT TAAAAAGACC ATCGATAGTA TTATAATTTG ATTCATTAAT 1500 GAAATTTGAC AATGTTATAT TAGATAAAGC TTTAAAAATA TGTTTTATTT 1450 TTATTTGTGC AATGGCTGCA TCTATACCTG CTTGAATAAC AGCTTGCTTA 1400 GCAGTTTCAT AAGCCATAGC TGTCGCAGCG ATTTTCCAAC CATAAGTACC 1350 CAATGCACCG AATATTCCAA CACCTGCTGC AACACCTCCT AACCCACACC 1300 CACACCTAAG ACAACCTTTT TCCACTTTTA CTGCTAATGA TTTTTGGATT 1250 TTATCTTTTG CAATAATTTC TTGTATATCT TTATCACATT GTTCTCTACA 1200 TTTTTGTCTG TTTTTGTTCA TACGTTCATT GTATTCTTCA AAACGTTGTG 1150 ATGTTTGTCG ATCAAAATCG TGCATTATTT CTTTCATTTC TGGGTCATCA 1100 TCATACATGG AAGTATATAG TTCACATTAG CATAATGATC TATATGATTT 1050 TATTGGTTCT GTGTTTTTCA TATTGGCTGT ATTGTAATGG TTCATTTGGT 1000 TATTTACCTA TAAAAAATGG TGATATATAT ATGTGATATT TATATGTAGA 950 TTATTTTATA TATATAAATA TTATATTGTT ATAATAATGG TTATTATATC 900 CATACCTGCG ATGGTGATAA TAACAATATA ATTAATGTAA AAGAAAATAA 850 TAATATGTTA TAGCAGTGAA CTTTCAT 824 "chrblob_0053.glm_1|24oct01" TTT TATTGTTATT CGTATATTAT 800 TTTATGATTA TACATATAAT TAATTTAAAA TATAATACCT TATTTTATTT 750 TGTAAATAAA TTAATTATGC TTAAACTAAA ATTTTTATAT AGCCTTATAA 700 TATAATACAC GATTATTTTC CCTTTATGTA AATATATATT TTTTTACTGG 650 ATCCATATTT GCTTTTTTAT TTAAAACACA AAAAAAAAAA AATAAATAAT 600 TAATTAATTA AATTTTAAAA AAAAATAATA TAATAAAACA TTTCAATATT 550 ATTTATAATT TTGAATTTGT ATTTCTAATG AAATATAATC TTATGTCATA 500 TCATAAATTG TAATAATAAT TTTTTTTCTT TTTTACTTTT TATTTTTTTA 450 TTTTTATACA TGTTAATAAC AAGTAAATGT GTAGTTACAA TAAAAAACAT 400 GTTTATATTT ACTTTTTAAA TTATATGAAA ATGTGTACAG TAATATTTGT 350 AAAAGATGTA AAATACATAT ATTAGAACTT ATTATAACAT ATATGCAGGT 300 AATAAATATC CCAACAGAAA CCTTGTATCA TTACTATTAT ATAAAAAAAT 250 TAAATACAAA CATATTATAT CATAATATAT GATATAAAAA AAAAAATTTA 200 AATAATAGTA AAAAAAATAA TTAAATTTGG TTATTTTCAT AATTTTTTTT 150 TTTTTTGTTC TAATATTTGT TGTACGTTTA CGTTTCTCTC TAATTTATCT 100 ATGTTATTAC TGGCCCTCAT ATTATTACTT CTCCCTTGTA CAAATATATT 50 ACAAAGTATT AAAAAAATAT ATTTATTATT ACAATACAAA ATATATGTCC end of file 0076 3 0077 9 2627 12 2654 13 not rama ag512 see 4173 2714 13 2818 10 2831 13 2858 9 Date: Tuesday, 3/5/2002 Time: 18:30 c2889.txt chrblob_2889|2001.10.15|GENOMIC|Sanger FEATURES Location CDS complement(226..1386) /gene="chrblob_2889.glm_1|24oct01" /note="(protein coding) 39% identity to (AF206252) seroreactive antigen BMN1-9B [Babesia microti]" /codon_start=1 ORIGIN watson strand "chrblob_2889.glm_1|24oct01" 1 TTATGAGCAA CTTCATCGAC ATTTGCATGT ATATGAGCAT CACGATGATG 51 TAATAAATTT TGATCATTAT TAATTTCATC ATTGTTCATG TCTATATTAG 101 CACCTGATAC GAAATTCATT TGTGGGATGA GTTGCTGATT ATTTCGATTT 151 TCCATCAAAT TATAACAATT TCTAATACCA AAAATTCGAT ACTCATTTTG 201 GTAATTTAAT AAAGACATTA GATTGTCAAC TCTCATATGG AGAATACGAG 251 TTTTGCAATG AATTGGATGC GTTTGTAATA TCTAGAAATT GATTTCTTTC 301 AAAATTATTT CTATTATTAG TTTCATCCGT GTTATTTGTT GTATTTACTG 351 GTGGTGCAGA ATTTACGGTA CTTTTATCAT TTGTAGGTGC TTCAGAAGAA 401 TCAAGAACTT CTTTATTTTC AATAATATCA ATAATTCCAC TTTTAAATGG 451 AATTTCTTCA TCCATTTTAA AATGAACTAC ACTTCTACCT ACCTGTAAAG 501 ACATAGTATC TTTAGGAAAT ATTTCTCTTG CTTTTCTTAG GGCTACTAAG 551 GTACCAAATT TGGAATTATG ATCTTCTAAT TTAAATAAAC CTTTTTCATA 601 TTTTATTGTT GCATGGTATC TGGAAATAGA AACATCCGGG ATACGAACAT 651 CTGATTCGTG TCCTCTTCCT AATTTTAAAT ATTTTTTATC GGCAAAACTT 701 ATTAAATGTA CTCCTTTACT AGTTTGCCCA ATAATATTAT CTAAGACAAT 751 TAATGGTGTT TTCAAATTAG GTATCTTTAC TAATTGTACT AGTTCCTCAT 801 TTTGTTTAAT ACTTTTTGGA TATTTAGATT TACATAACTC ACAACAAATA 851 TCCTTAATAA AAACTGAACC AGAAAATAAT TGATCATTTA AATTTAATCT 901 ACCATTAATC CATTTTCTTA AACACATTAA ATGTGCATAC TTAATGGAAC 951 CTTTACAATC ACATGGACAA ATTAAGGGAT CATTTTCTTG ATTCCCTTCA 1001 ATTAAACAAA TTCGACATTG AATATTAGAA GAATCTAAAA TAGTTTCACA 1051 TTTTTTTGAA GGGCAGTCAT CTAATTTCAA CGTATTTAAT GTGTCTACTG 1101 ATTCAATAAA TTGTCTTACC TTTAATCGAA AACGTCCTAA TTTTATAATA 1151 TCATTTTCAT GTAAAGCGTA ATATTTTTCA GGAAGATCTT TCACAATTAT 1201 CCACAATTTT TTTATATTGT ATTGGTTGCT TAATGAATGT TCAGCTGGCG 1251 TTATAACATA TTTATCTATA ACATGGTGAA ACAAAATAAA TAAAAATAAA 1301 ATACGTAAAT ATGTATAATA TATATATAAA ACATAGCACA TATTATGAAT 1351 ACTACATATA TGAATATCAT ATATTATGAA TACCATATAT TATGAATACG 1401 ACATATTATG AATACGACAT ATTATGAATA CCACACATTA TGCATACAAA 1451 TATATAATGA TATCTTTTCA GCTTTTACCT TCTTGAGGTC TAACAGATAA 1501 AAGATAATCC TGAGTTGTAT TAGGCAAACA TTCTGGAGAG TCAGCTACAC 1551 AAGATACTTG AGCTTTTGAA CGAAAAAGTT TTATTGCTGT AGATATTAAA 1601 AAACTTTTTT TATTTACTTG TTGTGCTTCA TAATCAAATA GATCATGACT 1651 ATCACGAGTC CATGTTTTTG TTTCTACTCT TAACCTAATA AAAAGAAAAA 1701 AATAAATAAA ATGAAATAAG AAAAAAAATA TAATATATTT ATATTATGTA 1751 CACTCATTAT TAATAAGAAA TATTCTTATC ATATCTATAA GGAATATAAT 1801 TTTTCTAGAC CTTAATTAAC AATCTCAT 1828 "chrblob_2889.glm_1|24oct01" AT TTCAAAAATA AATAAATAAA 1851 TAAATATAGT TTCCAATATA TATATATATA TATATATATA TATATATATA 1901 TATATATTAT ATTATATATT CATGCACATA TTCTTATATC AATTAATTTT 1951 TATATTACAT TTTCTCGTAT TTCCTGATAA ATAATTTTGT TATATTTACA 2001 AAATTCCAAA AAAAAAAAAA AAAAAAAAAA AAAAAAA // crick strand 2037 TTTTTTT TTTTTTTTTT TTTTTTTTTT TTTGGAATTT 2000 TGTAAATATA ACAAAATTAT TTATCAGGAA ATACGAGAAA ATGTAATATA 1950 AAAATTAATT GATATAAGAA TATGTGCATG AATATATAAT ATAATATATA 1900 TATATATATA TATATATATA TATATATATA TATATTGGAA ACTATATTTA 1850 TTTATTTATT TATTTTTGAA AT start chrblob_2889.glm_1|24oct01 vbc note partial gene exon 1 1828 ATG AGA TT intron GTTAATTAAG GTCTAGAAAA 1800 ATTATATTCC TTATAGATAT GATAAGAATA TTTCTTATTA ATAATGAGTG 1750 TACATAATAT AAATATATTA TATTTTTTTT CTTATTTCAT TTTATTTATT 1700 TTTTTCTTTT TATTAG exon 2 G TTA AGA GTA GAA ACA AAA ACA TGG ACT CGT GAT 1650 AGT CAT GAT CTA TTT GAT TAT GAA GCA CAA CAA GTA AAT AAA AAA AGT TT 1600 T TTA ATA TCT ACA GCA ATA AAA CTT TTT CGT TCA AAA GCT CAA GTA TCT T 1550 GT GTA GCT GAC TCT CCA GAA TGT TTG CCT AAT ACA ACT CAG GAT TAT CTT 1500 TTA TCT GTT AGA CCT CAA GAA G intron GTAAAAGC TGAAAAGATA TCATTATATA 1450 TTTGTATGCA TAATGTGTGG TATTCATAAT ATGTCGTATT CATAATATGT 1400 CGTATTCATA ATATATGGTA TTCATAATAT ATGATATTCA TATATGTAGT 1350 ATTCATAATA TGTGCTATGT TTTATATATA TATTATACAT ATTTACGTAT 1300 TTTATTTTTA TTTATTTTGT TTCACCATGT TATAG exon 3 AT AAA TAT GTT ATA A 1250 CG CCA GCT GAA CAT TCA TTA AGC AAC CAA TAC AAT ATA AAA AAA TTG TGG 1200 ATA ATT GTG AAA GAT CTT CCT GAA AAA TAT TAC GCT TTA CAT GAA AAT GA 1150 T ATT ATA AAA TTA GGA CGT TTT CGA TTA AAG GTA AGA CAA TTT ATT GAA T 1100 CA GTA GAC ACA TTA AAT ACG TTG AAA TTA GAT GAC TGC CCT TCA AAA AAA 1050 TGT GAA ACT ATT TTA GAT TCT TCT AAT ATT CAA TGT CGA ATT TGT TTA AT 1000 T GAA GGG AAT CAA GAA AAT GAT CCC TTA ATT TGT CCA TGT GAT TGT AAA G 950 GT TCC ATT AAG TAT GCA CAT TTA ATG TGT TTA AGA AAA TGG ATT AAT GGT 900 AGA TTA AAT TTA AAT GAT CAA TTA TTT TCT GGT TCA GTT TTT ATT AAG GA 850 T ATT TGT TGT GAG TTA TGT AAA TCT AAA TAT CCA AAA AGT ATT AAA CAA A 800 AT GAG GAA CTA GTA CAA TTA GTA AAG ATA CCT AAT TTG AAA ACA CCA TTA 750 ATT GTC TTA GAT AAT ATT ATT GGG CAA ACT AGT AAA GGA GTA CAT TTA AT 700 A AGT TTT GCC GAT AAA AAA TAT TTA AAA TTA GGA AGA GGA CAC GAA TCA G 650 AT GTT CGT ATC CCG GAT GTT TCT ATT TCC AGA TAC CAT GCA ACA ATA AAA 600 TAT GAA AAA GGT TTA TTT AAA TTA GAA GAT CAT AAT TCC AAA TTT GGT AC 550 C TTA GTA GCC CTA AGA AAA GCA AGA GAA ATA TTT CCT AAA GAT ACT ATG T 500 CT TTA CAG GTA GGT AGA AGT GTA GTT CAT TTT AAA ATG GAT GAA GAA ATT 450 CCA TTT AAA AGT GGA ATT ATT GAT ATT ATT GAA AAT AAA GAA GTT CTT GA 400 T TCT TCT GAA GCA CCT ACA AAT GAT AAA AGT ACC GTA AAT TCT GCA CCA C 350 CA GTA AAT ACA ACA AAT AAC ACG GAT GAA ACT AAT AAT AGA AAT AAT TTT 300 GAA AGA AAT CAA TTT CTA GAT ATT ACA AAC GCA TCC AAT TCA TTG CAA AA 250 C TC intron GTATTCT CCATATGAGA GTTGACAATC TAATGTCTTT ATTAAATTAC 200 CAAAATGAGT ATCGAATTTT TGGTATTAG exon 4 A AAT TGT TAT AAT TTG ATG GA 150 A AAT CGA AAT AAT CAG CAA CTC ATC CCA CAA ATG AAT TTC GTA TCA GGT G 100 CT AAT ATA GAC ATG AAC AAT GAT GAA ATT AAT AAT GAT CAA AAT TTA TTA 50 CAT CAT CGT GAT GCT CAT ATA CAT GCA AAT GTC GAT GAA GTT GCT CAT [AA...] (stop) chrblob_2889.glm_1|24oct01 end of file 2918 11 2927 3 2928 14 2939 9 2963 13 2968 13 2971 10 3029 12 3032 13 3045 10 3056 11 3059 12 3075 13 3116 10 3119 2 3126 12 3128 10 3133 2 3135 14 3137 4 3140 3 3146 3 3149 10 3158 9 3167 14 3174 9 3177 10 3180 3 3196 10 3202 2 3218 14 3227 10 3228 3 3231 10 3233 6 3234 9 3236 13 3246 9 3256 10 3260 11 3278 13 3280 10 3285 3 3288 4 3289 12 3300 9 3301 3 3303 14 3304 8 3306 13 3311 14 3315 3 3326 3 3330 10 3335 11 3336 10 3338 13 3341 11 3350 14 3355 8 3361 12 3363 14 3367 9 3372 11 3376 12 3378 13 3390 9 3400 3 3401 10 3402 9 3415 3 3418 9 3423 11 3424 4 Date: Thursday, 3/7/2002 Time: 01:59 c3428.txt chrblob_3428|2001.10.15|GENOMIC|Sanger FEATURES Location CDS 81..2134 /gene="chrblob_3428.gen_1|24oct01" /note="(protein coding) 36% identity to (AL136819) hypothetical protein [Homo sapiens]" /codon_start=1 ORIGIN watson strand start chrblob_3428.gen_1|24oct01 vbc note partial gene (exon 1) 1 [...AA] TTA GTT AGT TAT GTT ATA TCG GGT CAT AAT GCA TCA GTA TTT GCA TAT 51 GGT GCA TCA GGT GCG GGT AAA ACT CAT ACA ATG GTT GGT GGT ATT AAT AC 101 T GGT CCT GGT ATT ATG GTA TTA ACA ATG AAA GAA TTA TTC TCA TTG ATT G 151 AA AAA GAT AGA TCC AAT CAA TAC ATT GTT TCA ATG TCA TAT TTA GAA GTC 201 TAT AAC GAA ACC ATT AGA GAT TTA TTA ATT ACC AAT ACT GGT GGT GGT GG 251 T AAT AGT AAT AAT AAA GTT TTA GAA TTA TGT GAG GAT GAA AAT AAA CAA A 301 TT GTA ATT CGT GAT TTA TCA TGG GAA TAT CCG ACT TCA GCA GAC CAA GTT 351 TTT AAA TTA TTA AAA TAT GGA AAT TTA AAT AGA AAA CAA TCA CCA ACT CA 401 A ACC AAT CAA ACA TCA TCA AGA TCT CAT GCA GTT TTA CAA ATC ACT GTG A 451 AA CAA CAA AAC TTA CAA GAT AAA AGT AAA ATT TCG TTT GGT AAA CTT TCA 501 TTA ATT GAT TTG GCA GGT TCA GAA CGT GCT TCT AAA ACT TTA AAT ACC GG 551 T GAC AGA TTA AAA GAA GGT ACA AGT ATA AAT AAA TCT TTA TTA GCA TTA G 601 GA AAT TGT ATT AAA GCA TTA GGT GAA TTA TGT AAG AAT CAA CAG TCA CAA 651 CAG CAA TCC AGC AAT CCA AAT TTC ATA CCA TAT CGT GAT TCA AAA TTA AC 701 T AGA ATT TTA AAA GAT TCT TTG ACT GGT AGT TGT AAA ACT ATA ATG ATT G 751 CA AAT ATT AGT CCA AAT TCT TCA TCA TTC GAA GAG ACT CAC AAT ACA TTA 801 AAA TAT GCT CAA CGT GCT AAA TCA ATT AAA ACT CAA ATC ACT AAA AAT GT 851 A TTT GCA AGT TCA ACC AAT TTA ATA ACG CAA TAT AAT GAA ATC ATT AAA G 901 AA CAA AGA GAA GAA ATT AAA CAA TTA AAA TTA AAA TTA ATA CAA GCA ACT 951 TCA AAT AAT AAC AAT AGT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAC TA 1001 T TTT AGT AAC AGT TTT GGA AGT TGT GGT AAC AAA AAT CAA CCA ATT AAA C 1051 AA CCA ACA CCT CCA ACA TCA TTA TTT CAT CAA CAA AAT CAA AAA TAT TAT 1101 CGT AAT GAT GAT GAT GAT GAT GAT GAC AAT GAT CAA GAA GAA AAT AAT GA 1151 T GAA GTT TTA ATA AAT GAA GAT GAC GAA GAA GTA GAT GGA GAA GAT TCT A 1201 AT AAT AGG GAT AAT GAT GAA TCA ATG ATA CAA CAA TTA GAA GAA ATG AGT 1251 TTA TTA ATT AAT TCA AAC TTA CAA GAT ACT TTA ACA TTA AAG AAA ACT CA 1301 A AGT ATT CAA AGA CAA AGA AAA AGG GAA TTA GAA AAT GAA TTA AAA TCT T 1351 TA GAA AAA CAA CAA CAA TCA ATC TTA AAT GAA AAT AAT AAT GTA GAT ATA 1401 ATT AAA AGA ACA AAT GAA ATT GGT AGT CAA ATT TTA AAG ATT AAA ACA TT 1451 G GAA TCA AGT ATA AAT GAA AAA TTG GAA ATG AAT AAT CAA TGG AGA AGA A 1501 AA CTT CAA TCA GAG TTA ACA TTG AAA TTT GTA AAT TCT CCA AAG AAT TTA 1551 AAG ATA CTA ATT CAA CAA GCA AGA GCA GCA ACT TTA GAA TTG GAT AGA TT 1601 C GAT CTC ACC GAG AGA ATG ATT GAT GAT AGA TCA AAA TTA AAT TTA AAA A 1651 CA AAT GAA TGT AAA TCT TTA AAG GAC TCA CTC TCT TGG ATG TTT GGT ATT 1701 TTA TCA GAT GGT TTC AAA CTT TTA ACT GAA AAT AAT TTA GCA ACT GAT GA 1751 C TTT TTA AAA GAT TTT TTG AAA AGT GGT GAT TTA ATT AAT AAT TTG GAT A 1801 AT AGT TTT ATA ATA AAT GAA AAT AAT GAT TCA AAT AAT AAT AAC ATT ATT 1851 GAA AAT GAT GAT ATA GAT TTA TCA TTT AAT AAT GAT ATA AAT AAT AAT AA 1901 T AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT A 1951 AT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT 2001 AAT AAT AAT AAT AAT AAT AAT AAT AAT GTA CCT TTA AAT TGT AAT AAT AG 2051 T AAC AGT AAT ATT AAT AAT AAA AAT CAA AAC ATC ATA AAC CCA TCA CCA T 2101 TA AAA CCA AGA AGA ATT ATG AGT GGC AGC AAT [AA...] 2134 (stop) chrblob_3428.gen_1|24oct01 // crick strand 2134 TTAT TGCTGCCACT CATAATTCTT CTTGGTTTTA 2100 ATGGTGATGG GTTTATGATG TTTTGATTTT TATTATTAAT ATTACTGTTA 2050 CTATTATTAC AATTTAAAGG TACATTATTA TTATTATTAT TATTATTATT 2000 ATTATTATTA TTATTATTAT TATTATTATT ATTATTATTA TTATTATTAT 1950 TATTATTATT ATTATTATTA TTATTATTAT TATTATTATT ATTATTATTA 1900 TTATTATTAT TTATATCATT ATTAAATGAT AAATCTATAT CATCATTTTC 1850 AATAATGTTA TTATTATTTG AATCATTATT TTCATTTATT ATAAAACTAT 1800 TATCCAAATT ATTAATTAAA TCACCACTTT TCAAAAAATC TTTTAAAAAG 1750 TCATCAGTTG CTAAATTATT TTCAGTTAAA AGTTTGAAAC CATCTGATAA 1700 AATACCAAAC ATCCAAGAGA GTGAGTCCTT TAAAGATTTA CATTCATTTG 1650 TTTTTAAATT TAATTTTGAT CTATCATCAA TCATTCTCTC GGTGAGATCG 1600 AATCTATCCA ATTCTAAAGT TGCTGCTCTT GCTTGTTGAA TTAGTATCTT 1550 TAAATTCTTT GGAGAATTTA CAAATTTCAA TGTTAACTCT GATTGAAGTT 1500 TTCTTCTCCA TTGATTATTC ATTTCCAATT TTTCATTTAT ACTTGATTCC 1450 AATGTTTTAA TCTTTAAAAT TTGACTACCA ATTTCATTTG TTCTTTTAAT 1400 TATATCTACA TTATTATTTT CATTTAAGAT TGATTGTTGT TGTTTTTCTA 1350 AAGATTTTAA TTCATTTTCT AATTCCCTTT TTCTTTGTCT TTGAATACTT 1300 TGAGTTTTCT TTAATGTTAA AGTATCTTGT AAGTTTGAAT TAATTAATAA 1250 ACTCATTTCT TCTAATTGTT GTATCATTGA TTCATCATTA TCCCTATTAT 1200 TAGAATCTTC TCCATCTACT TCTTCGTCAT CTTCATTTAT TAAAACTTCA 1150 TCATTATTTT CTTCTTGATC ATTGTCATCA TCATCATCAT CATCATTACG 1100 ATAATATTTT TGATTTTGTT GATGAAATAA TGATGTTGGA GGTGTTGGTT 1050 GTTTAATTGG TTGATTTTTG TTACCACAAC TTCCAAAACT GTTACTAAAA 1000 TAGTTATTAT TATTATTATT ATTATTATTA TTACTATTGT TATTATTTGA 950 AGTTGCTTGT ATTAATTTTA ATTTTAATTG TTTAATTTCT TCTCTTTGTT 900 CTTTAATGAT TTCATTATAT TGCGTTATTA AATTGGTTGA ACTTGCAAAT 850 ACATTTTTAG TGATTTGAGT TTTAATTGAT TTAGCACGTT GAGCATATTT 800 TAATGTATTG TGAGTCTCTT CGAATGATGA AGAATTTGGA CTAATATTTG 750 CAATCATTAT AGTTTTACAA CTACCAGTCA AAGAATCTTT TAAAATTCTA 700 GTTAATTTTG AATCACGATA TGGTATGAAA TTTGGATTGC TGGATTGCTG 650 TTGTGACTGT TGATTCTTAC ATAATTCACC TAATGCTTTA ATACAATTTC 600 CTAATGCTAA TAAAGATTTA TTTATACTTG TACCTTCTTT TAATCTGTCA 550 CCGGTATTTA AAGTTTTAGA AGCACGTTCT GAACCTGCCA AATCAATTAA 500 TGAAAGTTTA CCAAACGAAA TTTTACTTTT ATCTTGTAAG TTTTGTTGTT 450 TCACAGTGAT TTGTAAAACT GCATGAGATC TTGATGATGT TTGATTGGTT 400 TGAGTTGGTG ATTGTTTTCT ATTTAAATTT CCATATTTTA ATAATTTAAA 350 AACTTGGTCT GCTGAAGTCG GATATTCCCA TGATAAATCA CGAATTACAA 300 TTTGTTTATT TTCATCCTCA CATAATTCTA AAACTTTATT ATTACTATTA 250 CCACCACCAC CAGTATTGGT AATTAATAAA TCTCTAATGG TTTCGTTATA 200 GACTTCTAAA TATGACATTG AAACAATGTA TTGATTGGAT CTATCTTTTT 150 CAATCAATGA GAATAATTCT TTCATTGTTA ATACCATAAT ACCAGGACCA 100 GTATTAATAC CACCAACCAT 81 "chrblob_3428.gen_1|24oct01" TGTATGAGTT TTACCCGCAC CTGATGCACC 50 ATATGCAAAT ACTGATGCAT TATGACCCGA TATAACATAA CTAACTAATT end of file 3430 10 3433 10 pf10:987119w has 9 less repeats ? misassembly 3434 12 3440 3 3442 9 3446 6 + 14 chimera 3447 9 3448 12 3454 9 3456 13 3457 9 3466 12 3470 14 3474 14 3480 11 blob has sequence error 3481 11 3482 3 sequence errors 3484 9 3488 10 3491 14 3492 10 stevor 3496 12 3497 9 3501 9 3503 4 3504 13 Date: Wednesday, 3/6/2002 Time: 23:12 c3506.txt chrblob_3506|2001.10.15|GENOMIC|Sanger FEATURES Location CDS join(738..800,902..1741) /gene="chrblob_3506.glm_1|24oct01" /note="(protein coding) 72% identity to (AL034560) PFC0025c (MAL3P8.4), stevor (3D7-stevorT3-1), len: 296 aa; Similarity to other P.falciparum stevors. Member of a multi-gene family; predicted using hexExon [Plasmodium falciparum]" /codon_start=1 ORIGIN watson strand 1 CATGGTAAGA TCCTATTAAT TATACATATA TATTTATATG TTATTATTTA 51 TAAATGATTA TTGCATAATT AAGTAGGATA AAATAAGAGA TACAAGGGAG 101 AGTATTTTAT AATATAGGAT AATGCTTAAC AACAAAACTG AAACAAACAA 151 AAAAACAAAA ATATATTTAT TAAAATACAT ATAAAACTAT TTTATTATAT 201 TATTTTTAAT ATAAATATTA TTTTTTATTA ATTACAAGAA AAATTGTTGT 251 TAGTTTCACA ATAGTAATTA TATTAGAATA TATTTTAGGA TATTTATTAG 301 ATAAAAATCA TGAGAGCTAT TATTATATAT ATATGGCTCA CACCCATAAC 351 AATTATTGCT ATACACATTT ATATATGTAT TTGAAGGAAA ATATATTGTT 401 ATTTATTAAA AATTTATAAT ATATATATAT GAGAGAATTA TTATAAGAAA 451 AATTAAAAAA AAAAAAAATA AAATAAAAAT AATATAATAT AATATAAAAA 501 AAAAACAATT ATATATATTT AAATTTTTTT TTTTTAATAT TAAATGAATA 551 TAGTCATAAA TTAAATTATA AGTATGATGA AACTATAAGG TTATTATATT 601 ATAAAATTAC AACAAAATTT CCGCTTATCA ATATATTATA TAAAATATAT 651 ATTAGCAAAA CAAAATAGAT AATTTTTTAT GAAATAGACT AATACAATTT 701 GAAATATAAC ATATTGTTTT TTGAATTAAA A start chrblob_3506.glm_1|24oct01 vbc stevor note codon s t a r t = 7 exon 1 732 ATA AAG ATG TAT TAC CTT A 751 AA ATG TTA TTG TTT ACC TTT TTA ATA AAT ACA TTA GTA TTA CAA CAT TAT intron 801 GTATGTAAAA AATATACATT ATTATTACTA TGACATAAAC ATATAATAAA 851 ACAATTATTA CATTTTCAGT ACATATTCAT TAATTCTTTT TTTTTTTTTA 901 G exon 2 902 GAG AAT TAT CTA AAT AAC CAT TAT AAT GTA AGT CTC ATT CAA AAT AAC A 951 CC AAA AGA ACA ACG ATA CAT TCA AGA TTA TTA GCA CAA ACG AAA AAC CAT 1001 AAT CCA CAT TAT CAT AAT GAT CCA GAA CTC AAA GAA ATA ATT GAT AAA AT 1051 G AAC GAG GAA GCA ATC AAA AAA TAT CAA CAA ACT CAT GAT CCA TAT AAA C 1101 AA TTG AAA GAT GTA GTA GAA AAA AAT GGA ACA AAA TAT ACA GGT GGT AAT 1151 GAT GTA GAA CCT ATG TCA ACT CTA GAA AAA GAA TTA TTG GAA ACA TAT GA 1201 A GAA ACG TTT GGT AAC AAA AGT GAT ATG TTG AAG TTG GGT AAG TAC AAA A 1251 AT GAT GAT GAC AAA TCA GAT GAT TCA TCT TCA TGT GGA TGT ACT AAT ATT 1301 AAT AAT ATG AAA CTA GCA AAA ACC AAA GGA AGA GAT AAG TAT TTA AAA CA 1351 C TTA AAA GGG AGA TGT ACC CGT GGT ATA TAT ATT TCT TCA CTT ACT ACT G 1401 TA ATA TTA ACA ACG ATC GCT TTG CAT ACT GCA AAA GCT GCT GCC CTT GCT 1451 AAG TTT GTT GAA TCT GCT AAA ACG TGT GCG TCT TAT ATG ACA ATA TTT AA 1501 C ATG TTG AAT GCT GGT AAC TTA AAT ACA GCT ATT CAA GCA GGT GGT GGA A 1551 TA TGT ACT TCT GCT TAT TCC GAT ATA GTT TTG CCT GCT GCA AAT GCT GCT 1601 TTG AGC GCA ATA TAC CCC TGT GGT ATT GCA GCT TTG GTT CTA CTT ATA TT 1651 A ACT GTT GTA CTT ATA ATA TTA TAT ATA TGG TTA TAT AGA AGA AGA AAA A 1701 GA TCA TGG AAA CAT GAA TGC AAG AAA CAT TTA TGC AAG TAA* 1741 stop chrblob_3506.glm_1|24oct01 TAAATTTTT 1751 AAAAATATGA ATTATGTAAT TTGTGAATCG CATATACATT ATATTTTATA 1801 ATAATTATTT TTTACAGAAG TAATATTTTT AGAATTATTT GTTTTTAAAG 1851 AAAATATATA TATTTATTTA TAAATAAATA AACAAAAGTA TTAAAAGTCT 1901 TATATTATAT TGTGTTATAA TATATCTGTT GATCAATTTA CATATTTTAT 1951 TTTTATTACA TTTCTAACCA AATGTATTTT TTATATGTTA AA // crick strand 1992 TT TAACATATAA AAAATACATT TGGTTAGAAA TGTAATAAAA 1950 ATAAAATATG TAAATTGATC AACAGATATA TTATAACACA ATATAATATA 1900 AGACTTTTAA TACTTTTGTT TATTTATTTA TAAATAAATA TATATATTTT 1850 CTTTAAAAAC AAATAATTCT AAAAATATTA CTTCTGTAAA AAATAATTAT 1800 TATAAAATAT AATGTATATG CGATTCACAA ATTACATAAT TCATATTTTT 1750 AAAAATTTA "chrblob_3506.glm_1|24oct01" 1741 T TACTTGCATA AATGTTTCTT GCATTCATGT TTCCATGATC 1700 TTTTTCTTCT TCTATATAAC CATATATATA ATATTATAAG TACAACAGTT 1650 AATATAAGTA GAACCAAAGC TGCAATACCA CAGGGGTATA TTGCGCTCAA 1600 AGCAGCATTT GCAGCAGGCA AAACTATATC GGAATAAGCA GAAGTACATA 1550 TTCCACCACC TGCTTGAATA GCTGTATTTA AGTTACCAGC ATTCAACATG 1500 TTAAATATTG TCATATAAGA CGCACACGTT TTAGCAGATT CAACAAACTT 1450 AGCAAGGGCA GCAGCTTTTG CAGTATGCAA AGCGATCGTT GTTAATATTA 1400 CAGTAGTAAG TGAAGAAATA TATATACCAC GGGTACATCT CCCTTTTAAG 1350 TGTTTTAAAT ACTTATCTCT TCCTTTGGTT TTTGCTAGTT TCATATTATT 1300 AATATTAGTA CATCCACATG AAGATGAATC ATCTGATTTG TCATCATCAT 1250 TTTTGTACTT ACCCAACTTC AACATATCAC TTTTGTTACC AAACGTTTCT 1200 TCATATGTTT CCAATAATTC TTTTTCTAGA GTTGACATAG GTTCTACATC 1150 ATTACCACCT GTATATTTTG TTCCATTTTT TTCTACTACA TCTTTCAATT 1100 GTTTATATGG ATCATGAGTT TGTTGATATT TTTTGATTGC TTCCTCGTTC 1050 ATTTTATCAA TTATTTCTTT GAGTTCTGGA TCATTATGAT AATGTGGATT 1000 ATGGTTTTTC GTTTGTGCTA ATAATCTTGA ATGTATCGTT GTTCTTTTGG 950 TGTTATTTTG AATGAGACTT ACATTATAAT GGTTATTTAG ATAATTCTCC 900 TAAAAAAAAA AAAAGAATTA ATGAATATGT ACTGAAAATG TAATAATTGT 850 TTTATTATAT GTTTATGTCA TAGTAATAAT AATGTATATT TTTTACATAC 800 ATAATGTTGT AATACTAATG TATTTATTAA AAAGGTAAAC AATAACATTT 750 TAAGGTAATA CAT 738 "chrblob_3506.glm_1|24oct01" CTTTATT TTTAATTCAA AAAACAATAT GTTATATTTC 700 AAATTGTATT AGTCTATTTC ATAAAAAATT ATCTATTTTG TTTTGCTAAT 650 ATATATTTTA TATAATATAT TGATAAGCGG AAATTTTGTT GTAATTTTAT 600 AATATAATAA CCTTATAGTT TCATCATACT TATAATTTAA TTTATGACTA 550 TATTCATTTA ATATTAAAAA AAAAAAATTT AAATATATAT AATTGTTTTT 500 TTTTTATATT ATATTATATT ATTTTTATTT TATTTTTTTT TTTTTTAATT 450 TTTCTTATAA TAATTCTCTC ATATATATAT ATTATAAATT TTTAATAAAT 400 AACAATATAT TTTCCTTCAA ATACATATAT AAATGTGTAT AGCAATAATT 350 GTTATGGGTG TGAGCCATAT ATATATAATA ATAGCTCTCA TGATTTTTAT 300 CTAATAAATA TCCTAAAATA TATTCTAATA TAATTACTAT TGTGAAACTA 250 ACAACAATTT TTCTTGTAAT TAATAAAAAA TAATATTTAT ATTAAAAATA 200 ATATAATAAA ATAGTTTTAT ATGTATTTTA ATAAATATAT TTTTGTTTTT 150 TTGTTTGTTT CAGTTTTGTT GTTAAGCATT ATCCTATATT ATAAAATACT 100 CTCCCTTGTA TCTCTTATTT TATCCTACTT AATTATGCAA TAATCATTTA 50 TAAATAATAA CATATAAATA TATATGTATA ATTAATAGGA TCTTACCATG end of file 3507 9 3513 13 3515 9 3518 9 3519 10 stevor pseudogene 3524 4 3526 9 3527 9 3528 10 3535 9 3537 10 telomere rep20 3538 13 3541 3 3543 13 3544 4 3546 9 3548 13 3549 3 3550 14 3552 12 3555 2 3556 3 3561 10 3563 9 stevor 3564 10 3565 3 stevor 3567 9 3569 13 3570 9 Date: Wednesday, 3/6/2002 Time: 23:13 c3572.txt chrblob_3572|2001.10.15|GENOMIC|Sanger FEATURES Location CDS complement(join(835..1716,1867..1938)) /gene="chrblob_3572.glm_1|24oct01" /note="(protein coding) 52% identity to (AL034559) predicted using hexExon; MAL3P7.51 (PFC1100w), Rifin, len: 318 aa; Similarity to other P.falciparum rifins. Member of a multi-gene family. [Plasmodium falciparum]" /codon_start=1 ORIGIN watson strand 1 TATGGGAATA AACGGATATC ATATAAATAT TATTATTCTA ATACAATTAT 51 AATTATTATA TATTATAGTG TGACTATTTT ATAATAATAC TTATTGTAAA 101 ATTAGTTTGA TTAATTATTC TTATGTTATA ATGTGTTGAT ATATCGATAT 151 ATCGTGTTCA AAACATTTTT TTTTGGTACT GTATATATAT ATATATTACA 201 TCTTTTTAAT ATGTGCCCTG TAATAAGATG ACACATATTT TGTTTTATTA 251 ACAGGGAAAA ATATTTAAAA TAAAATAAGA TAAAAAATAA TTAACCTAAT 301 ATTTTATTTT ACACATGACA TGCAAATGTA AAATAATAAT AAATATGTAT 351 TATATATATT ATAAAAATAA TATGGTACAA ATGATATAGA TTAATGTTAT 401 TAATTAAAAT TAGATTTATT TATATTAGTT TATATTATAT TAATATAATT 451 AGATTATAAA TAATATAAGA CTAATTATAT AATATATTCC ATTACATATT 501 ATTTTATATG AGGAATTTAA AATATATATG TTACAAGGTA TTCTTAAAGA 551 GTGTAAAATA AATAAATATA TATGTATACA TACAAACAAT ATATATTTAT 601 ATAAAATCTT CATTAAAAAA AATATATAAT TTACACTCGT TTCACTAAAA 651 AAAAATAAAT AAATATAAAT TAATTAATTT AATAACCACA TAACATTAAA 701 CAAAAAAAAA AATTATGGGG AAAACAAAAA TAAATATAAT GTTATAAAAA 751 ATTTAATTAT CATAATATGT TTGTATTAAT AAATCTAAAA TTCACAAAAC 801 ATTAAATTGT ATTTATTATC ATGAAACCAT ATAT "chrblob_3572.glm_1|24oct01" 835 TTATTG ATTTAATAAT 851 TTTGTGTATT GGGCTTTTTT CTTCATTTTT TTTTTTCGTC GATAACGTAA 901 AACTAAATAA ATAATTATCA TAACTAAAAC TATAACTACT ATTGCAATAA 951 TTGAAGCAGT TATTCCAGTA GTTAAACTAC TAGTAATCGA TGTATAGTTC 1001 GTAGCCTCAG CTGCTTTACC TTGTGCAATA GCTTTTTCAA TTGCTGCTAT 1051 GTGTGCGCTA TGCCTTGTAT TAAACTCAGC AATGGTTTCA GTTTTAACGA 1101 TACCATCTAG AACTGACACG AAACTACTAT AGCCACGATC CTCTAATGTT 1151 TCGTACATAG TAATAATATG TTCAAACATA TCAGAAAGAG TTACACCATT 1201 GTTAAATTTA CCTGAAGAAA GCATTTCTGT CACAGTAATT TGGGGAACAC 1251 TACCTAAACG AGTCGCTTTG TATATTTGAA TAATTTGATC TAAACCCACT 1301 TGTATACCTT TCTCAATACC CGCTGCAAGG GCTTTTTGAG TAACATATTG 1351 TGACCATGTT GCATACCATA AACCGCTGAC CAGACTCCAA ACAGGTAGAA 1401 CACCACCTCC TAACCCACAC CCACACTTAA GACAACCTTG TTCCACTTTT 1451 TTTGCTAATG ATTTTTGGAC TTTATCTTTT ACAATGATTT CTTGTATATC 1501 TTTGTCACAT TGTTCTTTAC ATTTTTTTCG TTTATCTTGC ACACGTTCCT 1551 CGTATTCTTC AAAACGTTGT GATGTTTGTC GATCGAAATT TTCCTTCACA 1601 GATTTCATAT CCGGATCTTT ATCATAATTG GGCATATATA GGTCACATTC 1651 GCTTAACACT CGTAATGTAG TAGTTGGTGT ATTTGGTGTG ATGTATGGTT 1701 TATTTTTATT ATGTGCCTAT AAGGAGTGCA ATATATATAT ACATGCATGT 1751 TTTAATGAGT TGTTTACTAT TTTATATATT TCTAATAAAT ATATATATGT 1801 TATATTAACA TAAATAATAA AACGTTACAT ATATATATAT ATAATAATTA 1851 TTTTTTTTAT TCATACATCT GATGATGATG CTACCAATAT ATTTAATGAA 1901 AGGGAAAATA ATAATATTTT AGAGTAGTGC AGTTTCAT 1938 "chrblob_3572.glm_1|24oct01" AT TTATTGTGAT 1951 ACTTATATTA TTTTATGACT AAAATTATAA GTAATTAATA CATAAAAATT 2001 CATTGTTTTT TATTAAAGGA ATTACATATG TATAATTTAA AATATTATTA 2051 TAGTTCCATC ATATAA // crick strand 2066 TTATAT GATGGAACTA 2050 TAATAATATT TTAAATTATA CATATGTAAT TCCTTTAATA AAAAACAATG 2000 AATTTTTATG TATTAATTAC TTATAATTTT AGTCATAAAA TAATATAAGT 1950 ATCACAATAA AT start chrblob_3572.glm_1|24oct01 glm stevor note may splice as rifin exon 1 1938 ATG AAA CTG CAC TAC TCT AAA ATA TTA TTA TTT TCC CT 1900 T TCA TTA AAT ATA TTG GTA GCA TCA TCA TCA GAT intron GTATGA ATAAAAAAAA 1850 TAATTATTAT ATATATATAT ATGTAACGTT TTATTATTTA TGTTAATATA 1800 ACATATATAT ATTTATTAGA AATATATAAA ATAGTAAACA ACTCATTAAA 1750 ACATGCATGT ATATATATAT TGCACTCCTT ATAG exon 2 1716 GCA CAT AAT AAA AAT A 1700 AA CCA TAC ATC ACA CCA AAT ACA CCA ACT ACT ACA TTA CGA GTG TTA AGC 1650 GAA TGT GAC CTA TAT ATG CCC AAT TAT GAT AAA GAT CCG GAT ATG AAA TC 1600 T GTG AAG GAA AAT TTC GAT CGA CAA ACA TCA CAA CGT TTT GAA GAA TAC G 1550 AG GAA CGT GTG CAA GAT AAA CGA AAA AAA TGT AAA GAA CAA TGT GAC AAA 1500 GAT ATA CAA GAA ATC ATT GTA AAA GAT AAA GTC CAA AAA TCA TTA GCA AA 1450 A AAA GTG GAA CAA GGT TGT CTT AAG TGT GGG TGT GGG TTA GGA GGT GGT G 1400 TT CTA CCT GTT TGG AGT CTG GTC AGC GGT TTA TGG TAT GCA ACA TGG TCA 1350 CAA TAT GTT ACT CAA AAA GCC CTT GCA GCG GGT ATT GAG AAA GGT ATA CA 1300 A GTG GGT TTA GAT CAA ATT ATT CAA ATA TAC AAA GCG ACT CGT TTA GGT A 1250 GT GTT CCC CAA ATT ACT GTG ACA GAA ATG CTT TCT TCA GGT AAA TTT AAC 1200 AAT GGT GTA ACT CTT TCT GAT ATG TTT GAA CAT ATT ATT ACT ATG TAC GA 1150 A ACA TTA GAG GAT CGT GGC TAT AGT AGT TTC GTG TCA GTT CTA GAT GGT A 1100 TC GTT AAA ACT GAA ACC ATT GCT GAG TTT AAT ACA AGG CAT AGC GCA CAC 1050 ATA GCA GCA ATT GAA AAA GCT ATT GCA CAA GGT AAA GCA GCT GAG GCT AC 1000 G AAC TAT ACA TCG ATT ACT AGT AGT TTA ACT ACT GGA ATA ACT GCT TCA A 950 TT ATT GCA ATA GTA GTT ATA GTT TTA GTT ATG ATA ATT ATT TAT TTA GTT 900 TTA CGT TAT CGA CGA AAA AAA AAA ATG AAG AAA AAA GCC CAA TAC ACA AA 850 A TTA TTA AAT CAA TAA* 835 stop chrblob_3572.glm_1|24oct01 ATAT ATGGTTTCAT GATAATAAAT ACAATTTAAT 800 GTTTTGTGAA TTTTAGATTT ATTAATACAA ACATATTATG ATAATTAAAT 750 TTTTTATAAC ATTATATTTA TTTTTGTTTT CCCCATAATT TTTTTTTTTG 700 TTTAATGTTA TGTGGTTATT AAATTAATTA ATTTATATTT ATTTATTTTT 650 TTTTAGTGAA ACGAGTGTAA ATTATATATT TTTTTTAATG AAGATTTTAT 600 ATAAATATAT ATTGTTTGTA TGTATACATA TATATTTATT TATTTTACAC 550 TCTTTAAGAA TACCTTGTAA CATATATATT TTAAATTCCT CATATAAAAT 500 AATATGTAAT GGAATATATT ATATAATTAG TCTTATATTA TTTATAATCT 450 AATTATATTA ATATAATATA AACTAATATA AATAAATCTA ATTTTAATTA 400 ATAACATTAA TCTATATCAT TTGTACCATA TTATTTTTAT AATATATATA 350 ATACATATTT ATTATTATTT TACATTTGCA TGTCATGTGT AAAATAAAAT 300 ATTAGGTTAA TTATTTTTTA TCTTATTTTA TTTTAAATAT TTTTCCCTGT 250 TAATAAAACA AAATATGTGT CATCTTATTA CAGGGCACAT ATTAAAAAGA 200 TGTAATATAT ATATATATAC AGTACCAAAA AAAAATGTTT TGAACACGAT 150 ATATCGATAT ATCAACACAT TATAACATAA GAATAATTAA TCAAACTAAT 100 TTTACAATAA GTATTATTAT AAAATAGTCA CACTATAATA TATAATAATT 50 ATAATTGTAT TAGAATAATA ATATTTATAT GATATCCGTT TATTCCCATA end of file 3573 3 3574 7 3576 9 3578 2 3581 14 3582 9 3584 12 3585 9 3589 10 3594 4 3595 10 3597 10 3598 4 3600 10 3601 14 3603 4 3604 13 3608 9 3609 9 3611 9 3613 4 Date: Friday, 3/8/2002 Time: 18:52 c3615.txt chrblob_3615|2001.10.15|GENOMIC|Sanger FEATURES Location CDS complement(join(1..539,704..786)) /gene="chrblob_3615.gen_1|24oct01" /note="(protein coding) 41% identity to fimbriae-associated protein Fap1 - Streptococcus parasanguinis" /codon_start=1 ORIGIN watson strand 1 TAACATCATA AGTAACATGT CTACTAACAT GACTACTAAC ATCATCACAA 51 CTAACATCAT AACTAACATG GTGACTAACA TGATCACTAA CATGACTACT 101 AACAACATCA CTAACATCAT GACTAACATT ACTACTTACA TGATTACTAA 151 CTTGACTACT AACATGATTA CTAACATGAC TACTAACATT ACTACTAACA 201 TGATCACTAA CATGACTACT AACATCATCA CTAACATGAC TAAGAACATT 251 ACTAACATGA CTACTTACAT GACTACTAAC ATAGTAACTA ACAACATGAC 301 TAACATGACT ATGAACATGA TGACTAACAA CATGACTAAC TTGACTACTA 351 ACATGACTAC TAACATCATT ACTAACATGT CTACTAACTT GACTACTAAC 401 AACATCACTC ACATGAATAC TAACATCATC ATTAACAACA TCACTAACAT 451 GATTACTTAC ATGACTACTA ACATTACTAC TTACATGACT ACTTACATGA 501 CTACTAACAT TACTACTAAC ATCATCACTA ACATGACTAC TAACATCATC 551 ATAACTAACA TAACTACTAA CATGACTAGT AACTTAGGTC TTAATTGTAC 601 TAACGCCGTC TCATCATTAC TAAGGTGTTT ATTTAACTAA TATGGATCTT 651 AACTAACTAG GGTCTTACCT TAACTAATAC AGGTCTTACG TCGACTAACA 701 TACGTCTTAC GTTGACTAAC TGAGGTCTTA ACTTCAACTA ACTTAGGTCT 751 TAACTTGACT AACATACGTC CTAACTTGAC TAACATATGT CTTAACTTGA 801 CTAACATAGG TCTTACTTTC ACTAACTTAG GTCTTCACTT AGCTAACTTA 851 GGTCTTAACT TAACTAACTA AGGTCTTAAC GTAACTAACT AAGGTCTTAA 901 CTTGACTAAC ATAGGTCTTA AGTTAACTAA CTCAGACCTT ACTTTCACTA 951 ATATAGGTCT TAAGTCATCT AACGTAGGTC TTAATTTCAA CTAACTTAGG 1001 TCTTAAATTG AGAAACTAAG GTCATACTTC GACTAACGTG GGTCTTACAT 1051 TAACTAACTC AGGTCTTACT TTCATTCATA TAGGTCTTAT TATTACTAAC 1101 TAAGGTCCTA ACTTAACTAA TATAGGTCAT AAAATTACTA AGCTAAGTCA 1151 TTAAGGTACT AACTTAGGTC TTACCTTCAC TTATATAGGT CTTACTTTCA 1201 CTAACTGAGG TCATACTTCT TCTAACTTAG GTCTTAACTT TACTAACCTA 1251 TGTCTTAAAG TAACTAATAT AGGTCTTAAC TTGACTAACA TATGTCTTAA 1301 CATTAGTAAT GTAGGTCTTA CTTTCACTCA TATAAGTCTT ATGGTAACTA 1351 ACTAAGGTCT TACTTTTACT AACTAAGGTG TTAACATAAC TAACTAAGGT 1401 CATACTTTTA CTAACTTAGG TCTTAAATTG AGTAACTAAG GTCATATTTC 1451 GACTAATATG GGTCTTAACT TCACTATCTC TCGTCCTACT ATTACTAACT 1501 TAAGTCTTAC TTTGCCTAGG TGAGTTCCTT CTGTTACTAA CATAGGTCTT 1551 AACTTAACTA ACTCTGGTTC TGCGATTACT AACTTAGGTC ATACTTCGAC 1601 TAATATGAGT CTTAACTTCA CTAACTCTGG TCATACTATT ACTAACTTAA 1651 GTCTTAACTT AAGTATCTCT GGTCCTACTA TTACTAATTT AGATGTTATT 1701 TTCATTAACT TAGGTCTTAA TTTCAACTAA CTTAGGTCTT AAATTGAGTA 1751 ACCAAGGTCA GACTTCGACT AACGTAGGCC TTACTTTCAC TAACCTAAGT 1801 CTTACTTTTA CTAACATAGG TCATACTTCG ATTAACGTAG GTCTTACTTT 1851 CACTCATATA GCTTTTATGG TAACTAACTA AGGTCTTAAC TTAACTAATA 1901 CAGGTCTTAC GTTTACTTAC ATAGGTCATA CTTCGACTAA TGTAGGTCTT 1951 AACTTAACTA ACTTAGGTCT TACTTCTACT AACTTAGGTC TTAACTCAAC 2001 TAACTGAGGT CTTACTTGGA CTCATATAGG TCTTACTTTC ACTAAGTGAG 2051 GTCCTTCTTT TACTAACATA GGTCTTAACT TTACTAACTC TGGTTCTGCG 2101 ATTACTAACT TAGGTCATAC TTCGACTAAC TAAGGTCTTA CGTTCACTAA 2151 GTGAGGTCTT TCTGTTACTA ACATAGGTCT TAACTTGACT AACATAGGTC 2201 TTACTTTTAC TAACATAGGT CATACTTCGA CTAACATAGG TCTTAAGTTA 2251 ACTAACTAAG GTCTTTCCAT CACTGATATA AGTCTTATGA TTACTAGCTA 2301 AGGTCCTAAC TTAACTAATA TAGGTCA // crick strand 2327 TGACCTA TATTAGTTAA GTTAGGACCT 2300 TAGCTAGTAA TCATAAGACT TATATCAGTG ATGGAAAGAC CTTAGTTAGT 2250 TAACTTAAGA CCTATGTTAG TCGAAGTATG ACCTATGTTA GTAAAAGTAA 2200 GACCTATGTT AGTCAAGTTA AGACCTATGT TAGTAACAGA AAGACCTCAC 2150 TTAGTGAACG TAAGACCTTA GTTAGTCGAA GTATGACCTA AGTTAGTAAT 2100 CGCAGAACCA GAGTTAGTAA AGTTAAGACC TATGTTAGTA AAAGAAGGAC 2050 CTCACTTAGT GAAAGTAAGA CCTATATGAG TCCAAGTAAG ACCTCAGTTA 2000 GTTGAGTTAA GACCTAAGTT AGTAGAAGTA AGACCTAAGT TAGTTAAGTT 1950 AAGACCTACA TTAGTCGAAG TATGACCTAT GTAAGTAAAC GTAAGACCTG 1900 TATTAGTTAA GTTAAGACCT TAGTTAGTTA CCATAAAAGC TATATGAGTG 1850 AAAGTAAGAC CTACGTTAAT CGAAGTATGA CCTATGTTAG TAAAAGTAAG 1800 ACTTAGGTTA GTGAAAGTAA GGCCTACGTT AGTCGAAGTC TGACCTTGGT 1750 TACTCAATTT AAGACCTAAG TTAGTTGAAA TTAAGACCTA AGTTAATGAA 1700 AATAACATCT AAATTAGTAA TAGTAGGACC AGAGATACTT AAGTTAAGAC 1650 TTAAGTTAGT AATAGTATGA CCAGAGTTAG TGAAGTTAAG ACTCATATTA 1600 GTCGAAGTAT GACCTAAGTT AGTAATCGCA GAACCAGAGT TAGTTAAGTT 1550 AAGACCTATG TTAGTAACAG AAGGAACTCA CCTAGGCAAA GTAAGACTTA 1500 AGTTAGTAAT AGTAGGACGA GAGATAGTGA AGTTAAGACC CATATTAGTC 1450 GAAATATGAC CTTAGTTACT CAATTTAAGA CCTAAGTTAG TAAAAGTATG 1400 ACCTTAGTTA GTTATGTTAA CACCTTAGTT AGTAAAAGTA AGACCTTAGT 1350 TAGTTACCAT AAGACTTATA TGAGTGAAAG TAAGACCTAC ATTACTAATG 1300 TTAAGACATA TGTTAGTCAA GTTAAGACCT ATATTAGTTA CTTTAAGACA 1250 TAGGTTAGTA AAGTTAAGAC CTAAGTTAGA AGAAGTATGA CCTCAGTTAG 1200 TGAAAGTAAG ACCTATATAA GTGAAGGTAA GACCTAAGTT AGTACCTTAA 1150 TGACTTAGCT TAGTAATTTT ATGACCTATA TTAGTTAAGT TAGGACCTTA 1100 GTTAGTAATA ATAAGACCTA TATGAATGAA AGTAAGACCT GAGTTAGTTA 1050 ATGTAAGACC CACGTTAGTC GAAGTATGAC CTTAGTTTCT CAATTTAAGA 1000 CCTAAGTTAG TTGAAATTAA GACCTACGTT AGATGACTTA AGACCTATAT 950 TAGTGAAAGT AAGGTCTGAG TTAGTTAACT TAAGACCTAT GTTAGTCAAG 900 TTAAGACCTTA GTTAGTTACGTTAAGACCTTA GTTAGTTAAGTTAAGACC 850 TAA GTTAGCTAAGTGAAGACCTAA GTTAGTGAAAGTAAGACCTAT GTTAG 800 TCAAGTTAAGACAT 786 AT GTT AGT CAA GTT AGG ACG TAT GTT AGT CAA GTT A 750 AG ACC TAA GTT AGT TGA A GTT AAG ACC TCA GTT AGT CAA CGT AAG AC GT A 700 T GTT AGT CGA CGT AAG ACC TGT ATT AGT TAA GGT AAG ACC CTA GTT AGT T 650 AA GAT CCA TAT TA GTT AAA TAA ACA CCT TAG TAA TGA TGA GAC GGC GTT A 600 GT ACA ATT AAG ACC*TAA* GTT ACT AGT CAT GTT AGT AGT TAT GTT AGT TAT 550 GAT GAT GTT AG T AGT CAT GTT AGT GAT GAT GTT AGT AGT AAT GTT AGT AG 500 T CAT GTA AGT AGT CAT GTA AGT AGT AAT GTT AGT AGT CAT GTA AGT AAT C 450 AT GTT AGT GAT GTT GTT AAT GAT GAT GTT AGT ATT CAT GTG AGT GAT GTT 400 GTT AGT AGT CAA GTT AGT AGA CAT GTT AGT AAT GAT GTT AGT AGT CAT GT 350 T AGT AGT CAA GTT AGT CAT GTT GTT AGT CAT CAT GTT CAT AGT CAT GTT A 300 GT CAT GTT GTT AGT TAC TAT GTT AGT AGT CAT GTA AGT AGT CAT GTT AGT 250 AAT GTT CTT AGT CAT GTT AGT GAT GAT GTT AGT AGT CAT GTT AGT GAT CA 200 T GTT AGT AGT AAT GTT AGT AGT CAT GTT AGT AAT CAT GTT AGT AGT CAA G 150 TT AGT AAT CAT GTA AGT AGT AAT GTT AGT CAT GAT GTT AGT GAT GTT GTT 100 AGT AGT CAT GTT AGT GAT CAT GTT AGT CAC CAT GTT AGT TAT GAT GTT AG 50 T TGT GAT GAT GTT AGT AGT CAT GTT AGT AGA CAT GTT ACT TAT GAT GTT A... 1 end of file 3616 4 3618 4 3620 9 3621 1 3623 9 3624 1 + 11 chimera telomere 3625 14 3626 13 3628 9 3629 9 3630 3 3632 4 3633 2 telomeric rep39 repeat region 3634 14 3635 12 pfemp1 var note no match to rifin intron: Date: Friday, 3/8/2002 Time: 19:05 c3636.txt chrblob_3636|2001.10.15|GENOMIC|Sanger FEATURES Location CDS 425..1396 /gene="chrblob_3636.glm_1|24oct01" /note="(protein coding) 60% identity to (AL034559) predicted using hexExon; MAL3P7.54 (PFC1115w), Rifin, len: 372 aa; Similarity to other P.falciparum rifins. Member of a multi-gene family. [Plasmodium falciparum]" /codon_start=1 ORIGIN watson strand 1 AAAAAAAATA TACGTATCAC AATTAAAAAA start chrblob_3636.glm_1|24oct01 vbc rifin pseudogene note possible sequence error exon 1 AAG AAA GTC CAT TAT ATT AA 51 T ATA TTA TTG TTT GCT CTT CCA TTA AAT ATA TTG intron GTAATT CCATGTCACA 101 TATATATTAA AGAGGATTAA TATAATCATA TTATAATATA ATATATATAT 151 TTATATATAA ATATATTACG ATATCGTATA TATAATTTTT ATATATATAT 201 AGTCCAAATA TACATATATA TATCTAAACA TAAAAACATA CATATTTATA 251 ACATATATAT ATAAAATAAA AAAGAACTAA TTATAATATA CATATATATG 301 TGACCATTTT GTATAG exon 2 ATA TAT AAT CAA AGG AAC CAT TAC ATC ACA CGT A 351 CA CCA AAA GCA ACC ACT AGG ACA TTA TGT GAA TGT GAA TTG TAT GCA CCA 401 TCA AAC TAT GAT AAT GAC CCT GAA ATG AAA GCA GTA ATG CAA GAT TTT GA 451 T CGT CAA ACG TCG CAA CGT TTT GAA GAA TAC AAT GAA CGC TTG CTC GAA A 501 AC AAA CAA AAA TGT AAA GAA CAA TGC GAT AAA GAA ATA CAA AAA ATT ATT 551 TTA AAA GAT AAA TTA GAA AAA GAA TTA ATG TAC AAA TTT GCG ACA TTA CA 601 A ACT GAT ATA CAA AGT GAC GCC ATT CCA ACA TGT ATT TGC GAA AAA TCT T 651 TA GCA GAT AAA GTG GAA AAA GGA TGT TTG AAA TGT GGA GGT GTG TTG GGA 701 GGT GGT ATT ACA CCC GGT TGG GGT TTG ATC AGC GGT ATT GTA TAT ACT GG 751 A TGG AAA GCA GCA GCG TTG GCA GCT GCT AAG GAA CTT GCC GAA AAA GCC G 801 GT GCT CTA GCC GGT GAA GCT GCA CGT ATT CCG GCA GCT ATT GAT GCA GTC 851 ATT GAA GGA ATA AAA TCA AAA TTC TCT ATA GAT ACT TTA GGT GGT GAA GC 901 A TTG AAA TCC GTT ATT GAT GGA ACA AAT TAT TAT GAT GCC TCA TAC ATT A 951 CT ACA GCT ATT TAT AAT AAA TTT AAT GTG TCC TCA TGT CTA CCT TCT GTC 1001 CCT TTC CTT GGC GGT CCC CCT GTC CCT GGA GCT GGC GCT AAT AAG CCT AT 1051 T TGC AGT GCT GTT GAT AAA TTA TAT CTA GGT TCA GGG AAC TTT CTT GAC A 1101 AA AGT TCA TTA CCA GGT TCT ATA CAA AAA GAT GTA GCA AAA ATT GTT GCA 1151 GGA GCT GAA CAA GCT GCT AAA GCC AAA GCT GCT ATG GTG GCT TCC GAT AA 1201 A ACA TTA GCT GTT GAA ACA GCA AAA AAA AAC GCT ATA GAA ACT ACT TTT A 1251 TG GGT TAT CAT AAT GCT ATT ATT GCT TCT ATC GTT GCA ATA GTG GTA ATC 1301 GTT TTA ATT ATG GTA ATT ATT TAT TTA ATT TTA CGT TAT AGA CGA AAA AA 1351 A AAA ATG AAG AAA AAA CTC CAA TAT ATC AAA TTA TTA GAA GAA TAG* 1396 stop chrblob_3636.glm_1|24oct01 ATAT 1401 GTTTTGTTAT ATAGATTTTG GTAGGAAGTT TGGTACTTGT ATTGTTTTTC 1451 TTTGAATTTA CCATGTTTTC TTTTCCATTA TTAATAACTA TATATTTTTA 1501 TATGTATTGC GCTTTTTTAT ATAATTTATT TTTCTATAAT TTTATTTATT 1551 TATTTATTTT TTTTTTTAAA ACTCTTTTAA TTAATAAACA ATGTAATTTT 1601 TAATTTATAT AAAATACTTA TACGTATTAT AATATATTAT TTTTTTAAAA 1651 CATAATGTAA CGTATATTTT TTAAATACCT CATATGTTTT TCAAAGGAAT 1701 ATATATTAAA AAAAAAAACA ATAAAACTTA TTATTATTAT AATTATGATT 1751 ATTATGATTA CTATTATTAT AAATATTTTA AGAAACATAT TATTCAAAAT 1801 ATTATATCTA TATTTATATA ATTTAAATTA AAACCAATAA GTATATTATT 1851 TCAATTCAGA ATTATCATCC TTAAAAAACC TATCATATTA TATATTATGT 1901 TATTTATATT TATTTCATAA TATATTTTAT TATTTTAATT ATTTTTTATT 1951 AGAAATACTA CTAATACAAT GAATTCAAAA AATAGTCAAC ATATAACAAA 2001 ATATAATAAT TATACGTAAT ATAACAAATA GATACAATAC ATAAAAAACC 2051 AATAAAAACA CAAAAAACAA ATCAAATTAA TAAAAATAAA ACACAATAAA 2101 AAAAAGAATA ATGTATATTT TTTATTTTAA TATAATAATA CACTTTTTCT 2151 TTATTTTGCT TTGTAATTTT TATTATGTTG TTTTATTTAG TATAATATGT 2201 AGATATTTTT TGTTTTTATA TATATATATT TATTTGATAA TATGTATATA 2251 TTTATGAGAT ATAATTTCAT ATATATTTCA TAATTTATAT TGTTCTTTTT 2301 AATTTTTTTT TAAGTGTTAT TTGTTTCTAT ATTACGGTAT GCATTGATTT 2351 ATTATCATTA TATTTTTATA TATATTAAGT GGCAAAAAAA GAAAAAAAAA 2401 AAAAAAATTT GTTTATTAAA TATTTTTTCT TCTGTAAAAT GTTTTCCATT 2451 TTTGTTTATA TTTATATTTA TATTTATATT TATATATTTT TTTTTTTTTT 2501 TTTTTTTTTG GGTATTTTTT ATATATATGA AATTTATATG ATATATTTCA 2551 AATTTTTCTT TTTTTTTTTT TTTTTTTT // crick strand 2578 AAAAAAAA AAAAAAAAAA AAGAAAAATT 2550 TGAAATATAT CATATAAATT TCATATATAT AAAAAATACC CAAAAAAAAA 2500 AAAAAAAAAA AAAATATATA AATATAAATA TAAATATAAA TATAAACAAA 2450 AATGGAAAAC ATTTTACAGA AGAAAAAATA TTTAATAAAC AAATTTTTTT 2400 TTTTTTTTTC TTTTTTTGCC ACTTAATATA TATAAAAATA TAATGATAAT 2350 AAATCAATGC ATACCGTAAT ATAGAAACAA ATAACACTTA AAAAAAAATT 2300 AAAAAGAACA ATATAAATTA TGAAATATAT ATGAAATTAT ATCTCATAAA 2250 TATATACATA TTATCAAATA AATATATATA TATAAAAACA AAAAATATCT 2200 ACATATTATA CTAAATAAAA CAACATAATA AAAATTACAA AGCAAAATAA 2150 AGAAAAAGTG TATTATTATA TTAAAATAAA AAATATACAT TATTCTTTTT 2100 TTTATTGTGT TTTATTTTTA TTAATTTGAT TTGTTTTTTG TGTTTTTATT 2050 GGTTTTTTAT GTATTGTATC TATTTGTTAT ATTACGTATA ATTATTATAT 2000 TTTGTTATAT GTTGACTATT TTTTGAATTC ATTGTATTAG TAGTATTTCT 1950 AATAAAAAAT AATTAAAATA ATAAAATATA TTATGAAATA AATATAAATA 1900 ACATAATATA TAATATGATA GGTTTTTTAA GGATGATAAT TCTGAATTGA 1850 AATAATATAC TTATTGGTTT TAATTTAAAT TATATAAATA TAGATATAAT 1800 ATTTTGAATA ATATGTTTCT TAAAATATTT ATAATAATAG TAATCATAAT 1750 AATCATAATT ATAATAATAA TAAGTTTTAT TGTTTTTTTT TTTAATATAT 1700 ATTCCTTTGA AAAACATATG AGGTATTTAA AAAATATACG TTACATTATG 1650 TTTTAAAAAA ATAATATATT ATAATACGTA TAAGTATTTT ATATAAATTA 1600 AAAATTACAT TGTTTATTAA TTAAAAGAGT TTTAAAAAAA AAAATAAATA 1550 AATAAATAAA ATTATAGAAA AATAAATTAT ATAAAAAAGC GCAATACATA 1500 TAAAAATATA TAGTTATTAA TAATGGAAAA GAAAACATGG TAAATTCAAA 1450 GAAAAACAAT ACAAGTACCA AACTTCCTAC CAAAATCTAT ATAACAAAAC 1400 ATAT "chrblob_3636.glm_1|24oct01" 1396 CTATTC TTCTAATAAT TTGATATATT GGAGTTTTTT CTTCATTTTT 1350 TTTTTTCGTC TATAACGTAA AATTAAATAA ATAATTACCA TAATTAAAAC 1300 GATTACCACT ATTGCAACGA TAGAAGCAAT AATAGCATTA TGATAACCCA 1250 TAAAAGTAGT TTCTATAGCG TTTTTTTTTG CTGTTTCAAC AGCTAATGTT 1200 TTATCGGAAG CCACCATAGC AGCTTTGGCT TTAGCAGCTT GTTCAGCTCC 1150 TGCAACAATT TTTGCTACAT CTTTTTGTAT AGAACCTGGT AATGAACTTT 1100 TGTCAAGAAA GTTCCCTGAA CCTAGATATA ATTTATCAAC AGCACTGCAA 1050 ATAGGCTTAT TAGCGCCAGC TCCAGGGACA GGGGGACCGC CAAGGAAAGG 1000 GACAGAAGGT AGACATGAGG ACACATTAAA TTTATTATAA ATAGCTGTAG 950 TAATGTATGA GGCATCATAA TAATTTGTTC CATCAATAAC GGATTTCAAT 900 GCTTCACCAC CTAAAGTATC TATAGAGAAT TTTGATTTTA TTCCTTCAAT 850 GACTGCATCA ATAGCTGCCG GAATACGTGC AGCTTCACCG GCTAGAGCAC 800 CGGCTTTTTC GGCAAGTTCC TTAGCAGCTG CCAACGCTGC TGCTTTCCAT 750 CCAGTATATA CAATACCGCT GATCAAACCC CAACCGGGTG TAATACCACC 700 TCCCAACACA CCTCCACATT TCAAACATCC TTTTTCCACT TTATCTGCTA 650 AAGATTTTTC GCAAATACAT GTTGGAATGG CGTCACTTTG TATATCAGTT 600 TGTAATGTCG CAAATTTGTA CATTAATTCT TTTTCTAATT TATCTTTTAA 550 AATAATTTTT TGTATTTCTT TATCGCATTG TTCTTTACAT TTTTGTTTGT 500 TTTCGAGCAA GCGTTCATTG TATTCTTCAA AACGTTGCGA CGTTTGACGA 450 TCAAAATCTT GCATTACTGC TTTCAT 425 "chrblob_3636.glm_1|24oct01" TTCA GGGTCATTAT CATAGTTTGA 400 TGGTGCATAC AATTCACATT CACATAATGT CCTAGTGGTT GCTTTTGGTG 350 TACGTGTGAT GTAATGGTTC CTTTGATTAT ATATCTATAC AAAATGGTCA 300 CATATATATG TATATTATAA TTAGTTCTTT TTTATTTTAT ATATATATGT 250 TATAAATATG TATGTTTTTA TGTTTAGATA TATATATGTA TATTTGGACT 200 ATATATATAT AAAAATTATA TATACGATAT CGTAATATAT TTATATATAA 150 ATATATATAT TATATTATAA TATGATTATA TTAATCCTCT TTAATATATA 100 TGTGACATGG AATTACCAAT ATATTTAATG GAAGAGCAAA CAATAATATA 50 TTAATATAAT GGACTTTCTT TTTTTTAATT GTGATACGTA TATTTTTTTT end of file Date: Friday, 3/8/2002 Time: 19:05 c3637.txt chrblob_3637|2001.10.15|GENOMIC|Sanger FEATURES Location CDS 28..210 /gene="chrblob_3637.glm_1|24oct01" /note="(protein coding) No NR protein Similarities" /codon_start=1 CDS complement(1463..2782) /gene="chrblob_3637.glm_2|24oct01" /note="(protein coding) No NR protein Similarities" /codon_start=1 ORIGIN watson strand 1 ACTAATATTA ATAATAAAAA TCAAAAC start chrblob_3637.glm_1|24oct01 vbc exon 1 28 ATG ATA AAC CCA TCA CCA TTA AA 51 A CCA AGA AGA ATT ATG AGT GGC AGC AAT AAT ATT ATT AAA AGT ACA AAT T 101 CA AAC AGT AGA ATG ACA TCT ACA GCA ACA ACA ACA GCA GCT TCA ACA GCC 151 ACA GCG ACA ACA ACA ACA ATA GGT AAT GTA GAA AAA AGG AGA GAT AAG AT 201 C AAT TG intron GTAA TCCAATTAAT AAGATATGAT CCTCAACTTC TTTATTACCA 251 TCTTCTTCAA CAAAAATATC AAACACAACA CCTTTATATA G exon 2 T AGA ACA TC 301 T ATT TTA AGA AAA AGA ACA TTG GAA ATT GAT GAC AGT ACA GAT TCA AAT C 351 CA AGA ACT AAA AAA ATT AAT GTA TCA TCA CCG GTT GTA ACA AAA CCA AAG 401 CAA TTA TTA CCT TCA ACA ACA ACG GCA ACA ACA ACA ACA CTA TCA TCA CC 451 A CTT GTT AAT AAA CCC AAA CAA ATT TTA CCA ACA ACT TCA TCA TTA CAA C 501 CA AAA CCA CAC ACA AAA ATA CAG CCA CAC AAA AAT AAT AAT AAT AAT AAT 551 AAT AAT ATT GCG CCA CAA ATG AAT ATG AAT ATT CAA ATC CCA AAT CCA AT 601 A CCA ATA CCA ATA CCA ATG CAT GTG CAA ATT CCA ATA TCA AAT CCT ATA C 651 CT ATG CCA TCT CCA TCT TCA ATG AAT CTT AAA GAA AAA TTA GAT AGT CTA 701 TCT CAG TTA TGT AAC AAT CGT AGT GCC AAA AAT GAA AAC TAC AAT CAC AA 751 T AAT AGT TTT AAT AGC CAA AAT CCT TTT GTT CAT CCC CTT CAA ATG CAT C 801 CT CCA CAA TTA CAA CTA CCA CTA CAT CCA CCA CAA ACA ATG ATA ATG CAA 851 TCA AAT ATG GAT TTA AAG ATG AAA TTA GAT AGC CTT TCC TTT TTT AAC AA 901 T AAT AAT AAT AAC CAC CAA GCA CAA AAT GAT CTT AGC TTT GAT TAT GGT C 951 AA AAT ACA CTC TCA AAT GAA AAT TTA ATT CTT CAT AAT AAA ATT GCA AGT 1001 CTA TCT TCC ACA TTA ATT AAT CAA CCT CAC CCA ATG AGA GTT AAA AAA TT 1051 A ACT CCA ACA TCA ACA ATA TCA TCA TCT ATT TCA ACT AGA CCA ATC ACA A 1101 CT AGT ACA ACA ACT TCA ACA ACA GTG CCT TCA GTA GTA TCA AAT AGA ATT 1151 AAA TCA CTT GTT CAT TCA AAT TCG CCA ATT AAA GAA AAT TTA TAT AAA GA 1201 A AAA TTA TCT TCT ACT GCA TCA GCA ACA TTA ACA CCA AAT CGA AAT AAT T 1251 CT CAA ATT GTG CAA CCT TTT AAA AGA GGA GTT TTA GGT AAT GGA CCC ACA 1301 TCG TCA TCA TCT AGA CTA TTA CCA TCA TCA AGA ACA ACT GTA AAT ACC TC 1351 A AGA AAA ATA ATT AAA TAA 1369 stop chrblob_3637.glm_1|24oct01 vbc A AGAATTTTAT AAATAAGATT GATTAAAAAA 1401 AAAAAATTAT TTATTTATTT TTTTATTTAT TTTTTACTTT GTTTTTTTTT 1451 ATTTATTTAT TT "chrblob_3637.glm_2|24oct01" 1463 TTATTGAA TTGTATTTTC ATTATATAAC AATGGTTTAT 1501 AATTATTTTT ATTATTATCT CTTTTAAATT TAGAACCAAT GGAAGTCCAT 1551 AATTTTTTAT TTGGAATTAA GTTTGTACCA GATTTACCTC TAGACTTATT 1601 AACCATAATA CCAATTGATA TGTATAATAT TATTACAACA CCAAATCCAA 1651 TAGCTATAGA TATGAAAATG ATTTGAATTT TTGAAAATCT ATTGAAAAAT 1701 GATTGATTAT CAGTTGAAGA TTTCGAATAA CAATTATTAA GTGTTTCTAT 1751 AGAATTTGAA TTTCTTTGAC CTGTTGGCAT TGGTGATGGT TGATATGTAA 1801 ATGAAATTGG TGTTGGTTTG GATAAATGTA ATTCATAATA AACACCATCT 1851 ATATAACAAT AGAATGTACC ATTAAATAAT GATATTAATT CTTGGAATAT 1901 TTGAAGAGCA CTTTCATTCT TATTTGCAAT ACCCATTAAA TTAATATAAA 1951 AGCTTGCCAA TTGATTCCTT TGTGTAATAT TATTATAATC CACAATAGTT 2001 GGTTCATCAG TTGTAAATAA TGTTATTTGA TCTTTTGGAG GATTACTTTG 2051 CATACCAACT AAAGTACCAC CTAATTGATA AATAGTATTA AAACTTGCCC 2101 AGACGAAATC ATCACAAGTA CTACTATTTT GATAAACTAT TAAATTTTCA 2151 CTACCACTAC CACCACCACC ACCACCAATA CCTAAATTAT GTAATATTGT 2201 TTCTAAATAA CCATTATCAC CACTACCACT GGCATCAGCT GATGCAATAC 2251 TAAATAAATT ATAAACTGGA TGAGTTTGGT TATATATTGG AGCCCAACTT 2301 AAATACTGTT TGACTTGTAA GCCTGTAAGT CCATACATAA TCAATTCTCT 2351 TTTACTCCAA TAAGTTTCAT TAATATAATT GGTAACTTCT ATTAATCCAT 2401 AAGTATTCCA TGTTAAATTA TAATTTCCTT GTGAATCTTT TGTAATATTC 2451 TGTGGTATTA ATGCATCCTC TAGGGTTGGA CCTGCGAAAT AATCTATTGA 2501 TATATTTGGC CCACCATTTA AATTATAAAA TCCAACACCA CTATGATAAG 2551 CATTAATCTT TTCGAAAAGA TCACCATAAA TTGCATACAT CAATGGTGCT 2601 TGTACATAAT ATAATTCATA CTGATCGTCA TCTCTTATAG AATTTGTGAA 2651 TTCGCAAATT GTCTCATATG TATAAAAATA AATACCATTT TCTGATGATC 2701 CACTATCACT TGATATTGAA ATTTTAATTA ATCCTATAAA AATTATTGTC 2751 AATGTTAAAA TTATATTTAA CATATTCTTC AT 2782 "chrblob_3637.glm_2|24oct01" TTTTCCTT TTTACCTTTT 2801 TCCTTTTTTT TTTTTTATTT ATATTAGTGG TATAATTGAT TTTATTTTTT 2851 TTTTTTTATT TTATTTTATT TTTTTTTTTT TTTTTTTTTT TTTTTTTTTT 2901 TTTTAAACCC GGGGGTTAAT TTAAATTAAT TTTTCCCTCT AAAAAATAAA 2951 AATAAAACCT TTTATTAAAA AAATTGGAAA AGTAAAAAAA CAATTGTAAA 3001 AAAAAAAAAA TTTTTTTTTA ATTAAAAACT CAAAAAAAAA AAAGGGTTTT 3051 TCCTATGGGT TTTATTTTTT TTTTTATTTT TTTTGGACCA ACCCAAATTT 3101 TAATTAAATT TTTTTTTTTT TCCCCCCCCC CCTTTCGAAA AATTAAAAAT 3151 TTTTTTCAAG GGGTTTTTTT GGATTGGGGG GAGTCAAAAA AAAAAAAAAA 3201 ATTTTAAAAA AATTTAAAAA TTTATTAAAA TTTGGGTTTT TTTGTTTTGG 3251 GGAAACAAAC CCTTCCTTTT AATTTTCCTT TTTTTTTTTT TTAATTTTTT 3301 TTCCAACCTT TTTTCTTTTC CCCGCCTTTT TTTTTTTTTT TTTGGGAAAT 3351 TTATTAAATT TATTTTTTTT TTTTAAAAAA AATTAAAAAT TTTTTTTTTC 3401 CCTCCCAATT CCCCAAAAAA AAAAAAAAA // crick strand 3429 TTTTTTTTT TTTTTTGGGG AATTGGGAGG 3400 GAAAAAAAAA ATTTTTAATT TTTTTTAAAA AAAAAAAATA AATTTAATAA 3350 ATTTCCCAAA AAAAAAAAAA AAAAGGCGGG GAAAAGAAAA AAGGTTGGAA 3300 AAAAAATTAA AAAAAAAAAA AAGGAAAATT AAAAGGAAGG GTTTGTTTCC 3250 CCAAAACAAA AAAACCCAAA TTTTAATAAA TTTTTAAATT TTTTTAAAAT 3200 TTTTTTTTTT TTTTTGACTC CCCCCAATCC AAAAAAACCC CTTGAAAAAA 3150 ATTTTTAATT TTTCGAAAGG GGGGGGGGGA AAAAAAAAAA AATTTAATTA 3100 AAATTTGGGT TGGTCCAAAA AAAATAAAAA AAAAAATAAA ACCCATAGGA 3050 AAAACCCTTT TTTTTTTTTG AGTTTTTAAT TAAAAAAAAA TTTTTTTTTT 3000 TTTACAATTG TTTTTTTACT TTTCCAATTT TTTTAATAAA AGGTTTTATT 2950 TTTATTTTTT AGAGGGAAAA ATTAATTTAA ATTAACCCCC GGGTTTAAAA 2900 AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AATAAAATAA AATAAAAAAA 2850 AAAAAATAAA ATCAATTATA CCACTAATAT AAATAAAAAA AAAAAAAGGA 2800 AAAAGGTAAA AAGGAAAA start chrblob_3637.glm_2|24oct01 glm exon 1 2782 ATG AAG AAT ATG TTA AAT ATA ATT TTA ACA TT 2750 G ACA ATA ATT TTT ATA GGA TTA ATT AAA ATT TCA ATA TCA AGT GAT AGT G 2700 GA TCA TCA GAA AAT GGT ATT TAT TTT TAT ACA TAT GAG ACA ATT TGC GAA 2650 TTC ACA AAT TCT ATA AGA GAT GAC GAT CAG TAT GAA TTA TAT TAT GTA CA 2600 A GCA CCA TTG ATG TAT GCA ATT TAT GGT GAT CTT TTC GAA AAG ATT AAT G 2550 CT TAT CAT AGT GGT GTT GGA TTT TAT AAT TTA AAT GGT GGG CCA AAT ATA 2500 TCA ATA GAT TAT TTC GCA GGT CCA ACC CTA GAG GAT GCA TTA ATA CCA CA 2450 G AAT ATT ACA AAA GAT TCA CAA GGA AAT TAT AAT TTA ACA TGG AAT ACT T 2400 AT GGA TTA ATA GAA GTT ACC AAT TAT ATT AAT GAA ACT TAT TGG AGT AAA 2350 AGA GAA TTG ATT ATG TAT GGA CTT ACA GGC TTA CAA GTC AAA CAG TAT TT 2300 A AGT TGG GCT CCA ATA TAT AAC CAA ACT CAT CCA GTT TAT AAT TTA TTT A 2250 GT ATT GCA TCA GCT GAT GCC AGT GGT AGT GGT GAT AAT GGT TAT TTA GAA 2200 ACA ATA TTA CAT AAT TTA GGT ATT GGT GGT GGT GGT GGT GGT AGT GGT AG 2150 T GAA AAT TTA ATA GTT TAT CAA AAT AGT AGT ACT TGT GAT GAT TTC GTC T 2100 GG GCA AGT TTT AAT ACT ATT TAT CAA TTA GGT GGT ACT TTA GTT GGT ATG 2050 CAA AGT AAT CCT CCA AAA GAT CAA ATA ACA TTA TTT ACA ACT GAT GAA CC 2000 A ACT ATT GTG GAT TAT AAT AAT ATT ACA CAA AGG AAT CAA TTG GCA AGC T 1950 TT TAT ATT AAT TTA ATG GGT ATT GCA AAT AAG AAT GAA AGT GCT CTT CAA 1900 ATA TTC CAA GAA TTA ATA TCA TTA TTT AAT GGT ACA TTC TAT TGT TAT AT 1850 A GAT GGT GTT TAT TAT GAA TTA CAT TTA TCC AAA CCA ACA CCA ATT TCA T 1800 TT ACA TAT CAA CCA TCA CCA ATG CCA ACA GGT CAA AGA AAT TCA AAT TCT 1750 ATA GAA ACA CTT AAT AAT TGT TAT TCG AAA TCT TCA ACT GAT AAT CAA TC 1700 A TTT TTC AAT AGA TTT TCA AAA ATT CAA ATC ATT TTC ATA TCT ATA GCT A 1650 TT GGA TTT GGT GTT GTA ATA ATA TTA TAC ATA TCA ATT GGT ATT ATG GTT 1600 AAT AAG TCT AGA GGT AAA TCT GGT ACA AAC TTA ATT CCA AAT AAA AAA TT 1550 A TGG ACT TCC ATT GGT TCT AAA TTT AAA AGA GAT AAT AAT AAA AAT AAT T 1500 AT AAA CCA TTG TTA TAT AAT GAA AAT ACA ATT CAA TAA* 1463 stop chrblob_3637.glm_2|24oct01 AA ATAAATAAAT 1450 AAAAAAAAAC AAAGTAAAAA ATAAATAAAA AAATAAATAA ATAATTTTTT 1400 TTTTTTAATC AATCTTATTT ATAAAATTCT TTTATTTAAT TATTTTTCTT 1350 GAGGTATTTA CAGTTGTTCT TGATGATGGT AATAGTCTAG ATGATGACGA 1300 TGTGGGTCCA TTACCTAAAA CTCCTCTTTT AAAAGGTTGC ACAATTTGAG 1250 AATTATTTCG ATTTGGTGTT AATGTTGCTG ATGCAGTAGA AGATAATTTT 1200 TCTTTATATA AATTTTCTTT AATTGGCGAA TTTGAATGAA CAAGTGATTT 1150 AATTCTATTT GATACTACTG AAGGCACTGT TGTTGAAGTT GTTGTACTAG 1100 TTGTGATTGG TCTAGTTGAA ATAGATGATG ATATTGTTGA TGTTGGAGTT 1050 AATTTTTTAA CTCTCATTGG GTGAGGTTGA TTAATTAATG TGGAAGATAG 1000 ACTTGCAATT TTATTATGAA GAATTAAATT TTCATTTGAG AGTGTATTTT 950 GACCATAATC AAAGCTAAGA TCATTTTGTG CTTGGTGGTT ATTATTATTA 900 TTGTTAAAAA AGGAAAGGCT ATCTAATTTC ATCTTTAAAT CCATATTTGA 850 TTGCATTATC ATTGTTTGTG GTGGATGTAG TGGTAGTTGT AATTGTGGAG 800 GATGCATTTG AAGGGGATGA ACAAAAGGAT TTTGGCTATT AAAACTATTA 750 TTGTGATTGT AGTTTTCATT TTTGGCACTA CGATTGTTAC ATAACTGAGA 700 TAGACTATCT AATTTTTCTT TAAGATTCAT TGAAGATGGA GATGGCATAG 650 GTATAGGATT TGATATTGGA ATTTGCACAT GCATTGGTAT TGGTATTGGT 600 ATTGGATTTG GGATTTGAAT ATTCATATTC ATTTGTGGCG CAATATTATT 550 ATTATTATTA TTATTATTTT TGTGTGGCTG TATTTTTGTG TGTGGTTTTG 500 GTTGTAATGA TGAAGTTGTT GGTAAAATTT GTTTGGGTTT ATTAACAAGT 450 GGTGATGATA GTGTTGTTGT TGTTGCCGTT GTTGTTGAAG GTAATAATTG 400 CTTTGGTTTT GTTACAACCG GTGATGATAC ATTAATTTTT TTAGTTCTTG 350 GATTTGAATC TGTACTGTCA TCAATTTCCA ATGTTCTTTT TCTTAAAATA 300 GATGTTCTAC TATATAAAGG TGTTGTGTTT GATATTTTTG TTGAAGAAGA 250 TGGTAATAAA GAAGTTGAGG ATCATATCTT ATTAATTGGA "chrblob_3637.glm_1|24oct01" 210 TTACCAATTG 200 ATCTTATCTC TCCTTTTTTC TACATTACCT ATTGTTGTTG TTGTCGCTGT 150 GGCTGTTGAA GCTGCTGTTG TTGTTGCTGT AGATGTCATT CTACTGTTTG 100 AATTTGTACT TTTAATAATA TTATTGCTGC CACTCATAAT TCTTCTTGGT 50 TTTAATGGTG ATGGGTTTAT CAT 28 "chrblob_3637.glm_1|24oct01" GTTTTGA TTTTTATTAT TAATATTAGT end of file 3638 10 3639 10 telomeric rep21 3643 9 3644 4 3645 12 3648 3 3650 11 3653 8 3656 13 3658 10 rifin 3659 9 3660 9 pfemp1 var 3662 9 3663 4 3664 4 3665 9 3666 4 no gene 3667 9 3668 9 3670 4 3671 4 3672 12 3673 3 3674 9 3676 10 3677 10 3678 9 3680 12 3682 12 3684 11 Date: Monday, 3/11/2002 Time: 10:17 c3685a.txt chrblob_3685|2001.10.15|GENOMIC|Sanger FEATURES Location CDS 275..3238 /gene="chrblob_3685.gen_1|24oct01" /note="(protein coding) 100% identity to (AF263455) TagA [Dictyostelium discoideum]" /codon_start=1 CDS complement(1951..2226) /gene="chrblob_3685.gen_2|24oct01" /note="(protein coding) No NR protein Similarities" /codon_start=1 CDS complement(1561..1689) /gene="chrblob_3685.gen_3|24oct01" /note="(protein coding) No NR protein Similarities" /codon_start=1 ORIGIN watson strand start chrblob_3685.gen_1|24oct01 vbc note partial gene (exon 1) 1 [...T] ACT CAA ATT CAT AGA AAT AAT GAA GGT AAT AAT AAA TTA TCA AAA TTA A 51 TT CAT TTA CAT AAT GAT GTA ATT GAT ACA ACC ATT TCA AAT AGA GAT AAT 101 ATT TTA TTT AAT AAG AAA TCT TTA AAT CAA AAA TCA AAG GGA AGT TTA TT 151 T TTA GTC CAT TTA AAT GGA CCA ATT GAA AAT CTA GTA CAT AAT GAA TTA A 201 TA AAA CAA TTG GAT CAA TTA TTT AAT GGT GGT GAA ATT ATT CAT TAT ATT 251 CCT GAT AAT ACT TAT TTA ATA TCA ATG ATT GGT AGT GAC AAC AAT GAT AA 301 T AAT AAT AAT AAC AAA ATT GAA TTA ATT AAT AGA TTA AAA GAA TTA ATA C 351 CA TCA ATT CAA TGG TTA AAA CCA TTA GAA CCA AGA TTA AAA ATT TCA CCA 401 TTA TTT AAA CAA AAT CAA TTC CAA GGT GAT AAT CAA AAT GAA ATT GAT CA 451 A CTT AGA ATT TAT TAT CAT GAA AAT AGT AAT CAA CAA TCA AAT GAT ATT G 501 AT AAT ATT ATT TCA GAA TCA TCA TTA ACT TTG GTT GAA AAA GAA TTA ATT 551 TCA AAT AAT AAT AAT AAT AAT AAT AAT GTT TTA ATT ACA GTT AAT TTA AA 601 A AAT AGT AAA TTA TCA TTA GAA TCA ATA ATT TAT AAA ATT TCA ACA AGG T 651 CA TTA GTT TAT TGG ATT GAA CCA AGT TCA AGT AAA TTA ATT AAA CAT ACA 701 CCA AGT AAT AAA TTT GCT CAC TAT TCA ATT CAA AGT GGT AGT GCA TCT AC 751 A ACT TCA ACC CCA ATT TGG GAT GTT ATT GGA ATT AAA GGT GAT GGT GAA A 801 TT GTT GGT TGT GCA GAT ACT GGT ATT GAT ATT AAT CAT TGT TTC TTT TAT 851 GAT ACA AAT CCA ATT GGT TCG ACT CAT AGA AAA ATC ATT TCT TAT TCA AG 901 T GGA AAT GGT GAT CAA ATC GAT GAA ATT GAT GGT CAT GGT ACT CAT ATT G 951 TT GGT ACT ATT ATA GGC TCA ACT ACT GTG GAT CCA AGT GTT TCA GAA TTT 1001 AGT GGT GGC GCT CCA AAT TCA AAG GTT GCA TTC GTT GAT TTA CAA GTT GG 1051 T AGT GGT AAT GGA TTA TCA ATT CAA TCA AAT TTA ACA GCA ATC TAT CAA T 1101 CA ACC TAT GAT CAA AAT GCA AAA GTA CAT TGT GAT GCA TGG AAT TCA AAT 1151 ATT GGT CCA TTC TAT ACT GGT GTC ACT GAA ATG ATA GAT AGA TTC CAA TG 1201 G GAC CAC CCA GAT TTC CTT GTA GTT AGA TCA GCA GGA AAT AAT GTA AAC T 1251 TT GGT TTC AAT TCA ATC TAT ACC TTA TCA CAA GAA TCA ACT AGT AAA AAT 1301 TCA TTG GTA GTT GGT AGT TCA AAT CAA CCA TCA AGT ACC TAT TTA TCA TC 1351 A ATT GAT TAT TGG GAC TGG GAT TTC ATT TAT AAT TCA ATT AGA ACT TCA G 1401 TT TGT ACT CAA GGT CAA TCT ATT TAT GGT ATA ACT TGT TCA GAT GTA CCA 1451 ACT CAA ACA ACC TCT GTC GAT ATT CAA ACT CAA TGT TGT TCA AAT CCA AT 1501 T TTG GCT AAA ATT TGT TGT TCA ACT GAA ATT CAA CAA CAA TAT CAA ACC A 1551 AT TCA ACA GTT TAT AGT GAA TTC ATT CCA AGT TTA TTT AGT GGT GTT GGT 1601 CCA ACA TCT GAT GGT CGT TTG AAA CCA GAT TTA TTA GCA CCA GGT TCA CC 1651 A ATT ATT TCA TCA CGT TCT TTG GGT CCA TCA TCA ACC ATT AAT CAT TGT T 1701 CA CCA ATT ACA TCA GGT ATT GCA ACA TCG GCT TTA ATC GCT ATG GAA GGT 1751 TCA AGT CAA GCA GCT GCT GTC GCT ACA AGT GCC GCA GTT TTA GTT CGT CA 1801 A TAC TAT AGA GAT GGT TAT TTT ATT AAT GGT AAA GTT AAT TCA TCT GTG G 1851 GA TTC CAA CCA TCA GCA TCA TTG GTT AAA GCA ACC TTA ATC AAT ACT GCA 1901 AGT ATT AAT GTT GAT TCA ACA TTA GAA TAT TCA CAA GGA TTT GGT AAT AT 1951 T CAA CTT TCA AAG TTA ATC ACA ACT ACA AAT GCC CAA ACC ACA TCT TTA G 2001 AC ATT CCA TCA TCA ATT GAA AAA GCT GAT CCA ATA ATT AAT ACT GGT GAA 2051 ACC AAT TCA TAT TGT TTC TCA CTC GAT AGT AAA GCA GAT ATT GAT ATA AC 2101 A TTG GTT TGG ACA GAT CCT GCC GGT TCA CCA TTA TCA ACA TTT ACT TTG G 2151 TA AAT AAT TTG GAT TTA GCT TTA CTT GCA TTT GTT GAT GGT GAA CTT TCA 2201 ATA TAT TCA GGA AAT AGT GAA ACC ATT TTC AAA AAT ACA AGC CAA GTA AT 2251 T TTC GAT CAA TTA AAT AAT GTT GAA GTC ATT AGA ATT AAG GAT GCA CCA A 2301 TT GGT AGT TAT GAT GTT AAA ATA TTT GGT ACA AAT ATT GTA ATT CCA AAT 2351 CAA TCC TAT TCA GTT GTA ATT AGA ACT TCC GGT GGT ACA ACT TTA ATG AA 2401 G GAA TCA GAA TGT GCT CAA TGT TTC TAT GAT CCA AAT GAT GAT CAA TCT C 2451 AA ATG TGT GAA TTT GAT AAT GGT ATT GGT ACA CAA TAT TGT AAA GAT GAT 2501 AAT AGA TTT TCA AAA TGT GTC GTC TAT GAA TGT AAT ACA GGT TAT GTC TT 2551 T GAT AAT GGT ATC ACA AAG TCT TGT GTA ACC ACC TTG GCA TTA ACA CTC T 2601 AT GAT ATT GTA TTA TTG GGT ATT TTT GGT ATA ATT ATT GTT GGT GCT GTA 2651 ATA TTT GTT TTG GTT TGT TAT AAA TCT AAA TCA TTG GAT CAA AAT AAA TA 2701 T TTT TCA TTA TCA AAA GAT AAA GGA GGT GAT GGA AAT TCA ATA AGA TCA A 2751 AT AGT GTT GCT GGA AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT 2801 AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AA 2851 T AAT AAT AAT AAT AGT AAT GGA AAA CAA TCA AAT ATT GAA TTA AAT TCA G 2901 TT GGT GGT GGT GAT GAT GGT ACT CCA AAT GGT GAT GAT CAG CAA CAA CAA 2951 AAT AAC TCA CCA CAA TAT GAT GAA GAT GGA AGA TTA ATT TCA GGT CAA GA 3001 A GTT GAA ATT TCA ATA TTT GAA GTA ATT TCA TTA GGT AAA CCA GAA AGT A 3051 AA ATC TTG GGT TTA GCA TTA TTT TTA TCA TTC ATT GAT GTT GCA TTA GGT 3101 TTA GCA GTA CCA TTA GTA GCA GCC AAT ATT TTC GAT TAT TTA TAT GCA GG 3151 T GAA ACG GGT AAA ATC TCA ACA ACT ATT TTA ACA TTT GCC TTA ATT ATC A 3201 TT GGT ATG ATT ATT GTT CAA TTC TTG TCT GGT ATT TTA 3238 ... (stop) chrblob_3685.gen_1|24oct01 // crick strand 3238 TAAAATAC CAGACAAGAA TTGAACAATA ATCATACCAA 3200 TGATAATTAA GGCAAATGTT AAAATAGTTG TTGAGATTTT ACCCGTTTCA 3150 CCTGCATATA AATAATCGAA AATATTGGCT GCTACTAATG GTACTGCTAA 3100 ACCTAATGCA ACATCAATGA ATGATAAAAA TAATGCTAAA CCCAAGATTT 3050 TACTTTCTGG TTTACCTAAT GAAATTACTT CAAATATTGA AATTTCAACT 3000 TCTTGACCTG AAATTAATCT TCCATCTTCA TCATATTGTG GTGAGTTATT 2950 TTGTTGTTGC TGATCATCAC CATTTGGAGT ACCATCATCA CCACCACCAA 2900 CTGAATTTAA TTCAATATTT GATTGTTTTC CATTACTATT ATTATTATTA 2850 TTATTATTAT TATTATTATT ATTATTATTA TTATTATTAT TATTATTATT 2800 ATTATTATTA TTATTATTAT TATTATTATT ATTATTTCCA GCAACACTAT 2750 TTGATCTTAT TGAATTTCCA TCACCTCCTT TATCTTTTGA TAATGAAAAA 2700 TATTTATTTT GATCCAATGA TTTAGATTTA TAACAAACCA AAACAAATAT 2650 TACAGCACCA ACAATAATTA TACCAAAAAT ACCCAATAAT ACAATATCAT 2600 AGAGTGTTAA TGCCAAGGTG GTTACACAAG ACTTTGTGAT ACCATTATCA 2550 AAGACATAAC CTGTATTACA TTCATAGACG ACACATTTTG AAAATCTATT 2500 ATCATCTTTA CAATATTGTG TACCAATACC ATTATCAAAT TCACACATTT 2450 GAGATTGATC ATCATTTGGA TCATAGAAAC ATTGAGCACA TTCTGATTCC 2400 TTCATTAAAG TTGTACCACC GGAAGTTCTA ATTACAACTG AATAGGATTG 2350 ATTTGGAATT ACAATATTTG TACCAAATAT TTTAACATCA TAACTACCAA 2300 TTGGTGCATC CTTAATTCTA ATGACTTCAA CATTATTTAA TTGATCGAAA 2250 ATTACTTGGC TTGTATTTTT GAAAATGGTT TCACTATTTC CTGAATATAT 2200 TGAAAGTTCA CCATCAACAA ATGCAAGTAA AGCTAAATCC AAATTATTTA 2150 CCAAAGTAAA TGTTGATAAT GGTGAACCGG CAGGATCTGT CCAAACCAAT 2100 GTTATATCAA TATCTGCTTT ACTATCGAGT GAGAAACAAT ATGAATTGGT 2050 TTCACCAGTA TTAATTATTG GATCAGCTTT TTCAATTGAT GATGGAATGT 2000 CTAAAGATGT GGTTTGGGCA TTTGTAGTTG TGATTAACTT TGAAAGTTGA 1950 ATATTACCAA ATCCTTGTGA ATATTCTAAT GTTGAATCAA CATTAATACT 1900 TGCAGTATTG ATTAAGGTTG CTTTAACCAA TGATGCTGAT GGTTGGAATC 1850 CCACAGATGA ATTAACTTTA CCATTAATAA AATAACCATC TCTATAGTAT 1800 TGACGAACTA AAACTGCGGC ACTTGTAGCG ACAGCAGCTG CTTGACTTGA 1750 ACCTTCCATA GCGATTAAAG CCGATGTTGC AATACCTGAT GTAATTGGTG 1700 AACAATGATT AATGGTTGAT GATGGACCCA AAGAACGTGA TGAAATAATT 1650 GGTGAACCTG GTGCTAATAA ATCTGGTTTC AAACGACCAT CAGATGTTGG 1600 ACCAACACCA CTAAATAAAC TTGGAATGAA TTCACTATAA ACTGTTGAAT 1550 TGGTTTGATA TTGTTGTTGA ATTTCAGTTG AACAACAAAT TTTAGCCAAA 1500 ATTGGATTTG AACAACATTG AGTTTGAATA TCGACAGAGG TTGTTTGAGT 1450 TGGTACATCT GAACAAGTTA TACCATAAAT AGATTGACCT TGAGTACAAA 1400 CTGAAGTTCT AATTGAATTA TAAATGAAAT CCCAGTCCCA ATAATCAATT 1350 GATGATAAAT AGGTACTTGA TGGTTGATTT GAACTACCAA CTACCAATGA 1300 ATTTTTACTA GTTGATTCTT GTGATAAGGT ATAGATTGAA TTGAAACCAA 1250 AGTTTACATT ATTTCCTGCT GATCTAACTA CAAGGAAATC TGGGTGGTCC 1200 CATTGGAATC TATCTATCAT TTCAGTGACA CCAGTATAGA ATGGACCAAT 1150 ATTTGAATTC CATGCATCAC AATGTACTTT TGCATTTTGA TCATAGGTTG 1100 ATTGATAGAT TGCTGTTAAA TTTGATTGAA TTGATAATCC ATTACCACTA 1050 CCAACTTGTA AATCAACGAA TGCAACCTTT GAATTTGGAG CGCCACCACT 1000 AAATTCTGAA ACACTTGGAT CCACAGTAGT TGAGCCTATA ATAGTACCAA 950 CAATATGAGT ACCATGACCA TCAATTTCAT CGATTTGATC ACCATTTCCA 900 CTTGAATAAG AAATGATTTT TCTATGAGTC GAACCAATTG GATTTGTATC 850 ATAAAAGAAA CAATGATTAA TATCAATACC AGTATCTGCA CAACCAACAA 800 TTTCACCATC ACCTTTAATT CCAATAACAT CCCAAATTGG GGTTGAAGTT 750 GTAGATGCAC TACCACTTTG AATTGAATAG TGAGCAAATT TATTACTTGG 700 TGTATGTTTA ATTAATTTAC TTGAACTTGG TTCAATCCAA TAAACTAATG 650 ACCTTGTTGA AATTTTATAA ATTATTGATT CTAATGATAA TTTACTATTT 600 TTTAAATTAA CTGTAATTAA AACATTATTA TTATTATTAT TATTATTTGA 550 AATTAATTCT TTTTCAACCA AAGTTAATGA TGATTCTGAA ATAATATTAT 500 CAATATCATT TGATTGTTGA TTACTATTTT CATGATAATA AATTCTAAGT 450 TGATCAATTT CATTTTGATT ATCACCTTGG AATTGATTTT GTTTAAATAA 400 TGGTGAAATT TTTAATCTTG GTTCTAATGG TTTTAACCAT TGAATTGATG 350 GTATTAATTC TTTTAATCTA TTAATTAATT CAATTTTGTT ATTATTATTA 300 TTATCATTGT TGTCACTACC AATCAT 275 "chrblob_3685.gen_1|24oct01" TGAT ATTAAATAAG TATTATCAGG 250 AATATAATGA ATAATTTCAC CACCATTAAA TAATTGATCC AATTGTTTTA 200 TTAATTCATT ATGTACTAGA TTTTCAATTG GTCCATTTAA ATGGACTAAA 150 AATAAACTTC CCTTTGATTT TTGATTTAAA GATTTCTTAT TAAATAAAAT 100 ATTATCTCTA TTTGAAATGG TTGTATCAAT TACATCATTA TGTAAATGAA 50 TTAATTTTGA TAATTTATTA TTACCTTCAT TATTTCTATG AATTTGAGTA end of file 3689 8 3690 14 3692 11 Date: Monday, 3/11/2002 Time: 09:37 c3693.txt chrblob_3693|2001.10.15|GENOMIC|Sanger FEATURES Location CDS complement(join(441..1433,1666..1719)) /gene="chrblob_3693.glm_1|24oct01" /note="(protein coding) 63% identity to (AF161311) variant surface antigen rifin 3 [Plasmodium falciparum]" /codon_start=1 ORIGIN watson strand 1 TTATTATTAA CATATATATA TCTATTTGTT ATATTTTATT ATATAACATT 51 TAATATGAAG TATTATAGAA ATATATATAT ATATATATAT ATATATATAT 101 ATATATATAT ACATATATAC CATATTTTAT TTTCTTAAAC AATTACATAT 151 ACCTACACTT ATGAGTTTAA TATTTAATAT ATATATTAAT AAATATATGA 201 TTTATTAAAA AAATAAAAGT TTTGTTGAAA AAAAAAAAGG TTAACATAAT 251 AGTAAATTAA TACAATAAAT AATCAAGAAA ATTGATCCAT AACAAAACAC 301 ATTGTATATG TACACAAACG TAATACAAAT AAAAATAATA TAGTTATTTA 351 TAATGGAGAA AAAAACATGG TATATTCAAA GAAAAACTGT ACGTGTACCG 401 TACATCCTAC CAACATCAAA AAATACCAAA CACATAATAT "chrblob_3693.glm_1|24oct01" 441 CTATTCTTCT 451 AATAATTTGA TATATTGCAG TTTTTTCTTC ATTTTCTTTT TTCGTCGATA 501 ACGTAAAATC AAATAAATTA TTACCATAAT TAAAACTATG ACAACTATTG 551 CAACGATGGA AGCAATAATA CTAATGTGGT AACCACCATA TGTAGCGTTT 601 ACTGCAGCCA TATATGTTTC CTTAAATTCT GCTGTTTTGG TTGTCAATGT 651 TGCCTGAAAT GCATCACTAC CAGCTTGTGC GAAACCCTTA ATGTTAGATT 701 CACCACCGTA CTTTATTACC GAATTATAAA AAATAGTCGT GCTATTTCTT 751 CCTGGAACAT TGCAGGCATT ACCTATTACT TTCTTAGCAG TTTCAACTAA 801 AGCATCACCA TTTTTAAATG TTGATTTACT AACAATTGAA CTCAAATCAA 851 CAAATCCTTG ATTTAGAGAA TAAATGTTAC TCAATCCTTC AATTTTAAGT 901 CTGACAGCAT TCATACCAGC TTCAATAGCG GCATCAGTAG CCTCAGTTAC 951 GGCCGCTTTT TTAGCAGCCT CAATTGCCAA AGGTTTCAAC ACACTTATGG 1001 CAGCTTCACC AATTCCTCCT AATAATCCAA CACTTGGCGC TACACCACCA 1051 CCGAACACAC CTGCACATCT CAAACATTCT TTTTCCATTT TATCTGCTAT 1101 TGACTTTTCG CAAACACATG TTGGAATAGC GTCACTTTGT ATATCTGTAT 1151 GTAATGTGGC AAATTTGTCC ATTAATTCTT TTTCTAATTT ATCTTTTAAA 1201 ATAATTTTTT GTATTTCTTT ATCACATTGC TCTTTACATT TTTGTTTGTT 1251 TTCGAGCAAG CGTTCATTGT ATTCTTCAAA ACGTTGCGAC GTTTGACGAT 1301 CAAAACCATG CAATACTGCT TTCATTTCAG GGTCATTATC ATAGTTTGAT 1351 GGTGCATACA ATTCACATTC GCATAATGTC CTAGTGGTTG CTTTTGGTGT 1401 ACGTGTGATG TAATGGTTCC TTTGATTATA TACCTATAAA GAAATGGTGA 1451 CATATATAAA TATGTAATGT TTAGTTGTAG TTTATTATTT TATATATTTG 1501 TAATAAATAT GTATAATTTT TTGGTTTATA AATATGTATA TTTTGACTAT 1551 ATATATATTA TATATGGATA TATAGATACA ACAATTATAT AAATGGTATC 1601 GTAATAAATA TATATATATT TTATAACATT AATAAATATT TAATACATAT 1651 GTAACATGGA ATTACCAATA TATTTAATGG AAGAGCAAAC AATAATATAT 1701 TAATATAATG GACTTTCAT 1719 "chrblob_3693.glm_1|24oct01" T TTTATTGTGA TATTTATAAT AATTTATGAT 1751 AAAAATTATA ACCAATTAAT TGTTATATAA TACTTTATTT TATTTTATAT 1801 ATAAATTAAA TATGTTTAAC ATAAAATATT ATTATAATTT TATAATATAC 1851 CACAATTAAT TGCCATTATA AAAATATATT ACACCATTGG TAAATGAATA 1901 ATTGTTCCAT TACAAAAAAA AAAAAAAAAA AAAAAAAAAA AAATTCAAAT 1951 TAAAATATAT CAAAATATAT TACATTTTTT TTAATTTTTA ATGAAATTTA 2001 ATTTTATGTC ATGTCATAAA TAACAATTAA ATTTTATTCT AACAAATTTA 2051 TATAACAAGT AAAACGGTAG TTACAACTTG TTTTTTTTTG TGTGTTGTAT 2101 ATAACATACA AATGTGTAGA ACAATAGTTG TTATTGGTGT AAATCGTATA 2151 TATATAATAA TAGCTCTCAT GATTTTTATC AAATAAATAT CCTAAAATAT 2201 ATTTTTAATA TAATTTCTAT TGTGGAAATA ACAAATTTTC TTGTAATTAA 2251 TAAAATATAA TATTAATCCG AAAGCAAATA TAATAAAATA CATTTATATT 2301 TATGTTAATA TTTGGATCTT TCCTTTTTAG TGTATTTCAT TTTTTTTTCT 2351 TAGCGGTATT CTATGATAGA AAATTCTCTC TATTGGATCT AATATTTTAT 2401 TTTACTTAAT TATGCTAAAA TAATATTTAA ATTTATGGAT AATAGCATAT 2451 TTAAATGATT ATTTTTTTAA AAAATAATTA ATTTTAAATT TTGGATAATT 2501 TAAAA // crick strand 2505 TTTTA 2500 AATTATCCAA AATTTAAAAT TAATTATTTT TTAAAAAAAT AATCATTTAA 2450 ATATGCTATT ATCCATAAAT TTAAATATTA TTTTAGCATA ATTAAGTAAA 2400 ATAAAATATT AGATCCAATA GAGAGAATTT TCTATCATAG AATACCGCTA 2350 AGAAAAAAAA ATGAAATACA CTAAAAAGGA AAGATCCAAA TATTAACATA 2300 AATATAAATG TATTTTATTA TATTTGCTTT CGGATTAATA TTATATTTTA 2250 TTAATTACAA GAAAATTTGT TATTTCCACA ATAGAAATTA TATTAAAAAT 2200 ATATTTTAGG ATATTTATTT GATAAAAATC ATGAGAGCTA TTATTATATA 2150 TATACGATTT ACACCAATAA CAACTATTGT TCTACACATT TGTATGTTAT 2100 ATACAACACA CAAAAAAAAA CAAGTTGTAA CTACCGTTTT ACTTGTTATA 2050 TAAATTTGTT AGAATAAAAT TTAATTGTTA TTTATGACAT GACATAAAAT 2000 TAAATTTCAT TAAAAATTAA AAAAAATGTA ATATATTTTG ATATATTTTA 1950 ATTTGAATTT TTTTTTTTTT TTTTTTTTTT TTTTTTTGTA ATGGAACAAT 1900 TATTCATTTA CCAATGGTGT AATATATTTT TATAATGGCA ATTAATTGTG 1850 GTATATTATA AAATTATAAT AATATTTTAT GTTAAACATA TTTAATTTAT 1800 ATATAAAATA AAATAAAGTA TTATATAACA ATTAATTGGT TATAATTTTT 1750 ATCATAAATT ATTATAAATA TCACAATAAA A start chrblob_3693.glm_1|24oct01 glm rifin exon 1 1719 ATG AAA GTC CAT TAT ATT A 1700 AT ATA TTA TTG TTT GCT CTT CCA TTA AAT ATA TTG intron GTAAT TCCATGTTAC 1650 ATATGTATTA AATATTTATT AATGTTATAA AATATATATA TATTTATTAC 1600 GATACCATTT ATATAATTGT TGTATCTATA TATCCATATA TAATATATAT 1550 ATAGTCAAAA TATACATATT TATAAACCAA AAAATTATAC ATATTTATTA 1500 CAAATATATA AAATAATAAA CTACAACTAA ACATTACATA TTTATATATG 1450 TCACCATTTC TTTATAG exon 2 1433 GTA TAT AAT CAA AGG AAC CAT TAC ATC ACA CGT 1400 ACA CCA AAA GCA ACC ACT AGG ACA TTA TGC GAA TGT GAA TTG TAT GCA CC 1350 A TCA AAC TAT GAT AAT GAC CCT GAA ATG AAA GCA GTA TTG CAT GGT TTT G 1300 AT CGT CAA ACG TCG CAA CGT TTT GAA GAA TAC AAT GAA CGC TTG CTC GAA 1250 AAC AAA CAA AAA TGT AAA GAG CAA TGT GAT AAA GAA ATA CAA AAA ATT AT 1200 T TTA AAA GAT AAA TTA GAA AAA GAA TTA ATG GAC AAA TTT GCC ACA TTA C 1150 AT ACA GAT ATA CAA AGT GAC GCT ATT CCA ACA TGT GTT TGC GAA AAG TCA 1100 ATA GCA GAT AAA ATG GAA AAA GAA TGT TTG AGA TGT GCA GGT GTG TTC GG 1050 T GGT GGT GTA GCG CCA AGT GTT GGA TTA TTA GGA GGA ATT GGT GAA GCT G 1000 CC ATA AGT GTG TTG AAA CCT TTG GCA ATT GAG GCT GCT AAA AAA GCG GCC 950 GTA ACT GAG GCT ACT GAT GCC GCT ATT GAA GCT GGT ATG AAT GCT GTC AG 900 A CTT AAA ATT GAA GGA TTG AGT AAC ATT TAT TCT CTA AAT CAA GGA TTT G 850 TT GAT TTG AGT TCA ATT GTT AGT AAA TCA ACA TTT AAA AAT GGT GAT GCT 800 TTA GTT GAA ACT GCT AAG AAA GTA ATA GGT AAT GCC TGC AAT GTT CCA GG 750 A AGA AAT AGC ACG ACT ATT TTT TAT AAT TCG GTA ATA AAG TAC GGT GGT G 700 AA TCT AAC ATT AAG GGT TTC GCA CAA GCT GGT AGT GAT GCA TTT CAG GCA 650 ACA TTG ACA ACC AAA ACA GCA GAA TTT AAG GAA ACA TAT ATG GCT GCA GT 600 A AAC GCT ACA TAT GGT GGT TAC CAC ATT AGT ATT ATT GCT TCC ATC GTT G 550 CA ATA GTT GTC ATA GTT TTA ATT ATG GTA ATA ATT TAT TTG ATT TTA CGT 500 TAT CGA CGA AAA AAG AAA ATG AAG AAA AAA CTG CAA TAT ATC AAA TTA TT 450 A GAA GAA TAG* 441 stop chrblob_3693.glm_1|24oct01 ATATTATGTG TTTGGTATTT TTTGATGTTG GTAGGATGTA 400 CGGTACACGT ACAGTTTTTC TTTGAATATA CCATGTTTTT TTCTCCATTA 350 TAAATAACTA TATTATTTTT ATTTGTATTA CGTTTGTGTA CATATACAAT 300 GTGTTTTGTT ATGGATCAAT TTTCTTGATT ATTTATTGTA TTAATTTACT 250 ATTATGTTAA CCTTTTTTTT TTTCAACAAA ACTTTTATTT TTTTAATAAA 200 TCATATATTT ATTAATATAT ATATTAAATA TTAAACTCAT AAGTGTAGGT 150 ATATGTAATT GTTTAAGAAA ATAAAATATG GTATATATGT ATATATATAT 100 ATATATATAT ATATATATAT ATATATATAT TTCTATAATA CTTCATATTA 50 AATGTTATAT AATAAAATAT AACAAATAGA TATATATATG TTAATAATAA end of file 3696 13 Date: Monday, 3/11/2002 Time: 09:37 c3697.txt chrblob_3697|2001.10.15|GENOMIC|Sanger FEATURES Location CDS 1163..1372 /gene="chrblob_3697.glm_1|24oct01" /note="(protein coding) 68% identity to (AL031747) rifin, MAL1P4.07 [Plasmodium falciparum]" /codon_start=1 CDS 1400..1954 /gene="chrblob_3697.glm_2|24oct01" /note="(protein coding) 45% identity to hypothetical protein (RIF-1 repetitive element) - Plasmodium falciparum (strain Camp) (fragment)" /codon_start=1 ORIGIN watson strand 1 TCTATCATCC TCCATCTCAG GCTCGGTACC GTGATCATAT AAAAAAAATA 51 ATATAATGAA AAACTTTTTT GTAAAATATT TTATAGTTAT ATGTACAACA 101 AAAATGTTAG TATAATTTTA GATACATTAG AGAGAAACGT ATAACATACA 151 ATACATTTTG GAACAAAAAA AAAAATATAT AATAACATTA AAATAAATTA 201 AATTATTAAA ATATATTACA TTTAATTAAT TAATATTAAA ATTTATATAC 251 TATTAGTTTT ACCTTTAAGA CCACATATTA TGATATGCAA TGATACTTAA 301 TAATTTTTAT ATAATTACAA CATTGTGAAC ATACATGTTA CAATATAAAT 351 ACCACATATA TGTTATAAGA TGTAAATTAT ATGTGATAAT ACACATTCAA 401 CCATTGTTAC TATATACATT GTTATGTTAT TTAGAACAAT AAATATGATG 451 TTAGTTATTA CAATATAGTA TCACTTGTTA TTATTATGTA CCCAAAAAAA 501 AAAAAAAAAA TTCATATTAA TAAATTTTTT TTTTTATATA AAATTAAAAG 551 TTATTAGAAA TAAAAAAAAA TTATAAAAAA TGTAATATAT TTTGATAAAT 601 TATATTATTT CTTTTATCTT TCTTTGGTTT TTTTTTTTTT TTTTTTTTGA 651 AATAATACAA ATGATGCGCT ATTATATAAA AAAAATTATA TTTTAATAAT 701 GTAACGTTAA TTATGGTGTA TTTTAAAAGT GTAATCATCT TTTAGATTAA 751 GTATATTTAA TTTATTTATA AAAAAAAAGT CATTATTATA TCTTAATTAT 801 TTAGTTACAA ATTTAATCAT AAAATAATAT AAGTATCACA ATAAAA start chrblob_3697.glm_1+2|24oct01 vbc stevor note read through tga at 1370 exon 1 847 ATG A 851 AA CTC CAC TAC TTT AAT ATA TTA TTA TTT TCT CTT CCA TTA AAT ATA TTG 901 TTA TTA TCA TCA TCA CAG intron GT ATGTATCTAC AAATAATTAT TATTACAATA 951 TATATATATA TATATATATA TATACATACC CTATACATAA TTATAATATA 1001 CATTATATAT ATATATATAA TATCATTTTG TACTAG exon 2 GTA TAT GTC CAT AG 1051 G AAC CAT TAC AGT ATT ACA CTT TAT ACA TCA AAA ACA CCA AAA CCA ATA A 1101 AA TCA AAT AGA TCA TTA TGC GAA TGC GAT CTA TAT AAG CCT AAT TAT AAC 1151 AAC GAC CCG GAA ATG AAA AAT CTA ATG GAA AAT TTC AGT AAA CAG GCG CA 1201 A CAA AGA TTT AAC GAG TAC GAC GAA CAT ATG AAT GAA AAA CTT CAA AAA T 1251 GT AAA GAA CAA TGT GAA AAG GAT ATA CAA AAT ATT ATA TTA AAA GAC AAA 1301 ATT GAA AAG GAA TTA ACA GAA AAG TTG TCA GCA TTA CAA ACG GAT ATA TC 1351 T ATC AAT AAT ATA CCT ACA*TGA*ATT TGC GAA AAA TCT GTA GCA GAT AAA A 1401 TG GAA AAA AAT TGT TTG AAA TGT GGT GGG ATA ATA GGT ACA GCC GTA CCT 1451 GAA TTG GCA CTT TTA GGA GGT GTT TCT ACA CAT ATG TTA ACA ACT GCA GC 1501 C ACT TAT GCT GCT ATT GAA GCT GGT ATG AGA GAA GTC GTC TCT CAT ATT A 1551 AA GAA TTC CTT ACT AAT TTT AAT GAA TAT TTG GTT GAT TTG ACA CCA ATT 1601 GTT AAT GAA TCA AAT TAC AAT TGT GGT ACT GCT CTT TTT GAG GCT GCT AA 1651 T AAA GCG GTT AGT ACA TCG TGT CTT ACA ACA AAA CCT GGA ATT ATA TCT C 1701 CT TTG TGC AGT GCT ATA AAA ACT ACT GGT AAA AAT ACG TTT AAT CAT TAT 1751 GCA CAA TAT GGT AGT GCA GCA TAT AAT GAA AAG TTG AAC GCA GAA ATG GT 1801 G GGA GTT ACT AGT TTT AAT AAT GCC ATG ATG GCT TCA ATT ATT GCA ATA G 1851 TA GTT ATA GTT TTA GTT ATG GTA ATT ATT TAT TTG ATA TTA CGT TAT CGT 1901 AGA AAA AAG AAA ATG AAG AAA AAA GTA CAA TAC TTA AAA CTA CTA AAT CA 1951 A TAA* 1954 stop chrblob_3697.glm_1+2|24oct01 ATATAT GCTTTCGTTA TATTAAATTC AATTTAATGT TATGAGAATT 2001 TTATAATTAT AATACAAGGA TATTATCATA ATTAAATTTT TATAACATTA 2051 TATATTTTTC CCTATAATTT TATTTTGTTT ATTCTTATGT GATTATTAAA 2101 TTATTAAATT TATATTTATT TATTTATTTT TTAGTGAAAA GAGAGTAATA 2151 TATATATATA TTTTATATCA AGAACCTACA TGAATATATA TTTATTTATT 2201 ATACAATATT TAAGAATATC TCGCAACATA TATTTTTTAA ATTATTTATA 2251 TAAAATGATA TATAATGAAA TATATTATAT TATTAATCTT ATACCCATAT 2301 ATTATTTAAA ATTTAATTAT ATTAAAT // crick strand 2327 ATTTAAT ATAATTAAAT TTTAAATAAT 2300 ATATGGGTAT AAGATTAATA ATATAATATA TTTCATTATA TATCATTTTA 2250 TATAAATAAT TTAAAAAATA TATGTTGCGA GATATTCTTA AATATTGTAT 2200 AATAAATAAA TATATATTCA TGTAGGTTCT TGATATAAAA TATATATATA 2150 TATTACTCTC TTTTCACTAA AAAATAAATA AATAAATATA AATTTAATAA 2100 TTTAATAATC ACATAAGAAT AAACAAAATA AAATTATAGG GAAAAATATA 2050 TAATGTTATA AAAATTTAAT TATGATAATA TCCTTGTATT ATAATTATAA 2000 AATTCTCATA ACATTAAATT GAATTTAATA TAACGAAAGC ATATAT "chrblob_3697.glm_1+2|24oct01" 1954 TTAT 1950 TGATTTAGTA GTTTTAAGTA TTGTACTTTT TTCTTCATTT TCTTTTTTCT 1900 ACGATAACGT AATATCAAAT AAATAATTAC CATAACTAAA ACTATAACTA 1850 CTATTGCAAT AATTGAAGCC ATCATGGCAT TATTAAAACT AGTAACTCCC 1800 ACCATTTCTG CGTTCAACTT TTCATTATAT GCTGCACTAC CATATTGTGC 1750 ATAATGATTA AACGTATTTT TACCAGTAGT TTTTATAGCA CTGCACAAAG 1700 GAGATATAAT TCCAGGTTTT GTTGTAAGAC ACGATGTACT AACCGCTTTA 1650 TTAGCAGCCT CAAAAAGAGC AGTACCACAA TTGTAATTTG ATTCATTAAC 1600 AATTGGTGTC AAATCAACCA AATATTCATT AAAATTAGTA AGGAATTCTT 1550 TAATATGAGA GACGACTTCT CTCATACCAG CTTCAATAGC AGCATAAGTG 1500 GCTGCAGTTG TTAACATATG TGTAGAAACA CCTCCTAAAA GTGCCAATTC 1450 AGGTACGGCT GTACCTATTA TCCCACCACA TTTCAAACAA TTTTTTTCCA 1400 TTTTATCTGC TACAGATTTT TCGCAAATTC ATGTAGGTAT ATTATTGATA 1350 GATATATCCG TTTGTAATGC TGACAACTTT TCTGTTAATT CCTTTTCAAT 1300 TTTGTCTTTT AATATAATAT TTTGTATATC CTTTTCACAT TGTTCTTTAC 1250 ATTTTTGAAG TTTTTCATTC ATATGTTCGT CGTACTCGTT AAATCTTTGT 1200 TGCGCCTGTT TACTGAAATT TTCCATTAGA TTTTTCAT 1163 "chrblob_3697.glm_1+2|24oct01" TT CCGGGTCGTT 1150 GTTATAATTA GGCTTATATA GATCGCATTC GCATAATGAT CTATTTGATT 1100 TTATTGGTTT TGGTGTTTTT GATGTATAAA GTGTAATACT GTAATGGTTC 1050 CTATGGACAT ATACCTAGTA CAAAATGATA TTATATATAT ATATATAATG 1000 TATATTATAA TTATGTATAG GGTATGTATA TATATATATA TATATATATA 950 TATTGTAATA ATAATTATTT GTAGATACAT ACCTGTGATG ATGATAATAA 900 CAATATATTT AATGGAAGAG AAAATAATAA TATATTAAAG TAGTGGAGTT 850 TCATTTTTAT TGTGATACTT ATATTATTTT ATGATTAAAT TTGTAACTAA 800 ATAATTAAGA TATAATAATG ACTTTTTTTT TATAAATAAA TTAAATATAC 750 TTAATCTAAA AGATGATTAC ACTTTTAAAA TACACCATAA TTAACGTTAC 700 ATTATTAAAA TATAATTTTT TTTATATAAT AGCGCATCAT TTGTATTATT 650 TCAAAAAAAA AAAAAAAAAA AAACCAAAGA AAGATAAAAG AAATAATATA 600 ATTTATCAAA ATATATTACA TTTTTTATAA TTTTTTTTTA TTTCTAATAA 550 CTTTTAATTT TATATAAAAA AAAAAATTTA TTAATATGAA TTTTTTTTTT 500 TTTTTTTGGG TACATAATAA TAACAAGTGA TACTATATTG TAATAACTAA 450 CATCATATTT ATTGTTCTAA ATAACATAAC AATGTATATA GTAACAATGG 400 TTGAATGTGT ATTATCACAT ATAATTTACA TCTTATAACA TATATGTGGT 350 ATTTATATTG TAACATGTAT GTTCACAATG TTGTAATTAT ATAAAAATTA 300 TTAAGTATCA TTGCATATCA TAATATGTGG TCTTAAAGGT AAAACTAATA 250 GTATATAAAT TTTAATATTA ATTAATTAAA TGTAATATAT TTTAATAATT 200 TAATTTATTT TAATGTTATT ATATATTTTT TTTTTTGTTC CAAAATGTAT 150 TGTATGTTAT ACGTTTCTCT CTAATGTATC TAAAATTATA CTAACATTTT 100 TGTTGTACAT ATAACTATAA AATATTTTAC AAAAAAGTTT TTCATTATAT 50 TATTTTTTTT ATATGATCAC GGTACCGAGC CTGAGATGGA GGATGATAGA end of file 3698 12 3699 9 3702 3 3703 9 3705 9 3707 9 3710 3 Date: Monday, 3/11/2002 Time: 09:38 c3712.txt chrblob_3712|2001.10.15|GENOMIC|Sanger FEATURES Location CDS complement(1523..1741) /gene="chrblob_3712.glm_1|24oct01" /note="(protein coding) No NR protein Similarities" /codon_start=1 CDS complement(1788..2093) /gene="chrblob_3712.glm_2|24oct01" /note="(protein coding) No NR protein Similarities" /codon_start=1 ORIGIN watson strand 1 TTTAAATTTA AATTTTTTTT TTTTAAAAAT TTTTTAGGGT TCCCCGCTCC 51 CACCCGCTTT CCAAAAAAAA CCGGGGATGT TTTTCATTTT CCCCGGTAAA 101 AAAAAGTTTG GGGATTTAAT AAAAAAATTT TGGGTGGGGG ATTGGGGGGG 151 TTTTCACCCA TTCCCAAGGC CAAGTTTAAC TTGGGTTTTT TGGGGTTAAC 201 CCCCGGCCCA AATTTCCCCC TTTATTTTTT TTTTTTTGAA CCCCCCCCCT 251 TAAAATTTCC AATTAAAATT TGCACCTTTT TTGCCTTCCA GGGCCCCCAT 301 GGATTATTTT TTTTTTTTTT TTTGTTTTTT TATCACCCCC CTTCAAATTT 351 TTTTTTTTTA AACTCCAATT TATAAAATTG GGTTCTTTTA AAGGCATTGG 401 CCTTTTTTTT AATAAAAAAA AAAAAAATTT TTTTTTTTTT TTTTTTTTTT 451 TTTTTTTTTT TTTTTTTTTT TTTTTTTTTT TTTTATAGAT AATTAATAAT 501 ACTGGTACTA ATTTTTAAAA ATTAAATTAA TTATATTAGG TTGTACTCCA 551 AATAATTGTG ATAATAATCC AATTTATAGA ACCAACTGTA TAACAGCAAA 601 ATGTTCAAAT AATGTTTGCG TTACTTCAGC ACCATATTGC AGTTCAACCG 651 AACCAGTAAG TAATAGGTTT TTCTATTATT CTTATTATCA TCCAACATCA 701 CCTATTACTA ATCTTTTTTT AATATTTAAA ATATTATTTA TTATAAAAAT 751 AATAACAACG CAACAATAAT AATAAAGTGT ACAGTTGGTC TTTGTACACC 801 AGGTGTTGGT TGTTCAGTTG TTCCAAAAAA TTGTGTAAAT GAAAATCATT 851 GTACCCAAGA TTCATGTAAT TCAACTATAA ATGCTTGCCA ACATGATCCA 901 ATTCCAGATT GTATCAATTG TGCCTATATT GGTTGTATCA CTACTGATTA 951 TTGTAATGAA CAAGTGTAAT TATTAAATTA ATTAATTATT TTATTTTTAA 1001 TATTATTATT ACTATTATTT TTCTTCCAAT TAGATTTTAA TATTTAATTT 1051 TAATTTTTAG ATGTTCAGCT GATGGAAGAT CATGTGAAAC TAGACCAAAG 1101 AATTGTGATG ATTTAAATTT TTGTACTGTT GATACAGTAA GTAAAATTTT 1151 TTTAATTATT TATCTATAGG TATTTATTGT TTCATTTCTA ATTTTTTTTT 1201 TCTTTTTATC TTCTATTAGT GTTCAAATGG AGTTTGCATT TACACAAGAA 1251 TTGATAATTG TGTAAATTGT ACAGGTCCAG GTATTGGTTG TATTACTACT 1301 GATCAATGTA ATCCAAATGT GTAAATATTA TTATTATTAT TATTATTATT 1351 ATTATTATTA TTATTATTAT TATTATTATT ATTATTATTA TTATTATTAT 1401 TATTATTATT ATTATTATTA TTATTTGAAT ATTTTTTTTC TTTATTTAAT 1451 AATATCTAAA TTAATAATCA ATTATTAAAA AAAAAAAAAC AGATGTTCTC 1501 CAGATGGTAA TTCATGTATC ATTCAACCAA AGAATTGTTC AGATGGTAAT 1551 GCTTGTAATG ATCCATCGTG TGTTTCAGGT GGTATGTGTA TGTTAACCCC 1601 AGTGAATTGT GATGATGGTG ATGATTGTAC TTTTGATTCG TATGTATTTC 1651 TTAATAAATT TTTTTTTTTT TTTTTTAATT GATTTATTAA CTCTTTTTTT 1701 TTTTTTTTTA TTTTTATATT TAAAAAAAAA TAGATGCTCA TCAACTGTAG 1751 GTTGCATACA TACTAATATA TCTAATTGTG TAGAATGTCA AAATATTGCT 1801 TGTATTACAA CTGATTTGTA AGTTTTTTTT TTTTTTTTTT TTTTATTTTT 1851 TTTTTTTTTT TTTTTTTTTT TTTTTCTCAT ATAAAAAAAA ACCAACCCCT 1901 TTTTTTTTTT TTTTTTTTTA AAATAAAAAA AAAAAATTGG AAGGGTAAAA 1951 ATTTGTTTTA AAAAAGGGCC AACATGGGAT ACTGTTCCAA AAACTTGGGA 2001 GGAGGGGGAT TCATTTCCAA AAAATTTTTG GGTCAACCCA AGGGGGCCCT 2051 TTTTTTTTTT AAAAAAATTT AAATTCAACC CCCTTTTTTT CATATTAATT 2101 TAAAAATTTT TTTTAGGGGC CTCCCTTTTT TAACCAAAAC CCAATTTTTT 2151 TATTTGGGGG GGGGAAAAAA GTTTAAAAAC C // crick strand 2181 G GTTTTTAAAC TTTTTTCCCC CCCCCAAATA 2150 AAAAAATTGG GTTTTGGTTA AAAAAGGGAG GCCCCTAAAA AAAATTTTTA 2100 AATTAAT no gene chrblob_3712.glm_2|24oct01 2093 ATG AAA AAA AGG GGG TTG AAT TTA AAT TTT TTT AAA AAA AAA A 2050 AG GGC CCC CTT GGG TTG ACC CAA AAA TTT TTT GGA AAT GAA TCC CCC TCC 2000 TCC CAA GTT TTT GGA ACA GTA TCC CAT GTT GGC CCT TTT TTA AAA CAA AT 1950 T TTT ACC CTT CCA ATT TTT TTT TTT TAT TTT AAA AAA AAA AAA AAA AAA A 1900 AG GGG TTG GTT TTT TTT TAT ATG AGA AAA AAA AAA AAA AAA AAA AAA AAA 1850 AAA AAT AAA AAA AAA AAA AAA AAA AAA ACT TAC AAA TCA GTT GTA ATA CA 1800 A GCA ATA TTT TGA* 1788 CATTCTA CACAATTAGA TATATTAGTA TGTATGCAAC 1750 CTACAGTTG no gene chrblob_3712.glm_1|24oct01 1741 ATG AGC ATC TAT TTT TTT TTA AAT ATA AAA ATA AAA AAA AA 1700 A AAA AAA GAG TTA ATA AAT CAA TTA AAA AAA AAA AAA AAA AAT TTA TTA A 1650 GA AAT ACA TAC GAA TCA AAA GTA CAA TCA TCA CCA TCA TCA CAA TTC ACT 1600 GGG GTT AAC ATA CAC ATA CCA CCT GAA ACA CAC GAT GGA TCA TTA CAA GC 1550 A TTA CCA TCT GAA CAA TTC TTT GGT TGA* 1523 AT GATACATGAA TTACCATCTG 1500 GAGAACATCT GTTTTTTTTT TTTTAATAAT TGATTATTAA TTTAGATATT 1450 ATTAAATAAA GAAAAAAAAT ATTCA AAT AAT AAT AAT AAT AAT AAT AAT A 1400 AT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT 1350 AAT AAT AAT AAT AAT AAT AAT AAT ATTTAC ACATTTGGAT TACATTGATC 1300 AGTAGTAATA CAACCAATAC CTGGACCTGT ACAATTTACA CAATTATCAA 1250 TTCTTGTGTA AATGCAAACT CCATTTGAAC ACTAATAGAA GATAAAAAGA 1200 AAAAAAAAAT TAGAAATGAA ACAATAAATA CCTATAGATA AATAATTAAA 1150 AAAATTTTAC TTACTGTATC AACAGTACAA AAATTTAAAT CATCACAATT 1100 CTTTGGTCTA GTTTCACATG ATCTTCCATC AGCTGAACAT CTAAAAATTA 1050 AAATTAAATA TTAAAATCTA ATTGGAAGAA AAATAATAGT AATAATAATA 1000 TTAAAAATAA AATAATTAAT TAATTTAATA ATTACACTTG TTCATTACAA 950 TAATCAGTAG TGATACAACC AATATAGGCA CAATTGATAC AATCTGGAAT 900 TGGATCATGT TGGCAAGCAT TTATAGTTGA ATTACATGAA TCTTGGGTAC 850 AATGATTTTC ATTTACACAA TTTTTTGGAA CAACTGAACA ACCAACACCT 800 GGTGTACAAA GACCAACTGT ACACTTTATT ATTATTGTTG CGTTGTTATT 750 ATTTTTATAA TAAATAATAT TTTAAATATT AAAAAAAGAT TAGTAATAGG 700 TGATGTTGGA TGATAATAAG AATAATAGAA AAACCTATTA CTTACTGGTT 650 CGGTTGAACT GCAATATGGT GCTGAAGTAA CGCAAACATT ATTTGAACAT 600 TTTGCTGTTA TACAGTTGGT TCTATAAATT GGATTATTAT CACAATTATT 550 TGGAGTACAA CCTAATATAA TTAATTTAAT TTTTAAAAAT TAGTACCAGT 500 ATTATTAATT ATCTATAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA 450 AAAAAAAAAA AAAAAAAAAA AAATTTTTTT TTTTTTTATT AAAAAAAAGG 400 CCAATGCCTT TAAAAGAACC CAATTTTATA AATTGGAGTT TAAAAAAAAA 350 AAATTTGAAG GGGGGTGATA AAAAAACAAA AAAAAAAAAA AAAATAATCC 300 ATGGGGGCCC TGGAAGGCAA AAAAGGTGCA AATTTTAATT GGAAATTTTA 250 AGGGGGGGGG TTCAAAAAAA AAAAAATAAA GGGGGAAATT TGGGCCGGGG 200 GTTAACCCCA AAAAACCCAA GTTAAACTTG GCCTTGGGAA TGGGTGAAAA 150 CCCCCCCAAT CCCCCACCCA AAATTTTTTT ATTAAATCCC CAAACTTTTT 100 TTTACCGGGG AAAATGAAAA ACATCCCCGG TTTTTTTTGG AAAGCGGGTG 50 GGAGCGGGGA ACCCTAAAAA ATTTTTAAAA AAAAAAAATT TAAATTTAAA end of file no similarity to intron Date: Monday, 3/11/2002 Time: 09:38 c3714.txt chrblob_3714|2001.10.15|GENOMIC|Sanger FEATURES Location CDS 363..1190 /gene="chrblob_3714.glm_1|24oct01" /note="(protein coding) 100% identity to rifin PFB0015c - malaria parasite (Plasmodium falciparum)" /codon_start=1 ORIGIN watson strand start chrblob_3714.glm_1|24oct01 vbc note partial gene (exon 1) 1 [...CA] TTA AAT ATA TTG TCA TCA TCA TCA G AA intron G TATGCATTAA ATAATAATTA 51 TAATAATATA AAATTATATA TATGTTTTTT ATCAATCATT ATATATTATA 101 ATTATACCTA TATATCCATA TATGTTGTAT ATAAAAATTA CCTTTATATC 151 AATATTGATT ATATATTATA ATTGTGATAA ATAAATATAA TAATAAATTA 201 CAATTAAACA TAACATATAT ATATATATAT ATATATATAT ATACTTTTTT 251 ATAG exon 2 GTA TAT AAT CAA AGG AAC CAT TAC ATC ACA CGT ACA CCA AAA GCA A 301 CC ACT AGG ACA TTA TGC GAA TGT GAA TTG TAT GCA CCA TCA AAC TAT GAT 351 AAT GAC CCA GAA ATG CAA AAA GTA ATG GAA AAT TAC AAT CGA CAA ACG TC 401 A CAG CGT TTT GAA GAA TAC AAT GAA CGT GTG ATC AAA AAC AGA CAA AAA T 451 GT AAG GAA CAA TGC GAT AAA GAA ATA CAA AAA ATT ATA TTA AAA GAT AAA 501 TTA GAA AAA GAA TTA ATG AAC AAA TTT GCC ACA TTA CAA ACT GAT ATA CA 551 A AGC GAT GCT ATT CCC ACA TGT GTT TGC GAA AAA TCA GTC GCA GAT AAA G 601 TT GAA AAA ACC TGT TTA AAA TGT GGA GGT GTG TTG GGA AGT GGT ATT GCG 651 CCA AGC GTT GGT TTG TTA GGT ACG GTT GCC ATA GAT CAG TGG ACA AAT GC 701 T GCC TTG CTT GAT GCA GCT CAA AAG GGT ATT CAG GCA GGT ATT GAT ACT G 751 TT GTT GCG GAA TTA GAA TAT GTG GCG GAG AGA TTT GAT GAT ATT GGT ATT 801 AAT ATA GTA GGA ATG ATA AAT AAA GAA ACT TAC CGT TGT CCG CAA GCT TT 851 G ATT GAA TCT ATT TAT GCA GCA AAA CAA AAA GTG TGT GAT AAT GTT GGA A 901 AT CCA GGA CCA ACT TGC CAT AGA GTA GGA CAA GAC GGC ACC TCA ATT TGG 951 TTT CGT CCA GAA GTA TTA AAG GCT ACG CAA GAT GGT ATT GAC GCT GCT GA 1001 A ACT GTT GAA AAA GCT GAA ATA GTC TTG ATA AAT GAA GAA AGT GCA CAT T 1051 TG TAC AGT GCA ATT GGT TAC TCC GTC CTT GCC ATA TTA ATT ATA GTT TTG 1101 GTT ATG TTA ATT ATT TAT TTA ATT TTA CGT TAT CGA CGA AAA AAG AAA AT 1151 G AAG AAA AAA CTC CAA TAC ATA AAA CTA TTA GAA GAA TAG* 1190 stop chrblob_3714.glm_1|24oct01 vbc ATATGTGACG 1201 TTTGGTATTT TTCGATGTTG GTAGGAAGTT TGGTACTTGT ATTGTTTTTC 1251 TTTGGATGTA CCGTGTGTTT TTTTTTTTTT TTTCTCCATT ATAAATAACT 1301 ATATATTTTT ATATGTATTG CGCTTTTATA TATAATTTAT TTTTCTATAA 1351 TTTTATTTAT TTATTTATTT ATTTATTTAT TTATTTTCTA AAACTCTTTT 1401 AATTAATAAA CAATGTAATT TTTAATTTAT ATAAAATACT TATACGTATT 1451 ATAATATATT ATTTTTTTAA AACATAATGT AACGTATATT TTTTAAATAC 1501 CTCATATGTT TTTCAAAGGA ATATATATCA AAAAAAAAAA CAATAAAACT 1551 TATTATTATT ATAATTATGA TTATTATGAT TATGATTATT ATGATTACTA 1601 TTATTATAAA TATTTTAAGA AACATATTAT TCAAAATATT ATATCTATAT 1651 TTATATAATT AAAATTAAAA CCAATAAGTA TATTATTTCA ATTCAGAATT 1701 ATCATCCTTA AAAAACCTAT CATATTATAT ATTATGTTAT TTATATTTAT 1751 TTCATAATAT ATTTTATTAT TTTTTTTAAT TATTTTTTAT TAGAAATACT 1801 ACTAATACAA TGAATTCAAA AAATAGTCAA CATATAACAA AATATAATAA 1851 TTACACGTAA TATAACAAAT AGATACAATA CATAAAAAAC CAATAAAAAC 1901 ACAAAAAACA AATCAAATTA ATAAAAATAA AACACAATAA AAAAAAGAAT 1951 AATGTATATT TTTTATTTTA ATATAATAAT ACACTTTTTC TTTATTTTGC 2001 CTTTGTAATT TTTATTATGT TGTTTTATTT AGTATAATAT GTAGATATTT 2051 TTTGTTTATA TATATATATA TTTATTTGAT AATATGTATA TATTTATGAG 2101 ATATAATTTC ATATATATTT CATAATTTAT ATTGTTCTTT TTAATTTTTT 2151 TTTAAGTGTT ATTTGTTTCT ATATTACGGT ATGCATTGAT TTATTATCAT 2201 TATATTTTTA TATATATTAA GTGGCAAAAA GAAAAAAAAA AAAAAATTTG 2251 TTTATTAAAT ATTTTTTCTT CTGTAAAATG TTTTCCATTT TTGTTTATAT 2301 TTATATTTAT ATATTTTTTT TTTTTTTTTT TTTTTTTGGG TATTTTTTAT 2351 ATATATGAAA GTTGTATGAT ATATTTAAAA TTTTTTTTTT TTTTTTTTTT 2401 TTTGGTATTT TTTATATATA TGAAATTTAT TTGAAATATT TCAAAATTTT 2451 CTTTTTTTTT TTTTTTTTTT TTAATTTTTT ATTTGGAAAC CCCCTTTTGG 2501 AAAAAAAAAT TTTAATAAAA ATTTTTATTT TTAAAAATAT TTTTTTTTTT 2551 TTTTTTTTAA TAAAAAAAAA AGGGAAAATT TTTAAAATAA AAATTAAAAT 2601 TTTAAATTTT TAAAGGCCTG GGTTCCCCCA TAAAATTAAA AGGTTTCCCG 2651 GGAATTCCCC CCTCTAAAAA TTTTCCCTTT AAAGAGGGGT TTAATACCCC 2701 TTTTCCCAAT TGTGATTTTT TTTTTTTTTC CATGCGTTTC CCATAGGTTA 2751 TGGTTTTTAA TTTAAAAATT TTAACCCTTA TTGGGCTCCC TTTAAACTTT 2801 TTTTTTTAAC CCC // crick strand 2813 GGG GTTAAAAAAA 2800 AAAGTTTAAA GGGAGCCCAA TAAGGGTTAA AATTTTTAAA TTAAAAACCA 2750 TAACCTATGG GAAACGCATG GAAAAAAAAA AAAAATCACA ATTGGGAAAA 2700 GGGGTATTAA ACCCCTCTTT AAAGGGAAAA TTTTTAGAGG GGGGAATTCC 2650 CGGGAAACCT TTTAATTTTA TGGGGGAACC CAGGCCTTTA AAAATTTAAA 2600 ATTTTAATTT TTATTTTAAA AATTTTCCCT TTTTTTTTTA TTAAAAAAAA 2550 AAAAAAAAAA ATATTTTTAA AAATAAAAAT TTTTATTAAA ATTTTTTTTT 2500 CCAAAAGGGG GTTTCCAAAT AAAAAATTAA AAAAAAAAAA AAAAAAAAAG 2450 AAAATTTTGA AATATTTCAA ATAAATTTCA TATATATAAA AAATACCAAA 2400 AAAAAAAAAA AAAAAAAAAA TTTTAAATAT ATCATACAAC TTTCATATAT 2350 ATAAAAAATA CCCAAAAAAA AAAAAAAAAA AAAAAAATAT ATAAATATAA 2300 ATATAAACAA AAATGGAAAA CATTTTACAG AAGAAAAAAT ATTTAATAAA 2250 CAAATTTTTT TTTTTTTTTC TTTTTGCCAC TTAATATATA TAAAAATATA 2200 ATGATAATAA ATCAATGCAT ACCGTAATAT AGAAACAAAT AACACTTAAA 2150 AAAAAATTAA AAAGAACAAT ATAAATTATG AAATATATAT GAAATTATAT 2100 CTCATAAATA TATACATATT ATCAAATAAA TATATATATA TATAAACAAA 2050 AAATATCTAC ATATTATACT AAATAAAACA ACATAATAAA AATTACAAAG 2000 GCAAAATAAA GAAAAAGTGT ATTATTATAT TAAAATAAAA AATATACATT 1950 ATTCTTTTTT TTATTGTGTT TTATTTTTAT TAATTTGATT TGTTTTTTGT 1900 GTTTTTATTG GTTTTTTATG TATTGTATCT ATTTGTTATA TTACGTGTAA 1850 TTATTATATT TTGTTATATG TTGACTATTT TTTGAATTCA TTGTATTAGT 1800 AGTATTTCTA ATAAAAAATA ATTAAAAAAA ATAATAAAAT ATATTATGAA 1750 ATAAATATAA ATAACATAAT ATATAATATG ATAGGTTTTT TAAGGATGAT 1700 AATTCTGAAT TGAAATAATA TACTTATTGG TTTTAATTTT AATTATATAA 1650 ATATAGATAT AATATTTTGA ATAATATGTT TCTTAAAATA TTTATAATAA 1600 TAGTAATCAT AATAATCATA ATCATAATAA TCATAATTAT AATAATAATA 1550 AGTTTTATTG TTTTTTTTTT TGATATATAT TCCTTTGAAA AACATATGAG 1500 GTATTTAAAA AATATACGTT ACATTATGTT TTAAAAAAAT AATATATTAT 1450 AATACGTATA AGTATTTTAT ATAAATTAAA AATTACATTG TTTATTAATT 1400 AAAAGAGTTT TAGAAAATAA ATAAATAAAT AAATAAATAA ATAAATAAAA 1350 TTATAGAAAA ATAAATTATA TATAAAAGCG CAATACATAT AAAAATATAT 1300 AGTTATTTAT AATGGAGAAA AAAAAAAAAA AAACACACGG TACATCCAAA 1250 GAAAAACAAT ACAAGTACCA AACTTCCTAC CAACATCGAA AAATACCAAA 1200 CGTCACATAT "chrblob_3714.glm_1|24oct01" 1190 CTATTCTTCT AATAGTTTTA TGTATTGGAG TTTTTTCTTC 1150 ATTTTCTTTT TTCGTCGATA ACGTAAAATT AAATAAATAA TTAACATAAC 1100 CAAAACTATA ATTAATATGG CAAGGACGGA GTAACCAATT GCACTGTACA 1050 AATGTGCACT TTCTTCATTT ATCAAGACTA TTTCAGCTTT TTCAACAGTT 1000 TCAGCAGCGT CAATACCATC TTGCGTAGCC TTTAATACTT CTGGACGAAA 950 CCAAATTGAG GTGCCGTCTT GTCCTACTCT ATGGCAAGTT GGTCCTGGAT 900 TTCCAACATT ATCACACACT TTTTGTTTTG CTGCATAAAT AGATTCAATC 850 AAAGCTTGCG GACAACGGTA AGTTTCTTTA TTTATCATTC CTACTATATT 800 AATACCAATA TCATCAAATC TCTCCGCCAC ATATTCTAAT TCCGCAACAA 750 CAGTATCAAT ACCTGCCTGA ATACCCTTTT GAGCTGCATC AAGCAAGGCA 700 GCATTTGTCC ACTGATCTAT GGCAACCGTA CCTAACAAAC CAACGCTTGG 650 CGCAATACCA CTTCCCAACA CACCTCCACA TTTTAAACAG GTTTTTTCAA 600 CTTTATCTGC GACTGATTTT TCGCAAACAC ATGTGGGAAT AGCATCGCTT 550 TGTATATCAG TTTGTAATGT GGCAAATTTG TTCATTAATT CTTTTTCTAA 500 TTTATCTTTT AATATAATTT TTTGTATTTC TTTATCGCAT TGTTCCTTAC 450 ATTTTTGTCT GTTTTTGATC ACACGTTCAT TGTATTCTTC AAAACGCTGT 400 GACGTTTGTC GATTGTAATT TTCCATTACT TTTTGCAT 363 "chrblob_3714.glm_1|24oct01" TT CTGGGTCATT 350 ATCATAGTTT GATGGTGCAT ACAATTCACA TTCGCATAAT GTCCTAGTGG 300 TTGCTTTTGG TGTACGTGTG ATGTAATGGT TCCTTTGATT ATATACCTAT 250 AAAAAAGTAT ATATATATAT ATATATATAT ATATATGTTA TGTTTAATTG 200 TAATTTATTA TTATATTTAT TTATCACAAT TATAATATAT AATCAATATT 150 GATATAAAGG TAATTTTTAT ATACAACATA TATGGATATA TAGGTATAAT 100 TATAATATAT AATGATTGAT AAAAAACATA TATATAATTT TATATTATTA 50 TAATTATTAT TTAATGCATA CTTCTGATGA TGATGACAAT ATATTTAATG end of file 3715 10 3716 10 3717 7 3718 4 3721 9 3722 10 1437557w LSA liver stage antigen 3723 3 3726 12 3727 2 3728 4 3730 3 3731 9 Date: Monday, 3/11/2002 Time: 16:50 c3733.txt chrblob_3733|2001.10.15|GENOMIC|Sanger FEATURES Location CDS 408..953 /gene="chrblob_3733.gen_1|24oct01" /note="(protein coding) 39% identity to EA59 GENE PROTEIN" /codon_start=1 CDS join(1042..1662,1827..2183) /gene="chrblob_3733.gen_2|24oct01" /note="(protein coding) 30% identity to EA31 GENE PROTEIN" /codon_start=1 CDS 2347..2691 /gene="chrblob_3733.gen_3|24oct01" /note="(protein coding) No NR protein Similarities" /codon_start=1 cds complement(1103..1402) /gene="chrblob_3733.gen_4|24oct01" /note="(protein coding) No NR protein Similarities" /codon_start=1 ORIGIN watson strand centromere ? 1 AAGAGGGAGT GTCCATAGAC GTGGACCTTC AGCCAGATGA CCCTGTGCCA 51 GGCCGAATCC TCGCGATCAT TGGTCGCAAC GGAGTGGGGA AGACTCAATT 101 TTTAGCCCAG CTTGCACGAG ACCTTGCGAC GACAAAGCGG GTGTCGATAG 151 AGACAGCCAG CCAAGTAGAG TCTGCTTTTG AGCCTGCCAG ACCTCTTTTC 201 TCACGAGTCA TCGCGTTGTC CTTCAGCGCA TTCGACAAGT TCCAGCGCCC 251 CGAGCCGGAG AAGTACTTCA GCTATATCTA CTGCGGGGTG CGTGATGACA 301 GCGGCGGAAT TTCTAGGCGA GCACTTGAAG CGAAGCACCT TGAGTACCTA 351 AAGCGCATCG TTGAACAAGA CCGTGAGGAC CATTGGGAGC AGCACGTTGC 401 GAACGTA 408 ATG GGC GTT CCG AAG AAA ATT ATC TCC ATT ACG GAG CAC ATC G 451 AG GAG CTT GAG AAG AGC CTG CCG CCC ACC ATG AGC TCC GGG CAG TCC ATC 501 CTG GCC TAC TTC ATT TCG GCT GCA CTG GCT TAC CTC AAG GAA GGG TCG CT 551 G GTC ATC TTC GAC GAG CCC GAA ATT CAC CTG CAT CCC AAT GCA GTT GCG C 601 TG CTG ATG CAG ACC TTG CAG GCA CTG CTG AAG GAG TTC GAC TCG TAC GCA 651 ATC ATC GCG ACC CAT TCA CCG GTG GTG ATC CAG GAG GTT CCC CGC AAG CG 701 G GTC ATT CGG TTT GAG CGT GAA GGC AAC ATC ACC ACT GGC AGT CCC CTC G 751 GC CAT GAG TCA TTT GGG GAG AAT ATC GCC GAG CTG ACC CGC CTG GTG TTT 801 GAG ACT GTC GAG ATT CCA AAT TTC TAT AAG AAG ACA TTA CAG GCG CTG GC 851 C AAG AAA CAC GAT TTC GAC ACG GTC GCC AAG ATG TTC GAC GAA CAG CTA A 901 GC CTG CAC GCA ACG GCG TAC CTT GCC TCG CTG TAC GAG GAC GGG GAT GCA 951 TAA GCTTACC CTTGCAGCCG GTCTCCCGAG AGAGCATTTT TCCGGTATCG 1001 TCGATGGGAA AAGCGGTGAC CGAGGCGCCC GATTGACGGA C ATG CTA CCG 1051 GTA GTC CAA GCT CAC TAT GGA GTC TTT GAG GCT GCC TAT ACA GTG GCG GA 1101 C ATC AGT GGT GTG GCT CAG GGC ACT TGG ACG AAG ACT GAA CGT GAA GAC C 1151 TG CTG CAC TGC TAT GAG ACC ACG GCC AAG GCT CTG CAG CAA CTG AAG ACG 1201 CTG ATT TTA GAC AGC CAG CCG GAA GGC ATT CGA GAG GTT TGC CCT TAC TG 1251 C GGC ATC GGT GGC CCC AGG CAG TTT GAC CAC TAT TTG CCA AAA GAG AAG T 1301 TC CCC GAG TAC AGC GTC CAC TCG TAC AAC TTG GTG CCG TGC TGT GGC GTC 1351 TGC AAT GGC AAG AAG GCC GAT ATC TGG CTG CAG CCC AAC AAC ACC CGG AC 1401 A TTC ATC AAT TTT TAT CTC GAC TCT TTG CCT GCA GTG CCG ATG CTC GAC G 1451 TC ACG GTT CAA TGG TCA GTG AAG AAC GGC AAG CTC GTC CCG GTG TCG ATA 1501 TTT CAG TTA GTC TGT CCA GCT GGG TTT GGA GCA GCT GAG TTC CAG CTC GT 1551 C TCG AAT CAC TTC CAG AAG CTG GGT TTG CTC GCA AGG TAC AAG GAC CAG G 1601 CG CAC ACT GAG TTC CTT GCC ATT CGA AAT GCT GCG CTT TCC AGA GAG GCG 1651 AAG ACT GTA GTG GTGCTGCG TCGGTTTTTG GGAGAATTTG TCAAGAATTG 1701 GGAGCAGACT TTGGGACCGT TGAACTGGCG CATCTCGCTC TACCGAGCGC 1751 TGATTGCACA CACAGACTTC CTGCAGACTT GCCTCAAGCC ATAGGCTAAC 1801 AGTTTGGACT GTCCCTGATA GGGGAG 1827 ACT GGC CTG CGG TGT ATC GGC ACC 1851 ACC CGA TCG CCT GCG ACG GAA CGG CGG GTC TGT CCG ATA CCG ACG TTC AG 1901 C GGG AGC TCA AAG AAC AGC TGC AGC GCT GCC ATA TGG AGT GGT CCC GGT C 1951 TA GTA GAC AAA CCC CAG CCT CAA GCC GAG GCG CGT TCA AGC GTC TCA GAT 2001 CTA GCG CCG GTC AGA GGT AGC AGT GGC GGG GAG CTT CGC CGA TGG TTG CG 2051 T TTT TTA AAT CAT CCA TCC TCT GTG CGA TTT GCT CTC GGC ACA GCA GGT G 2101 AT GCT GCG TGC GGC GGA TGT CTG CCT GTG TTT CCG ACA TTA GCT AGG CCC 2151 ATC GAT CGT CGC GGA CGT ACG AAG GCC GCA TGA ATGCTGG ATCCCAGTTT 2201 CCAATTAACC CAAGAACAGC CGGCGCGGGC ATAGCGTCGG CTTGCGGCTA 2251 AAGCAACCGT TTGAGCGCGC TGGAAACTCC ATTGAGCATC TCCAGCGCTG 2301 GAGCGTGACA CCCTCTACCC CTGCGGGACA GGAGGCTGCA ATCACG 2347 ATG C 2351 GA GAA TCT TGC GCA ACG TCG AGC AGG CAT TGC TCA ATG CAC ATG CCG ATG 2401 ATG AAT GTC CGG GTA GTG CGG ATG CCT GTG AGT CAG CAC CTC GTG CGT AT 2451 G GGC ATG GAC ATG AGG TTC TTT GCC GCC CCA TTC AGC GCC ATG GCC ATG T 2501 TG ATG GTG CTC ATC ATG TCG GTG GCT GTG CGT ATG CAC GAT CGG CTC ATG 2551 CGA GTG CTC ATG CTC ATG ACG CTC TCG CAG GTG AAG CCA AAC GCC GAT GC 2601 C CAT GAA CAC TGC CGC CGC CCA GAA CAG CGT GGA GGG CGC TTC TTG CAA A 2651 AT GGC GAA CGA CAG TGC CAC ACC GAA CAG CGG TCG ACG GAG 2691 // crick strand 2691 C TCCGTCGACC GCTGTTCGGT GTGGCACTGT CGTTCGCCAT 2650 TTTGCAAGAA GCGCCCTCCA CGCTGTTCTG GGCGGCGGCA GTGTTCATGG 2600 GCATCGGCGT TTGGCTTCAC CTGCGAGAGC GTCATGAGCA TGAGCACTCG 2550 CATGAGCCGA TCGTGCATAC GCACAGCCAC CGACATGATG AGCACCATCA 2500 ACATGGCCAT GGCGCTGAAT GGGGCGGCAA AGAACCTCAT GTCCATGCCC 2450 ATACGCACGA GGTGCTGACT CACAGGCATC CGCACTACCC GGACATTCAT 2400 CATCGGCATG TGCATTGAGC AATGCCTGCT CGACGTTGCG CAAGATTCTC 2350 GCATCGTGAT TGCAGCCTCC TGTCCCGCAG GGGTAGAGGG TGTCACGCTC 2300 CAGCGCTGGA GATGCTCAAT GGAGTTTCCA GCGCGCTCAA ACGGTTGCTT 2250 TAGCCGCAAG CCGACGCTAT GCCCGCGCCG GCTGTTCTTG GGTTAATTGG 2200 AAACTGGGAT CCAGCATTCA TGCGGCCTTC GTACGTCCGC GACGATCGAT 2150 GGGCCTAGCT AATGTCGGAA ACACAGGCAG ACATCCGCCG CACGCAGCAT 2100 CACCTGCTGT GCCGAGAGCA AATCGCACAG AGGATGGATG ATTTAAAAAA 2050 CGCAACCATC GGCGAAGCTC CCCGCCACTG CTACCTCTGA CCGGCGCTAG 2000 ATCTGAGACG CTTGAACGCG CCTCGGCTTG AGGCTGGGGT TTGTCTACTA 1950 GACCGGGACC ACTCCATATG GCAGCGCTGC AGCTGTTCTT TGAGCTCCCG 1900 CTGAACGTCG GTATCGGACA GACCCGCCGT TCCGTCGCAG GCGATCGGGT 1850 GGTGCCGATA CACCGCAGGC CAGTCTCCCC TATCAGGGAC AGTCCAAACT 1800 GTTAGCCTAT GGCTTGAGGC AAGTCTGCAG GAAGTCTGTG TGTGCAATCA 1750 GCGCTCGGTA GAGCGAGATG CGCCAGTTCA ACGGTCCCAA AGTCTGCTCC 1700 CAATTCTTGA CAAATTCTCC CAAAAACCGA CGCAGCACCA CTACAGTCTT 1650 CGCCTCTCTG GAAAGCGCAG CATTTCGAAT GGCAAGGAAC TCAGTGTGCG 1600 CCTGGTCCTT GTACCTTGCG AGCAAACCCA GCTTCTGGAA GTGATTCGAG 1550 ACGAGCTGGA ACTCAGCTGC TCCAAACCCA GCTGGACAGA CTAACTGAAA 1500 TATCGACACC GGGACGAGCT TGCCGTTCTT CACTGACCAT TGAACCGTGA 1450 CGTCGAGCAT CGGCACTGCA GGCAAAGAGT CGAGATAAAA ATTGATGA 1402 AT 1400 GTCCGGGTGT TGTTGGGCTG CAGCCAGATA TCGGCCTTCT TGCCATTGCA 1350 GACGCCACAG CACGGCACCA AGTTGTACGA GTGGACGCTG TACTCGGGGA 1300 ACTTCTCTTT TGGCAAATAG TGGTCAAACT GCCTGGGGCC ACCGATGCCG 1250 CAGTAAGGGC AAACCTCTCG AATGCCTTCC GGCTGGCTGT CTAAAATCAG 1200 CGTCTTCAGT TGCTGCAGAG CCTTGGCCGT GGTCTCATAG CAGTGCAGCA 1150 GGTCTTCACG TTCAGTCTTC GTCCAAGTGC CCTGAGCCAC ACCACTGA TG 1100 TCCGCCACTG TATAGGCAGC CTCAAAGACT CCATAGTGAG CTTGGACTAC 1050 CGGTAGCATG TCCGTCAATC GGGCGCCTCG GTCACCGCTT TTCCCATCGA 1000 CGATACCGGA AAAATGCTCT CTCGGGAGAC CGGCTGCAAG GGTAAGCTTA 950 TGCATCCCCG TCCTCGTACA GCGAGGCAAG GTACGCCGTT GCGTGCAGGC 900 TTAGCTGTTC GTCGAACATC TTGGCGACCG TGTCGAAATC GTGTTTCTTG 850 GCCAGCGCCT GTAATGTCTT CTTATAGAAA TTTGGAATCT CGACAGTCTC 800 AAACACCAGG CGGGTCAGCT CGGCGATATT CTCCCCAAAT GACTCATGGC 750 CGAGGGGACT GCCAGTGGTG ATGTTGCCTT CACGCTCAAA CCGAATGACC 700 CGCTTGCGGG GAACCTCCTG GATCACCACC GGTGAATGGG TCGCGATGAT 650 TGCGTACGAG TCGAACTCCT TCAGCAGTGC CTGCAAGGTC TGCATCAGCA 600 GCGCAACTGC ATTGGGATGC AGGTGAATTT CGGGCTCGTC GAAGATGACC 550 AGCGACCCTT CCTTGAGGTA AGCCAGTGCA GCCGAAATGA AGTAGGCCAG 500 GATGGACTGC CCGGAGCTCA TGGTGGGCGG CAGGCTCTTC TCAAGCTCCT 450 CGATGTGCTC CGTAATGGAG ATAATTTTCT TCGGAACGCC CATTACGTTC 400 GCAACGTGCT GCTCCCAATG GTCCTCACGG TCTTGTTCAA CGATGCGCTT 350 TAGGTACTCA AGGTGCTTCG CTTCAAGTGC TCGCCTAGAA ATTCCGCCGC 300 TGTCATCACG CACCCCGCAG TAGATATAGC TGAAGTACTT CTCCGGCTCG 250 GGGCGCTGGA ACTTGTCGAA TGCGCTGAAG GACAACGCGA TGACTCGTGA 200 GAAAAGAGGT CTGGCAGGCT CAAAAGCAGA CTCTACTTGG CTGGCTGTCT 150 CTATCGACAC CCGCTTTGTC GTCGCAAGGT CTCGTGCAAG CTGGGCTAAA 100 AATTGAGTCT TCCCCACTCC GTTGCGACCA ATGATCGCGA GGATTCGGCC 50 TGGCACAGGG TCATCTGGCT GAAGGTCCAC GTCTATGGAC ACTCCCTCTT centromere ? end of file 3734 9 3735 9 Date: Monday, 3/11/2002 Time: 16:53 c3736.txt chrblob_3736|2001.10.15|GENOMIC|Sanger FEATURES Location CDS complement(1811..2056) /gene="chrblob_3736.glm_1|24oct01" /note="(protein coding) 65% identity to (AB053203) Psi facor [Dictyostelium discoideum]" /codon_start=1 ORIGIN watson strand 1 ATTACACTTT ACACAGTTTT CAATTGGTAC AGCTGTGCAT ATACCTATTA 51 TATTTTTAAA AATGATAGAG AGAGATTTAA TTATAATTAA ACTAAAATTA 101 TTTCATATTA TAAAATTAAT TTACATACCA TCTGGTGAAT GACATTGATT 151 TAAAGTACAT GGTTTATTAT CATTACAAGT TTTAGGTATA CTGACACATG 201 TTGTTGAACC ATCAGTTGGA CAAGATAATG GTGAACATAA ATCTAGTGTT 251 ATACAATTAA ATGTACCACA ATCAGTACAA TTCTGTAATA TTTCATGTGC 301 ACAAGTACCA TTGGGACTAA TACATCTATC ATTTGAACAG GCATTACCAT 351 CATCACATAC TTTTGGAACT TCTGTACATT TAGTACCATT ATCAGTACAT 401 CTATTTTATC AGTAAAAAAG GAAATCAACA TTTGGTTTTT TTTTTTTTTT 451 TTTTTTTTTT TTTTTTTTTT TGTAAAAAAT CTTACAATTT TTGGTTACAA 501 AGGTCAGTGG TAATACAAGC AAGTCCAGTA CAAGCAATAC AATTGTCCAA 551 AGGAGTATGG ACACAACCTA AAGTTTCATC ACATCTGTGT TATTATTAAA 601 AAAATGATAT TGTTAAACAA ATAAAAATTA ATTTTCCTTT TTTAATAAAT 651 TATAAAAAAA CTTACGTATC TACTGTGCAA TCATCAACAT CATCACAATC 701 TATTGGAATA AATAAACAAT GTCCTGCAAA ACACTAAATA GTTTAGAAAT 751 TCCATGTTAA TAAAATTATA AAAAAAAGTA TTTGTGCCAT AAAATTGATT 801 ATATAATATT TACAAAATCC TTAGTACAAG TTTTATTATC ATTACATAGA 851 ACTTCAGTTA AACATGATTT TCCATCTGGA GCACATCTAT TAAATTTAAA 901 TATATAATTA GTAATTTTTA AAAATAGAAT TTTTTAAAAT CTTTGAATAC 951 AAACACTTTA GGATTACAAT CATTAGTGGT AATACAACCA GTACCTGCAC 1001 AATTGACACA TTTTGGTATT GGCGTATGGA TACAAATACC ATCTTGACAC 1051 TTTTTTATTA TATTTTATTT TATTAAATTA GTAACATATT AAAAAAGTTT 1101 TTACATATAA TCCAAAACTT ACAGTATCAG TAGTACAATA ATCTCTATCA 1151 TCACAATTCT TATTTGATGA TACACAATTT CCTTTAGAAT CACATCTAAT 1201 TAATTAAAAA ATTAAAAAAA TTATTTTAAT TAAACAAACA AATTAATAAA 1251 TTAGAACCTT TGAATAACCA TAAACATTAT ATTACATACT TTTGTGGGAA 1301 ACATAAATCA GTGGTAATAC AAGGTCCATT CGAACATGAA ACACAATTTG 1351 CGATTGGTGA ACGTTCACAT GTGTTGGTAT CTTTATTACA AAAACTATTT 1401 TCACAATTTG TTCTATTACA TGTTATCTCT GAATAAGAAC AACCAAAATT 1451 TGGAATACAA GTACCAGCTT CACAAGGATT AATCGATGGG CAACTTGGTG 1501 CAGATTTAAC ACAAACATTA TTTGAGCATT GTGCTGTAAT ACAATTCAAT 1551 TTATTATTTG GATTATCATT ACAATTACTT TTGGTACAAC CTTTATTTTT 1601 TTTTTTTTTT TTTTTAAAAA TCAATTAATA ATAAAGCATT ATTGTTTAAA 1651 ACTTATAATA ATATTAAAAA TACCTACAAG AAGATCCATC ACCTTGGCAA 1701 ACACCACATT CATCGTATCC ACTTATTAAT TTTTAGTAAA TGAAAATTAA 1751 TAAATACTTT ATTTGAAAAT AAAATTATAA TTATAATCTT AAAATTGGAT 1801 TAAAAAATAC "chrblob_3736.glm_1|24oct01" 1811 TTACGGACAT GTTAACTCTA TAGATGTTTC GATTGAAATA 1851 TGAGATTCAG TTGTATGGCG TTCACAATAA AAGAAATCAA ATGGATAATT 1901 GGTGCCCTCA GTCAAACCTA ATCTATCCAA ATTAATACTT GTTGTTGCTT 1951 TACCGTGAAT TCCTCCCAAA TCAACAACTA ATATTTTATT CATAAATACC 2001 CAAACATCAT CATCACCATT AAAATAGAAA GTATCACCTT TCTTATATGC 2051 AAACAT 2056 "chrblob_3736.glm_1|24oct01" TGAG TGAATTTGCA AACCTATATA TTGAAAATTT TCAATTAATA 2101 CTTTTCATTA ATCCATTGGT TATTTTTACT TACAAAAGTG AAAATTATGT 2151 GGTGTTCCAC GTTCATCTCT ATATACGGCT TCATATGGAT AATTTGTCTT 2201 TGTGTTTCAA TTAAAAAAAA AATGATAATA ATAAAAAATA ATTAAATTTA 2251 TGAATTTTAA AAAAATAATA ATATTGAAAA ATAAAATTAT AACACACACC 2301 TTATTATCAA ATCCTTGTCC ATCTATTGGA AAAAAGGCAT CATTTGTATA 2351 TGCATAAACA TTTGGATTTG TAGTACTTTG AGTTAAAGTA ATTTGATAAT 2401 TAATTGGTAA ATTTACTCCT GGATAATTGT GAAACCATTG ATTAAAAGTT 2451 TCTGGTGAAT GAATTGTTGA TGATCGCTCA GCCACTAAAA ATAATTGGAA 2501 ATTTTATTTC TATGTAATTT GTTTT // crick strand 2525 AAAAC AAATTACATA GAAATAAAAT 2500 TTCCAATTAT TTTTAGTGGC TGAGCGATCA TCAACAATTC ATTCACCAGA 2450 AACTTTTAAT CAATGGTTTC ACAATTATCC AGGAGTAAAT TTACCAATTA 2400 ATTATCAAAT TACTTTAACT CAAAGTACTA CAAATCCAAA TGTTTATGCA 2350 TATACAAATG ATGCCTTTTT TCCAATAGAT GGACAAGGAT TTGATAATAA 2300 GGTGTGTGTT ATAATTTTAT TTTTCAATAT TATTATTTTT TTAAAATTCA 2250 TAAATTTAAT TATTTTTTAT TATTATCATT TTTTTTTTAA TTGAAACACA 2200 AAGACAAATT ATCCATATGA AGCCGTATAT AGAGATGAAC GTGGAACACC 2150 ACATAATTTT CACTTTTGT AAGTAAAAATA ACCAATGGAT TAA TGA AAA G 2100 TA TTA ATT GAA AAT TTT CAA TAT ATA GGT TTG CAA ATT CAC TCA no gene chrblob_3736.glm_1|24oct01 2056 ATG TTT 2050 GCA TAT AAG AAA GGT GAT ACT TTC TAT TTT AAT GGT GAT GAT GAT GTT TG 2000 G GTA TTT ATG AAT AAA ATA TTA GTT GTT GAT TTG GGA GGA ATT CAC GGT A 1950 AA GCA ACA ACA AGT ATT AAT TTG GAT AGA TTA GGT TTG ACT GAG GGC ACC 1900 AAT TAT CCA TTT GAT TTC TTT TAT TGT GAA CGC CAT ACA ACT GAA TCT CA 1850 T ATT TCA ATC GAA ACA TCT ATA GAG TTA ACA TGT CCG TAA* 1811 GTATTTTTTA 1800 ATCCAATTTT AAGATTATAA TTATAATTTT ATTTTCAAAT AAAGTATTTA 1750 TTAATTTTCA TTTACTAAAA ATTAATAAGT GGATACGATG AATGTGGTGT 1700 TTGCCAAGGT GATGGATCTT CTTGTAGGTA TTTTTAATAT TATTATAAGT 1650 TTTAAACAAT AATGCTTTAT TATTAATTGA TTTTTAAAAA AAAAAAAAAA 1600 AAAAATAAAG GTTGTACCAA AAGTAATTGT AATGATAATC CAAATAATAA 1550 ATTGAATTGT ATTACAGCAC AATGCTCAAA TAATGTTTGT GTTAAATCTG 1500 CACCAAGTTG CCCATCGATT AATCCTTGTG AAGCTGGTAC TTGTATTCCA 1450 AATTTTGGTT GTTCTTATTC AGAGATAACA TGTAATAGAA CAAATTGTGA 1400 AAATAGTTTT TGTAATAAAG ATACCAACAC ATGTGAACGT TCACCAATCG 1350 CAAATTGTGT TTCATGTTCG AATGGACCTT GTATTACCAC TGATTTATGT 1300 TTCCCACAAA AGTATGTAAT ATAATGTTTA TGGTTATTCA AAGGTTCTAA 1250 TTTATTAATT TGTTTGTTTA ATTAAAATAA TTTTTTTAAT TTTTTAATTA 1200 ATTAGATGTG ATTCTAAAGG AAATTGTGTA TCATCAAATA AGAATTGTGA 1150 TGATAGAGAT TATTGTACTA CTGATACTGT AAGTTTTGGA TTATATGTAA 1100 AAACTTTTTT AATATGTTAC TAATTTAATA AAATAAAATA TAATAAAAAA 1050 GTGTCAAGAT GGTATTTGTA TCCATACGCC AATACCAAAA TGTGTCAATT 1000 GTGCAGGTAC TGGTTGTATT ACCACTAATG ATTGTAATCC TAAAGTGTTT 950 GTATTCAAAG ATTTTAAAAA ATTCTATTTT TAAAAATTAC TAATTATATA 900 TTTAAATTTA ATAGATGTGC TCCAGATGGA AAATCATGTT TAACTGAAGT 850 TCTATGTAAT GATAATAAAA CTTGTACTAA GGATTTTGTA AATATTATAT 800 AATCAATTTT ATGGCACAAA TACTTTTTTT TATAATTTTA TTAACATGGA 750 ATTTCTAAAC TATTTAGTGT TTTGCAGGAC ATTGTTTATT TATTCCAATA 700 GATTGTGATG ATGTTGATGA TTGCACAGTA GATACGTAAG TTTTTTTATA 650 ATTTATTAAA AAAGGAAAAT TAATTTTTAT TTGTTTAACA ATATCATTTT 600 TTTAATAATA ACACAGATGT GATGAAACTT TAGGTTGTGT CCATACTCCT 550 TTGGACAATT GTATTGCTTG TACTGGACTT GCTTGTATTA CCACTGACCT 500 TTGTAACCAA AAATTGTAAG ATTTTTTACA AAAAAAAAAA AAAAAAAAAA 450 AAAAAAAAAA AAAAACCAAA TGTTGATTTC CTTTTTTACT GATAAAATAG 400 A TGT ACT GAT AAT GGT ACT AAA TGT ACA GAA GTT CCA AAA GTA TGT GAT G 350 AT GGT AAT GCC TGT TCA AAT GAT AGA TGT ATT AGT CCC AAT GGT ACT TGT 300 GCA CAT GAA ATA TTA CAG AAT TGT ACT GAT TGT GGT ACA TTT AAT TGT AT 250 A ACA CTA GAT TTA TGT TCA CCA TTA TCT TGT CCA ACT GAT GGT TCA ACA A 200 CA TGT GTC AGT ATA CCT AAA ACT TGT AAT GAT AAT AAA CCA TGT ACT TTA 150 AAT CAA TGT CAT TCA CCA GAT GGT ATG TAA ATTAATTTTA TAATATGAAA 100 TAATTTTAGT TTAATTATAA TTAAATCTCT CTCTATCATT TTTAAAAATA 50 TAATAGGTAT ATGCACAGCT GTACCAATTG AAAACTGTGT AAAGTGTAAT end of file 3737 9 3738 4 3739 9 3740 9 3741 4 3742 3 3744 9 Date: Monday, 3/11/2002 Time: 16:55 c3745.txt chrblob_3745|2001.10.15|GENOMIC|Sanger FEATURES Location CDS complement(267..473) /gene="chrblob_3745.glm_2|24oct01" /note="(protein coding) No NR protein Similarities" /codon_start=1 CDS complement(718..2661) /gene="chrblob_3745.glm_1|24oct01" /note="(protein coding) 28% identity to CIGB PROTEIN (FRAGMENT)" /codon_start=1 ORIGIN watson strand 1 ACAAAAAATT TAAAACCCAA ATTATTATAA TATTACTACA AAAATTTTAA 51 TTTACTTCCT CTTGTTCTTT TATTTATAAA TTTAACTAAA AAAATAACAA 101 AAAAAAGGTT TATCCAAATT TTTTTTTTTT TTTTAATTTT TTCACTTCCA 151 TTTAGATATT TGAACCAATC TATTTATTAA TCTTAAATAT TGTAAATCTT 201 TTTCTAAATC TTTTCTTATT TCTAAATCAT GATAATTCAT TATTTTAAAA 251 ACATTACATG GTTGAA "chrblob_3745.glm_2|24oct01" 267 CTAA AATATATATA TATATATAAT TAGAATATTG 301 ATATCTTTTA ATTTGAAATA ATTATAATTA TTATACATAC CAGGTAATTC 351 ATAATTAGAA GTGACTAAAC CTGCATATTC GGATGTTGAA ACTTGATCAG 401 AAAAAGTGAT AGCTAAAATG GGAACAATAC CCAAAGCAAT TGATTCTTTC 451 ATTCTTTTTT CCATTTTTCT CAT 473 "chrblob_3745.glm_2|24oct01" TGTTTCA ACACTGGTGA AACTTTTTAT 501 TGATACAACA AATAAGAATA CATTAACTGA AAATTCTGGT TTAGGAATAC 551 TGCCAATATT AAATTTTTCA TTAATTGCTA AATTATTATA AACTCTACCC 601 TGAACTTTAT ATTTTAATTC TATATCACTA TCACATAATC CCCACTATTT 651 ATAAAAAAAA AAAAAACCCA TTGATTAGTT TTATTATAAT TAAATAATTA 701 AACAATTATA ATAATAA "chrblob_3745.glm_1|24oct01" 718 TTA ACTTACAGTA TCTACGAATG AAATATCAAA 751 ACCACTTAAA AATGAATTTG AAAATGGATC ATTTGAATAA TTTGAATCGA 801 TAATACTTTT AATTGATCTA TAAGTGATAC GATTAGTTGA GAAATAAGTG 851 CTACCACCAT GTTCTTCAGA GAAATTTTGT TGAATTGTAG AAGATAAATT 901 GAAAAGATTA ATTAAACCCA TAATTAAAGA AGTTTTACCT GAAGAAGCAC 951 AACCTTCCAA ACCAATGGTT AAACGTTTAT TTGGTTTTAA ATCACCTAAA 1001 TACCAACTGA TATTTGGATA CATATTACTG AAATAATTAA CACCAATATC 1051 CAAAGTAAAT TGTACATTTA TATTAAACAT TGGCTGAAAT GAACAACCTA 1101 AATTTCGTTG AAATTCATTA AAAGTTATTA ATTGTTTATA ATATGTACCT 1151 GTTGTTGAAG TTGTTGATGC AATGATTGCT GCTGCTGCTG CTGATGTTAT 1201 TGATGATGAT GATGATGATG TTGTTGTTGT TGTAGTCATT GTTGAAGTAT 1251 TTGTAATTGA TGGATGAAGA CTTAGTGTAT TAGGTATTTC AATTGATTGA 1301 GAACCATAAA ATTTATTTGT AAATATAATT TTCGTACCTT TTACAACATT 1351 ATTTTGAATA TCTTTTGGTG AAACTATAAC CATAATCTCC AAATTATCCT 1401 TAATTGGTGA TAATGTTTGA CTTGAAATTA AAAATGCTTC AATTCTAATT 1451 GGTAAATTAT AAACTTCTCT AAAATGAATT TTAAATTGAT AAAGTTTATT 1501 ATTCTCCTGA TGATTTGTTA ATGAAATATT TGAATTAGAA GAGGATGATA 1551 TCGGTATTGG TTGTGGTAAT ATATTTAAAC TATTACTATT ATTACTATTA 1601 TTATTATTAT TATTATTATT ATTATTATTA TTATTATTAT TATTATTATT 1651 ACTAATACTA TTATTATTTG TACATTTTGT ATTTTTATTA TTTAAATTTG 1701 CTGATAATAA TTCATTTGAA AAATTATTAA ATGGTTTAAT ATCTTTACTT 1751 GAAATATTTT CATTTTCTTC TTTATTTTCT TCTTTATTTT CTTCTTTATT 1801 TTCTTCATTT TCTTCATCAT CAGTATCTTC ATCATTATCA TTATCATTAT 1851 TATTATTACT ATTAATTAAT ACATTTTGAT TTATTGAATA AATTGTTTTT 1901 AAAGTTGATT TTATATTATC AATAATATCA TTTTTAAATG AGAGGGTAGT 1951 TTCTTTAAAA GGTTCATTAT TATTTTTATC TTTAATAATA TTTAAAAGTT 2001 GATAATTATC TTTAAGTATT GATAAATGTT GTTTATTTGA TTGATTATAA 2051 ATTTGATCGA TTGAGTAGTC TGTTATTTTA AAGATTGGTG GTATTGTTGG 2101 AGGTGATTGA GTGGTTGAAT GTTTGGTAAT GAGTGAATTG ATTAATTGAA 2151 CTTTATTATC TAATAAAGAT TTGGTTTTTA AATATAGTTC TTCATTATCT 2201 GTAAATAGGG TTTCTAAAGT TCTTTTAATA TCAAGCTCTA AAATTTGTAA 2251 AATTTGATGT AACTGTTTGA ATTTATCCGA TAATTGATTC ATATTACTTT 2301 GATGATTTAA TTTAATTTTT TGGAATTGTT GTTCAACAAT TTGTATTTTT 2351 TTTTTACTTT TTTCTTTAAA TCTTTGAGAT TTGTTATAAG TTTCATTTAA 2401 ATCTTTTAAT GTATTTTGTA TCATTGATTT TGAAATTAAT GAAAATGAGT 2451 GACCTTTATG TCCAATACTA CAGATACAAA CTAAACATAC AGGAATTTTA 2501 CAATCTTCAC AAAAACTACA AATTTCACTA TCACTATGTT CAAAACATTT 2551 TATATCAAAT ATTGTTGTTG GTATTATTGT TGTTGTTGTG GTTGATGATG 2601 ATGTTGTTGT AGTGGTAGTT GTCATCGTTT GTAATGGTGA TTTTTGTGAA 2651 TCATTTTCCA T 2661 "chrblob_3745.glm_1|24oct01" TATATTTTT AAAAACCAAC TTTTGTTAAT ATATATATAT 2701 AGATATTTTG TTTTGTTTTG TTTTGTTTAT TATTAAATTT TTGTTGTGTT 2751 ATATTTTTTT TTTTTTTTTT TTTTTTTTTT CCAACCCTTG TGTTGGCGGT 2801 TTGATGACAT ATTTTTTAAT TTTTTTTAAT TTTTTTTTTT TTTTTAATTT 2851 TTTTTTTTTT TAATAATTTT TTTAATAATT TTTTTTTTTA AAGTTTTTTT 2901 TTTCCTCTTT ACATTTTTAC ATTTTTAAAA ACAGGGGGGG TTTTTTAACC 2951 TTTTTTTTTT TTTTTTTTTT AAAAAAAAAA TTAAAAAATT TGATTTTGGG 3001 GATTGGGATT GACAACCCCC AAATAATTTC CCAAATTTTT TATTTTGGGT 3051 TTTTTTAAAA A // crick strand 3061 T TTTTAAAAAA 3050 ACCCAAAATA AAAAATTTGG GAAATTATTT GGGGGTTGTC AATCCCAATC 3000 CCCAAAATCA AATTTTTTAA TTTTTTTTTT AAAAAAAAAA AAAAAAAAAA 2950 GGTTAAAAAA CCCCCCCTGT TTTTAAAAAT GTAAAAATGT AAAGAGGAAA 2900 AAAAAAACTT TAAAAAAAAA AATTATTAAA AAAATTATTA AAAAAAAAAA 2850 AAATTAAAAA AAAAAAAAAA ATTAAAAAAA ATTAAAAAAT ATGTCATCAA 2800 ACCGCCAACA CAAGGGTTGG AAAAAAAAAA AAAAAAAAAA AAAAAAATAT 2750 AACACAACAA AAATTTAATA ATAAACAAAA CAAAACAAAA CAAAATATCT 2700 ATATATATAT ATTAACAAAA GTTGGTTTTT AAAAATATA start chrblob_3745.glm_1+2|24oct01 vbc exon 1 2661 ATG GAA AAT GA 2650 T TCA CAA AAA TCA CCA TTA CAA ACG ATG ACA ACT ACC ACT ACA ACA ACA T 2600 CA TCA TCA ACC ACA ACA ACA ACA ATA ATA CCA ACA ACA ATA TTT GAT ATA 2550 AAA TGT TTT GAA CAT AGT GAT AGT GAA ATT TGT AGT TTT TGT GAA GAT TG 2500 T AAA ATT CCT GTA TGT TTA GTT TGT ATC TGT AGT ATT GGA CAT AAA GGT C 2450 AC TCA TTT TCA TTA ATT TCA AAA TCA ATG ATA CAA AAT ACA TTA AAA GAT 2400 TTA AAT GAA ACT TAT AAC AAA TCT CAA AGA TTT AAA GAA AAA AGT AAA AA 2350 A AAA ATA CAA ATT GTT GAA CAA CAA TTC CAA AAA ATT AAA TTA AAT CAT C 2300 AA AGT AAT ATG AAT CAA TTA TCG GAT AAA TTC AAA CAG TTA CAT CAA ATT 2250 TTA CAA ATT TTA GAG CTT GAT ATT AAA AGA ACT TTA GAA ACC CTA TTT AC 2200 A GAT AAT GAA GAA CTA TAT TTA AAA ACC AAA TCT TTA TTA GAT AAT AAA G 2150 TT CAA TTA ATC AAT TCA CTC ATT ACC AAA CAT TCA ACC ACT CAA TCA CCT 2100 CCA ACA ATA CCA CCA ATC TTT AAA ATA ACA GAC TAC TCA ATC GAT CAA AT 2050 T TAT AAT CAA TCA AAT AAA CAA CAT TTA TCA ATA CTT AAA GAT AAT TAT C 2000 AA CTT TTA AAT ATT ATT AAA GAT AAA AAT AAT AAT GAA CCT TTT AAA GAA 1950 ACT ACC CTC TCA TTT AAA AAT GAT ATT ATT GAT AAT ATA AAA TCA ACT TT 1900 A AAA ACA ATT TAT TCA ATA AAT CAA AAT GTA TTA ATT AAT AGT AAT AAT A 1850 AT AAT GAT AAT GAT AAT GAT GAA GAT ACT GAT GAT GAA GAA AAT GAA GAA 1800 AAT AAA GAA GAA AAT AAA GAA GAA AAT AAA GAA GAA AAT GAA AAT ATT TC 1750 A AGT AAA GAT ATT AAA CCA TTT AAT AAT TTT TCA AAT GAA TTA TTA TCA G 1700 CA AAT TTA AAT AAT AAA AAT ACA AAA TGT ACA AAT AAT AAT AGT ATT AGT 1650 AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AA 1600 T AAT AGT AAT AAT AGT AAT AGT TTA AAT ATA TTA CCA CAA CCA ATA CCG A 1550 TA TCA TCC TCT TCT AAT TCA AAT ATT TCA TTA ACA AAT CAT CAG GAG AAT 1500 AAT AAA CTT TAT CAA TTT AAA ATT CAT TTT AGA GAA GTT TAT AAT TTA CC 1450 A ATT AGA ATT GAA GCA TTT TTA ATT TCA AGT CAA ACA TTA TCA CCA ATT A 1400 AG GAT AAT TTG GAG ATT ATG GTT ATA GTT TCA CCA AAA GAT ATT CAA AAT 1350 AAT GTT GTA AAA GGT ACG AAA ATT ATA TTT ACA AAT AAA TTT TAT GGT TC 1300 T CAA TCA ATT GAA ATA CCT AAT ACA CTA AGT CTT CAT CCA TCA ATT ACA A 1250 AT ACT TCA ACA ATG ACT ACA ACA ACA ACA ACA TCA TCA TCA TCA TCA TCA 1200 ATA ACA TCA GCA GCA GCA GCA GCA ATC ATT GCA TCA ACA ACT TCA ACA AC 1150 A GGT ACA TAT TAT AAA CAA TTA ATA ACT TTT AAT GAA TTT CAA CGA AAT T 1100 TA GGT TGT TCA TTT CAG CCA ATG TTT AAT ATA AAT GTA CAA TTT ACT TTG 1050 GAT ATT GGT GTT AAT TAT TTC AGT AAT ATG TAT CCA AAT ATC AGT TGG TA 1000 T TTA GGT GAT TTA AAA CCA AAT AAA CGT TTA ACC ATT GGT TTG GAA GGT T 950 GT GCT TCT TCA GGT AAA ACT TCT TTA ATT ATG GGT TTA ATT AAT CTT TTC 900 AAT TTA TCT TCT ACA ATT CAA CAA AAT TTC TCT GAA GAA CAT GGT GGT AG 850 C ACT TAT TTC TCA ACT AAT CGT ATC ACT TAT AGA TCA ATT AAA AGT ATT A 800 TC GAT TCA AAT TAT TCA AAT GAT CCA TTT TCA AAT TCA TTT TTA AGT GGT 750 TTT GAT ATT TCA TTC GTA GAT ACT intron GTAAGT TAATTATTAT TATAATTGTT 700 TAATTATTTA ATTATAATAA AACTAATCAA TGGGTTTTTT TTTTTTTTAT 650 AAATAG exon 2 TGG GGA TTA TGT GAT AGT GAT ATA GAA TTA AAA TAT AAA GTT CA 600 G GGT AGA GTT TAT AAT AAT TTA GCA ATT AAT GAA AAA TTT AAT ATT GGC A 550 GT ATT CCT AAA CCA GAA TTT TCA GTT AAT GTA TTC TTA TTT GTT GTA TCA 500 ATA AAA AGT TTC ACC AGT GTT GAA ACA ATG AGA AAA ATG GAA AAA AGA AT 450 G AAA GAA TCA ATT GCT TTG GGT ATT GTT CCC ATT TTA GCT ATC ACT TTT T 400 CT GAT CAA GTT TCA ACA TCC GAA TAT GCA GGT TTA GTC ACT TCT AAT TAT 350 GAA TTA CCT G intron GTATGTATAA TAATTATAAT TATTTCAAAT TAAAAGATAT 300 CAATATTCTA ATTATATATA TATATATATT TTAGTTCAAC CATGTAATGT 250 TTTTAAAATA ATGAATTATC ATGATTTAG exon 3 AA ATA AGA AAA GAT TTA GAA A 200 AA GAT TTA CAA TAT TTA AGA TTA ATA AAT AGA TTG GTT CAA ATA TCT AAA 150 TGG AAG TGA 142 stop chrblob_3745.glm_1|24oct01 A AAAATTAAAA AAAAAAAAAA AATTTGGATA AACCTTTTTT 100 TTGTTATTTT TTTAGTTAAA TTTATAAATA AAAGAACAAG AGGAAGTAAA 50 TTAAAATTTT TGTAGTAATA TTATAATAAT TTGGGTTTTA AATTTTTTGT end of file 3747 4 3748 12 3750 4 3751 9 3752 3 3753 3 3754 9 3757 4 3758 9 3759 3 3760 14 3761 9 3762 9 3763 9 3764 10 3765 9 3768 14 3769 9 3770 3 3772 4 3775 5 only five 3777 7 3778 14 3779 13 3782 2 3784 4 3786 9 3787 8 3790 11 pfemp1 exon 2 2031591..2032796 ? misassembly in c11 3791 9 3792 9 3793 4 3794 10 3795 9 3796 10 3797 8 3798 10 3800 4 Date: Thursday, 3/14/2002 Time: 11:36 c3801.txt chrblob_3801|2001.10.15|GENOMIC|Sanger FEATURES Location CDS 556..786 /gene="chrblob_3801.glm_1|24oct01" /note="(protein coding) 53% identity to (AK007678) putative [Mus musculus]" /codon_start=1 CDS complement(2089..2388) /gene="chrblob_3801.glm_2|24oct01" /note="(protein coding) No NR protein Similarities" /codon_start=1 ORIGIN watson strand 1 AATTACATAC ATTCGATCAT ATGATTGATA TTAGTAGAAC CATTTGTACA 51 AAATGTGAAA AAAAGAGAAA ATATTTTTGT TATGACTGTT GTTTACCATT 101 AGGTGATCCT GAAAACTCAC CAAAATTAAA ATTACCTTTA AATGTTGA TG 151 T GTA AGT AAT TAT AAT AAT AAT AAT AAA AAT AAT AAT AAT AAT AAT AAT A 201 AT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT 251 AAT AAT TAC TAA TTA TTT TTA TTT AAA GTA TTC ATC ATC CAA CCG AAT TA 301 ATTAGTAAAA GTACAGCAAT TCATTCCAAA GTTATAGCAT ATGAGGATGT 351 AAAATTTATA GAATTTCCAG AGGAAATACC AGATTATAAT TTAGATGAAA 401 CTATATTGTT ATATCCTTCA GAAGATTCAT GTTTTGTAAA GGATATTGAT 451 TTTAGTAATA TTAAGAAAGT GTTATTCGTT GAATCACAAT GGCATAATGC 501 AAGAAAGATA TTAAAACATC CAAAATTACA AGGTATAAAA TGTGTAAAGA 551 TCGAT no gene chrblob_3801.glm_1|24oct01 556 ATG CAA AAA ACA ATG TTT TGG AGA CAC CAA CGT CAT GGT GAC AGT 601 TAT CTA GCA ACC ATA GAA GCA ATC TAT TAC TTT TTC AAA GAA TTT CAT TT 651 A TCT CAA AAT AAT AAT CAA TAC AAT GGT GAA TAT GAT AAT CTC TTA TTC T 701 AT TAC ACA TTT TTT TAT AAT TTA ATT CAA ACA ACC TAT AAA CAA CAA AAT 751 AGA GAT TTT ATT AGA AAA GAT AAT TAT ATT CAA TAA* 786 AATA AAATAAACTT 801 TTTTTTTTAT ATATATAAGT TTTATTTTTT TTTTTTTTAT TTTTATTATT 851 TTTTATT "chrblob_3801.glm_2|24oct01" 863 TTA TTTTAAATTT GTTTTGATTT TGAAATTGAT AAATCAAAAC 901 GTGAATATAA AATAATGAAA ATACAAAGTG TAAAGACAGC ACCAATAACT 951 AATAATGGTT CATGGAAGAT AGAGAGTGAT GAGAGGTTAT AGGTGACTTG 1001