chromosome 6, 7 & 8 unmapped contigs b678da02.txt 0002 8 0003 13 0005 8 0006 9 0010 13 0030 3 0045 13 0049 3 Date: Monday, 3/11/2002 Time: 17:33 c0053.txt chrblob_0053|2001.10.15|GENOMIC|Sanger FEATURES Location CDS 1093..1884 /gene="chrblob_0053.glm_1|24oct01" /note="(protein coding) 49% identity to rifin PFB1005w - malaria parasite (Plasmodium falciparum)" /codon_start=1 ORIGIN watson strand 1 GGACATATAT TTTGTATTGT AATAATAAAT ATATTTTTTT AATACTTTGT 51 AATATATTTG TACAAGGGAG AAGTAATAAT ATGAGGGCCA GTAATAACAT 101 AGATAAATTA GAGAGAAACG TAAACGTACA ACAAATATTA GAACAAAAAA 151 AAAAAAAATT ATGAAAATAA CCAAATTTAA TTATTTTTTT TACTATTATT 201 TAAATTTTTT TTTTTATATC ATATATTATG ATATAATATG TTTGTATTTA 251 ATTTTTTTAT ATAATAGTAA TGATACAAGG TTTCTGTTGG GATATTTATT 301 ACCTGCATAT ATGTTATAAT AAGTTCTAAT ATATGTATTT TACATCTTTT 351 ACAAATATTA CTGTACACAT TTTCATATAA TTTAAAAAGT AAATATAAAC 401 ATGTTTTTTA TTGTAACTAC ACATTTACTT GTTATTAACA TGTATAAAAA 451 TAAAAAAATA AAAAGTAAAA AAGAAAAAAA ATTATTATTA CAATTTATGA 501 TATGACATAA GATTATATTT CATTAGAAAT ACAAATTCAA AATTATAAAT 551 AATATTGAAA TGTTTTATTA TATTATTTTT TTTTAAAATT TAATTAATTA 601 ATTATTTATT TTTTTTTTTT TGTGTTTTAA ATAAAAAAGC AAATATGGAT 651 CCAGTAAAAA AATATATATT TACATAAAGG GAAAATAATC GTGTATTATA 701 TTATAAGGCT ATATAAAAAT TTTAGTTTAA GCATAATTAA TTTATTTACA 751 AAATAAAATA AGGTATTATA TTTTAAATTA ATTATATGTA TAATCATAAA 801 ATAATATACG AATAACAATA AAA start chrblob_0053.glm_1|24oct01 vbc stevor note read through taa at 1972 exon 1 824 ATG AAA GTT CAC TGC TAT AAC ATA TTA 851 TTA TTT TCT TTT ACA TTA ATT ATA TTG TTA TTA TCA CCA TCG CAG intron GTATG 901 GATATAATAA CCATTATTAT AACAATATAA TATTTATATA TATAAAATAA 951 TCTACATATA AATATCACAT ATATATATCA CCATTTTTTA TAG exon 2 GTA AAT A 1001 AC CAA ATG AAC CAT TAC AAT ACA GCC AAT ATG AAA AAC ACA GAA CCA ATA 1051 AAA TCA TAT AGA TCA TTA TGC*TAA*TGT GAA CTA TAT ACT TCC ATG TAT GA 1101 T GAT GAC CCA GAA ATG AAA GAA ATA ATG CAC GAT TTT GAT CGA CAA ACA T 1151 CA CAA CGT TTT GAA GAA TAC AAT GAA CGT ATG AAC AAA AAC AGA CAA AAA 1201 TGT AGA GAA CAA TGT GAT AAA GAT ATA CAA GAA ATT ATT GCA AAA GAT AA 1251 A ATC CAA AAA TCA TTA GCA GTA AAA GTG GAA AAA GGT TGT CTT AGG TGT G 1301 GG TGT GGG TTA GGA GGT GTT GCA GCA GGT GTT GGA ATA TTC GGT GCA TTG 1351 GGT ACT TAT GGT TGG AAA ATC GCT GCG ACA GCT ATG GCT TAT GAA ACT GC 1401 T AAG CAA GCT GTT ATT CAA GCA GGT ATA GAT GCA GCC ATT GCA CAA ATA A 1451 AA ATA AAA CAT ATT TTT AAA GCT TTA TCT AAT ATA ACA TTG TCA AAT TTC 1501 ATT AAT GAA TCA AAT TAT AAT ACT ATC GAT GGT CTT TTT AAT GCT ATT AT 1551 G AAT GCT ATC CAT TCA ACT AAA AAC ACA TGT CCA AAT TAC AAT GGC CCT A 1601 TG TAT CGA GTG TGT AAT GGT ATA GTA ACT GCT AGG AAT ACG TGG CTT GAT 1651 GAC ATT GTA GAA GCC GGT ACA AAA GCT TCT GTT GAG AAA ATC ACA GCT GT 1701 T GAA GCT GAT GAA CTT GTT AAG GTA ACA GCT ACA GTT TCC AAT GCG TAC A 1751 GC GCA ATT GGT TAC TCT GTA ACT GTC ATA TTG ATT ATA GTT TTG GTT ATG 1801 ATA ATA ATT TAT TTA ATT TTA CTT TAT GGA CGA AAA AAA AAA ATG AAT AA 1851 A AAA CTA CAA TAC ACA AAA TTA TTA AAT CAA TAA* 1884 stop chrblob_0053.glm_1|24oct01 ATATAT GGTTTCATGA 1901 TATTAAATTC AATTTAATGT TTTTTGAATT TAAGATTTTA AAAAAAAGGA 1951 TATTATGATA ATTATATTTT GATAACATTA TATTTTTTTT TGCTATAATT 2001 TTTGTTTTTG TTTATTGTTA TGTCGTTACT AAATTATTTA ATTAATAATT 2051 ATTTATTATT TTTTAGTGAA ACGAGTGTAA TTTATATATA CTTTTTTAAT 2101 TAAAATTATA TATATATATA TATATATATA TATATATATA TACATATTTA 2151 TTTATTTATA ATACATTCTT TAAGAACACC TTGTAACATA TATATTAAAA 2201 AATTTTATAT AAAATAATAT GTAATGGAAT ATATTATAGA ATAAATATAT 2251 TATATTATTA ATCCTATGTT GATATATTAT TTAAAATTTA ATTATATTTA 2301 TATAAATTAA TATAAATAAA TATAATTGTA ATTAATAACA TTTAACTTTA 2351 TCATTTTATC TTTATAATAT ATATAATAAA TATTTATTAT TACCTTACAT 2401 TACAATATCA TGTGTAATAT AAAATGTTAA GTTAATTATT TTTTATCTTC 2451 TTTCTTTTTA TAATTTCCCT TTTAATAAAA TAGAATATGT GTATTATTAC 2501 AGAACAAATA TAAATATATA TATATATAAT TTGTATAATA TACCAACTAC 2551 AAAATTATTT TCGACACGAC ATATCGATAT ATCGAATTAT CAACACATGA 2601 CAATATAATA AAAATGAATT AACCTAATTG TACAATAAAT ATTATTATAA 2651 AATAGTAACA ATATATTATA TATTATAATT ATAATTCTAT TATAATAATA 2701 ATATTCATAT GATATACTTT ATATTATACT ATTTTAATGC ATATAATTAA 2751 TATAATATGA AATGTAAAAC AATATATGAA TATTAATAAT TTATGAACTA 2801 TTAAAAATAA ACATATATAT AGTTTATGTA TTCTATTTAT ATATGTTTAT 2851 AAAACGTTTA TTATTATTAT TCTCTTTATT ATAAAATTGT AGTAATTATT 2901 ATAAGATTAT TTTTAAAAAG TATATCATTA AGATGACTAT GATTATAATA 2951 TAATAATACT ATTAATTTGT TATGTATTGT ACAAATGATA TATGATATTT 3001 CGTATATATA GATATGAT // crick strand 3018 ATCATATC TATATATACG 3000 AAATATCATA TATCATTTGT ACAATACATA ACAAATTAAT AGTATTATTA 2950 TATTATAATC ATAGTCATCT TAATGATATA CTTTTTAAAA ATAATCTTAT 2900 AATAATTACT ACAATTTTAT AATAAAGAGA ATAATAATAA TAAACGTTTT 2850 ATAAACATAT ATAAATAGAA TACATAAACT ATATATATGT TTATTTTTAA 2800 TAGTTCATAA ATTATTAATA TTCATATATT GTTTTACATT TCATATTATA 2750 TTAATTATAT GCATTAAAAT AGTATAATAT AAAGTATATC ATATGAATAT 2700 TATTATTATA ATAGAATTAT AATTATAATA TATAATATAT TGTTACTATT 2650 TTATAATAAT ATTTATTGTA CAATTAGGTT AATTCATTTT TATTATATTG 2600 TCATGTGTTG ATAATTCGAT ATATCGATAT GTCGTGTCGA AAATAATTTT 2550 GTAGTTGGTA TATTATACAA ATTATATATA TATATATTTA TATTTGTTCT 2500 GTAATAATAC ACATATTCTA TTTTATTAAA AGGGAAATTA TAAAAAGAAA 2450 GAAGATAAAA AATAATTAAC TTAACATTTT ATATTACACA TGATATTGTA 2400 ATGTAAGGTA ATAATAAATA TTTATTATAT ATATTATAAA GATAAAATGA 2350 TAAAGTTAAA TGTTATTAAT TACAATTATA TTTATTTATA TTAATTTATA 2300 TAAATATAAT TAAATTTTAA ATAATATATC AACATAGGAT TAATAATATA 2250 ATATATTTAT TCTATAATAT ATTCCATTAC ATATTATTTT ATATAAAATT 2200 TTTTAATATA TATGTTACAA GGTGTTCTTA AAGAATGTAT TATAAATAAA 2150 TAAATATGTA TATATATATA TATATATATA TATATATATA TATAATTTTA 2100 ATTAAAAAAG TATATATAAA TTACACTCGT TTCACTAAAA AATAATAAAT 2050 AATTATTAAT TAAATAATTT AGTAACGACA TAACAATAAA CAAAAACAAA 2000 AATTATAGCA AAAAAAAATA TAATGTTATC AAAATATAAT TATCATAATA 1950 TCCTTTTTTT TAAAATCTTA AATTCAAAAA ACATTAAATT GAATTTAATA 1900 TCATGAAACC ATATAT "chrblob_0053.glm_1|24oct01" 1884 TTAT TGATTTAATA ATTTTGTGTA TTGTAGTTTT 1850 TTATTCATTT TTTTTTTTCG TCCATAAAGT AAAATTAAAT AAATTATTAT 1800 CATAACCAAA ACTATAATCA ATATGACAGT TACAGAGTAA CCAATTGCGC 1750 TGTACGCATT GGAAACTGTA GCTGTTACCT TAACAAGTTC ATCAGCTTCA 1700 ACAGCTGTGA TTTTCTCAAC AGAAGCTTTT GTACCGGCTT CTACAATGTC 1650 ATCAAGCCAC GTATTCCTAG CAGTTACTAT ACCATTACAC ACTCGATACA 1600 TAGGGCCATT GTAATTTGGA CATGTGTTTT TAGTTGAATG GATAGCATTC 1550 ATAATAGCAT TAAAAAGACC ATCGATAGTA TTATAATTTG ATTCATTAAT 1500 GAAATTTGAC AATGTTATAT TAGATAAAGC TTTAAAAATA TGTTTTATTT 1450 TTATTTGTGC AATGGCTGCA TCTATACCTG CTTGAATAAC AGCTTGCTTA 1400 GCAGTTTCAT AAGCCATAGC TGTCGCAGCG ATTTTCCAAC CATAAGTACC 1350 CAATGCACCG AATATTCCAA CACCTGCTGC AACACCTCCT AACCCACACC 1300 CACACCTAAG ACAACCTTTT TCCACTTTTA CTGCTAATGA TTTTTGGATT 1250 TTATCTTTTG CAATAATTTC TTGTATATCT TTATCACATT GTTCTCTACA 1200 TTTTTGTCTG TTTTTGTTCA TACGTTCATT GTATTCTTCA AAACGTTGTG 1150 ATGTTTGTCG ATCAAAATCG TGCATTATTT CTTTCATTTC TGGGTCATCA 1100 TCATACATGG AAGTATATAG TTCACATTAG CATAATGATC TATATGATTT 1050 TATTGGTTCT GTGTTTTTCA TATTGGCTGT ATTGTAATGG TTCATTTGGT 1000 TATTTACCTA TAAAAAATGG TGATATATAT ATGTGATATT TATATGTAGA 950 TTATTTTATA TATATAAATA TTATATTGTT ATAATAATGG TTATTATATC 900 CATACCTGCG ATGGTGATAA TAACAATATA ATTAATGTAA AAGAAAATAA 850 TAATATGTTA TAGCAGTGAA CTTTCAT 824 "chrblob_0053.glm_1|24oct01" TTT TATTGTTATT CGTATATTAT 800 TTTATGATTA TACATATAAT TAATTTAAAA TATAATACCT TATTTTATTT 750 TGTAAATAAA TTAATTATGC TTAAACTAAA ATTTTTATAT AGCCTTATAA 700 TATAATACAC GATTATTTTC CCTTTATGTA AATATATATT TTTTTACTGG 650 ATCCATATTT GCTTTTTTAT TTAAAACACA AAAAAAAAAA AATAAATAAT 600 TAATTAATTA AATTTTAAAA AAAAATAATA TAATAAAACA TTTCAATATT 550 ATTTATAATT TTGAATTTGT ATTTCTAATG AAATATAATC TTATGTCATA 500 TCATAAATTG TAATAATAAT TTTTTTTCTT TTTTACTTTT TATTTTTTTA 450 TTTTTATACA TGTTAATAAC AAGTAAATGT GTAGTTACAA TAAAAAACAT 400 GTTTATATTT ACTTTTTAAA TTATATGAAA ATGTGTACAG TAATATTTGT 350 AAAAGATGTA AAATACATAT ATTAGAACTT ATTATAACAT ATATGCAGGT 300 AATAAATATC CCAACAGAAA CCTTGTATCA TTACTATTAT ATAAAAAAAT 250 TAAATACAAA CATATTATAT CATAATATAT GATATAAAAA AAAAAATTTA 200 AATAATAGTA AAAAAAATAA TTAAATTTGG TTATTTTCAT AATTTTTTTT 150 TTTTTTGTTC TAATATTTGT TGTACGTTTA CGTTTCTCTC TAATTTATCT 100 ATGTTATTAC TGGCCCTCAT ATTATTACTT CTCCCTTGTA CAAATATATT 50 ACAAAGTATT AAAAAAATAT ATTTATTATT ACAATACAAA ATATATGTCC end of file 0076 3 0077 9 2627 12 2654 13 not rama ag512 see 4173 2714 13 2818 10 2831 13 2858 9 Date: Tuesday, 3/5/2002 Time: 18:30 c2889.txt chrblob_2889|2001.10.15|GENOMIC|Sanger FEATURES Location CDS complement(226..1386) /gene="chrblob_2889.glm_1|24oct01" /note="(protein coding) 39% identity to (AF206252) seroreactive antigen BMN1-9B [Babesia microti]" /codon_start=1 ORIGIN watson strand "chrblob_2889.glm_1|24oct01" 1 TTATGAGCAA CTTCATCGAC ATTTGCATGT ATATGAGCAT CACGATGATG 51 TAATAAATTT TGATCATTAT TAATTTCATC ATTGTTCATG TCTATATTAG 101 CACCTGATAC GAAATTCATT TGTGGGATGA GTTGCTGATT ATTTCGATTT 151 TCCATCAAAT TATAACAATT TCTAATACCA AAAATTCGAT ACTCATTTTG 201 GTAATTTAAT AAAGACATTA GATTGTCAAC TCTCATATGG AGAATACGAG 251 TTTTGCAATG AATTGGATGC GTTTGTAATA TCTAGAAATT GATTTCTTTC 301 AAAATTATTT CTATTATTAG TTTCATCCGT GTTATTTGTT GTATTTACTG 351 GTGGTGCAGA ATTTACGGTA CTTTTATCAT TTGTAGGTGC TTCAGAAGAA 401 TCAAGAACTT CTTTATTTTC AATAATATCA ATAATTCCAC TTTTAAATGG 451 AATTTCTTCA TCCATTTTAA AATGAACTAC ACTTCTACCT ACCTGTAAAG 501 ACATAGTATC TTTAGGAAAT ATTTCTCTTG CTTTTCTTAG GGCTACTAAG 551 GTACCAAATT TGGAATTATG ATCTTCTAAT TTAAATAAAC CTTTTTCATA 601 TTTTATTGTT GCATGGTATC TGGAAATAGA AACATCCGGG ATACGAACAT 651 CTGATTCGTG TCCTCTTCCT AATTTTAAAT ATTTTTTATC GGCAAAACTT 701 ATTAAATGTA CTCCTTTACT AGTTTGCCCA ATAATATTAT CTAAGACAAT 751 TAATGGTGTT TTCAAATTAG GTATCTTTAC TAATTGTACT AGTTCCTCAT 801 TTTGTTTAAT ACTTTTTGGA TATTTAGATT TACATAACTC ACAACAAATA 851 TCCTTAATAA AAACTGAACC AGAAAATAAT TGATCATTTA AATTTAATCT 901 ACCATTAATC CATTTTCTTA AACACATTAA ATGTGCATAC TTAATGGAAC 951 CTTTACAATC ACATGGACAA ATTAAGGGAT CATTTTCTTG ATTCCCTTCA 1001 ATTAAACAAA TTCGACATTG AATATTAGAA GAATCTAAAA TAGTTTCACA 1051 TTTTTTTGAA GGGCAGTCAT CTAATTTCAA CGTATTTAAT GTGTCTACTG 1101 ATTCAATAAA TTGTCTTACC TTTAATCGAA AACGTCCTAA TTTTATAATA 1151 TCATTTTCAT GTAAAGCGTA ATATTTTTCA GGAAGATCTT TCACAATTAT 1201 CCACAATTTT TTTATATTGT ATTGGTTGCT TAATGAATGT TCAGCTGGCG 1251 TTATAACATA TTTATCTATA ACATGGTGAA ACAAAATAAA TAAAAATAAA 1301 ATACGTAAAT ATGTATAATA TATATATAAA ACATAGCACA TATTATGAAT 1351 ACTACATATA TGAATATCAT ATATTATGAA TACCATATAT TATGAATACG 1401 ACATATTATG AATACGACAT ATTATGAATA CCACACATTA TGCATACAAA 1451 TATATAATGA TATCTTTTCA GCTTTTACCT TCTTGAGGTC TAACAGATAA 1501 AAGATAATCC TGAGTTGTAT TAGGCAAACA TTCTGGAGAG TCAGCTACAC 1551 AAGATACTTG AGCTTTTGAA CGAAAAAGTT TTATTGCTGT AGATATTAAA 1601 AAACTTTTTT TATTTACTTG TTGTGCTTCA TAATCAAATA GATCATGACT 1651 ATCACGAGTC CATGTTTTTG TTTCTACTCT TAACCTAATA AAAAGAAAAA 1701 AATAAATAAA ATGAAATAAG AAAAAAAATA TAATATATTT ATATTATGTA 1751 CACTCATTAT TAATAAGAAA TATTCTTATC ATATCTATAA GGAATATAAT 1801 TTTTCTAGAC CTTAATTAAC AATCTCAT 1828 "chrblob_2889.glm_1|24oct01" AT TTCAAAAATA AATAAATAAA 1851 TAAATATAGT TTCCAATATA TATATATATA TATATATATA TATATATATA 1901 TATATATTAT ATTATATATT CATGCACATA TTCTTATATC AATTAATTTT 1951 TATATTACAT TTTCTCGTAT TTCCTGATAA ATAATTTTGT TATATTTACA 2001 AAATTCCAAA AAAAAAAAAA AAAAAAAAAA AAAAAAA // crick strand 2037 TTTTTTT TTTTTTTTTT TTTTTTTTTT TTTGGAATTT 2000 TGTAAATATA ACAAAATTAT TTATCAGGAA ATACGAGAAA ATGTAATATA 1950 AAAATTAATT GATATAAGAA TATGTGCATG AATATATAAT ATAATATATA 1900 TATATATATA TATATATATA TATATATATA TATATTGGAA ACTATATTTA 1850 TTTATTTATT TATTTTTGAA AT start chrblob_2889.glm_1|24oct01 vbc note partial gene exon 1 1828 ATG AGA TT intron GTTAATTAAG GTCTAGAAAA 1800 ATTATATTCC TTATAGATAT GATAAGAATA TTTCTTATTA ATAATGAGTG 1750 TACATAATAT AAATATATTA TATTTTTTTT CTTATTTCAT TTTATTTATT 1700 TTTTTCTTTT TATTAG exon 2 G TTA AGA GTA GAA ACA AAA ACA TGG ACT CGT GAT 1650 AGT CAT GAT CTA TTT GAT TAT GAA GCA CAA CAA GTA AAT AAA AAA AGT TT 1600 T TTA ATA TCT ACA GCA ATA AAA CTT TTT CGT TCA AAA GCT CAA GTA TCT T 1550 GT GTA GCT GAC TCT CCA GAA TGT TTG CCT AAT ACA ACT CAG GAT TAT CTT 1500 TTA TCT GTT AGA CCT CAA GAA G intron GTAAAAGC TGAAAAGATA TCATTATATA 1450 TTTGTATGCA TAATGTGTGG TATTCATAAT ATGTCGTATT CATAATATGT 1400 CGTATTCATA ATATATGGTA TTCATAATAT ATGATATTCA TATATGTAGT 1350 ATTCATAATA TGTGCTATGT TTTATATATA TATTATACAT ATTTACGTAT 1300 TTTATTTTTA TTTATTTTGT TTCACCATGT TATAG exon 3 AT AAA TAT GTT ATA A 1250 CG CCA GCT GAA CAT TCA TTA AGC AAC CAA TAC AAT ATA AAA AAA TTG TGG 1200 ATA ATT GTG AAA GAT CTT CCT GAA AAA TAT TAC GCT TTA CAT GAA AAT GA 1150 T ATT ATA AAA TTA GGA CGT TTT CGA TTA AAG GTA AGA CAA TTT ATT GAA T 1100 CA GTA GAC ACA TTA AAT ACG TTG AAA TTA GAT GAC TGC CCT TCA AAA AAA 1050 TGT GAA ACT ATT TTA GAT TCT TCT AAT ATT CAA TGT CGA ATT TGT TTA AT 1000 T GAA GGG AAT CAA GAA AAT GAT CCC TTA ATT TGT CCA TGT GAT TGT AAA G 950 GT TCC ATT AAG TAT GCA CAT TTA ATG TGT TTA AGA AAA TGG ATT AAT GGT 900 AGA TTA AAT TTA AAT GAT CAA TTA TTT TCT GGT TCA GTT TTT ATT AAG GA 850 T ATT TGT TGT GAG TTA TGT AAA TCT AAA TAT CCA AAA AGT ATT AAA CAA A 800 AT GAG GAA CTA GTA CAA TTA GTA AAG ATA CCT AAT TTG AAA ACA CCA TTA 750 ATT GTC TTA GAT AAT ATT ATT GGG CAA ACT AGT AAA GGA GTA CAT TTA AT 700 A AGT TTT GCC GAT AAA AAA TAT TTA AAA TTA GGA AGA GGA CAC GAA TCA G 650 AT GTT CGT ATC CCG GAT GTT TCT ATT TCC AGA TAC CAT GCA ACA ATA AAA 600 TAT GAA AAA GGT TTA TTT AAA TTA GAA GAT CAT AAT TCC AAA TTT GGT AC 550 C TTA GTA GCC CTA AGA AAA GCA AGA GAA ATA TTT CCT AAA GAT ACT ATG T 500 CT TTA CAG GTA GGT AGA AGT GTA GTT CAT TTT AAA ATG GAT GAA GAA ATT 450 CCA TTT AAA AGT GGA ATT ATT GAT ATT ATT GAA AAT AAA GAA GTT CTT GA 400 T TCT TCT GAA GCA CCT ACA AAT GAT AAA AGT ACC GTA AAT TCT GCA CCA C 350 CA GTA AAT ACA ACA AAT AAC ACG GAT GAA ACT AAT AAT AGA AAT AAT TTT 300 GAA AGA AAT CAA TTT CTA GAT ATT ACA AAC GCA TCC AAT TCA TTG CAA AA 250 C TC intron GTATTCT CCATATGAGA GTTGACAATC TAATGTCTTT ATTAAATTAC 200 CAAAATGAGT ATCGAATTTT TGGTATTAG exon 4 A AAT TGT TAT AAT TTG ATG GA 150 A AAT CGA AAT AAT CAG CAA CTC ATC CCA CAA ATG AAT TTC GTA TCA GGT G 100 CT AAT ATA GAC ATG AAC AAT GAT GAA ATT AAT AAT GAT CAA AAT TTA TTA 50 CAT CAT CGT GAT GCT CAT ATA CAT GCA AAT GTC GAT GAA GTT GCT CAT [AA...] (stop) chrblob_2889.glm_1|24oct01 end of file 2918 11 2927 3 2928 14 2939 9 2963 13 2968 13 2971 10 3029 12 3032 13 3045 10 3056 11 3059 12 3075 13 3116 10 3119 2 3126 12 3128 10 3133 2 3135 14 3137 4 3140 3 3146 3 3149 10 3158 9 3167 14 3174 9 3177 10 3180 3 3196 10 3202 2 3218 14 3227 10 3228 3 3231 10 3233 6 3234 9 3236 13 3246 9 3256 10 3260 11 3278 13 3280 10 3285 3 3288 4 3289 12 3300 9 3301 3 3303 14 3304 8 3306 13 3311 14 3315 3 3326 3 3330 10 3335 11 3336 10 3338 13 3341 11 3350 14 3355 8 3361 12 3363 14 3367 9 3372 11 3376 12 3378 13 3390 9 3400 3 3401 10 3402 9 3415 3 3418 9 3423 11 3424 4 Date: Thursday, 3/7/2002 Time: 01:59 c3428.txt chrblob_3428|2001.10.15|GENOMIC|Sanger FEATURES Location CDS 81..2134 /gene="chrblob_3428.gen_1|24oct01" /note="(protein coding) 36% identity to (AL136819) hypothetical protein [Homo sapiens]" /codon_start=1 ORIGIN watson strand start chrblob_3428.gen_1|24oct01 vbc note partial gene (exon 1) 1 [...AA] TTA GTT AGT TAT GTT ATA TCG GGT CAT AAT GCA TCA GTA TTT GCA TAT 51 GGT GCA TCA GGT GCG GGT AAA ACT CAT ACA ATG GTT GGT GGT ATT AAT AC 101 T GGT CCT GGT ATT ATG GTA TTA ACA ATG AAA GAA TTA TTC TCA TTG ATT G 151 AA AAA GAT AGA TCC AAT CAA TAC ATT GTT TCA ATG TCA TAT TTA GAA GTC 201 TAT AAC GAA ACC ATT AGA GAT TTA TTA ATT ACC AAT ACT GGT GGT GGT GG 251 T AAT AGT AAT AAT AAA GTT TTA GAA TTA TGT GAG GAT GAA AAT AAA CAA A 301 TT GTA ATT CGT GAT TTA TCA TGG GAA TAT CCG ACT TCA GCA GAC CAA GTT 351 TTT AAA TTA TTA AAA TAT GGA AAT TTA AAT AGA AAA CAA TCA CCA ACT CA 401 A ACC AAT CAA ACA TCA TCA AGA TCT CAT GCA GTT TTA CAA ATC ACT GTG A 451 AA CAA CAA AAC TTA CAA GAT AAA AGT AAA ATT TCG TTT GGT AAA CTT TCA 501 TTA ATT GAT TTG GCA GGT TCA GAA CGT GCT TCT AAA ACT TTA AAT ACC GG 551 T GAC AGA TTA AAA GAA GGT ACA AGT ATA AAT AAA TCT TTA TTA GCA TTA G 601 GA AAT TGT ATT AAA GCA TTA GGT GAA TTA TGT AAG AAT CAA CAG TCA CAA 651 CAG CAA TCC AGC AAT CCA AAT TTC ATA CCA TAT CGT GAT TCA AAA TTA AC 701 T AGA ATT TTA AAA GAT TCT TTG ACT GGT AGT TGT AAA ACT ATA ATG ATT G 751 CA AAT ATT AGT CCA AAT TCT TCA TCA TTC GAA GAG ACT CAC AAT ACA TTA 801 AAA TAT GCT CAA CGT GCT AAA TCA ATT AAA ACT CAA ATC ACT AAA AAT GT 851 A TTT GCA AGT TCA ACC AAT TTA ATA ACG CAA TAT AAT GAA ATC ATT AAA G 901 AA CAA AGA GAA GAA ATT AAA CAA TTA AAA TTA AAA TTA ATA CAA GCA ACT 951 TCA AAT AAT AAC AAT AGT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAC TA 1001 T TTT AGT AAC AGT TTT GGA AGT TGT GGT AAC AAA AAT CAA CCA ATT AAA C 1051 AA CCA ACA CCT CCA ACA TCA TTA TTT CAT CAA CAA AAT CAA AAA TAT TAT 1101 CGT AAT GAT GAT GAT GAT GAT GAT GAC AAT GAT CAA GAA GAA AAT AAT GA 1151 T GAA GTT TTA ATA AAT GAA GAT GAC GAA GAA GTA GAT GGA GAA GAT TCT A 1201 AT AAT AGG GAT AAT GAT GAA TCA ATG ATA CAA CAA TTA GAA GAA ATG AGT 1251 TTA TTA ATT AAT TCA AAC TTA CAA GAT ACT TTA ACA TTA AAG AAA ACT CA 1301 A AGT ATT CAA AGA CAA AGA AAA AGG GAA TTA GAA AAT GAA TTA AAA TCT T 1351 TA GAA AAA CAA CAA CAA TCA ATC TTA AAT GAA AAT AAT AAT GTA GAT ATA 1401 ATT AAA AGA ACA AAT GAA ATT GGT AGT CAA ATT TTA AAG ATT AAA ACA TT 1451 G GAA TCA AGT ATA AAT GAA AAA TTG GAA ATG AAT AAT CAA TGG AGA AGA A 1501 AA CTT CAA TCA GAG TTA ACA TTG AAA TTT GTA AAT TCT CCA AAG AAT TTA 1551 AAG ATA CTA ATT CAA CAA GCA AGA GCA GCA ACT TTA GAA TTG GAT AGA TT 1601 C GAT CTC ACC GAG AGA ATG ATT GAT GAT AGA TCA AAA TTA AAT TTA AAA A 1651 CA AAT GAA TGT AAA TCT TTA AAG GAC TCA CTC TCT TGG ATG TTT GGT ATT 1701 TTA TCA GAT GGT TTC AAA CTT TTA ACT GAA AAT AAT TTA GCA ACT GAT GA 1751 C TTT TTA AAA GAT TTT TTG AAA AGT GGT GAT TTA ATT AAT AAT TTG GAT A 1801 AT AGT TTT ATA ATA AAT GAA AAT AAT GAT TCA AAT AAT AAT AAC ATT ATT 1851 GAA AAT GAT GAT ATA GAT TTA TCA TTT AAT AAT GAT ATA AAT AAT AAT AA 1901 T AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT A 1951 AT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT 2001 AAT AAT AAT AAT AAT AAT AAT AAT AAT GTA CCT TTA AAT TGT AAT AAT AG 2051 T AAC AGT AAT ATT AAT AAT AAA AAT CAA AAC ATC ATA AAC CCA TCA CCA T 2101 TA AAA CCA AGA AGA ATT ATG AGT GGC AGC AAT [AA...] 2134 (stop) chrblob_3428.gen_1|24oct01 // crick strand 2134 TTAT TGCTGCCACT CATAATTCTT CTTGGTTTTA 2100 ATGGTGATGG GTTTATGATG TTTTGATTTT TATTATTAAT ATTACTGTTA 2050 CTATTATTAC AATTTAAAGG TACATTATTA TTATTATTAT TATTATTATT 2000 ATTATTATTA TTATTATTAT TATTATTATT ATTATTATTA TTATTATTAT 1950 TATTATTATT ATTATTATTA TTATTATTAT TATTATTATT ATTATTATTA 1900 TTATTATTAT TTATATCATT ATTAAATGAT AAATCTATAT CATCATTTTC 1850 AATAATGTTA TTATTATTTG AATCATTATT TTCATTTATT ATAAAACTAT 1800 TATCCAAATT ATTAATTAAA TCACCACTTT TCAAAAAATC TTTTAAAAAG 1750 TCATCAGTTG CTAAATTATT TTCAGTTAAA AGTTTGAAAC CATCTGATAA 1700 AATACCAAAC ATCCAAGAGA GTGAGTCCTT TAAAGATTTA CATTCATTTG 1650 TTTTTAAATT TAATTTTGAT CTATCATCAA TCATTCTCTC GGTGAGATCG 1600 AATCTATCCA ATTCTAAAGT TGCTGCTCTT GCTTGTTGAA TTAGTATCTT 1550 TAAATTCTTT GGAGAATTTA CAAATTTCAA TGTTAACTCT GATTGAAGTT 1500 TTCTTCTCCA TTGATTATTC ATTTCCAATT TTTCATTTAT ACTTGATTCC 1450 AATGTTTTAA TCTTTAAAAT TTGACTACCA ATTTCATTTG TTCTTTTAAT 1400 TATATCTACA TTATTATTTT CATTTAAGAT TGATTGTTGT TGTTTTTCTA 1350 AAGATTTTAA TTCATTTTCT AATTCCCTTT TTCTTTGTCT TTGAATACTT 1300 TGAGTTTTCT TTAATGTTAA AGTATCTTGT AAGTTTGAAT TAATTAATAA 1250 ACTCATTTCT TCTAATTGTT GTATCATTGA TTCATCATTA TCCCTATTAT 1200 TAGAATCTTC TCCATCTACT TCTTCGTCAT CTTCATTTAT TAAAACTTCA 1150 TCATTATTTT CTTCTTGATC ATTGTCATCA TCATCATCAT CATCATTACG 1100 ATAATATTTT TGATTTTGTT GATGAAATAA TGATGTTGGA GGTGTTGGTT 1050 GTTTAATTGG TTGATTTTTG TTACCACAAC TTCCAAAACT GTTACTAAAA 1000 TAGTTATTAT TATTATTATT ATTATTATTA TTACTATTGT TATTATTTGA 950 AGTTGCTTGT ATTAATTTTA ATTTTAATTG TTTAATTTCT TCTCTTTGTT 900 CTTTAATGAT TTCATTATAT TGCGTTATTA AATTGGTTGA ACTTGCAAAT 850 ACATTTTTAG TGATTTGAGT TTTAATTGAT TTAGCACGTT GAGCATATTT 800 TAATGTATTG TGAGTCTCTT CGAATGATGA AGAATTTGGA CTAATATTTG 750 CAATCATTAT AGTTTTACAA CTACCAGTCA AAGAATCTTT TAAAATTCTA 700 GTTAATTTTG AATCACGATA TGGTATGAAA TTTGGATTGC TGGATTGCTG 650 TTGTGACTGT TGATTCTTAC ATAATTCACC TAATGCTTTA ATACAATTTC 600 CTAATGCTAA TAAAGATTTA TTTATACTTG TACCTTCTTT TAATCTGTCA 550 CCGGTATTTA AAGTTTTAGA AGCACGTTCT GAACCTGCCA AATCAATTAA 500 TGAAAGTTTA CCAAACGAAA TTTTACTTTT ATCTTGTAAG TTTTGTTGTT 450 TCACAGTGAT TTGTAAAACT GCATGAGATC TTGATGATGT TTGATTGGTT 400 TGAGTTGGTG ATTGTTTTCT ATTTAAATTT CCATATTTTA ATAATTTAAA 350 AACTTGGTCT GCTGAAGTCG GATATTCCCA TGATAAATCA CGAATTACAA 300 TTTGTTTATT TTCATCCTCA CATAATTCTA AAACTTTATT ATTACTATTA 250 CCACCACCAC CAGTATTGGT AATTAATAAA TCTCTAATGG TTTCGTTATA 200 GACTTCTAAA TATGACATTG AAACAATGTA TTGATTGGAT CTATCTTTTT 150 CAATCAATGA GAATAATTCT TTCATTGTTA ATACCATAAT ACCAGGACCA 100 GTATTAATAC CACCAACCAT 81 "chrblob_3428.gen_1|24oct01" TGTATGAGTT TTACCCGCAC CTGATGCACC 50 ATATGCAAAT ACTGATGCAT TATGACCCGA TATAACATAA CTAACTAATT end of file 3430 10 3433 10 pf10:987119w has 9 less repeats ? misassembly 3434 12 3440 3 3442 9 3446 6 + 14 chimera 3447 9 3448 12 3454 9 3456 13 3457 9 3466 12 3470 14 3474 14 3480 11 blob has sequence error 3481 11 3482 3 sequence errors 3484 9 3488 10 3491 14 3492 10 stevor 3496 12 3497 9 3501 9 3503 4 3504 13 Date: Wednesday, 3/6/2002 Time: 23:12 c3506.txt chrblob_3506|2001.10.15|GENOMIC|Sanger FEATURES Location CDS join(738..800,902..1741) /gene="chrblob_3506.glm_1|24oct01" /note="(protein coding) 72% identity to (AL034560) PFC0025c (MAL3P8.4), stevor (3D7-stevorT3-1), len: 296 aa; Similarity to other P.falciparum stevors. Member of a multi-gene family; predicted using hexExon [Plasmodium falciparum]" /codon_start=1 ORIGIN watson strand 1 CATGGTAAGA TCCTATTAAT TATACATATA TATTTATATG TTATTATTTA 51 TAAATGATTA TTGCATAATT AAGTAGGATA AAATAAGAGA TACAAGGGAG 101 AGTATTTTAT AATATAGGAT AATGCTTAAC AACAAAACTG AAACAAACAA 151 AAAAACAAAA ATATATTTAT TAAAATACAT ATAAAACTAT TTTATTATAT 201 TATTTTTAAT ATAAATATTA TTTTTTATTA ATTACAAGAA AAATTGTTGT 251 TAGTTTCACA ATAGTAATTA TATTAGAATA TATTTTAGGA TATTTATTAG 301 ATAAAAATCA TGAGAGCTAT TATTATATAT ATATGGCTCA CACCCATAAC 351 AATTATTGCT ATACACATTT ATATATGTAT TTGAAGGAAA ATATATTGTT 401 ATTTATTAAA AATTTATAAT ATATATATAT GAGAGAATTA TTATAAGAAA 451 AATTAAAAAA AAAAAAAATA AAATAAAAAT AATATAATAT AATATAAAAA 501 AAAAACAATT ATATATATTT AAATTTTTTT TTTTTAATAT TAAATGAATA 551 TAGTCATAAA TTAAATTATA AGTATGATGA AACTATAAGG TTATTATATT 601 ATAAAATTAC AACAAAATTT CCGCTTATCA ATATATTATA TAAAATATAT 651 ATTAGCAAAA CAAAATAGAT AATTTTTTAT GAAATAGACT AATACAATTT 701 GAAATATAAC ATATTGTTTT TTGAATTAAA A start chrblob_3506.glm_1|24oct01 vbc stevor note codon s t a r t = 7 exon 1 732 ATA AAG ATG TAT TAC CTT A 751 AA ATG TTA TTG TTT ACC TTT TTA ATA AAT ACA TTA GTA TTA CAA CAT TAT intron 801 GTATGTAAAA AATATACATT ATTATTACTA TGACATAAAC ATATAATAAA 851 ACAATTATTA CATTTTCAGT ACATATTCAT TAATTCTTTT TTTTTTTTTA 901 G exon 2 902 GAG AAT TAT CTA AAT AAC CAT TAT AAT GTA AGT CTC ATT CAA AAT AAC A 951 CC AAA AGA ACA ACG ATA CAT TCA AGA TTA TTA GCA CAA ACG AAA AAC CAT 1001 AAT CCA CAT TAT CAT AAT GAT CCA GAA CTC AAA GAA ATA ATT GAT AAA AT 1051 G AAC GAG GAA GCA ATC AAA AAA TAT CAA CAA ACT CAT GAT CCA TAT AAA C 1101 AA TTG AAA GAT GTA GTA GAA AAA AAT GGA ACA AAA TAT ACA GGT GGT AAT 1151 GAT GTA GAA CCT ATG TCA ACT CTA GAA AAA GAA TTA TTG GAA ACA TAT GA 1201 A GAA ACG TTT GGT AAC AAA AGT GAT ATG TTG AAG TTG GGT AAG TAC AAA A 1251 AT GAT GAT GAC AAA TCA GAT GAT TCA TCT TCA TGT GGA TGT ACT AAT ATT 1301 AAT AAT ATG AAA CTA GCA AAA ACC AAA GGA AGA GAT AAG TAT TTA AAA CA 1351 C TTA AAA GGG AGA TGT ACC CGT GGT ATA TAT ATT TCT TCA CTT ACT ACT G 1401 TA ATA TTA ACA ACG ATC GCT TTG CAT ACT GCA AAA GCT GCT GCC CTT GCT 1451 AAG TTT GTT GAA TCT GCT AAA ACG TGT GCG TCT TAT ATG ACA ATA TTT AA 1501 C ATG TTG AAT GCT GGT AAC TTA AAT ACA GCT ATT CAA GCA GGT GGT GGA A 1551 TA TGT ACT TCT GCT TAT TCC GAT ATA GTT TTG CCT GCT GCA AAT GCT GCT 1601 TTG AGC GCA ATA TAC CCC TGT GGT ATT GCA GCT TTG GTT CTA CTT ATA TT 1651 A ACT GTT GTA CTT ATA ATA TTA TAT ATA TGG TTA TAT AGA AGA AGA AAA A 1701 GA TCA TGG AAA CAT GAA TGC AAG AAA CAT TTA TGC AAG TAA* 1741 stop chrblob_3506.glm_1|24oct01 TAAATTTTT 1751 AAAAATATGA ATTATGTAAT TTGTGAATCG CATATACATT ATATTTTATA 1801 ATAATTATTT TTTACAGAAG TAATATTTTT AGAATTATTT GTTTTTAAAG 1851 AAAATATATA TATTTATTTA TAAATAAATA AACAAAAGTA TTAAAAGTCT 1901 TATATTATAT TGTGTTATAA TATATCTGTT GATCAATTTA CATATTTTAT 1951 TTTTATTACA TTTCTAACCA AATGTATTTT TTATATGTTA AA // crick strand 1992 TT TAACATATAA AAAATACATT TGGTTAGAAA TGTAATAAAA 1950 ATAAAATATG TAAATTGATC AACAGATATA TTATAACACA ATATAATATA 1900 AGACTTTTAA TACTTTTGTT TATTTATTTA TAAATAAATA TATATATTTT 1850 CTTTAAAAAC AAATAATTCT AAAAATATTA CTTCTGTAAA AAATAATTAT 1800 TATAAAATAT AATGTATATG CGATTCACAA ATTACATAAT TCATATTTTT 1750 AAAAATTTA "chrblob_3506.glm_1|24oct01" 1741 T TACTTGCATA AATGTTTCTT GCATTCATGT TTCCATGATC 1700 TTTTTCTTCT TCTATATAAC CATATATATA ATATTATAAG TACAACAGTT 1650 AATATAAGTA GAACCAAAGC TGCAATACCA CAGGGGTATA TTGCGCTCAA 1600 AGCAGCATTT GCAGCAGGCA AAACTATATC GGAATAAGCA GAAGTACATA 1550 TTCCACCACC TGCTTGAATA GCTGTATTTA AGTTACCAGC ATTCAACATG 1500 TTAAATATTG TCATATAAGA CGCACACGTT TTAGCAGATT CAACAAACTT 1450 AGCAAGGGCA GCAGCTTTTG CAGTATGCAA AGCGATCGTT GTTAATATTA 1400 CAGTAGTAAG TGAAGAAATA TATATACCAC GGGTACATCT CCCTTTTAAG 1350 TGTTTTAAAT ACTTATCTCT TCCTTTGGTT TTTGCTAGTT TCATATTATT 1300 AATATTAGTA CATCCACATG AAGATGAATC ATCTGATTTG TCATCATCAT 1250 TTTTGTACTT ACCCAACTTC AACATATCAC TTTTGTTACC AAACGTTTCT 1200 TCATATGTTT CCAATAATTC TTTTTCTAGA GTTGACATAG GTTCTACATC 1150 ATTACCACCT GTATATTTTG TTCCATTTTT TTCTACTACA TCTTTCAATT 1100 GTTTATATGG ATCATGAGTT TGTTGATATT TTTTGATTGC TTCCTCGTTC 1050 ATTTTATCAA TTATTTCTTT GAGTTCTGGA TCATTATGAT AATGTGGATT 1000 ATGGTTTTTC GTTTGTGCTA ATAATCTTGA ATGTATCGTT GTTCTTTTGG 950 TGTTATTTTG AATGAGACTT ACATTATAAT GGTTATTTAG ATAATTCTCC 900 TAAAAAAAAA AAAAGAATTA ATGAATATGT ACTGAAAATG TAATAATTGT 850 TTTATTATAT GTTTATGTCA TAGTAATAAT AATGTATATT TTTTACATAC 800 ATAATGTTGT AATACTAATG TATTTATTAA AAAGGTAAAC AATAACATTT 750 TAAGGTAATA CAT 738 "chrblob_3506.glm_1|24oct01" CTTTATT TTTAATTCAA AAAACAATAT GTTATATTTC 700 AAATTGTATT AGTCTATTTC ATAAAAAATT ATCTATTTTG TTTTGCTAAT 650 ATATATTTTA TATAATATAT TGATAAGCGG AAATTTTGTT GTAATTTTAT 600 AATATAATAA CCTTATAGTT TCATCATACT TATAATTTAA TTTATGACTA 550 TATTCATTTA ATATTAAAAA AAAAAAATTT AAATATATAT AATTGTTTTT 500 TTTTTATATT ATATTATATT ATTTTTATTT TATTTTTTTT TTTTTTAATT 450 TTTCTTATAA TAATTCTCTC ATATATATAT ATTATAAATT TTTAATAAAT 400 AACAATATAT TTTCCTTCAA ATACATATAT AAATGTGTAT AGCAATAATT 350 GTTATGGGTG TGAGCCATAT ATATATAATA ATAGCTCTCA TGATTTTTAT 300 CTAATAAATA TCCTAAAATA TATTCTAATA TAATTACTAT TGTGAAACTA 250 ACAACAATTT TTCTTGTAAT TAATAAAAAA TAATATTTAT ATTAAAAATA 200 ATATAATAAA ATAGTTTTAT ATGTATTTTA ATAAATATAT TTTTGTTTTT 150 TTGTTTGTTT CAGTTTTGTT GTTAAGCATT ATCCTATATT ATAAAATACT 100 CTCCCTTGTA TCTCTTATTT TATCCTACTT AATTATGCAA TAATCATTTA 50 TAAATAATAA CATATAAATA TATATGTATA ATTAATAGGA TCTTACCATG end of file 3507 9 3513 13 3515 9 3518 9 3519 10 stevor pseudogene 3524 4 3526 9 3527 9 3528 10 3535 9 3537 10 telomere rep20 3538 13 3541 3 3543 13 3544 4 3546 9 3548 13 3549 3 3550 14 3552 12 3555 2 3556 3 3561 10 3563 9 stevor 3564 10 3565 3 stevor 3567 9 3569 13 3570 9 Date: Wednesday, 3/6/2002 Time: 23:13 c3572.txt chrblob_3572|2001.10.15|GENOMIC|Sanger FEATURES Location CDS complement(join(835..1716,1867..1938)) /gene="chrblob_3572.glm_1|24oct01" /note="(protein coding) 52% identity to (AL034559) predicted using hexExon; MAL3P7.51 (PFC1100w), Rifin, len: 318 aa; Similarity to other P.falciparum rifins. Member of a multi-gene family. [Plasmodium falciparum]" /codon_start=1 ORIGIN watson strand 1 TATGGGAATA AACGGATATC ATATAAATAT TATTATTCTA ATACAATTAT 51 AATTATTATA TATTATAGTG TGACTATTTT ATAATAATAC TTATTGTAAA 101 ATTAGTTTGA TTAATTATTC TTATGTTATA ATGTGTTGAT ATATCGATAT 151 ATCGTGTTCA AAACATTTTT TTTTGGTACT GTATATATAT ATATATTACA 201 TCTTTTTAAT ATGTGCCCTG TAATAAGATG ACACATATTT TGTTTTATTA 251 ACAGGGAAAA ATATTTAAAA TAAAATAAGA TAAAAAATAA TTAACCTAAT 301 ATTTTATTTT ACACATGACA TGCAAATGTA AAATAATAAT AAATATGTAT 351 TATATATATT ATAAAAATAA TATGGTACAA ATGATATAGA TTAATGTTAT 401 TAATTAAAAT TAGATTTATT TATATTAGTT TATATTATAT TAATATAATT 451 AGATTATAAA TAATATAAGA CTAATTATAT AATATATTCC ATTACATATT 501 ATTTTATATG AGGAATTTAA AATATATATG TTACAAGGTA TTCTTAAAGA 551 GTGTAAAATA AATAAATATA TATGTATACA TACAAACAAT ATATATTTAT 601 ATAAAATCTT CATTAAAAAA AATATATAAT TTACACTCGT TTCACTAAAA 651 AAAAATAAAT AAATATAAAT TAATTAATTT AATAACCACA TAACATTAAA 701 CAAAAAAAAA AATTATGGGG AAAACAAAAA TAAATATAAT GTTATAAAAA 751 ATTTAATTAT CATAATATGT TTGTATTAAT AAATCTAAAA TTCACAAAAC 801 ATTAAATTGT ATTTATTATC ATGAAACCAT ATAT "chrblob_3572.glm_1|24oct01" 835 TTATTG ATTTAATAAT 851 TTTGTGTATT GGGCTTTTTT CTTCATTTTT TTTTTTCGTC GATAACGTAA 901 AACTAAATAA ATAATTATCA TAACTAAAAC TATAACTACT ATTGCAATAA 951 TTGAAGCAGT TATTCCAGTA GTTAAACTAC TAGTAATCGA TGTATAGTTC 1001 GTAGCCTCAG CTGCTTTACC TTGTGCAATA GCTTTTTCAA TTGCTGCTAT 1051 GTGTGCGCTA TGCCTTGTAT TAAACTCAGC AATGGTTTCA GTTTTAACGA 1101 TACCATCTAG AACTGACACG AAACTACTAT AGCCACGATC CTCTAATGTT 1151 TCGTACATAG TAATAATATG TTCAAACATA TCAGAAAGAG TTACACCATT 1201 GTTAAATTTA CCTGAAGAAA GCATTTCTGT CACAGTAATT TGGGGAACAC 1251 TACCTAAACG AGTCGCTTTG TATATTTGAA TAATTTGATC TAAACCCACT 1301 TGTATACCTT TCTCAATACC CGCTGCAAGG GCTTTTTGAG TAACATATTG 1351 TGACCATGTT GCATACCATA AACCGCTGAC CAGACTCCAA ACAGGTAGAA 1401 CACCACCTCC TAACCCACAC CCACACTTAA GACAACCTTG TTCCACTTTT 1451 TTTGCTAATG ATTTTTGGAC TTTATCTTTT ACAATGATTT CTTGTATATC 1501 TTTGTCACAT TGTTCTTTAC ATTTTTTTCG TTTATCTTGC ACACGTTCCT 1551 CGTATTCTTC AAAACGTTGT GATGTTTGTC GATCGAAATT TTCCTTCACA 1601 GATTTCATAT CCGGATCTTT ATCATAATTG GGCATATATA GGTCACATTC 1651 GCTTAACACT CGTAATGTAG TAGTTGGTGT ATTTGGTGTG ATGTATGGTT 1701 TATTTTTATT ATGTGCCTAT AAGGAGTGCA ATATATATAT ACATGCATGT 1751 TTTAATGAGT TGTTTACTAT TTTATATATT TCTAATAAAT ATATATATGT 1801 TATATTAACA TAAATAATAA AACGTTACAT ATATATATAT ATAATAATTA 1851 TTTTTTTTAT TCATACATCT GATGATGATG CTACCAATAT ATTTAATGAA 1901 AGGGAAAATA ATAATATTTT AGAGTAGTGC AGTTTCAT 1938 "chrblob_3572.glm_1|24oct01" AT TTATTGTGAT 1951 ACTTATATTA TTTTATGACT AAAATTATAA GTAATTAATA CATAAAAATT 2001 CATTGTTTTT TATTAAAGGA ATTACATATG TATAATTTAA AATATTATTA 2051 TAGTTCCATC ATATAA // crick strand 2066 TTATAT GATGGAACTA 2050 TAATAATATT TTAAATTATA CATATGTAAT TCCTTTAATA AAAAACAATG 2000 AATTTTTATG TATTAATTAC TTATAATTTT AGTCATAAAA TAATATAAGT 1950 ATCACAATAA AT start chrblob_3572.glm_1|24oct01 glm stevor note may splice as rifin exon 1 1938 ATG AAA CTG CAC TAC TCT AAA ATA TTA TTA TTT TCC CT 1900 T TCA TTA AAT ATA TTG GTA GCA TCA TCA TCA GAT intron GTATGA ATAAAAAAAA 1850 TAATTATTAT ATATATATAT ATGTAACGTT TTATTATTTA TGTTAATATA 1800 ACATATATAT ATTTATTAGA AATATATAAA ATAGTAAACA ACTCATTAAA 1750 ACATGCATGT ATATATATAT TGCACTCCTT ATAG exon 2 1716 GCA CAT AAT AAA AAT A 1700 AA CCA TAC ATC ACA CCA AAT ACA CCA ACT ACT ACA TTA CGA GTG TTA AGC 1650 GAA TGT GAC CTA TAT ATG CCC AAT TAT GAT AAA GAT CCG GAT ATG AAA TC 1600 T GTG AAG GAA AAT TTC GAT CGA CAA ACA TCA CAA CGT TTT GAA GAA TAC G 1550 AG GAA CGT GTG CAA GAT AAA CGA AAA AAA TGT AAA GAA CAA TGT GAC AAA 1500 GAT ATA CAA GAA ATC ATT GTA AAA GAT AAA GTC CAA AAA TCA TTA GCA AA 1450 A AAA GTG GAA CAA GGT TGT CTT AAG TGT GGG TGT GGG TTA GGA GGT GGT G 1400 TT CTA CCT GTT TGG AGT CTG GTC AGC GGT TTA TGG TAT GCA ACA TGG TCA 1350 CAA TAT GTT ACT CAA AAA GCC CTT GCA GCG GGT ATT GAG AAA GGT ATA CA 1300 A GTG GGT TTA GAT CAA ATT ATT CAA ATA TAC AAA GCG ACT CGT TTA GGT A 1250 GT GTT CCC CAA ATT ACT GTG ACA GAA ATG CTT TCT TCA GGT AAA TTT AAC 1200 AAT GGT GTA ACT CTT TCT GAT ATG TTT GAA CAT ATT ATT ACT ATG TAC GA 1150 A ACA TTA GAG GAT CGT GGC TAT AGT AGT TTC GTG TCA GTT CTA GAT GGT A 1100 TC GTT AAA ACT GAA ACC ATT GCT GAG TTT AAT ACA AGG CAT AGC GCA CAC 1050 ATA GCA GCA ATT GAA AAA GCT ATT GCA CAA GGT AAA GCA GCT GAG GCT AC 1000 G AAC TAT ACA TCG ATT ACT AGT AGT TTA ACT ACT GGA ATA ACT GCT TCA A 950 TT ATT GCA ATA GTA GTT ATA GTT TTA GTT ATG ATA ATT ATT TAT TTA GTT 900 TTA CGT TAT CGA CGA AAA AAA AAA ATG AAG AAA AAA GCC CAA TAC ACA AA 850 A TTA TTA AAT CAA TAA* 835 stop chrblob_3572.glm_1|24oct01 ATAT ATGGTTTCAT GATAATAAAT ACAATTTAAT 800 GTTTTGTGAA TTTTAGATTT ATTAATACAA ACATATTATG ATAATTAAAT 750 TTTTTATAAC ATTATATTTA TTTTTGTTTT CCCCATAATT TTTTTTTTTG 700 TTTAATGTTA TGTGGTTATT AAATTAATTA ATTTATATTT ATTTATTTTT 650 TTTTAGTGAA ACGAGTGTAA ATTATATATT TTTTTTAATG AAGATTTTAT 600 ATAAATATAT ATTGTTTGTA TGTATACATA TATATTTATT TATTTTACAC 550 TCTTTAAGAA TACCTTGTAA CATATATATT TTAAATTCCT CATATAAAAT 500 AATATGTAAT GGAATATATT ATATAATTAG TCTTATATTA TTTATAATCT 450 AATTATATTA ATATAATATA AACTAATATA AATAAATCTA ATTTTAATTA 400 ATAACATTAA TCTATATCAT TTGTACCATA TTATTTTTAT AATATATATA 350 ATACATATTT ATTATTATTT TACATTTGCA TGTCATGTGT AAAATAAAAT 300 ATTAGGTTAA TTATTTTTTA TCTTATTTTA TTTTAAATAT TTTTCCCTGT 250 TAATAAAACA AAATATGTGT CATCTTATTA CAGGGCACAT ATTAAAAAGA 200 TGTAATATAT ATATATATAC AGTACCAAAA AAAAATGTTT TGAACACGAT 150 ATATCGATAT ATCAACACAT TATAACATAA GAATAATTAA TCAAACTAAT 100 TTTACAATAA GTATTATTAT AAAATAGTCA CACTATAATA TATAATAATT 50 ATAATTGTAT TAGAATAATA ATATTTATAT GATATCCGTT TATTCCCATA end of file 3573 3 3574 7 3576 9 3578 2 3581 14 3582 9 3584 12 3585 9 3589 10 3594 4 3595 10 3597 10 3598 4 3600 10 3601 14 3603 4 3604 13 3608 9 3609 9 3611 9 3613 4 Date: Friday, 3/8/2002 Time: 18:52 c3615.txt chrblob_3615|2001.10.15|GENOMIC|Sanger FEATURES Location CDS complement(join(1..539,704..786)) /gene="chrblob_3615.gen_1|24oct01" /note="(protein coding) 41% identity to fimbriae-associated protein Fap1 - Streptococcus parasanguinis" /codon_start=1 ORIGIN watson strand 1 TAACATCATA AGTAACATGT CTACTAACAT GACTACTAAC ATCATCACAA 51 CTAACATCAT AACTAACATG GTGACTAACA TGATCACTAA CATGACTACT 101 AACAACATCA CTAACATCAT GACTAACATT ACTACTTACA TGATTACTAA 151 CTTGACTACT AACATGATTA CTAACATGAC TACTAACATT ACTACTAACA 201 TGATCACTAA CATGACTACT AACATCATCA CTAACATGAC TAAGAACATT 251 ACTAACATGA CTACTTACAT GACTACTAAC ATAGTAACTA ACAACATGAC 301 TAACATGACT ATGAACATGA TGACTAACAA CATGACTAAC TTGACTACTA 351 ACATGACTAC TAACATCATT ACTAACATGT CTACTAACTT GACTACTAAC 401 AACATCACTC ACATGAATAC TAACATCATC ATTAACAACA TCACTAACAT 451 GATTACTTAC ATGACTACTA ACATTACTAC TTACATGACT ACTTACATGA 501 CTACTAACAT TACTACTAAC ATCATCACTA ACATGACTAC TAACATCATC 551 ATAACTAACA TAACTACTAA CATGACTAGT AACTTAGGTC TTAATTGTAC 601 TAACGCCGTC TCATCATTAC TAAGGTGTTT ATTTAACTAA TATGGATCTT 651 AACTAACTAG GGTCTTACCT TAACTAATAC AGGTCTTACG TCGACTAACA 701 TACGTCTTAC GTTGACTAAC TGAGGTCTTA ACTTCAACTA ACTTAGGTCT 751 TAACTTGACT AACATACGTC CTAACTTGAC TAACATATGT CTTAACTTGA 801 CTAACATAGG TCTTACTTTC ACTAACTTAG GTCTTCACTT AGCTAACTTA 851 GGTCTTAACT TAACTAACTA AGGTCTTAAC GTAACTAACT AAGGTCTTAA 901 CTTGACTAAC ATAGGTCTTA AGTTAACTAA CTCAGACCTT ACTTTCACTA 951 ATATAGGTCT TAAGTCATCT AACGTAGGTC TTAATTTCAA CTAACTTAGG 1001 TCTTAAATTG AGAAACTAAG GTCATACTTC GACTAACGTG GGTCTTACAT 1051 TAACTAACTC AGGTCTTACT TTCATTCATA TAGGTCTTAT TATTACTAAC 1101 TAAGGTCCTA ACTTAACTAA TATAGGTCAT AAAATTACTA AGCTAAGTCA 1151 TTAAGGTACT AACTTAGGTC TTACCTTCAC TTATATAGGT CTTACTTTCA 1201 CTAACTGAGG TCATACTTCT TCTAACTTAG GTCTTAACTT TACTAACCTA 1251 TGTCTTAAAG TAACTAATAT AGGTCTTAAC TTGACTAACA TATGTCTTAA 1301 CATTAGTAAT GTAGGTCTTA CTTTCACTCA TATAAGTCTT ATGGTAACTA 1351 ACTAAGGTCT TACTTTTACT AACTAAGGTG TTAACATAAC TAACTAAGGT 1401 CATACTTTTA CTAACTTAGG TCTTAAATTG AGTAACTAAG GTCATATTTC 1451 GACTAATATG GGTCTTAACT TCACTATCTC TCGTCCTACT ATTACTAACT 1501 TAAGTCTTAC TTTGCCTAGG TGAGTTCCTT CTGTTACTAA CATAGGTCTT 1551 AACTTAACTA ACTCTGGTTC TGCGATTACT AACTTAGGTC ATACTTCGAC 1601 TAATATGAGT CTTAACTTCA CTAACTCTGG TCATACTATT ACTAACTTAA 1651 GTCTTAACTT AAGTATCTCT GGTCCTACTA TTACTAATTT AGATGTTATT 1701 TTCATTAACT TAGGTCTTAA TTTCAACTAA CTTAGGTCTT AAATTGAGTA 1751 ACCAAGGTCA GACTTCGACT AACGTAGGCC TTACTTTCAC TAACCTAAGT 1801 CTTACTTTTA CTAACATAGG TCATACTTCG ATTAACGTAG GTCTTACTTT 1851 CACTCATATA GCTTTTATGG TAACTAACTA AGGTCTTAAC TTAACTAATA 1901 CAGGTCTTAC GTTTACTTAC ATAGGTCATA CTTCGACTAA TGTAGGTCTT 1951 AACTTAACTA ACTTAGGTCT TACTTCTACT AACTTAGGTC TTAACTCAAC 2001 TAACTGAGGT CTTACTTGGA CTCATATAGG TCTTACTTTC ACTAAGTGAG 2051 GTCCTTCTTT TACTAACATA GGTCTTAACT TTACTAACTC TGGTTCTGCG 2101 ATTACTAACT TAGGTCATAC TTCGACTAAC TAAGGTCTTA CGTTCACTAA 2151 GTGAGGTCTT TCTGTTACTA ACATAGGTCT TAACTTGACT AACATAGGTC 2201 TTACTTTTAC TAACATAGGT CATACTTCGA CTAACATAGG TCTTAAGTTA 2251 ACTAACTAAG GTCTTTCCAT CACTGATATA AGTCTTATGA TTACTAGCTA 2301 AGGTCCTAAC TTAACTAATA TAGGTCA // crick strand 2327 TGACCTA TATTAGTTAA GTTAGGACCT 2300 TAGCTAGTAA TCATAAGACT TATATCAGTG ATGGAAAGAC CTTAGTTAGT 2250 TAACTTAAGA CCTATGTTAG TCGAAGTATG ACCTATGTTA GTAAAAGTAA 2200 GACCTATGTT AGTCAAGTTA AGACCTATGT TAGTAACAGA AAGACCTCAC 2150 TTAGTGAACG TAAGACCTTA GTTAGTCGAA GTATGACCTA AGTTAGTAAT 2100 CGCAGAACCA GAGTTAGTAA AGTTAAGACC TATGTTAGTA AAAGAAGGAC 2050 CTCACTTAGT GAAAGTAAGA CCTATATGAG TCCAAGTAAG ACCTCAGTTA 2000 GTTGAGTTAA GACCTAAGTT AGTAGAAGTA AGACCTAAGT TAGTTAAGTT 1950 AAGACCTACA TTAGTCGAAG TATGACCTAT GTAAGTAAAC GTAAGACCTG 1900 TATTAGTTAA GTTAAGACCT TAGTTAGTTA CCATAAAAGC TATATGAGTG 1850 AAAGTAAGAC CTACGTTAAT CGAAGTATGA CCTATGTTAG TAAAAGTAAG 1800 ACTTAGGTTA GTGAAAGTAA GGCCTACGTT AGTCGAAGTC TGACCTTGGT 1750 TACTCAATTT AAGACCTAAG TTAGTTGAAA TTAAGACCTA AGTTAATGAA 1700 AATAACATCT AAATTAGTAA TAGTAGGACC AGAGATACTT AAGTTAAGAC 1650 TTAAGTTAGT AATAGTATGA CCAGAGTTAG TGAAGTTAAG ACTCATATTA 1600 GTCGAAGTAT GACCTAAGTT AGTAATCGCA GAACCAGAGT TAGTTAAGTT 1550 AAGACCTATG TTAGTAACAG AAGGAACTCA CCTAGGCAAA GTAAGACTTA 1500 AGTTAGTAAT AGTAGGACGA GAGATAGTGA AGTTAAGACC CATATTAGTC 1450 GAAATATGAC CTTAGTTACT CAATTTAAGA CCTAAGTTAG TAAAAGTATG 1400 ACCTTAGTTA GTTATGTTAA CACCTTAGTT AGTAAAAGTA AGACCTTAGT 1350 TAGTTACCAT AAGACTTATA TGAGTGAAAG TAAGACCTAC ATTACTAATG 1300 TTAAGACATA TGTTAGTCAA GTTAAGACCT ATATTAGTTA CTTTAAGACA 1250 TAGGTTAGTA AAGTTAAGAC CTAAGTTAGA AGAAGTATGA CCTCAGTTAG 1200 TGAAAGTAAG ACCTATATAA GTGAAGGTAA GACCTAAGTT AGTACCTTAA 1150 TGACTTAGCT TAGTAATTTT ATGACCTATA TTAGTTAAGT TAGGACCTTA 1100 GTTAGTAATA ATAAGACCTA TATGAATGAA AGTAAGACCT GAGTTAGTTA 1050 ATGTAAGACC CACGTTAGTC GAAGTATGAC CTTAGTTTCT CAATTTAAGA 1000 CCTAAGTTAG TTGAAATTAA GACCTACGTT AGATGACTTA AGACCTATAT 950 TAGTGAAAGT AAGGTCTGAG TTAGTTAACT TAAGACCTAT GTTAGTCAAG 900 TTAAGACCTTA GTTAGTTACGTTAAGACCTTA GTTAGTTAAGTTAAGACC 850 TAA GTTAGCTAAGTGAAGACCTAA GTTAGTGAAAGTAAGACCTAT GTTAG 800 TCAAGTTAAGACAT 786 AT GTT AGT CAA GTT AGG ACG TAT GTT AGT CAA GTT A 750 AG ACC TAA GTT AGT TGA A GTT AAG ACC TCA GTT AGT CAA CGT AAG AC GT A 700 T GTT AGT CGA CGT AAG ACC TGT ATT AGT TAA GGT AAG ACC CTA GTT AGT T 650 AA GAT CCA TAT TA GTT AAA TAA ACA CCT TAG TAA TGA TGA GAC GGC GTT A 600 GT ACA ATT AAG ACC*TAA* GTT ACT AGT CAT GTT AGT AGT TAT GTT AGT TAT 550 GAT GAT GTT AG T AGT CAT GTT AGT GAT GAT GTT AGT AGT AAT GTT AGT AG 500 T CAT GTA AGT AGT CAT GTA AGT AGT AAT GTT AGT AGT CAT GTA AGT AAT C 450 AT GTT AGT GAT GTT GTT AAT GAT GAT GTT AGT ATT CAT GTG AGT GAT GTT 400 GTT AGT AGT CAA GTT AGT AGA CAT GTT AGT AAT GAT GTT AGT AGT CAT GT 350 T AGT AGT CAA GTT AGT CAT GTT GTT AGT CAT CAT GTT CAT AGT CAT GTT A 300 GT CAT GTT GTT AGT TAC TAT GTT AGT AGT CAT GTA AGT AGT CAT GTT AGT 250 AAT GTT CTT AGT CAT GTT AGT GAT GAT GTT AGT AGT CAT GTT AGT GAT CA 200 T GTT AGT AGT AAT GTT AGT AGT CAT GTT AGT AAT CAT GTT AGT AGT CAA G 150 TT AGT AAT CAT GTA AGT AGT AAT GTT AGT CAT GAT GTT AGT GAT GTT GTT 100 AGT AGT CAT GTT AGT GAT CAT GTT AGT CAC CAT GTT AGT TAT GAT GTT AG 50 T TGT GAT GAT GTT AGT AGT CAT GTT AGT AGA CAT GTT ACT TAT GAT GTT A... 1 end of file 3616 4 3618 4 3620 9 3621 1 3623 9 3624 1 + 11 chimera telomere 3625 14 3626 13 3628 9 3629 9 3630 3 3632 4 3633 2 telomeric rep39 repeat region 3634 14 3635 12 pfemp1 var note no match to rifin intron: Date: Friday, 3/8/2002 Time: 19:05 c3636.txt chrblob_3636|2001.10.15|GENOMIC|Sanger FEATURES Location CDS 425..1396 /gene="chrblob_3636.glm_1|24oct01" /note="(protein coding) 60% identity to (AL034559) predicted using hexExon; MAL3P7.54 (PFC1115w), Rifin, len: 372 aa; Similarity to other P.falciparum rifins. Member of a multi-gene family. [Plasmodium falciparum]" /codon_start=1 ORIGIN watson strand 1 AAAAAAAATA TACGTATCAC AATTAAAAAA start chrblob_3636.glm_1|24oct01 vbc rifin pseudogene note possible sequence error exon 1 AAG AAA GTC CAT TAT ATT AA 51 T ATA TTA TTG TTT GCT CTT CCA TTA AAT ATA TTG intron GTAATT CCATGTCACA 101 TATATATTAA AGAGGATTAA TATAATCATA TTATAATATA ATATATATAT 151 TTATATATAA ATATATTACG ATATCGTATA TATAATTTTT ATATATATAT 201 AGTCCAAATA TACATATATA TATCTAAACA TAAAAACATA CATATTTATA 251 ACATATATAT ATAAAATAAA AAAGAACTAA TTATAATATA CATATATATG 301 TGACCATTTT GTATAG exon 2 ATA TAT AAT CAA AGG AAC CAT TAC ATC ACA CGT A 351 CA CCA AAA GCA ACC ACT AGG ACA TTA TGT GAA TGT GAA TTG TAT GCA CCA 401 TCA AAC TAT GAT AAT GAC CCT GAA ATG AAA GCA GTA ATG CAA GAT TTT GA 451 T CGT CAA ACG TCG CAA CGT TTT GAA GAA TAC AAT GAA CGC TTG CTC GAA A 501 AC AAA CAA AAA TGT AAA GAA CAA TGC GAT AAA GAA ATA CAA AAA ATT ATT 551 TTA AAA GAT AAA TTA GAA AAA GAA TTA ATG TAC AAA TTT GCG ACA TTA CA 601 A ACT GAT ATA CAA AGT GAC GCC ATT CCA ACA TGT ATT TGC GAA AAA TCT T 651 TA GCA GAT AAA GTG GAA AAA GGA TGT TTG AAA TGT GGA GGT GTG TTG GGA 701 GGT GGT ATT ACA CCC GGT TGG GGT TTG ATC AGC GGT ATT GTA TAT ACT GG 751 A TGG AAA GCA GCA GCG TTG GCA GCT GCT AAG GAA CTT GCC GAA AAA GCC G 801 GT GCT CTA GCC GGT GAA GCT GCA CGT ATT CCG GCA GCT ATT GAT GCA GTC 851 ATT GAA GGA ATA AAA TCA AAA TTC TCT ATA GAT ACT TTA GGT GGT GAA GC 901 A TTG AAA TCC GTT ATT GAT GGA ACA AAT TAT TAT GAT GCC TCA TAC ATT A 951 CT ACA GCT ATT TAT AAT AAA TTT AAT GTG TCC TCA TGT CTA CCT TCT GTC 1001 CCT TTC CTT GGC GGT CCC CCT GTC CCT GGA GCT GGC GCT AAT AAG CCT AT 1051 T TGC AGT GCT GTT GAT AAA TTA TAT CTA GGT TCA GGG AAC TTT CTT GAC A 1101 AA AGT TCA TTA CCA GGT TCT ATA CAA AAA GAT GTA GCA AAA ATT GTT GCA 1151 GGA GCT GAA CAA GCT GCT AAA GCC AAA GCT GCT ATG GTG GCT TCC GAT AA 1201 A ACA TTA GCT GTT GAA ACA GCA AAA AAA AAC GCT ATA GAA ACT ACT TTT A 1251 TG GGT TAT CAT AAT GCT ATT ATT GCT TCT ATC GTT GCA ATA GTG GTA ATC 1301 GTT TTA ATT ATG GTA ATT ATT TAT TTA ATT TTA CGT TAT AGA CGA AAA AA 1351 A AAA ATG AAG AAA AAA CTC CAA TAT ATC AAA TTA TTA GAA GAA TAG* 1396 stop chrblob_3636.glm_1|24oct01 ATAT 1401 GTTTTGTTAT ATAGATTTTG GTAGGAAGTT TGGTACTTGT ATTGTTTTTC 1451 TTTGAATTTA CCATGTTTTC TTTTCCATTA TTAATAACTA TATATTTTTA 1501 TATGTATTGC GCTTTTTTAT ATAATTTATT TTTCTATAAT TTTATTTATT 1551 TATTTATTTT TTTTTTTAAA ACTCTTTTAA TTAATAAACA ATGTAATTTT 1601 TAATTTATAT AAAATACTTA TACGTATTAT AATATATTAT TTTTTTAAAA 1651 CATAATGTAA CGTATATTTT TTAAATACCT CATATGTTTT TCAAAGGAAT 1701 ATATATTAAA AAAAAAAACA ATAAAACTTA TTATTATTAT AATTATGATT 1751 ATTATGATTA CTATTATTAT AAATATTTTA AGAAACATAT TATTCAAAAT 1801 ATTATATCTA TATTTATATA ATTTAAATTA AAACCAATAA GTATATTATT 1851 TCAATTCAGA ATTATCATCC TTAAAAAACC TATCATATTA TATATTATGT 1901 TATTTATATT TATTTCATAA TATATTTTAT TATTTTAATT ATTTTTTATT 1951 AGAAATACTA CTAATACAAT GAATTCAAAA AATAGTCAAC ATATAACAAA 2001 ATATAATAAT TATACGTAAT ATAACAAATA GATACAATAC ATAAAAAACC 2051 AATAAAAACA CAAAAAACAA ATCAAATTAA TAAAAATAAA ACACAATAAA 2101 AAAAAGAATA ATGTATATTT TTTATTTTAA TATAATAATA CACTTTTTCT 2151 TTATTTTGCT TTGTAATTTT TATTATGTTG TTTTATTTAG TATAATATGT 2201 AGATATTTTT TGTTTTTATA TATATATATT TATTTGATAA TATGTATATA 2251 TTTATGAGAT ATAATTTCAT ATATATTTCA TAATTTATAT TGTTCTTTTT 2301 AATTTTTTTT TAAGTGTTAT TTGTTTCTAT ATTACGGTAT GCATTGATTT 2351 ATTATCATTA TATTTTTATA TATATTAAGT GGCAAAAAAA GAAAAAAAAA 2401 AAAAAAATTT GTTTATTAAA TATTTTTTCT TCTGTAAAAT GTTTTCCATT 2451 TTTGTTTATA TTTATATTTA TATTTATATT TATATATTTT TTTTTTTTTT 2501 TTTTTTTTTG GGTATTTTTT ATATATATGA AATTTATATG ATATATTTCA 2551 AATTTTTCTT TTTTTTTTTT TTTTTTTT // crick strand 2578 AAAAAAAA AAAAAAAAAA AAGAAAAATT 2550 TGAAATATAT CATATAAATT TCATATATAT AAAAAATACC CAAAAAAAAA 2500 AAAAAAAAAA AAAATATATA AATATAAATA TAAATATAAA TATAAACAAA 2450 AATGGAAAAC ATTTTACAGA AGAAAAAATA TTTAATAAAC AAATTTTTTT 2400 TTTTTTTTTC TTTTTTTGCC ACTTAATATA TATAAAAATA TAATGATAAT 2350 AAATCAATGC ATACCGTAAT ATAGAAACAA ATAACACTTA AAAAAAAATT 2300 AAAAAGAACA ATATAAATTA TGAAATATAT ATGAAATTAT ATCTCATAAA 2250 TATATACATA TTATCAAATA AATATATATA TATAAAAACA AAAAATATCT 2200 ACATATTATA CTAAATAAAA CAACATAATA AAAATTACAA AGCAAAATAA 2150 AGAAAAAGTG TATTATTATA TTAAAATAAA AAATATACAT TATTCTTTTT 2100 TTTATTGTGT TTTATTTTTA TTAATTTGAT TTGTTTTTTG TGTTTTTATT 2050 GGTTTTTTAT GTATTGTATC TATTTGTTAT ATTACGTATA ATTATTATAT 2000 TTTGTTATAT GTTGACTATT TTTTGAATTC ATTGTATTAG TAGTATTTCT 1950 AATAAAAAAT AATTAAAATA ATAAAATATA TTATGAAATA AATATAAATA 1900 ACATAATATA TAATATGATA GGTTTTTTAA GGATGATAAT TCTGAATTGA 1850 AATAATATAC TTATTGGTTT TAATTTAAAT TATATAAATA TAGATATAAT 1800 ATTTTGAATA ATATGTTTCT TAAAATATTT ATAATAATAG TAATCATAAT 1750 AATCATAATT ATAATAATAA TAAGTTTTAT TGTTTTTTTT TTTAATATAT 1700 ATTCCTTTGA AAAACATATG AGGTATTTAA AAAATATACG TTACATTATG 1650 TTTTAAAAAA ATAATATATT ATAATACGTA TAAGTATTTT ATATAAATTA 1600 AAAATTACAT TGTTTATTAA TTAAAAGAGT TTTAAAAAAA AAAATAAATA 1550 AATAAATAAA ATTATAGAAA AATAAATTAT ATAAAAAAGC GCAATACATA 1500 TAAAAATATA TAGTTATTAA TAATGGAAAA GAAAACATGG TAAATTCAAA 1450 GAAAAACAAT ACAAGTACCA AACTTCCTAC CAAAATCTAT ATAACAAAAC 1400 ATAT "chrblob_3636.glm_1|24oct01" 1396 CTATTC TTCTAATAAT TTGATATATT GGAGTTTTTT CTTCATTTTT 1350 TTTTTTCGTC TATAACGTAA AATTAAATAA ATAATTACCA TAATTAAAAC 1300 GATTACCACT ATTGCAACGA TAGAAGCAAT AATAGCATTA TGATAACCCA 1250 TAAAAGTAGT TTCTATAGCG TTTTTTTTTG CTGTTTCAAC AGCTAATGTT 1200 TTATCGGAAG CCACCATAGC AGCTTTGGCT TTAGCAGCTT GTTCAGCTCC 1150 TGCAACAATT TTTGCTACAT CTTTTTGTAT AGAACCTGGT AATGAACTTT 1100 TGTCAAGAAA GTTCCCTGAA CCTAGATATA ATTTATCAAC AGCACTGCAA 1050 ATAGGCTTAT TAGCGCCAGC TCCAGGGACA GGGGGACCGC CAAGGAAAGG 1000 GACAGAAGGT AGACATGAGG ACACATTAAA TTTATTATAA ATAGCTGTAG 950 TAATGTATGA GGCATCATAA TAATTTGTTC CATCAATAAC GGATTTCAAT 900 GCTTCACCAC CTAAAGTATC TATAGAGAAT TTTGATTTTA TTCCTTCAAT 850 GACTGCATCA ATAGCTGCCG GAATACGTGC AGCTTCACCG GCTAGAGCAC 800 CGGCTTTTTC GGCAAGTTCC TTAGCAGCTG CCAACGCTGC TGCTTTCCAT 750 CCAGTATATA CAATACCGCT GATCAAACCC CAACCGGGTG TAATACCACC 700 TCCCAACACA CCTCCACATT TCAAACATCC TTTTTCCACT TTATCTGCTA 650 AAGATTTTTC GCAAATACAT GTTGGAATGG CGTCACTTTG TATATCAGTT 600 TGTAATGTCG CAAATTTGTA CATTAATTCT TTTTCTAATT TATCTTTTAA 550 AATAATTTTT TGTATTTCTT TATCGCATTG TTCTTTACAT TTTTGTTTGT 500 TTTCGAGCAA GCGTTCATTG TATTCTTCAA AACGTTGCGA CGTTTGACGA 450 TCAAAATCTT GCATTACTGC TTTCAT 425 "chrblob_3636.glm_1|24oct01" TTCA GGGTCATTAT CATAGTTTGA 400 TGGTGCATAC AATTCACATT CACATAATGT CCTAGTGGTT GCTTTTGGTG 350 TACGTGTGAT GTAATGGTTC CTTTGATTAT ATATCTATAC AAAATGGTCA 300 CATATATATG TATATTATAA TTAGTTCTTT TTTATTTTAT ATATATATGT 250 TATAAATATG TATGTTTTTA TGTTTAGATA TATATATGTA TATTTGGACT 200 ATATATATAT AAAAATTATA TATACGATAT CGTAATATAT TTATATATAA 150 ATATATATAT TATATTATAA TATGATTATA TTAATCCTCT TTAATATATA 100 TGTGACATGG AATTACCAAT ATATTTAATG GAAGAGCAAA CAATAATATA 50 TTAATATAAT GGACTTTCTT TTTTTTAATT GTGATACGTA TATTTTTTTT end of file Date: Friday, 3/8/2002 Time: 19:05 c3637.txt chrblob_3637|2001.10.15|GENOMIC|Sanger FEATURES Location CDS 28..210 /gene="chrblob_3637.glm_1|24oct01" /note="(protein coding) No NR protein Similarities" /codon_start=1 CDS complement(1463..2782) /gene="chrblob_3637.glm_2|24oct01" /note="(protein coding) No NR protein Similarities" /codon_start=1 ORIGIN watson strand 1 ACTAATATTA ATAATAAAAA TCAAAAC start chrblob_3637.glm_1|24oct01 vbc exon 1 28 ATG ATA AAC CCA TCA CCA TTA AA 51 A CCA AGA AGA ATT ATG AGT GGC AGC AAT AAT ATT ATT AAA AGT ACA AAT T 101 CA AAC AGT AGA ATG ACA TCT ACA GCA ACA ACA ACA GCA GCT TCA ACA GCC 151 ACA GCG ACA ACA ACA ACA ATA GGT AAT GTA GAA AAA AGG AGA GAT AAG AT 201 C AAT TG intron GTAA TCCAATTAAT AAGATATGAT CCTCAACTTC TTTATTACCA 251 TCTTCTTCAA CAAAAATATC AAACACAACA CCTTTATATA G exon 2 T AGA ACA TC 301 T ATT TTA AGA AAA AGA ACA TTG GAA ATT GAT GAC AGT ACA GAT TCA AAT C 351 CA AGA ACT AAA AAA ATT AAT GTA TCA TCA CCG GTT GTA ACA AAA CCA AAG 401 CAA TTA TTA CCT TCA ACA ACA ACG GCA ACA ACA ACA ACA CTA TCA TCA CC 451 A CTT GTT AAT AAA CCC AAA CAA ATT TTA CCA ACA ACT TCA TCA TTA CAA C 501 CA AAA CCA CAC ACA AAA ATA CAG CCA CAC AAA AAT AAT AAT AAT AAT AAT 551 AAT AAT ATT GCG CCA CAA ATG AAT ATG AAT ATT CAA ATC CCA AAT CCA AT 601 A CCA ATA CCA ATA CCA ATG CAT GTG CAA ATT CCA ATA TCA AAT CCT ATA C 651 CT ATG CCA TCT CCA TCT TCA ATG AAT CTT AAA GAA AAA TTA GAT AGT CTA 701 TCT CAG TTA TGT AAC AAT CGT AGT GCC AAA AAT GAA AAC TAC AAT CAC AA 751 T AAT AGT TTT AAT AGC CAA AAT CCT TTT GTT CAT CCC CTT CAA ATG CAT C 801 CT CCA CAA TTA CAA CTA CCA CTA CAT CCA CCA CAA ACA ATG ATA ATG CAA 851 TCA AAT ATG GAT TTA AAG ATG AAA TTA GAT AGC CTT TCC TTT TTT AAC AA 901 T AAT AAT AAT AAC CAC CAA GCA CAA AAT GAT CTT AGC TTT GAT TAT GGT C 951 AA AAT ACA CTC TCA AAT GAA AAT TTA ATT CTT CAT AAT AAA ATT GCA AGT 1001 CTA TCT TCC ACA TTA ATT AAT CAA CCT CAC CCA ATG AGA GTT AAA AAA TT 1051 A ACT CCA ACA TCA ACA ATA TCA TCA TCT ATT TCA ACT AGA CCA ATC ACA A 1101 CT AGT ACA ACA ACT TCA ACA ACA GTG CCT TCA GTA GTA TCA AAT AGA ATT 1151 AAA TCA CTT GTT CAT TCA AAT TCG CCA ATT AAA GAA AAT TTA TAT AAA GA 1201 A AAA TTA TCT TCT ACT GCA TCA GCA ACA TTA ACA CCA AAT CGA AAT AAT T 1251 CT CAA ATT GTG CAA CCT TTT AAA AGA GGA GTT TTA GGT AAT GGA CCC ACA 1301 TCG TCA TCA TCT AGA CTA TTA CCA TCA TCA AGA ACA ACT GTA AAT ACC TC 1351 A AGA AAA ATA ATT AAA TAA 1369 stop chrblob_3637.glm_1|24oct01 vbc A AGAATTTTAT AAATAAGATT GATTAAAAAA 1401 AAAAAATTAT TTATTTATTT TTTTATTTAT TTTTTACTTT GTTTTTTTTT 1451 ATTTATTTAT TT "chrblob_3637.glm_2|24oct01" 1463 TTATTGAA TTGTATTTTC ATTATATAAC AATGGTTTAT 1501 AATTATTTTT ATTATTATCT CTTTTAAATT TAGAACCAAT GGAAGTCCAT 1551 AATTTTTTAT TTGGAATTAA GTTTGTACCA GATTTACCTC TAGACTTATT 1601 AACCATAATA CCAATTGATA TGTATAATAT TATTACAACA CCAAATCCAA 1651 TAGCTATAGA TATGAAAATG ATTTGAATTT TTGAAAATCT ATTGAAAAAT 1701 GATTGATTAT CAGTTGAAGA TTTCGAATAA CAATTATTAA GTGTTTCTAT 1751 AGAATTTGAA TTTCTTTGAC CTGTTGGCAT TGGTGATGGT TGATATGTAA 1801 ATGAAATTGG TGTTGGTTTG GATAAATGTA ATTCATAATA AACACCATCT 1851 ATATAACAAT AGAATGTACC ATTAAATAAT GATATTAATT CTTGGAATAT 1901 TTGAAGAGCA CTTTCATTCT TATTTGCAAT ACCCATTAAA TTAATATAAA 1951 AGCTTGCCAA TTGATTCCTT TGTGTAATAT TATTATAATC CACAATAGTT 2001 GGTTCATCAG TTGTAAATAA TGTTATTTGA TCTTTTGGAG GATTACTTTG 2051 CATACCAACT AAAGTACCAC CTAATTGATA AATAGTATTA AAACTTGCCC 2101 AGACGAAATC ATCACAAGTA CTACTATTTT GATAAACTAT TAAATTTTCA 2151 CTACCACTAC CACCACCACC ACCACCAATA CCTAAATTAT GTAATATTGT 2201 TTCTAAATAA CCATTATCAC CACTACCACT GGCATCAGCT GATGCAATAC 2251 TAAATAAATT ATAAACTGGA TGAGTTTGGT TATATATTGG AGCCCAACTT 2301 AAATACTGTT TGACTTGTAA GCCTGTAAGT CCATACATAA TCAATTCTCT 2351 TTTACTCCAA TAAGTTTCAT TAATATAATT GGTAACTTCT ATTAATCCAT 2401 AAGTATTCCA TGTTAAATTA TAATTTCCTT GTGAATCTTT TGTAATATTC 2451 TGTGGTATTA ATGCATCCTC TAGGGTTGGA CCTGCGAAAT AATCTATTGA 2501 TATATTTGGC CCACCATTTA AATTATAAAA TCCAACACCA CTATGATAAG 2551 CATTAATCTT TTCGAAAAGA TCACCATAAA TTGCATACAT CAATGGTGCT 2601 TGTACATAAT ATAATTCATA CTGATCGTCA TCTCTTATAG AATTTGTGAA 2651 TTCGCAAATT GTCTCATATG TATAAAAATA AATACCATTT TCTGATGATC 2701 CACTATCACT TGATATTGAA ATTTTAATTA ATCCTATAAA AATTATTGTC 2751 AATGTTAAAA TTATATTTAA CATATTCTTC AT 2782 "chrblob_3637.glm_2|24oct01" TTTTCCTT TTTACCTTTT 2801 TCCTTTTTTT TTTTTTATTT ATATTAGTGG TATAATTGAT TTTATTTTTT 2851 TTTTTTTATT TTATTTTATT TTTTTTTTTT TTTTTTTTTT TTTTTTTTTT 2901 TTTTAAACCC GGGGGTTAAT TTAAATTAAT TTTTCCCTCT AAAAAATAAA 2951 AATAAAACCT TTTATTAAAA AAATTGGAAA AGTAAAAAAA CAATTGTAAA 3001 AAAAAAAAAA TTTTTTTTTA ATTAAAAACT CAAAAAAAAA AAAGGGTTTT 3051 TCCTATGGGT TTTATTTTTT TTTTTATTTT TTTTGGACCA ACCCAAATTT 3101 TAATTAAATT TTTTTTTTTT TCCCCCCCCC CCTTTCGAAA AATTAAAAAT 3151 TTTTTTCAAG GGGTTTTTTT GGATTGGGGG GAGTCAAAAA AAAAAAAAAA 3201 ATTTTAAAAA AATTTAAAAA TTTATTAAAA TTTGGGTTTT TTTGTTTTGG 3251 GGAAACAAAC CCTTCCTTTT AATTTTCCTT TTTTTTTTTT TTAATTTTTT 3301 TTCCAACCTT TTTTCTTTTC CCCGCCTTTT TTTTTTTTTT TTTGGGAAAT 3351 TTATTAAATT TATTTTTTTT TTTTAAAAAA AATTAAAAAT TTTTTTTTTC 3401 CCTCCCAATT CCCCAAAAAA AAAAAAAAA // crick strand 3429 TTTTTTTTT TTTTTTGGGG AATTGGGAGG 3400 GAAAAAAAAA ATTTTTAATT TTTTTTAAAA AAAAAAAATA AATTTAATAA 3350 ATTTCCCAAA AAAAAAAAAA AAAAGGCGGG GAAAAGAAAA AAGGTTGGAA 3300 AAAAAATTAA AAAAAAAAAA AAGGAAAATT AAAAGGAAGG GTTTGTTTCC 3250 CCAAAACAAA AAAACCCAAA TTTTAATAAA TTTTTAAATT TTTTTAAAAT 3200 TTTTTTTTTT TTTTTGACTC CCCCCAATCC AAAAAAACCC CTTGAAAAAA 3150 ATTTTTAATT TTTCGAAAGG GGGGGGGGGA AAAAAAAAAA AATTTAATTA 3100 AAATTTGGGT TGGTCCAAAA AAAATAAAAA AAAAAATAAA ACCCATAGGA 3050 AAAACCCTTT TTTTTTTTTG AGTTTTTAAT TAAAAAAAAA TTTTTTTTTT 3000 TTTACAATTG TTTTTTTACT TTTCCAATTT TTTTAATAAA AGGTTTTATT 2950 TTTATTTTTT AGAGGGAAAA ATTAATTTAA ATTAACCCCC GGGTTTAAAA 2900 AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AATAAAATAA AATAAAAAAA 2850 AAAAAATAAA ATCAATTATA CCACTAATAT AAATAAAAAA AAAAAAAGGA 2800 AAAAGGTAAA AAGGAAAA start chrblob_3637.glm_2|24oct01 glm exon 1 2782 ATG AAG AAT ATG TTA AAT ATA ATT TTA ACA TT 2750 G ACA ATA ATT TTT ATA GGA TTA ATT AAA ATT TCA ATA TCA AGT GAT AGT G 2700 GA TCA TCA GAA AAT GGT ATT TAT TTT TAT ACA TAT GAG ACA ATT TGC GAA 2650 TTC ACA AAT TCT ATA AGA GAT GAC GAT CAG TAT GAA TTA TAT TAT GTA CA 2600 A GCA CCA TTG ATG TAT GCA ATT TAT GGT GAT CTT TTC GAA AAG ATT AAT G 2550 CT TAT CAT AGT GGT GTT GGA TTT TAT AAT TTA AAT GGT GGG CCA AAT ATA 2500 TCA ATA GAT TAT TTC GCA GGT CCA ACC CTA GAG GAT GCA TTA ATA CCA CA 2450 G AAT ATT ACA AAA GAT TCA CAA GGA AAT TAT AAT TTA ACA TGG AAT ACT T 2400 AT GGA TTA ATA GAA GTT ACC AAT TAT ATT AAT GAA ACT TAT TGG AGT AAA 2350 AGA GAA TTG ATT ATG TAT GGA CTT ACA GGC TTA CAA GTC AAA CAG TAT TT 2300 A AGT TGG GCT CCA ATA TAT AAC CAA ACT CAT CCA GTT TAT AAT TTA TTT A 2250 GT ATT GCA TCA GCT GAT GCC AGT GGT AGT GGT GAT AAT GGT TAT TTA GAA 2200 ACA ATA TTA CAT AAT TTA GGT ATT GGT GGT GGT GGT GGT GGT AGT GGT AG 2150 T GAA AAT TTA ATA GTT TAT CAA AAT AGT AGT ACT TGT GAT GAT TTC GTC T 2100 GG GCA AGT TTT AAT ACT ATT TAT CAA TTA GGT GGT ACT TTA GTT GGT ATG 2050 CAA AGT AAT CCT CCA AAA GAT CAA ATA ACA TTA TTT ACA ACT GAT GAA CC 2000 A ACT ATT GTG GAT TAT AAT AAT ATT ACA CAA AGG AAT CAA TTG GCA AGC T 1950 TT TAT ATT AAT TTA ATG GGT ATT GCA AAT AAG AAT GAA AGT GCT CTT CAA 1900 ATA TTC CAA GAA TTA ATA TCA TTA TTT AAT GGT ACA TTC TAT TGT TAT AT 1850 A GAT GGT GTT TAT TAT GAA TTA CAT TTA TCC AAA CCA ACA CCA ATT TCA T 1800 TT ACA TAT CAA CCA TCA CCA ATG CCA ACA GGT CAA AGA AAT TCA AAT TCT 1750 ATA GAA ACA CTT AAT AAT TGT TAT TCG AAA TCT TCA ACT GAT AAT CAA TC 1700 A TTT TTC AAT AGA TTT TCA AAA ATT CAA ATC ATT TTC ATA TCT ATA GCT A 1650 TT GGA TTT GGT GTT GTA ATA ATA TTA TAC ATA TCA ATT GGT ATT ATG GTT 1600 AAT AAG TCT AGA GGT AAA TCT GGT ACA AAC TTA ATT CCA AAT AAA AAA TT 1550 A TGG ACT TCC ATT GGT TCT AAA TTT AAA AGA GAT AAT AAT AAA AAT AAT T 1500 AT AAA CCA TTG TTA TAT AAT GAA AAT ACA ATT CAA TAA* 1463 stop chrblob_3637.glm_2|24oct01 AA ATAAATAAAT 1450 AAAAAAAAAC AAAGTAAAAA ATAAATAAAA AAATAAATAA ATAATTTTTT 1400 TTTTTTAATC AATCTTATTT ATAAAATTCT TTTATTTAAT TATTTTTCTT 1350 GAGGTATTTA CAGTTGTTCT TGATGATGGT AATAGTCTAG ATGATGACGA 1300 TGTGGGTCCA TTACCTAAAA CTCCTCTTTT AAAAGGTTGC ACAATTTGAG 1250 AATTATTTCG ATTTGGTGTT AATGTTGCTG ATGCAGTAGA AGATAATTTT 1200 TCTTTATATA AATTTTCTTT AATTGGCGAA TTTGAATGAA CAAGTGATTT 1150 AATTCTATTT GATACTACTG AAGGCACTGT TGTTGAAGTT GTTGTACTAG 1100 TTGTGATTGG TCTAGTTGAA ATAGATGATG ATATTGTTGA TGTTGGAGTT 1050 AATTTTTTAA CTCTCATTGG GTGAGGTTGA TTAATTAATG TGGAAGATAG 1000 ACTTGCAATT TTATTATGAA GAATTAAATT TTCATTTGAG AGTGTATTTT 950 GACCATAATC AAAGCTAAGA TCATTTTGTG CTTGGTGGTT ATTATTATTA 900 TTGTTAAAAA AGGAAAGGCT ATCTAATTTC ATCTTTAAAT CCATATTTGA 850 TTGCATTATC ATTGTTTGTG GTGGATGTAG TGGTAGTTGT AATTGTGGAG 800 GATGCATTTG AAGGGGATGA ACAAAAGGAT TTTGGCTATT AAAACTATTA 750 TTGTGATTGT AGTTTTCATT TTTGGCACTA CGATTGTTAC ATAACTGAGA 700 TAGACTATCT AATTTTTCTT TAAGATTCAT TGAAGATGGA GATGGCATAG 650 GTATAGGATT TGATATTGGA ATTTGCACAT GCATTGGTAT TGGTATTGGT 600 ATTGGATTTG GGATTTGAAT ATTCATATTC ATTTGTGGCG CAATATTATT 550 ATTATTATTA TTATTATTTT TGTGTGGCTG TATTTTTGTG TGTGGTTTTG 500 GTTGTAATGA TGAAGTTGTT GGTAAAATTT GTTTGGGTTT ATTAACAAGT 450 GGTGATGATA GTGTTGTTGT TGTTGCCGTT GTTGTTGAAG GTAATAATTG 400 CTTTGGTTTT GTTACAACCG GTGATGATAC ATTAATTTTT TTAGTTCTTG 350 GATTTGAATC TGTACTGTCA TCAATTTCCA ATGTTCTTTT TCTTAAAATA 300 GATGTTCTAC TATATAAAGG TGTTGTGTTT GATATTTTTG TTGAAGAAGA 250 TGGTAATAAA GAAGTTGAGG ATCATATCTT ATTAATTGGA "chrblob_3637.glm_1|24oct01" 210 TTACCAATTG 200 ATCTTATCTC TCCTTTTTTC TACATTACCT ATTGTTGTTG TTGTCGCTGT 150 GGCTGTTGAA GCTGCTGTTG TTGTTGCTGT AGATGTCATT CTACTGTTTG 100 AATTTGTACT TTTAATAATA TTATTGCTGC CACTCATAAT TCTTCTTGGT 50 TTTAATGGTG ATGGGTTTAT CAT 28 "chrblob_3637.glm_1|24oct01" GTTTTGA TTTTTATTAT TAATATTAGT end of file 3638 10 3639 10 telomeric rep21 3643 9 3644 4 3645 12 3648 3 3650 11 3653 8 3656 13 3658 10 rifin 3659 9 3660 9 pfemp1 var 3662 9 3663 4 3664 4 3665 9 3666 4 no gene 3667 9 3668 9 3670 4 3671 4 3672 12 3673 3 3674 9 3676 10 3677 10 3678 9 3680 12 3682 12 3684 11 Date: Monday, 3/11/2002 Time: 10:17 c3685a.txt chrblob_3685|2001.10.15|GENOMIC|Sanger FEATURES Location CDS 275..3238 /gene="chrblob_3685.gen_1|24oct01" /note="(protein coding) 100% identity to (AF263455) TagA [Dictyostelium discoideum]" /codon_start=1 CDS complement(1951..2226) /gene="chrblob_3685.gen_2|24oct01" /note="(protein coding) No NR protein Similarities" /codon_start=1 CDS complement(1561..1689) /gene="chrblob_3685.gen_3|24oct01" /note="(protein coding) No NR protein Similarities" /codon_start=1 ORIGIN watson strand start chrblob_3685.gen_1|24oct01 vbc note partial gene (exon 1) 1 [...T] ACT CAA ATT CAT AGA AAT AAT GAA GGT AAT AAT AAA TTA TCA AAA TTA A 51 TT CAT TTA CAT AAT GAT GTA ATT GAT ACA ACC ATT TCA AAT AGA GAT AAT 101 ATT TTA TTT AAT AAG AAA TCT TTA AAT CAA AAA TCA AAG GGA AGT TTA TT 151 T TTA GTC CAT TTA AAT GGA CCA ATT GAA AAT CTA GTA CAT AAT GAA TTA A 201 TA AAA CAA TTG GAT CAA TTA TTT AAT GGT GGT GAA ATT ATT CAT TAT ATT 251 CCT GAT AAT ACT TAT TTA ATA TCA ATG ATT GGT AGT GAC AAC AAT GAT AA 301 T AAT AAT AAT AAC AAA ATT GAA TTA ATT AAT AGA TTA AAA GAA TTA ATA C 351 CA TCA ATT CAA TGG TTA AAA CCA TTA GAA CCA AGA TTA AAA ATT TCA CCA 401 TTA TTT AAA CAA AAT CAA TTC CAA GGT GAT AAT CAA AAT GAA ATT GAT CA 451 A CTT AGA ATT TAT TAT CAT GAA AAT AGT AAT CAA CAA TCA AAT GAT ATT G 501 AT AAT ATT ATT TCA GAA TCA TCA TTA ACT TTG GTT GAA AAA GAA TTA ATT 551 TCA AAT AAT AAT AAT AAT AAT AAT AAT GTT TTA ATT ACA GTT AAT TTA AA 601 A AAT AGT AAA TTA TCA TTA GAA TCA ATA ATT TAT AAA ATT TCA ACA AGG T 651 CA TTA GTT TAT TGG ATT GAA CCA AGT TCA AGT AAA TTA ATT AAA CAT ACA 701 CCA AGT AAT AAA TTT GCT CAC TAT TCA ATT CAA AGT GGT AGT GCA TCT AC 751 A ACT TCA ACC CCA ATT TGG GAT GTT ATT GGA ATT AAA GGT GAT GGT GAA A 801 TT GTT GGT TGT GCA GAT ACT GGT ATT GAT ATT AAT CAT TGT TTC TTT TAT 851 GAT ACA AAT CCA ATT GGT TCG ACT CAT AGA AAA ATC ATT TCT TAT TCA AG 901 T GGA AAT GGT GAT CAA ATC GAT GAA ATT GAT GGT CAT GGT ACT CAT ATT G 951 TT GGT ACT ATT ATA GGC TCA ACT ACT GTG GAT CCA AGT GTT TCA GAA TTT 1001 AGT GGT GGC GCT CCA AAT TCA AAG GTT GCA TTC GTT GAT TTA CAA GTT GG 1051 T AGT GGT AAT GGA TTA TCA ATT CAA TCA AAT TTA ACA GCA ATC TAT CAA T 1101 CA ACC TAT GAT CAA AAT GCA AAA GTA CAT TGT GAT GCA TGG AAT TCA AAT 1151 ATT GGT CCA TTC TAT ACT GGT GTC ACT GAA ATG ATA GAT AGA TTC CAA TG 1201 G GAC CAC CCA GAT TTC CTT GTA GTT AGA TCA GCA GGA AAT AAT GTA AAC T 1251 TT GGT TTC AAT TCA ATC TAT ACC TTA TCA CAA GAA TCA ACT AGT AAA AAT 1301 TCA TTG GTA GTT GGT AGT TCA AAT CAA CCA TCA AGT ACC TAT TTA TCA TC 1351 A ATT GAT TAT TGG GAC TGG GAT TTC ATT TAT AAT TCA ATT AGA ACT TCA G 1401 TT TGT ACT CAA GGT CAA TCT ATT TAT GGT ATA ACT TGT TCA GAT GTA CCA 1451 ACT CAA ACA ACC TCT GTC GAT ATT CAA ACT CAA TGT TGT TCA AAT CCA AT 1501 T TTG GCT AAA ATT TGT TGT TCA ACT GAA ATT CAA CAA CAA TAT CAA ACC A 1551 AT TCA ACA GTT TAT AGT GAA TTC ATT CCA AGT TTA TTT AGT GGT GTT GGT 1601 CCA ACA TCT GAT GGT CGT TTG AAA CCA GAT TTA TTA GCA CCA GGT TCA CC 1651 A ATT ATT TCA TCA CGT TCT TTG GGT CCA TCA TCA ACC ATT AAT CAT TGT T 1701 CA CCA ATT ACA TCA GGT ATT GCA ACA TCG GCT TTA ATC GCT ATG GAA GGT 1751 TCA AGT CAA GCA GCT GCT GTC GCT ACA AGT GCC GCA GTT TTA GTT CGT CA 1801 A TAC TAT AGA GAT GGT TAT TTT ATT AAT GGT AAA GTT AAT TCA TCT GTG G 1851 GA TTC CAA CCA TCA GCA TCA TTG GTT AAA GCA ACC TTA ATC AAT ACT GCA 1901 AGT ATT AAT GTT GAT TCA ACA TTA GAA TAT TCA CAA GGA TTT GGT AAT AT 1951 T CAA CTT TCA AAG TTA ATC ACA ACT ACA AAT GCC CAA ACC ACA TCT TTA G 2001 AC ATT CCA TCA TCA ATT GAA AAA GCT GAT CCA ATA ATT AAT ACT GGT GAA 2051 ACC AAT TCA TAT TGT TTC TCA CTC GAT AGT AAA GCA GAT ATT GAT ATA AC 2101 A TTG GTT TGG ACA GAT CCT GCC GGT TCA CCA TTA TCA ACA TTT ACT TTG G 2151 TA AAT AAT TTG GAT TTA GCT TTA CTT GCA TTT GTT GAT GGT GAA CTT TCA 2201 ATA TAT TCA GGA AAT AGT GAA ACC ATT TTC AAA AAT ACA AGC CAA GTA AT 2251 T TTC GAT CAA TTA AAT AAT GTT GAA GTC ATT AGA ATT AAG GAT GCA CCA A 2301 TT GGT AGT TAT GAT GTT AAA ATA TTT GGT ACA AAT ATT GTA ATT CCA AAT 2351 CAA TCC TAT TCA GTT GTA ATT AGA ACT TCC GGT GGT ACA ACT TTA ATG AA 2401 G GAA TCA GAA TGT GCT CAA TGT TTC TAT GAT CCA AAT GAT GAT CAA TCT C 2451 AA ATG TGT GAA TTT GAT AAT GGT ATT GGT ACA CAA TAT TGT AAA GAT GAT 2501 AAT AGA TTT TCA AAA TGT GTC GTC TAT GAA TGT AAT ACA GGT TAT GTC TT 2551 T GAT AAT GGT ATC ACA AAG TCT TGT GTA ACC ACC TTG GCA TTA ACA CTC T 2601 AT GAT ATT GTA TTA TTG GGT ATT TTT GGT ATA ATT ATT GTT GGT GCT GTA 2651 ATA TTT GTT TTG GTT TGT TAT AAA TCT AAA TCA TTG GAT CAA AAT AAA TA 2701 T TTT TCA TTA TCA AAA GAT AAA GGA GGT GAT GGA AAT TCA ATA AGA TCA A 2751 AT AGT GTT GCT GGA AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT 2801 AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AA 2851 T AAT AAT AAT AAT AGT AAT GGA AAA CAA TCA AAT ATT GAA TTA AAT TCA G 2901 TT GGT GGT GGT GAT GAT GGT ACT CCA AAT GGT GAT GAT CAG CAA CAA CAA 2951 AAT AAC TCA CCA CAA TAT GAT GAA GAT GGA AGA TTA ATT TCA GGT CAA GA 3001 A GTT GAA ATT TCA ATA TTT GAA GTA ATT TCA TTA GGT AAA CCA GAA AGT A 3051 AA ATC TTG GGT TTA GCA TTA TTT TTA TCA TTC ATT GAT GTT GCA TTA GGT 3101 TTA GCA GTA CCA TTA GTA GCA GCC AAT ATT TTC GAT TAT TTA TAT GCA GG 3151 T GAA ACG GGT AAA ATC TCA ACA ACT ATT TTA ACA TTT GCC TTA ATT ATC A 3201 TT GGT ATG ATT ATT GTT CAA TTC TTG TCT GGT ATT TTA 3238 ... (stop) chrblob_3685.gen_1|24oct01 // crick strand 3238 TAAAATAC CAGACAAGAA TTGAACAATA ATCATACCAA 3200 TGATAATTAA GGCAAATGTT AAAATAGTTG TTGAGATTTT ACCCGTTTCA 3150 CCTGCATATA AATAATCGAA AATATTGGCT GCTACTAATG GTACTGCTAA 3100 ACCTAATGCA ACATCAATGA ATGATAAAAA TAATGCTAAA CCCAAGATTT 3050 TACTTTCTGG TTTACCTAAT GAAATTACTT CAAATATTGA AATTTCAACT 3000 TCTTGACCTG AAATTAATCT TCCATCTTCA TCATATTGTG GTGAGTTATT 2950 TTGTTGTTGC TGATCATCAC CATTTGGAGT ACCATCATCA CCACCACCAA 2900 CTGAATTTAA TTCAATATTT GATTGTTTTC CATTACTATT ATTATTATTA 2850 TTATTATTAT TATTATTATT ATTATTATTA TTATTATTAT TATTATTATT 2800 ATTATTATTA TTATTATTAT TATTATTATT ATTATTTCCA GCAACACTAT 2750 TTGATCTTAT TGAATTTCCA TCACCTCCTT TATCTTTTGA TAATGAAAAA 2700 TATTTATTTT GATCCAATGA TTTAGATTTA TAACAAACCA AAACAAATAT 2650 TACAGCACCA ACAATAATTA TACCAAAAAT ACCCAATAAT ACAATATCAT 2600 AGAGTGTTAA TGCCAAGGTG GTTACACAAG ACTTTGTGAT ACCATTATCA 2550 AAGACATAAC CTGTATTACA TTCATAGACG ACACATTTTG AAAATCTATT 2500 ATCATCTTTA CAATATTGTG TACCAATACC ATTATCAAAT TCACACATTT 2450 GAGATTGATC ATCATTTGGA TCATAGAAAC ATTGAGCACA TTCTGATTCC 2400 TTCATTAAAG TTGTACCACC GGAAGTTCTA ATTACAACTG AATAGGATTG 2350 ATTTGGAATT ACAATATTTG TACCAAATAT TTTAACATCA TAACTACCAA 2300 TTGGTGCATC CTTAATTCTA ATGACTTCAA CATTATTTAA TTGATCGAAA 2250 ATTACTTGGC TTGTATTTTT GAAAATGGTT TCACTATTTC CTGAATATAT 2200 TGAAAGTTCA CCATCAACAA ATGCAAGTAA AGCTAAATCC AAATTATTTA 2150 CCAAAGTAAA TGTTGATAAT GGTGAACCGG CAGGATCTGT CCAAACCAAT 2100 GTTATATCAA TATCTGCTTT ACTATCGAGT GAGAAACAAT ATGAATTGGT 2050 TTCACCAGTA TTAATTATTG GATCAGCTTT TTCAATTGAT GATGGAATGT 2000 CTAAAGATGT GGTTTGGGCA TTTGTAGTTG TGATTAACTT TGAAAGTTGA 1950 ATATTACCAA ATCCTTGTGA ATATTCTAAT GTTGAATCAA CATTAATACT 1900 TGCAGTATTG ATTAAGGTTG CTTTAACCAA TGATGCTGAT GGTTGGAATC 1850 CCACAGATGA ATTAACTTTA CCATTAATAA AATAACCATC TCTATAGTAT 1800 TGACGAACTA AAACTGCGGC ACTTGTAGCG ACAGCAGCTG CTTGACTTGA 1750 ACCTTCCATA GCGATTAAAG CCGATGTTGC AATACCTGAT GTAATTGGTG 1700 AACAATGATT AATGGTTGAT GATGGACCCA AAGAACGTGA TGAAATAATT 1650 GGTGAACCTG GTGCTAATAA ATCTGGTTTC AAACGACCAT CAGATGTTGG 1600 ACCAACACCA CTAAATAAAC TTGGAATGAA TTCACTATAA ACTGTTGAAT 1550 TGGTTTGATA TTGTTGTTGA ATTTCAGTTG AACAACAAAT TTTAGCCAAA 1500 ATTGGATTTG AACAACATTG AGTTTGAATA TCGACAGAGG TTGTTTGAGT 1450 TGGTACATCT GAACAAGTTA TACCATAAAT AGATTGACCT TGAGTACAAA 1400 CTGAAGTTCT AATTGAATTA TAAATGAAAT CCCAGTCCCA ATAATCAATT 1350 GATGATAAAT AGGTACTTGA TGGTTGATTT GAACTACCAA CTACCAATGA 1300 ATTTTTACTA GTTGATTCTT GTGATAAGGT ATAGATTGAA TTGAAACCAA 1250 AGTTTACATT ATTTCCTGCT GATCTAACTA CAAGGAAATC TGGGTGGTCC 1200 CATTGGAATC TATCTATCAT TTCAGTGACA CCAGTATAGA ATGGACCAAT 1150 ATTTGAATTC CATGCATCAC AATGTACTTT TGCATTTTGA TCATAGGTTG 1100 ATTGATAGAT TGCTGTTAAA TTTGATTGAA TTGATAATCC ATTACCACTA 1050 CCAACTTGTA AATCAACGAA TGCAACCTTT GAATTTGGAG CGCCACCACT 1000 AAATTCTGAA ACACTTGGAT CCACAGTAGT TGAGCCTATA ATAGTACCAA 950 CAATATGAGT ACCATGACCA TCAATTTCAT CGATTTGATC ACCATTTCCA 900 CTTGAATAAG AAATGATTTT TCTATGAGTC GAACCAATTG GATTTGTATC 850 ATAAAAGAAA CAATGATTAA TATCAATACC AGTATCTGCA CAACCAACAA 800 TTTCACCATC ACCTTTAATT CCAATAACAT CCCAAATTGG GGTTGAAGTT 750 GTAGATGCAC TACCACTTTG AATTGAATAG TGAGCAAATT TATTACTTGG 700 TGTATGTTTA ATTAATTTAC TTGAACTTGG TTCAATCCAA TAAACTAATG 650 ACCTTGTTGA AATTTTATAA ATTATTGATT CTAATGATAA TTTACTATTT 600 TTTAAATTAA CTGTAATTAA AACATTATTA TTATTATTAT TATTATTTGA 550 AATTAATTCT TTTTCAACCA AAGTTAATGA TGATTCTGAA ATAATATTAT 500 CAATATCATT TGATTGTTGA TTACTATTTT CATGATAATA AATTCTAAGT 450 TGATCAATTT CATTTTGATT ATCACCTTGG AATTGATTTT GTTTAAATAA 400 TGGTGAAATT TTTAATCTTG GTTCTAATGG TTTTAACCAT TGAATTGATG 350 GTATTAATTC TTTTAATCTA TTAATTAATT CAATTTTGTT ATTATTATTA 300 TTATCATTGT TGTCACTACC AATCAT 275 "chrblob_3685.gen_1|24oct01" TGAT ATTAAATAAG TATTATCAGG 250 AATATAATGA ATAATTTCAC CACCATTAAA TAATTGATCC AATTGTTTTA 200 TTAATTCATT ATGTACTAGA TTTTCAATTG GTCCATTTAA ATGGACTAAA 150 AATAAACTTC CCTTTGATTT TTGATTTAAA GATTTCTTAT TAAATAAAAT 100 ATTATCTCTA TTTGAAATGG TTGTATCAAT TACATCATTA TGTAAATGAA 50 TTAATTTTGA TAATTTATTA TTACCTTCAT TATTTCTATG AATTTGAGTA end of file 3689 8 3690 14 3692 11 Date: Monday, 3/11/2002 Time: 09:37 c3693.txt chrblob_3693|2001.10.15|GENOMIC|Sanger FEATURES Location CDS complement(join(441..1433,1666..1719)) /gene="chrblob_3693.glm_1|24oct01" /note="(protein coding) 63% identity to (AF161311) variant surface antigen rifin 3 [Plasmodium falciparum]" /codon_start=1 ORIGIN watson strand 1 TTATTATTAA CATATATATA TCTATTTGTT ATATTTTATT ATATAACATT 51 TAATATGAAG TATTATAGAA ATATATATAT ATATATATAT ATATATATAT 101 ATATATATAT ACATATATAC CATATTTTAT TTTCTTAAAC AATTACATAT 151 ACCTACACTT ATGAGTTTAA TATTTAATAT ATATATTAAT AAATATATGA 201 TTTATTAAAA AAATAAAAGT TTTGTTGAAA AAAAAAAAGG TTAACATAAT 251 AGTAAATTAA TACAATAAAT AATCAAGAAA ATTGATCCAT AACAAAACAC 301 ATTGTATATG TACACAAACG TAATACAAAT AAAAATAATA TAGTTATTTA 351 TAATGGAGAA AAAAACATGG TATATTCAAA GAAAAACTGT ACGTGTACCG 401 TACATCCTAC CAACATCAAA AAATACCAAA CACATAATAT "chrblob_3693.glm_1|24oct01" 441 CTATTCTTCT 451 AATAATTTGA TATATTGCAG TTTTTTCTTC ATTTTCTTTT TTCGTCGATA 501 ACGTAAAATC AAATAAATTA TTACCATAAT TAAAACTATG ACAACTATTG 551 CAACGATGGA AGCAATAATA CTAATGTGGT AACCACCATA TGTAGCGTTT 601 ACTGCAGCCA TATATGTTTC CTTAAATTCT GCTGTTTTGG TTGTCAATGT 651 TGCCTGAAAT GCATCACTAC CAGCTTGTGC GAAACCCTTA ATGTTAGATT 701 CACCACCGTA CTTTATTACC GAATTATAAA AAATAGTCGT GCTATTTCTT 751 CCTGGAACAT TGCAGGCATT ACCTATTACT TTCTTAGCAG TTTCAACTAA 801 AGCATCACCA TTTTTAAATG TTGATTTACT AACAATTGAA CTCAAATCAA 851 CAAATCCTTG ATTTAGAGAA TAAATGTTAC TCAATCCTTC AATTTTAAGT 901 CTGACAGCAT TCATACCAGC TTCAATAGCG GCATCAGTAG CCTCAGTTAC 951 GGCCGCTTTT TTAGCAGCCT CAATTGCCAA AGGTTTCAAC ACACTTATGG 1001 CAGCTTCACC AATTCCTCCT AATAATCCAA CACTTGGCGC TACACCACCA 1051 CCGAACACAC CTGCACATCT CAAACATTCT TTTTCCATTT TATCTGCTAT 1101 TGACTTTTCG CAAACACATG TTGGAATAGC GTCACTTTGT ATATCTGTAT 1151 GTAATGTGGC AAATTTGTCC ATTAATTCTT TTTCTAATTT ATCTTTTAAA 1201 ATAATTTTTT GTATTTCTTT ATCACATTGC TCTTTACATT TTTGTTTGTT 1251 TTCGAGCAAG CGTTCATTGT ATTCTTCAAA ACGTTGCGAC GTTTGACGAT 1301 CAAAACCATG CAATACTGCT TTCATTTCAG GGTCATTATC ATAGTTTGAT 1351 GGTGCATACA ATTCACATTC GCATAATGTC CTAGTGGTTG CTTTTGGTGT 1401 ACGTGTGATG TAATGGTTCC TTTGATTATA TACCTATAAA GAAATGGTGA 1451 CATATATAAA TATGTAATGT TTAGTTGTAG TTTATTATTT TATATATTTG 1501 TAATAAATAT GTATAATTTT TTGGTTTATA AATATGTATA TTTTGACTAT 1551 ATATATATTA TATATGGATA TATAGATACA ACAATTATAT AAATGGTATC 1601 GTAATAAATA TATATATATT TTATAACATT AATAAATATT TAATACATAT 1651 GTAACATGGA ATTACCAATA TATTTAATGG AAGAGCAAAC AATAATATAT 1701 TAATATAATG GACTTTCAT 1719 "chrblob_3693.glm_1|24oct01" T TTTATTGTGA TATTTATAAT AATTTATGAT 1751 AAAAATTATA ACCAATTAAT TGTTATATAA TACTTTATTT TATTTTATAT 1801 ATAAATTAAA TATGTTTAAC ATAAAATATT ATTATAATTT TATAATATAC 1851 CACAATTAAT TGCCATTATA AAAATATATT ACACCATTGG TAAATGAATA 1901 ATTGTTCCAT TACAAAAAAA AAAAAAAAAA AAAAAAAAAA AAATTCAAAT 1951 TAAAATATAT CAAAATATAT TACATTTTTT TTAATTTTTA ATGAAATTTA 2001 ATTTTATGTC ATGTCATAAA TAACAATTAA ATTTTATTCT AACAAATTTA 2051 TATAACAAGT AAAACGGTAG TTACAACTTG TTTTTTTTTG TGTGTTGTAT 2101 ATAACATACA AATGTGTAGA ACAATAGTTG TTATTGGTGT AAATCGTATA 2151 TATATAATAA TAGCTCTCAT GATTTTTATC AAATAAATAT CCTAAAATAT 2201 ATTTTTAATA TAATTTCTAT TGTGGAAATA ACAAATTTTC TTGTAATTAA 2251 TAAAATATAA TATTAATCCG AAAGCAAATA TAATAAAATA CATTTATATT 2301 TATGTTAATA TTTGGATCTT TCCTTTTTAG TGTATTTCAT TTTTTTTTCT 2351 TAGCGGTATT CTATGATAGA AAATTCTCTC TATTGGATCT AATATTTTAT 2401 TTTACTTAAT TATGCTAAAA TAATATTTAA ATTTATGGAT AATAGCATAT 2451 TTAAATGATT ATTTTTTTAA AAAATAATTA ATTTTAAATT TTGGATAATT 2501 TAAAA // crick strand 2505 TTTTA 2500 AATTATCCAA AATTTAAAAT TAATTATTTT TTAAAAAAAT AATCATTTAA 2450 ATATGCTATT ATCCATAAAT TTAAATATTA TTTTAGCATA ATTAAGTAAA 2400 ATAAAATATT AGATCCAATA GAGAGAATTT TCTATCATAG AATACCGCTA 2350 AGAAAAAAAA ATGAAATACA CTAAAAAGGA AAGATCCAAA TATTAACATA 2300 AATATAAATG TATTTTATTA TATTTGCTTT CGGATTAATA TTATATTTTA 2250 TTAATTACAA GAAAATTTGT TATTTCCACA ATAGAAATTA TATTAAAAAT 2200 ATATTTTAGG ATATTTATTT GATAAAAATC ATGAGAGCTA TTATTATATA 2150 TATACGATTT ACACCAATAA CAACTATTGT TCTACACATT TGTATGTTAT 2100 ATACAACACA CAAAAAAAAA CAAGTTGTAA CTACCGTTTT ACTTGTTATA 2050 TAAATTTGTT AGAATAAAAT TTAATTGTTA TTTATGACAT GACATAAAAT 2000 TAAATTTCAT TAAAAATTAA AAAAAATGTA ATATATTTTG ATATATTTTA 1950 ATTTGAATTT TTTTTTTTTT TTTTTTTTTT TTTTTTTGTA ATGGAACAAT 1900 TATTCATTTA CCAATGGTGT AATATATTTT TATAATGGCA ATTAATTGTG 1850 GTATATTATA AAATTATAAT AATATTTTAT GTTAAACATA TTTAATTTAT 1800 ATATAAAATA AAATAAAGTA TTATATAACA ATTAATTGGT TATAATTTTT 1750 ATCATAAATT ATTATAAATA TCACAATAAA A start chrblob_3693.glm_1|24oct01 glm rifin exon 1 1719 ATG AAA GTC CAT TAT ATT A 1700 AT ATA TTA TTG TTT GCT CTT CCA TTA AAT ATA TTG intron GTAAT TCCATGTTAC 1650 ATATGTATTA AATATTTATT AATGTTATAA AATATATATA TATTTATTAC 1600 GATACCATTT ATATAATTGT TGTATCTATA TATCCATATA TAATATATAT 1550 ATAGTCAAAA TATACATATT TATAAACCAA AAAATTATAC ATATTTATTA 1500 CAAATATATA AAATAATAAA CTACAACTAA ACATTACATA TTTATATATG 1450 TCACCATTTC TTTATAG exon 2 1433 GTA TAT AAT CAA AGG AAC CAT TAC ATC ACA CGT 1400 ACA CCA AAA GCA ACC ACT AGG ACA TTA TGC GAA TGT GAA TTG TAT GCA CC 1350 A TCA AAC TAT GAT AAT GAC CCT GAA ATG AAA GCA GTA TTG CAT GGT TTT G 1300 AT CGT CAA ACG TCG CAA CGT TTT GAA GAA TAC AAT GAA CGC TTG CTC GAA 1250 AAC AAA CAA AAA TGT AAA GAG CAA TGT GAT AAA GAA ATA CAA AAA ATT AT 1200 T TTA AAA GAT AAA TTA GAA AAA GAA TTA ATG GAC AAA TTT GCC ACA TTA C 1150 AT ACA GAT ATA CAA AGT GAC GCT ATT CCA ACA TGT GTT TGC GAA AAG TCA 1100 ATA GCA GAT AAA ATG GAA AAA GAA TGT TTG AGA TGT GCA GGT GTG TTC GG 1050 T GGT GGT GTA GCG CCA AGT GTT GGA TTA TTA GGA GGA ATT GGT GAA GCT G 1000 CC ATA AGT GTG TTG AAA CCT TTG GCA ATT GAG GCT GCT AAA AAA GCG GCC 950 GTA ACT GAG GCT ACT GAT GCC GCT ATT GAA GCT GGT ATG AAT GCT GTC AG 900 A CTT AAA ATT GAA GGA TTG AGT AAC ATT TAT TCT CTA AAT CAA GGA TTT G 850 TT GAT TTG AGT TCA ATT GTT AGT AAA TCA ACA TTT AAA AAT GGT GAT GCT 800 TTA GTT GAA ACT GCT AAG AAA GTA ATA GGT AAT GCC TGC AAT GTT CCA GG 750 A AGA AAT AGC ACG ACT ATT TTT TAT AAT TCG GTA ATA AAG TAC GGT GGT G 700 AA TCT AAC ATT AAG GGT TTC GCA CAA GCT GGT AGT GAT GCA TTT CAG GCA 650 ACA TTG ACA ACC AAA ACA GCA GAA TTT AAG GAA ACA TAT ATG GCT GCA GT 600 A AAC GCT ACA TAT GGT GGT TAC CAC ATT AGT ATT ATT GCT TCC ATC GTT G 550 CA ATA GTT GTC ATA GTT TTA ATT ATG GTA ATA ATT TAT TTG ATT TTA CGT 500 TAT CGA CGA AAA AAG AAA ATG AAG AAA AAA CTG CAA TAT ATC AAA TTA TT 450 A GAA GAA TAG* 441 stop chrblob_3693.glm_1|24oct01 ATATTATGTG TTTGGTATTT TTTGATGTTG GTAGGATGTA 400 CGGTACACGT ACAGTTTTTC TTTGAATATA CCATGTTTTT TTCTCCATTA 350 TAAATAACTA TATTATTTTT ATTTGTATTA CGTTTGTGTA CATATACAAT 300 GTGTTTTGTT ATGGATCAAT TTTCTTGATT ATTTATTGTA TTAATTTACT 250 ATTATGTTAA CCTTTTTTTT TTTCAACAAA ACTTTTATTT TTTTAATAAA 200 TCATATATTT ATTAATATAT ATATTAAATA TTAAACTCAT AAGTGTAGGT 150 ATATGTAATT GTTTAAGAAA ATAAAATATG GTATATATGT ATATATATAT 100 ATATATATAT ATATATATAT ATATATATAT TTCTATAATA CTTCATATTA 50 AATGTTATAT AATAAAATAT AACAAATAGA TATATATATG TTAATAATAA end of file 3696 13 Date: Monday, 3/11/2002 Time: 09:37 c3697.txt chrblob_3697|2001.10.15|GENOMIC|Sanger FEATURES Location CDS 1163..1372 /gene="chrblob_3697.glm_1|24oct01" /note="(protein coding) 68% identity to (AL031747) rifin, MAL1P4.07 [Plasmodium falciparum]" /codon_start=1 CDS 1400..1954 /gene="chrblob_3697.glm_2|24oct01" /note="(protein coding) 45% identity to hypothetical protein (RIF-1 repetitive element) - Plasmodium falciparum (strain Camp) (fragment)" /codon_start=1 ORIGIN watson strand 1 TCTATCATCC TCCATCTCAG GCTCGGTACC GTGATCATAT AAAAAAAATA 51 ATATAATGAA AAACTTTTTT GTAAAATATT TTATAGTTAT ATGTACAACA 101 AAAATGTTAG TATAATTTTA GATACATTAG AGAGAAACGT ATAACATACA 151 ATACATTTTG GAACAAAAAA AAAAATATAT AATAACATTA AAATAAATTA 201 AATTATTAAA ATATATTACA TTTAATTAAT TAATATTAAA ATTTATATAC 251 TATTAGTTTT ACCTTTAAGA CCACATATTA TGATATGCAA TGATACTTAA 301 TAATTTTTAT ATAATTACAA CATTGTGAAC ATACATGTTA CAATATAAAT 351 ACCACATATA TGTTATAAGA TGTAAATTAT ATGTGATAAT ACACATTCAA 401 CCATTGTTAC TATATACATT GTTATGTTAT TTAGAACAAT AAATATGATG 451 TTAGTTATTA CAATATAGTA TCACTTGTTA TTATTATGTA CCCAAAAAAA 501 AAAAAAAAAA TTCATATTAA TAAATTTTTT TTTTTATATA AAATTAAAAG 551 TTATTAGAAA TAAAAAAAAA TTATAAAAAA TGTAATATAT TTTGATAAAT 601 TATATTATTT CTTTTATCTT TCTTTGGTTT TTTTTTTTTT TTTTTTTTGA 651 AATAATACAA ATGATGCGCT ATTATATAAA AAAAATTATA TTTTAATAAT 701 GTAACGTTAA TTATGGTGTA TTTTAAAAGT GTAATCATCT TTTAGATTAA 751 GTATATTTAA TTTATTTATA AAAAAAAAGT CATTATTATA TCTTAATTAT 801 TTAGTTACAA ATTTAATCAT AAAATAATAT AAGTATCACA ATAAAA start chrblob_3697.glm_1+2|24oct01 vbc stevor note read through tga at 1370 exon 1 847 ATG A 851 AA CTC CAC TAC TTT AAT ATA TTA TTA TTT TCT CTT CCA TTA AAT ATA TTG 901 TTA TTA TCA TCA TCA CAG intron GT ATGTATCTAC AAATAATTAT TATTACAATA 951 TATATATATA TATATATATA TATACATACC CTATACATAA TTATAATATA 1001 CATTATATAT ATATATATAA TATCATTTTG TACTAG exon 2 GTA TAT GTC CAT AG 1051 G AAC CAT TAC AGT ATT ACA CTT TAT ACA TCA AAA ACA CCA AAA CCA ATA A 1101 AA TCA AAT AGA TCA TTA TGC GAA TGC GAT CTA TAT AAG CCT AAT TAT AAC 1151 AAC GAC CCG GAA ATG AAA AAT CTA ATG GAA AAT TTC AGT AAA CAG GCG CA 1201 A CAA AGA TTT AAC GAG TAC GAC GAA CAT ATG AAT GAA AAA CTT CAA AAA T 1251 GT AAA GAA CAA TGT GAA AAG GAT ATA CAA AAT ATT ATA TTA AAA GAC AAA 1301 ATT GAA AAG GAA TTA ACA GAA AAG TTG TCA GCA TTA CAA ACG GAT ATA TC 1351 T ATC AAT AAT ATA CCT ACA*TGA*ATT TGC GAA AAA TCT GTA GCA GAT AAA A 1401 TG GAA AAA AAT TGT TTG AAA TGT GGT GGG ATA ATA GGT ACA GCC GTA CCT 1451 GAA TTG GCA CTT TTA GGA GGT GTT TCT ACA CAT ATG TTA ACA ACT GCA GC 1501 C ACT TAT GCT GCT ATT GAA GCT GGT ATG AGA GAA GTC GTC TCT CAT ATT A 1551 AA GAA TTC CTT ACT AAT TTT AAT GAA TAT TTG GTT GAT TTG ACA CCA ATT 1601 GTT AAT GAA TCA AAT TAC AAT TGT GGT ACT GCT CTT TTT GAG GCT GCT AA 1651 T AAA GCG GTT AGT ACA TCG TGT CTT ACA ACA AAA CCT GGA ATT ATA TCT C 1701 CT TTG TGC AGT GCT ATA AAA ACT ACT GGT AAA AAT ACG TTT AAT CAT TAT 1751 GCA CAA TAT GGT AGT GCA GCA TAT AAT GAA AAG TTG AAC GCA GAA ATG GT 1801 G GGA GTT ACT AGT TTT AAT AAT GCC ATG ATG GCT TCA ATT ATT GCA ATA G 1851 TA GTT ATA GTT TTA GTT ATG GTA ATT ATT TAT TTG ATA TTA CGT TAT CGT 1901 AGA AAA AAG AAA ATG AAG AAA AAA GTA CAA TAC TTA AAA CTA CTA AAT CA 1951 A TAA* 1954 stop chrblob_3697.glm_1+2|24oct01 ATATAT GCTTTCGTTA TATTAAATTC AATTTAATGT TATGAGAATT 2001 TTATAATTAT AATACAAGGA TATTATCATA ATTAAATTTT TATAACATTA 2051 TATATTTTTC CCTATAATTT TATTTTGTTT ATTCTTATGT GATTATTAAA 2101 TTATTAAATT TATATTTATT TATTTATTTT TTAGTGAAAA GAGAGTAATA 2151 TATATATATA TTTTATATCA AGAACCTACA TGAATATATA TTTATTTATT 2201 ATACAATATT TAAGAATATC TCGCAACATA TATTTTTTAA ATTATTTATA 2251 TAAAATGATA TATAATGAAA TATATTATAT TATTAATCTT ATACCCATAT 2301 ATTATTTAAA ATTTAATTAT ATTAAAT // crick strand 2327 ATTTAAT ATAATTAAAT TTTAAATAAT 2300 ATATGGGTAT AAGATTAATA ATATAATATA TTTCATTATA TATCATTTTA 2250 TATAAATAAT TTAAAAAATA TATGTTGCGA GATATTCTTA AATATTGTAT 2200 AATAAATAAA TATATATTCA TGTAGGTTCT TGATATAAAA TATATATATA 2150 TATTACTCTC TTTTCACTAA AAAATAAATA AATAAATATA AATTTAATAA 2100 TTTAATAATC ACATAAGAAT AAACAAAATA AAATTATAGG GAAAAATATA 2050 TAATGTTATA AAAATTTAAT TATGATAATA TCCTTGTATT ATAATTATAA 2000 AATTCTCATA ACATTAAATT GAATTTAATA TAACGAAAGC ATATAT "chrblob_3697.glm_1+2|24oct01" 1954 TTAT 1950 TGATTTAGTA GTTTTAAGTA TTGTACTTTT TTCTTCATTT TCTTTTTTCT 1900 ACGATAACGT AATATCAAAT AAATAATTAC CATAACTAAA ACTATAACTA 1850 CTATTGCAAT AATTGAAGCC ATCATGGCAT TATTAAAACT AGTAACTCCC 1800 ACCATTTCTG CGTTCAACTT TTCATTATAT GCTGCACTAC CATATTGTGC 1750 ATAATGATTA AACGTATTTT TACCAGTAGT TTTTATAGCA CTGCACAAAG 1700 GAGATATAAT TCCAGGTTTT GTTGTAAGAC ACGATGTACT AACCGCTTTA 1650 TTAGCAGCCT CAAAAAGAGC AGTACCACAA TTGTAATTTG ATTCATTAAC 1600 AATTGGTGTC AAATCAACCA AATATTCATT AAAATTAGTA AGGAATTCTT 1550 TAATATGAGA GACGACTTCT CTCATACCAG CTTCAATAGC AGCATAAGTG 1500 GCTGCAGTTG TTAACATATG TGTAGAAACA CCTCCTAAAA GTGCCAATTC 1450 AGGTACGGCT GTACCTATTA TCCCACCACA TTTCAAACAA TTTTTTTCCA 1400 TTTTATCTGC TACAGATTTT TCGCAAATTC ATGTAGGTAT ATTATTGATA 1350 GATATATCCG TTTGTAATGC TGACAACTTT TCTGTTAATT CCTTTTCAAT 1300 TTTGTCTTTT AATATAATAT TTTGTATATC CTTTTCACAT TGTTCTTTAC 1250 ATTTTTGAAG TTTTTCATTC ATATGTTCGT CGTACTCGTT AAATCTTTGT 1200 TGCGCCTGTT TACTGAAATT TTCCATTAGA TTTTTCAT 1163 "chrblob_3697.glm_1+2|24oct01" TT CCGGGTCGTT 1150 GTTATAATTA GGCTTATATA GATCGCATTC GCATAATGAT CTATTTGATT 1100 TTATTGGTTT TGGTGTTTTT GATGTATAAA GTGTAATACT GTAATGGTTC 1050 CTATGGACAT ATACCTAGTA CAAAATGATA TTATATATAT ATATATAATG 1000 TATATTATAA TTATGTATAG GGTATGTATA TATATATATA TATATATATA 950 TATTGTAATA ATAATTATTT GTAGATACAT ACCTGTGATG ATGATAATAA 900 CAATATATTT AATGGAAGAG AAAATAATAA TATATTAAAG TAGTGGAGTT 850 TCATTTTTAT TGTGATACTT ATATTATTTT ATGATTAAAT TTGTAACTAA 800 ATAATTAAGA TATAATAATG ACTTTTTTTT TATAAATAAA TTAAATATAC 750 TTAATCTAAA AGATGATTAC ACTTTTAAAA TACACCATAA TTAACGTTAC 700 ATTATTAAAA TATAATTTTT TTTATATAAT AGCGCATCAT TTGTATTATT 650 TCAAAAAAAA AAAAAAAAAA AAACCAAAGA AAGATAAAAG AAATAATATA 600 ATTTATCAAA ATATATTACA TTTTTTATAA TTTTTTTTTA TTTCTAATAA 550 CTTTTAATTT TATATAAAAA AAAAAATTTA TTAATATGAA TTTTTTTTTT 500 TTTTTTTGGG TACATAATAA TAACAAGTGA TACTATATTG TAATAACTAA 450 CATCATATTT ATTGTTCTAA ATAACATAAC AATGTATATA GTAACAATGG 400 TTGAATGTGT ATTATCACAT ATAATTTACA TCTTATAACA TATATGTGGT 350 ATTTATATTG TAACATGTAT GTTCACAATG TTGTAATTAT ATAAAAATTA 300 TTAAGTATCA TTGCATATCA TAATATGTGG TCTTAAAGGT AAAACTAATA 250 GTATATAAAT TTTAATATTA ATTAATTAAA TGTAATATAT TTTAATAATT 200 TAATTTATTT TAATGTTATT ATATATTTTT TTTTTTGTTC CAAAATGTAT 150 TGTATGTTAT ACGTTTCTCT CTAATGTATC TAAAATTATA CTAACATTTT 100 TGTTGTACAT ATAACTATAA AATATTTTAC AAAAAAGTTT TTCATTATAT 50 TATTTTTTTT ATATGATCAC GGTACCGAGC CTGAGATGGA GGATGATAGA end of file 3698 12 3699 9 3702 3 3703 9 3705 9 3707 9 3710 3 Date: Monday, 3/11/2002 Time: 09:38 c3712.txt chrblob_3712|2001.10.15|GENOMIC|Sanger FEATURES Location CDS complement(1523..1741) /gene="chrblob_3712.glm_1|24oct01" /note="(protein coding) No NR protein Similarities" /codon_start=1 CDS complement(1788..2093) /gene="chrblob_3712.glm_2|24oct01" /note="(protein coding) No NR protein Similarities" /codon_start=1 ORIGIN watson strand 1 TTTAAATTTA AATTTTTTTT TTTTAAAAAT TTTTTAGGGT TCCCCGCTCC 51 CACCCGCTTT CCAAAAAAAA CCGGGGATGT TTTTCATTTT CCCCGGTAAA 101 AAAAAGTTTG GGGATTTAAT AAAAAAATTT TGGGTGGGGG ATTGGGGGGG 151 TTTTCACCCA TTCCCAAGGC CAAGTTTAAC TTGGGTTTTT TGGGGTTAAC 201 CCCCGGCCCA AATTTCCCCC TTTATTTTTT TTTTTTTGAA CCCCCCCCCT 251 TAAAATTTCC AATTAAAATT TGCACCTTTT TTGCCTTCCA GGGCCCCCAT 301 GGATTATTTT TTTTTTTTTT TTTGTTTTTT TATCACCCCC CTTCAAATTT 351 TTTTTTTTTA AACTCCAATT TATAAAATTG GGTTCTTTTA AAGGCATTGG 401 CCTTTTTTTT AATAAAAAAA AAAAAAATTT TTTTTTTTTT TTTTTTTTTT 451 TTTTTTTTTT TTTTTTTTTT TTTTTTTTTT TTTTATAGAT AATTAATAAT 501 ACTGGTACTA ATTTTTAAAA ATTAAATTAA TTATATTAGG TTGTACTCCA 551 AATAATTGTG ATAATAATCC AATTTATAGA ACCAACTGTA TAACAGCAAA 601 ATGTTCAAAT AATGTTTGCG TTACTTCAGC ACCATATTGC AGTTCAACCG 651 AACCAGTAAG TAATAGGTTT TTCTATTATT CTTATTATCA TCCAACATCA 701 CCTATTACTA ATCTTTTTTT AATATTTAAA ATATTATTTA TTATAAAAAT 751 AATAACAACG CAACAATAAT AATAAAGTGT ACAGTTGGTC TTTGTACACC 801 AGGTGTTGGT TGTTCAGTTG TTCCAAAAAA TTGTGTAAAT GAAAATCATT 851 GTACCCAAGA TTCATGTAAT TCAACTATAA ATGCTTGCCA ACATGATCCA 901 ATTCCAGATT GTATCAATTG TGCCTATATT GGTTGTATCA CTACTGATTA 951 TTGTAATGAA CAAGTGTAAT TATTAAATTA ATTAATTATT TTATTTTTAA 1001 TATTATTATT ACTATTATTT TTCTTCCAAT TAGATTTTAA TATTTAATTT 1051 TAATTTTTAG ATGTTCAGCT GATGGAAGAT CATGTGAAAC TAGACCAAAG 1101 AATTGTGATG ATTTAAATTT TTGTACTGTT GATACAGTAA GTAAAATTTT 1151 TTTAATTATT TATCTATAGG TATTTATTGT TTCATTTCTA ATTTTTTTTT 1201 TCTTTTTATC TTCTATTAGT GTTCAAATGG AGTTTGCATT TACACAAGAA 1251 TTGATAATTG TGTAAATTGT ACAGGTCCAG GTATTGGTTG TATTACTACT 1301 GATCAATGTA ATCCAAATGT GTAAATATTA TTATTATTAT TATTATTATT 1351 ATTATTATTA TTATTATTAT TATTATTATT ATTATTATTA TTATTATTAT 1401 TATTATTATT ATTATTATTA TTATTTGAAT ATTTTTTTTC TTTATTTAAT 1451 AATATCTAAA TTAATAATCA ATTATTAAAA AAAAAAAAAC AGATGTTCTC 1501 CAGATGGTAA TTCATGTATC ATTCAACCAA AGAATTGTTC AGATGGTAAT 1551 GCTTGTAATG ATCCATCGTG TGTTTCAGGT GGTATGTGTA TGTTAACCCC 1601 AGTGAATTGT GATGATGGTG ATGATTGTAC TTTTGATTCG TATGTATTTC 1651 TTAATAAATT TTTTTTTTTT TTTTTTAATT GATTTATTAA CTCTTTTTTT 1701 TTTTTTTTTA TTTTTATATT TAAAAAAAAA TAGATGCTCA TCAACTGTAG 1751 GTTGCATACA TACTAATATA TCTAATTGTG TAGAATGTCA AAATATTGCT 1801 TGTATTACAA CTGATTTGTA AGTTTTTTTT TTTTTTTTTT TTTTATTTTT 1851 TTTTTTTTTT TTTTTTTTTT TTTTTCTCAT ATAAAAAAAA ACCAACCCCT 1901 TTTTTTTTTT TTTTTTTTTA AAATAAAAAA AAAAAATTGG AAGGGTAAAA 1951 ATTTGTTTTA AAAAAGGGCC AACATGGGAT ACTGTTCCAA AAACTTGGGA 2001 GGAGGGGGAT TCATTTCCAA AAAATTTTTG GGTCAACCCA AGGGGGCCCT 2051 TTTTTTTTTT AAAAAAATTT AAATTCAACC CCCTTTTTTT CATATTAATT 2101 TAAAAATTTT TTTTAGGGGC CTCCCTTTTT TAACCAAAAC CCAATTTTTT 2151 TATTTGGGGG GGGGAAAAAA GTTTAAAAAC C // crick strand 2181 G GTTTTTAAAC TTTTTTCCCC CCCCCAAATA 2150 AAAAAATTGG GTTTTGGTTA AAAAAGGGAG GCCCCTAAAA AAAATTTTTA 2100 AATTAAT no gene chrblob_3712.glm_2|24oct01 2093 ATG AAA AAA AGG GGG TTG AAT TTA AAT TTT TTT AAA AAA AAA A 2050 AG GGC CCC CTT GGG TTG ACC CAA AAA TTT TTT GGA AAT GAA TCC CCC TCC 2000 TCC CAA GTT TTT GGA ACA GTA TCC CAT GTT GGC CCT TTT TTA AAA CAA AT 1950 T TTT ACC CTT CCA ATT TTT TTT TTT TAT TTT AAA AAA AAA AAA AAA AAA A 1900 AG GGG TTG GTT TTT TTT TAT ATG AGA AAA AAA AAA AAA AAA AAA AAA AAA 1850 AAA AAT AAA AAA AAA AAA AAA AAA AAA ACT TAC AAA TCA GTT GTA ATA CA 1800 A GCA ATA TTT TGA* 1788 CATTCTA CACAATTAGA TATATTAGTA TGTATGCAAC 1750 CTACAGTTG no gene chrblob_3712.glm_1|24oct01 1741 ATG AGC ATC TAT TTT TTT TTA AAT ATA AAA ATA AAA AAA AA 1700 A AAA AAA GAG TTA ATA AAT CAA TTA AAA AAA AAA AAA AAA AAT TTA TTA A 1650 GA AAT ACA TAC GAA TCA AAA GTA CAA TCA TCA CCA TCA TCA CAA TTC ACT 1600 GGG GTT AAC ATA CAC ATA CCA CCT GAA ACA CAC GAT GGA TCA TTA CAA GC 1550 A TTA CCA TCT GAA CAA TTC TTT GGT TGA* 1523 AT GATACATGAA TTACCATCTG 1500 GAGAACATCT GTTTTTTTTT TTTTAATAAT TGATTATTAA TTTAGATATT 1450 ATTAAATAAA GAAAAAAAAT ATTCA AAT AAT AAT AAT AAT AAT AAT AAT A 1400 AT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT 1350 AAT AAT AAT AAT AAT AAT AAT AAT ATTTAC ACATTTGGAT TACATTGATC 1300 AGTAGTAATA CAACCAATAC CTGGACCTGT ACAATTTACA CAATTATCAA 1250 TTCTTGTGTA AATGCAAACT CCATTTGAAC ACTAATAGAA GATAAAAAGA 1200 AAAAAAAAAT TAGAAATGAA ACAATAAATA CCTATAGATA AATAATTAAA 1150 AAAATTTTAC TTACTGTATC AACAGTACAA AAATTTAAAT CATCACAATT 1100 CTTTGGTCTA GTTTCACATG ATCTTCCATC AGCTGAACAT CTAAAAATTA 1050 AAATTAAATA TTAAAATCTA ATTGGAAGAA AAATAATAGT AATAATAATA 1000 TTAAAAATAA AATAATTAAT TAATTTAATA ATTACACTTG TTCATTACAA 950 TAATCAGTAG TGATACAACC AATATAGGCA CAATTGATAC AATCTGGAAT 900 TGGATCATGT TGGCAAGCAT TTATAGTTGA ATTACATGAA TCTTGGGTAC 850 AATGATTTTC ATTTACACAA TTTTTTGGAA CAACTGAACA ACCAACACCT 800 GGTGTACAAA GACCAACTGT ACACTTTATT ATTATTGTTG CGTTGTTATT 750 ATTTTTATAA TAAATAATAT TTTAAATATT AAAAAAAGAT TAGTAATAGG 700 TGATGTTGGA TGATAATAAG AATAATAGAA AAACCTATTA CTTACTGGTT 650 CGGTTGAACT GCAATATGGT GCTGAAGTAA CGCAAACATT ATTTGAACAT 600 TTTGCTGTTA TACAGTTGGT TCTATAAATT GGATTATTAT CACAATTATT 550 TGGAGTACAA CCTAATATAA TTAATTTAAT TTTTAAAAAT TAGTACCAGT 500 ATTATTAATT ATCTATAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA 450 AAAAAAAAAA AAAAAAAAAA AAATTTTTTT TTTTTTTATT AAAAAAAAGG 400 CCAATGCCTT TAAAAGAACC CAATTTTATA AATTGGAGTT TAAAAAAAAA 350 AAATTTGAAG GGGGGTGATA AAAAAACAAA AAAAAAAAAA AAAATAATCC 300 ATGGGGGCCC TGGAAGGCAA AAAAGGTGCA AATTTTAATT GGAAATTTTA 250 AGGGGGGGGG TTCAAAAAAA AAAAAATAAA GGGGGAAATT TGGGCCGGGG 200 GTTAACCCCA AAAAACCCAA GTTAAACTTG GCCTTGGGAA TGGGTGAAAA 150 CCCCCCCAAT CCCCCACCCA AAATTTTTTT ATTAAATCCC CAAACTTTTT 100 TTTACCGGGG AAAATGAAAA ACATCCCCGG TTTTTTTTGG AAAGCGGGTG 50 GGAGCGGGGA ACCCTAAAAA ATTTTTAAAA AAAAAAAATT TAAATTTAAA end of file no similarity to intron Date: Monday, 3/11/2002 Time: 09:38 c3714.txt chrblob_3714|2001.10.15|GENOMIC|Sanger FEATURES Location CDS 363..1190 /gene="chrblob_3714.glm_1|24oct01" /note="(protein coding) 100% identity to rifin PFB0015c - malaria parasite (Plasmodium falciparum)" /codon_start=1 ORIGIN watson strand start chrblob_3714.glm_1|24oct01 vbc note partial gene (exon 1) 1 [...CA] TTA AAT ATA TTG TCA TCA TCA TCA G AA intron G TATGCATTAA ATAATAATTA 51 TAATAATATA AAATTATATA TATGTTTTTT ATCAATCATT ATATATTATA 101 ATTATACCTA TATATCCATA TATGTTGTAT ATAAAAATTA CCTTTATATC 151 AATATTGATT ATATATTATA ATTGTGATAA ATAAATATAA TAATAAATTA 201 CAATTAAACA TAACATATAT ATATATATAT ATATATATAT ATACTTTTTT 251 ATAG exon 2 GTA TAT AAT CAA AGG AAC CAT TAC ATC ACA CGT ACA CCA AAA GCA A 301 CC ACT AGG ACA TTA TGC GAA TGT GAA TTG TAT GCA CCA TCA AAC TAT GAT 351 AAT GAC CCA GAA ATG CAA AAA GTA ATG GAA AAT TAC AAT CGA CAA ACG TC 401 A CAG CGT TTT GAA GAA TAC AAT GAA CGT GTG ATC AAA AAC AGA CAA AAA T 451 GT AAG GAA CAA TGC GAT AAA GAA ATA CAA AAA ATT ATA TTA AAA GAT AAA 501 TTA GAA AAA GAA TTA ATG AAC AAA TTT GCC ACA TTA CAA ACT GAT ATA CA 551 A AGC GAT GCT ATT CCC ACA TGT GTT TGC GAA AAA TCA GTC GCA GAT AAA G 601 TT GAA AAA ACC TGT TTA AAA TGT GGA GGT GTG TTG GGA AGT GGT ATT GCG 651 CCA AGC GTT GGT TTG TTA GGT ACG GTT GCC ATA GAT CAG TGG ACA AAT GC 701 T GCC TTG CTT GAT GCA GCT CAA AAG GGT ATT CAG GCA GGT ATT GAT ACT G 751 TT GTT GCG GAA TTA GAA TAT GTG GCG GAG AGA TTT GAT GAT ATT GGT ATT 801 AAT ATA GTA GGA ATG ATA AAT AAA GAA ACT TAC CGT TGT CCG CAA GCT TT 851 G ATT GAA TCT ATT TAT GCA GCA AAA CAA AAA GTG TGT GAT AAT GTT GGA A 901 AT CCA GGA CCA ACT TGC CAT AGA GTA GGA CAA GAC GGC ACC TCA ATT TGG 951 TTT CGT CCA GAA GTA TTA AAG GCT ACG CAA GAT GGT ATT GAC GCT GCT GA 1001 A ACT GTT GAA AAA GCT GAA ATA GTC TTG ATA AAT GAA GAA AGT GCA CAT T 1051 TG TAC AGT GCA ATT GGT TAC TCC GTC CTT GCC ATA TTA ATT ATA GTT TTG 1101 GTT ATG TTA ATT ATT TAT TTA ATT TTA CGT TAT CGA CGA AAA AAG AAA AT 1151 G AAG AAA AAA CTC CAA TAC ATA AAA CTA TTA GAA GAA TAG* 1190 stop chrblob_3714.glm_1|24oct01 vbc ATATGTGACG 1201 TTTGGTATTT TTCGATGTTG GTAGGAAGTT TGGTACTTGT ATTGTTTTTC 1251 TTTGGATGTA CCGTGTGTTT TTTTTTTTTT TTTCTCCATT ATAAATAACT 1301 ATATATTTTT ATATGTATTG CGCTTTTATA TATAATTTAT TTTTCTATAA 1351 TTTTATTTAT TTATTTATTT ATTTATTTAT TTATTTTCTA AAACTCTTTT 1401 AATTAATAAA CAATGTAATT TTTAATTTAT ATAAAATACT TATACGTATT 1451 ATAATATATT ATTTTTTTAA AACATAATGT AACGTATATT TTTTAAATAC 1501 CTCATATGTT TTTCAAAGGA ATATATATCA AAAAAAAAAA CAATAAAACT 1551 TATTATTATT ATAATTATGA TTATTATGAT TATGATTATT ATGATTACTA 1601 TTATTATAAA TATTTTAAGA AACATATTAT TCAAAATATT ATATCTATAT 1651 TTATATAATT AAAATTAAAA CCAATAAGTA TATTATTTCA ATTCAGAATT 1701 ATCATCCTTA AAAAACCTAT CATATTATAT ATTATGTTAT TTATATTTAT 1751 TTCATAATAT ATTTTATTAT TTTTTTTAAT TATTTTTTAT TAGAAATACT 1801 ACTAATACAA TGAATTCAAA AAATAGTCAA CATATAACAA AATATAATAA 1851 TTACACGTAA TATAACAAAT AGATACAATA CATAAAAAAC CAATAAAAAC 1901 ACAAAAAACA AATCAAATTA ATAAAAATAA AACACAATAA AAAAAAGAAT 1951 AATGTATATT TTTTATTTTA ATATAATAAT ACACTTTTTC TTTATTTTGC 2001 CTTTGTAATT TTTATTATGT TGTTTTATTT AGTATAATAT GTAGATATTT 2051 TTTGTTTATA TATATATATA TTTATTTGAT AATATGTATA TATTTATGAG 2101 ATATAATTTC ATATATATTT CATAATTTAT ATTGTTCTTT TTAATTTTTT 2151 TTTAAGTGTT ATTTGTTTCT ATATTACGGT ATGCATTGAT TTATTATCAT 2201 TATATTTTTA TATATATTAA GTGGCAAAAA GAAAAAAAAA AAAAAATTTG 2251 TTTATTAAAT ATTTTTTCTT CTGTAAAATG TTTTCCATTT TTGTTTATAT 2301 TTATATTTAT ATATTTTTTT TTTTTTTTTT TTTTTTTGGG TATTTTTTAT 2351 ATATATGAAA GTTGTATGAT ATATTTAAAA TTTTTTTTTT TTTTTTTTTT 2401 TTTGGTATTT TTTATATATA TGAAATTTAT TTGAAATATT TCAAAATTTT 2451 CTTTTTTTTT TTTTTTTTTT TTAATTTTTT ATTTGGAAAC CCCCTTTTGG 2501 AAAAAAAAAT TTTAATAAAA ATTTTTATTT TTAAAAATAT TTTTTTTTTT 2551 TTTTTTTTAA TAAAAAAAAA AGGGAAAATT TTTAAAATAA AAATTAAAAT 2601 TTTAAATTTT TAAAGGCCTG GGTTCCCCCA TAAAATTAAA AGGTTTCCCG 2651 GGAATTCCCC CCTCTAAAAA TTTTCCCTTT AAAGAGGGGT TTAATACCCC 2701 TTTTCCCAAT TGTGATTTTT TTTTTTTTTC CATGCGTTTC CCATAGGTTA 2751 TGGTTTTTAA TTTAAAAATT TTAACCCTTA TTGGGCTCCC TTTAAACTTT 2801 TTTTTTTAAC CCC // crick strand 2813 GGG GTTAAAAAAA 2800 AAAGTTTAAA GGGAGCCCAA TAAGGGTTAA AATTTTTAAA TTAAAAACCA 2750 TAACCTATGG GAAACGCATG GAAAAAAAAA AAAAATCACA ATTGGGAAAA 2700 GGGGTATTAA ACCCCTCTTT AAAGGGAAAA TTTTTAGAGG GGGGAATTCC 2650 CGGGAAACCT TTTAATTTTA TGGGGGAACC CAGGCCTTTA AAAATTTAAA 2600 ATTTTAATTT TTATTTTAAA AATTTTCCCT TTTTTTTTTA TTAAAAAAAA 2550 AAAAAAAAAA ATATTTTTAA AAATAAAAAT TTTTATTAAA ATTTTTTTTT 2500 CCAAAAGGGG GTTTCCAAAT AAAAAATTAA AAAAAAAAAA AAAAAAAAAG 2450 AAAATTTTGA AATATTTCAA ATAAATTTCA TATATATAAA AAATACCAAA 2400 AAAAAAAAAA AAAAAAAAAA TTTTAAATAT ATCATACAAC TTTCATATAT 2350 ATAAAAAATA CCCAAAAAAA AAAAAAAAAA AAAAAAATAT ATAAATATAA 2300 ATATAAACAA AAATGGAAAA CATTTTACAG AAGAAAAAAT ATTTAATAAA 2250 CAAATTTTTT TTTTTTTTTC TTTTTGCCAC TTAATATATA TAAAAATATA 2200 ATGATAATAA ATCAATGCAT ACCGTAATAT AGAAACAAAT AACACTTAAA 2150 AAAAAATTAA AAAGAACAAT ATAAATTATG AAATATATAT GAAATTATAT 2100 CTCATAAATA TATACATATT ATCAAATAAA TATATATATA TATAAACAAA 2050 AAATATCTAC ATATTATACT AAATAAAACA ACATAATAAA AATTACAAAG 2000 GCAAAATAAA GAAAAAGTGT ATTATTATAT TAAAATAAAA AATATACATT 1950 ATTCTTTTTT TTATTGTGTT TTATTTTTAT TAATTTGATT TGTTTTTTGT 1900 GTTTTTATTG GTTTTTTATG TATTGTATCT ATTTGTTATA TTACGTGTAA 1850 TTATTATATT TTGTTATATG TTGACTATTT TTTGAATTCA TTGTATTAGT 1800 AGTATTTCTA ATAAAAAATA ATTAAAAAAA ATAATAAAAT ATATTATGAA 1750 ATAAATATAA ATAACATAAT ATATAATATG ATAGGTTTTT TAAGGATGAT 1700 AATTCTGAAT TGAAATAATA TACTTATTGG TTTTAATTTT AATTATATAA 1650 ATATAGATAT AATATTTTGA ATAATATGTT TCTTAAAATA TTTATAATAA 1600 TAGTAATCAT AATAATCATA ATCATAATAA TCATAATTAT AATAATAATA 1550 AGTTTTATTG TTTTTTTTTT TGATATATAT TCCTTTGAAA AACATATGAG 1500 GTATTTAAAA AATATACGTT ACATTATGTT TTAAAAAAAT AATATATTAT 1450 AATACGTATA AGTATTTTAT ATAAATTAAA AATTACATTG TTTATTAATT 1400 AAAAGAGTTT TAGAAAATAA ATAAATAAAT AAATAAATAA ATAAATAAAA 1350 TTATAGAAAA ATAAATTATA TATAAAAGCG CAATACATAT AAAAATATAT 1300 AGTTATTTAT AATGGAGAAA AAAAAAAAAA AAACACACGG TACATCCAAA 1250 GAAAAACAAT ACAAGTACCA AACTTCCTAC CAACATCGAA AAATACCAAA 1200 CGTCACATAT "chrblob_3714.glm_1|24oct01" 1190 CTATTCTTCT AATAGTTTTA TGTATTGGAG TTTTTTCTTC 1150 ATTTTCTTTT TTCGTCGATA ACGTAAAATT AAATAAATAA TTAACATAAC 1100 CAAAACTATA ATTAATATGG CAAGGACGGA GTAACCAATT GCACTGTACA 1050 AATGTGCACT TTCTTCATTT ATCAAGACTA TTTCAGCTTT TTCAACAGTT 1000 TCAGCAGCGT CAATACCATC TTGCGTAGCC TTTAATACTT CTGGACGAAA 950 CCAAATTGAG GTGCCGTCTT GTCCTACTCT ATGGCAAGTT GGTCCTGGAT 900 TTCCAACATT ATCACACACT TTTTGTTTTG CTGCATAAAT AGATTCAATC 850 AAAGCTTGCG GACAACGGTA AGTTTCTTTA TTTATCATTC CTACTATATT 800 AATACCAATA TCATCAAATC TCTCCGCCAC ATATTCTAAT TCCGCAACAA 750 CAGTATCAAT ACCTGCCTGA ATACCCTTTT GAGCTGCATC AAGCAAGGCA 700 GCATTTGTCC ACTGATCTAT GGCAACCGTA CCTAACAAAC CAACGCTTGG 650 CGCAATACCA CTTCCCAACA CACCTCCACA TTTTAAACAG GTTTTTTCAA 600 CTTTATCTGC GACTGATTTT TCGCAAACAC ATGTGGGAAT AGCATCGCTT 550 TGTATATCAG TTTGTAATGT GGCAAATTTG TTCATTAATT CTTTTTCTAA 500 TTTATCTTTT AATATAATTT TTTGTATTTC TTTATCGCAT TGTTCCTTAC 450 ATTTTTGTCT GTTTTTGATC ACACGTTCAT TGTATTCTTC AAAACGCTGT 400 GACGTTTGTC GATTGTAATT TTCCATTACT TTTTGCAT 363 "chrblob_3714.glm_1|24oct01" TT CTGGGTCATT 350 ATCATAGTTT GATGGTGCAT ACAATTCACA TTCGCATAAT GTCCTAGTGG 300 TTGCTTTTGG TGTACGTGTG ATGTAATGGT TCCTTTGATT ATATACCTAT 250 AAAAAAGTAT ATATATATAT ATATATATAT ATATATGTTA TGTTTAATTG 200 TAATTTATTA TTATATTTAT TTATCACAAT TATAATATAT AATCAATATT 150 GATATAAAGG TAATTTTTAT ATACAACATA TATGGATATA TAGGTATAAT 100 TATAATATAT AATGATTGAT AAAAAACATA TATATAATTT TATATTATTA 50 TAATTATTAT TTAATGCATA CTTCTGATGA TGATGACAAT ATATTTAATG end of file 3715 10 3716 10 3717 7 3718 4 3721 9 3722 10 1437557w LSA liver stage antigen 3723 3 3726 12 3727 2 3728 4 3730 3 3731 9 Date: Monday, 3/11/2002 Time: 16:50 c3733.txt chrblob_3733|2001.10.15|GENOMIC|Sanger FEATURES Location CDS 408..953 /gene="chrblob_3733.gen_1|24oct01" /note="(protein coding) 39% identity to EA59 GENE PROTEIN" /codon_start=1 CDS join(1042..1662,1827..2183) /gene="chrblob_3733.gen_2|24oct01" /note="(protein coding) 30% identity to EA31 GENE PROTEIN" /codon_start=1 CDS 2347..2691 /gene="chrblob_3733.gen_3|24oct01" /note="(protein coding) No NR protein Similarities" /codon_start=1 cds complement(1103..1402) /gene="chrblob_3733.gen_4|24oct01" /note="(protein coding) No NR protein Similarities" /codon_start=1 ORIGIN watson strand centromere ? 1 AAGAGGGAGT GTCCATAGAC GTGGACCTTC AGCCAGATGA CCCTGTGCCA 51 GGCCGAATCC TCGCGATCAT TGGTCGCAAC GGAGTGGGGA AGACTCAATT 101 TTTAGCCCAG CTTGCACGAG ACCTTGCGAC GACAAAGCGG GTGTCGATAG 151 AGACAGCCAG CCAAGTAGAG TCTGCTTTTG AGCCTGCCAG ACCTCTTTTC 201 TCACGAGTCA TCGCGTTGTC CTTCAGCGCA TTCGACAAGT TCCAGCGCCC 251 CGAGCCGGAG AAGTACTTCA GCTATATCTA CTGCGGGGTG CGTGATGACA 301 GCGGCGGAAT TTCTAGGCGA GCACTTGAAG CGAAGCACCT TGAGTACCTA 351 AAGCGCATCG TTGAACAAGA CCGTGAGGAC CATTGGGAGC AGCACGTTGC 401 GAACGTA 408 ATG GGC GTT CCG AAG AAA ATT ATC TCC ATT ACG GAG CAC ATC G 451 AG GAG CTT GAG AAG AGC CTG CCG CCC ACC ATG AGC TCC GGG CAG TCC ATC 501 CTG GCC TAC TTC ATT TCG GCT GCA CTG GCT TAC CTC AAG GAA GGG TCG CT 551 G GTC ATC TTC GAC GAG CCC GAA ATT CAC CTG CAT CCC AAT GCA GTT GCG C 601 TG CTG ATG CAG ACC TTG CAG GCA CTG CTG AAG GAG TTC GAC TCG TAC GCA 651 ATC ATC GCG ACC CAT TCA CCG GTG GTG ATC CAG GAG GTT CCC CGC AAG CG 701 G GTC ATT CGG TTT GAG CGT GAA GGC AAC ATC ACC ACT GGC AGT CCC CTC G 751 GC CAT GAG TCA TTT GGG GAG AAT ATC GCC GAG CTG ACC CGC CTG GTG TTT 801 GAG ACT GTC GAG ATT CCA AAT TTC TAT AAG AAG ACA TTA CAG GCG CTG GC 851 C AAG AAA CAC GAT TTC GAC ACG GTC GCC AAG ATG TTC GAC GAA CAG CTA A 901 GC CTG CAC GCA ACG GCG TAC CTT GCC TCG CTG TAC GAG GAC GGG GAT GCA 951 TAA GCTTACC CTTGCAGCCG GTCTCCCGAG AGAGCATTTT TCCGGTATCG 1001 TCGATGGGAA AAGCGGTGAC CGAGGCGCCC GATTGACGGA C ATG CTA CCG 1051 GTA GTC CAA GCT CAC TAT GGA GTC TTT GAG GCT GCC TAT ACA GTG GCG GA 1101 C ATC AGT GGT GTG GCT CAG GGC ACT TGG ACG AAG ACT GAA CGT GAA GAC C 1151 TG CTG CAC TGC TAT GAG ACC ACG GCC AAG GCT CTG CAG CAA CTG AAG ACG 1201 CTG ATT TTA GAC AGC CAG CCG GAA GGC ATT CGA GAG GTT TGC CCT TAC TG 1251 C GGC ATC GGT GGC CCC AGG CAG TTT GAC CAC TAT TTG CCA AAA GAG AAG T 1301 TC CCC GAG TAC AGC GTC CAC TCG TAC AAC TTG GTG CCG TGC TGT GGC GTC 1351 TGC AAT GGC AAG AAG GCC GAT ATC TGG CTG CAG CCC AAC AAC ACC CGG AC 1401 A TTC ATC AAT TTT TAT CTC GAC TCT TTG CCT GCA GTG CCG ATG CTC GAC G 1451 TC ACG GTT CAA TGG TCA GTG AAG AAC GGC AAG CTC GTC CCG GTG TCG ATA 1501 TTT CAG TTA GTC TGT CCA GCT GGG TTT GGA GCA GCT GAG TTC CAG CTC GT 1551 C TCG AAT CAC TTC CAG AAG CTG GGT TTG CTC GCA AGG TAC AAG GAC CAG G 1601 CG CAC ACT GAG TTC CTT GCC ATT CGA AAT GCT GCG CTT TCC AGA GAG GCG 1651 AAG ACT GTA GTG GTGCTGCG TCGGTTTTTG GGAGAATTTG TCAAGAATTG 1701 GGAGCAGACT TTGGGACCGT TGAACTGGCG CATCTCGCTC TACCGAGCGC 1751 TGATTGCACA CACAGACTTC CTGCAGACTT GCCTCAAGCC ATAGGCTAAC 1801 AGTTTGGACT GTCCCTGATA GGGGAG 1827 ACT GGC CTG CGG TGT ATC GGC ACC 1851 ACC CGA TCG CCT GCG ACG GAA CGG CGG GTC TGT CCG ATA CCG ACG TTC AG 1901 C GGG AGC TCA AAG AAC AGC TGC AGC GCT GCC ATA TGG AGT GGT CCC GGT C 1951 TA GTA GAC AAA CCC CAG CCT CAA GCC GAG GCG CGT TCA AGC GTC TCA GAT 2001 CTA GCG CCG GTC AGA GGT AGC AGT GGC GGG GAG CTT CGC CGA TGG TTG CG 2051 T TTT TTA AAT CAT CCA TCC TCT GTG CGA TTT GCT CTC GGC ACA GCA GGT G 2101 AT GCT GCG TGC GGC GGA TGT CTG CCT GTG TTT CCG ACA TTA GCT AGG CCC 2151 ATC GAT CGT CGC GGA CGT ACG AAG GCC GCA TGA ATGCTGG ATCCCAGTTT 2201 CCAATTAACC CAAGAACAGC CGGCGCGGGC ATAGCGTCGG CTTGCGGCTA 2251 AAGCAACCGT TTGAGCGCGC TGGAAACTCC ATTGAGCATC TCCAGCGCTG 2301 GAGCGTGACA CCCTCTACCC CTGCGGGACA GGAGGCTGCA ATCACG 2347 ATG C 2351 GA GAA TCT TGC GCA ACG TCG AGC AGG CAT TGC TCA ATG CAC ATG CCG ATG 2401 ATG AAT GTC CGG GTA GTG CGG ATG CCT GTG AGT CAG CAC CTC GTG CGT AT 2451 G GGC ATG GAC ATG AGG TTC TTT GCC GCC CCA TTC AGC GCC ATG GCC ATG T 2501 TG ATG GTG CTC ATC ATG TCG GTG GCT GTG CGT ATG CAC GAT CGG CTC ATG 2551 CGA GTG CTC ATG CTC ATG ACG CTC TCG CAG GTG AAG CCA AAC GCC GAT GC 2601 C CAT GAA CAC TGC CGC CGC CCA GAA CAG CGT GGA GGG CGC TTC TTG CAA A 2651 AT GGC GAA CGA CAG TGC CAC ACC GAA CAG CGG TCG ACG GAG 2691 // crick strand 2691 C TCCGTCGACC GCTGTTCGGT GTGGCACTGT CGTTCGCCAT 2650 TTTGCAAGAA GCGCCCTCCA CGCTGTTCTG GGCGGCGGCA GTGTTCATGG 2600 GCATCGGCGT TTGGCTTCAC CTGCGAGAGC GTCATGAGCA TGAGCACTCG 2550 CATGAGCCGA TCGTGCATAC GCACAGCCAC CGACATGATG AGCACCATCA 2500 ACATGGCCAT GGCGCTGAAT GGGGCGGCAA AGAACCTCAT GTCCATGCCC 2450 ATACGCACGA GGTGCTGACT CACAGGCATC CGCACTACCC GGACATTCAT 2400 CATCGGCATG TGCATTGAGC AATGCCTGCT CGACGTTGCG CAAGATTCTC 2350 GCATCGTGAT TGCAGCCTCC TGTCCCGCAG GGGTAGAGGG TGTCACGCTC 2300 CAGCGCTGGA GATGCTCAAT GGAGTTTCCA GCGCGCTCAA ACGGTTGCTT 2250 TAGCCGCAAG CCGACGCTAT GCCCGCGCCG GCTGTTCTTG GGTTAATTGG 2200 AAACTGGGAT CCAGCATTCA TGCGGCCTTC GTACGTCCGC GACGATCGAT 2150 GGGCCTAGCT AATGTCGGAA ACACAGGCAG ACATCCGCCG CACGCAGCAT 2100 CACCTGCTGT GCCGAGAGCA AATCGCACAG AGGATGGATG ATTTAAAAAA 2050 CGCAACCATC GGCGAAGCTC CCCGCCACTG CTACCTCTGA CCGGCGCTAG 2000 ATCTGAGACG CTTGAACGCG CCTCGGCTTG AGGCTGGGGT TTGTCTACTA 1950 GACCGGGACC ACTCCATATG GCAGCGCTGC AGCTGTTCTT TGAGCTCCCG 1900 CTGAACGTCG GTATCGGACA GACCCGCCGT TCCGTCGCAG GCGATCGGGT 1850 GGTGCCGATA CACCGCAGGC CAGTCTCCCC TATCAGGGAC AGTCCAAACT 1800 GTTAGCCTAT GGCTTGAGGC AAGTCTGCAG GAAGTCTGTG TGTGCAATCA 1750 GCGCTCGGTA GAGCGAGATG CGCCAGTTCA ACGGTCCCAA AGTCTGCTCC 1700 CAATTCTTGA CAAATTCTCC CAAAAACCGA CGCAGCACCA CTACAGTCTT 1650 CGCCTCTCTG GAAAGCGCAG CATTTCGAAT GGCAAGGAAC TCAGTGTGCG 1600 CCTGGTCCTT GTACCTTGCG AGCAAACCCA GCTTCTGGAA GTGATTCGAG 1550 ACGAGCTGGA ACTCAGCTGC TCCAAACCCA GCTGGACAGA CTAACTGAAA 1500 TATCGACACC GGGACGAGCT TGCCGTTCTT CACTGACCAT TGAACCGTGA 1450 CGTCGAGCAT CGGCACTGCA GGCAAAGAGT CGAGATAAAA ATTGATGA 1402 AT 1400 GTCCGGGTGT TGTTGGGCTG CAGCCAGATA TCGGCCTTCT TGCCATTGCA 1350 GACGCCACAG CACGGCACCA AGTTGTACGA GTGGACGCTG TACTCGGGGA 1300 ACTTCTCTTT TGGCAAATAG TGGTCAAACT GCCTGGGGCC ACCGATGCCG 1250 CAGTAAGGGC AAACCTCTCG AATGCCTTCC GGCTGGCTGT CTAAAATCAG 1200 CGTCTTCAGT TGCTGCAGAG CCTTGGCCGT GGTCTCATAG CAGTGCAGCA 1150 GGTCTTCACG TTCAGTCTTC GTCCAAGTGC CCTGAGCCAC ACCACTGA TG 1100 TCCGCCACTG TATAGGCAGC CTCAAAGACT CCATAGTGAG CTTGGACTAC 1050 CGGTAGCATG TCCGTCAATC GGGCGCCTCG GTCACCGCTT TTCCCATCGA 1000 CGATACCGGA AAAATGCTCT CTCGGGAGAC CGGCTGCAAG GGTAAGCTTA 950 TGCATCCCCG TCCTCGTACA GCGAGGCAAG GTACGCCGTT GCGTGCAGGC 900 TTAGCTGTTC GTCGAACATC TTGGCGACCG TGTCGAAATC GTGTTTCTTG 850 GCCAGCGCCT GTAATGTCTT CTTATAGAAA TTTGGAATCT CGACAGTCTC 800 AAACACCAGG CGGGTCAGCT CGGCGATATT CTCCCCAAAT GACTCATGGC 750 CGAGGGGACT GCCAGTGGTG ATGTTGCCTT CACGCTCAAA CCGAATGACC 700 CGCTTGCGGG GAACCTCCTG GATCACCACC GGTGAATGGG TCGCGATGAT 650 TGCGTACGAG TCGAACTCCT TCAGCAGTGC CTGCAAGGTC TGCATCAGCA 600 GCGCAACTGC ATTGGGATGC AGGTGAATTT CGGGCTCGTC GAAGATGACC 550 AGCGACCCTT CCTTGAGGTA AGCCAGTGCA GCCGAAATGA AGTAGGCCAG 500 GATGGACTGC CCGGAGCTCA TGGTGGGCGG CAGGCTCTTC TCAAGCTCCT 450 CGATGTGCTC CGTAATGGAG ATAATTTTCT TCGGAACGCC CATTACGTTC 400 GCAACGTGCT GCTCCCAATG GTCCTCACGG TCTTGTTCAA CGATGCGCTT 350 TAGGTACTCA AGGTGCTTCG CTTCAAGTGC TCGCCTAGAA ATTCCGCCGC 300 TGTCATCACG CACCCCGCAG TAGATATAGC TGAAGTACTT CTCCGGCTCG 250 GGGCGCTGGA ACTTGTCGAA TGCGCTGAAG GACAACGCGA TGACTCGTGA 200 GAAAAGAGGT CTGGCAGGCT CAAAAGCAGA CTCTACTTGG CTGGCTGTCT 150 CTATCGACAC CCGCTTTGTC GTCGCAAGGT CTCGTGCAAG CTGGGCTAAA 100 AATTGAGTCT TCCCCACTCC GTTGCGACCA ATGATCGCGA GGATTCGGCC 50 TGGCACAGGG TCATCTGGCT GAAGGTCCAC GTCTATGGAC ACTCCCTCTT centromere ? end of file 3734 9 3735 9 Date: Monday, 3/11/2002 Time: 16:53 c3736.txt chrblob_3736|2001.10.15|GENOMIC|Sanger FEATURES Location CDS complement(1811..2056) /gene="chrblob_3736.glm_1|24oct01" /note="(protein coding) 65% identity to (AB053203) Psi facor [Dictyostelium discoideum]" /codon_start=1 ORIGIN watson strand 1 ATTACACTTT ACACAGTTTT CAATTGGTAC AGCTGTGCAT ATACCTATTA 51 TATTTTTAAA AATGATAGAG AGAGATTTAA TTATAATTAA ACTAAAATTA 101 TTTCATATTA TAAAATTAAT TTACATACCA TCTGGTGAAT GACATTGATT 151 TAAAGTACAT GGTTTATTAT CATTACAAGT TTTAGGTATA CTGACACATG 201 TTGTTGAACC ATCAGTTGGA CAAGATAATG GTGAACATAA ATCTAGTGTT 251 ATACAATTAA ATGTACCACA ATCAGTACAA TTCTGTAATA TTTCATGTGC 301 ACAAGTACCA TTGGGACTAA TACATCTATC ATTTGAACAG GCATTACCAT 351 CATCACATAC TTTTGGAACT TCTGTACATT TAGTACCATT ATCAGTACAT 401 CTATTTTATC AGTAAAAAAG GAAATCAACA TTTGGTTTTT TTTTTTTTTT 451 TTTTTTTTTT TTTTTTTTTT TGTAAAAAAT CTTACAATTT TTGGTTACAA 501 AGGTCAGTGG TAATACAAGC AAGTCCAGTA CAAGCAATAC AATTGTCCAA 551 AGGAGTATGG ACACAACCTA AAGTTTCATC ACATCTGTGT TATTATTAAA 601 AAAATGATAT TGTTAAACAA ATAAAAATTA ATTTTCCTTT TTTAATAAAT 651 TATAAAAAAA CTTACGTATC TACTGTGCAA TCATCAACAT CATCACAATC 701 TATTGGAATA AATAAACAAT GTCCTGCAAA ACACTAAATA GTTTAGAAAT 751 TCCATGTTAA TAAAATTATA AAAAAAAGTA TTTGTGCCAT AAAATTGATT 801 ATATAATATT TACAAAATCC TTAGTACAAG TTTTATTATC ATTACATAGA 851 ACTTCAGTTA AACATGATTT TCCATCTGGA GCACATCTAT TAAATTTAAA 901 TATATAATTA GTAATTTTTA AAAATAGAAT TTTTTAAAAT CTTTGAATAC 951 AAACACTTTA GGATTACAAT CATTAGTGGT AATACAACCA GTACCTGCAC 1001 AATTGACACA TTTTGGTATT GGCGTATGGA TACAAATACC ATCTTGACAC 1051 TTTTTTATTA TATTTTATTT TATTAAATTA GTAACATATT AAAAAAGTTT 1101 TTACATATAA TCCAAAACTT ACAGTATCAG TAGTACAATA ATCTCTATCA 1151 TCACAATTCT TATTTGATGA TACACAATTT CCTTTAGAAT CACATCTAAT 1201 TAATTAAAAA ATTAAAAAAA TTATTTTAAT TAAACAAACA AATTAATAAA 1251 TTAGAACCTT TGAATAACCA TAAACATTAT ATTACATACT TTTGTGGGAA 1301 ACATAAATCA GTGGTAATAC AAGGTCCATT CGAACATGAA ACACAATTTG 1351 CGATTGGTGA ACGTTCACAT GTGTTGGTAT CTTTATTACA AAAACTATTT 1401 TCACAATTTG TTCTATTACA TGTTATCTCT GAATAAGAAC AACCAAAATT 1451 TGGAATACAA GTACCAGCTT CACAAGGATT AATCGATGGG CAACTTGGTG 1501 CAGATTTAAC ACAAACATTA TTTGAGCATT GTGCTGTAAT ACAATTCAAT 1551 TTATTATTTG GATTATCATT ACAATTACTT TTGGTACAAC CTTTATTTTT 1601 TTTTTTTTTT TTTTTAAAAA TCAATTAATA ATAAAGCATT ATTGTTTAAA 1651 ACTTATAATA ATATTAAAAA TACCTACAAG AAGATCCATC ACCTTGGCAA 1701 ACACCACATT CATCGTATCC ACTTATTAAT TTTTAGTAAA TGAAAATTAA 1751 TAAATACTTT ATTTGAAAAT AAAATTATAA TTATAATCTT AAAATTGGAT 1801 TAAAAAATAC "chrblob_3736.glm_1|24oct01" 1811 TTACGGACAT GTTAACTCTA TAGATGTTTC GATTGAAATA 1851 TGAGATTCAG TTGTATGGCG TTCACAATAA AAGAAATCAA ATGGATAATT 1901 GGTGCCCTCA GTCAAACCTA ATCTATCCAA ATTAATACTT GTTGTTGCTT 1951 TACCGTGAAT TCCTCCCAAA TCAACAACTA ATATTTTATT CATAAATACC 2001 CAAACATCAT CATCACCATT AAAATAGAAA GTATCACCTT TCTTATATGC 2051 AAACAT 2056 "chrblob_3736.glm_1|24oct01" TGAG TGAATTTGCA AACCTATATA TTGAAAATTT TCAATTAATA 2101 CTTTTCATTA ATCCATTGGT TATTTTTACT TACAAAAGTG AAAATTATGT 2151 GGTGTTCCAC GTTCATCTCT ATATACGGCT TCATATGGAT AATTTGTCTT 2201 TGTGTTTCAA TTAAAAAAAA AATGATAATA ATAAAAAATA ATTAAATTTA 2251 TGAATTTTAA AAAAATAATA ATATTGAAAA ATAAAATTAT AACACACACC 2301 TTATTATCAA ATCCTTGTCC ATCTATTGGA AAAAAGGCAT CATTTGTATA 2351 TGCATAAACA TTTGGATTTG TAGTACTTTG AGTTAAAGTA ATTTGATAAT 2401 TAATTGGTAA ATTTACTCCT GGATAATTGT GAAACCATTG ATTAAAAGTT 2451 TCTGGTGAAT GAATTGTTGA TGATCGCTCA GCCACTAAAA ATAATTGGAA 2501 ATTTTATTTC TATGTAATTT GTTTT // crick strand 2525 AAAAC AAATTACATA GAAATAAAAT 2500 TTCCAATTAT TTTTAGTGGC TGAGCGATCA TCAACAATTC ATTCACCAGA 2450 AACTTTTAAT CAATGGTTTC ACAATTATCC AGGAGTAAAT TTACCAATTA 2400 ATTATCAAAT TACTTTAACT CAAAGTACTA CAAATCCAAA TGTTTATGCA 2350 TATACAAATG ATGCCTTTTT TCCAATAGAT GGACAAGGAT TTGATAATAA 2300 GGTGTGTGTT ATAATTTTAT TTTTCAATAT TATTATTTTT TTAAAATTCA 2250 TAAATTTAAT TATTTTTTAT TATTATCATT TTTTTTTTAA TTGAAACACA 2200 AAGACAAATT ATCCATATGA AGCCGTATAT AGAGATGAAC GTGGAACACC 2150 ACATAATTTT CACTTTTGT AAGTAAAAATA ACCAATGGAT TAA TGA AAA G 2100 TA TTA ATT GAA AAT TTT CAA TAT ATA GGT TTG CAA ATT CAC TCA no gene chrblob_3736.glm_1|24oct01 2056 ATG TTT 2050 GCA TAT AAG AAA GGT GAT ACT TTC TAT TTT AAT GGT GAT GAT GAT GTT TG 2000 G GTA TTT ATG AAT AAA ATA TTA GTT GTT GAT TTG GGA GGA ATT CAC GGT A 1950 AA GCA ACA ACA AGT ATT AAT TTG GAT AGA TTA GGT TTG ACT GAG GGC ACC 1900 AAT TAT CCA TTT GAT TTC TTT TAT TGT GAA CGC CAT ACA ACT GAA TCT CA 1850 T ATT TCA ATC GAA ACA TCT ATA GAG TTA ACA TGT CCG TAA* 1811 GTATTTTTTA 1800 ATCCAATTTT AAGATTATAA TTATAATTTT ATTTTCAAAT AAAGTATTTA 1750 TTAATTTTCA TTTACTAAAA ATTAATAAGT GGATACGATG AATGTGGTGT 1700 TTGCCAAGGT GATGGATCTT CTTGTAGGTA TTTTTAATAT TATTATAAGT 1650 TTTAAACAAT AATGCTTTAT TATTAATTGA TTTTTAAAAA AAAAAAAAAA 1600 AAAAATAAAG GTTGTACCAA AAGTAATTGT AATGATAATC CAAATAATAA 1550 ATTGAATTGT ATTACAGCAC AATGCTCAAA TAATGTTTGT GTTAAATCTG 1500 CACCAAGTTG CCCATCGATT AATCCTTGTG AAGCTGGTAC TTGTATTCCA 1450 AATTTTGGTT GTTCTTATTC AGAGATAACA TGTAATAGAA CAAATTGTGA 1400 AAATAGTTTT TGTAATAAAG ATACCAACAC ATGTGAACGT TCACCAATCG 1350 CAAATTGTGT TTCATGTTCG AATGGACCTT GTATTACCAC TGATTTATGT 1300 TTCCCACAAA AGTATGTAAT ATAATGTTTA TGGTTATTCA AAGGTTCTAA 1250 TTTATTAATT TGTTTGTTTA ATTAAAATAA TTTTTTTAAT TTTTTAATTA 1200 ATTAGATGTG ATTCTAAAGG AAATTGTGTA TCATCAAATA AGAATTGTGA 1150 TGATAGAGAT TATTGTACTA CTGATACTGT AAGTTTTGGA TTATATGTAA 1100 AAACTTTTTT AATATGTTAC TAATTTAATA AAATAAAATA TAATAAAAAA 1050 GTGTCAAGAT GGTATTTGTA TCCATACGCC AATACCAAAA TGTGTCAATT 1000 GTGCAGGTAC TGGTTGTATT ACCACTAATG ATTGTAATCC TAAAGTGTTT 950 GTATTCAAAG ATTTTAAAAA ATTCTATTTT TAAAAATTAC TAATTATATA 900 TTTAAATTTA ATAGATGTGC TCCAGATGGA AAATCATGTT TAACTGAAGT 850 TCTATGTAAT GATAATAAAA CTTGTACTAA GGATTTTGTA AATATTATAT 800 AATCAATTTT ATGGCACAAA TACTTTTTTT TATAATTTTA TTAACATGGA 750 ATTTCTAAAC TATTTAGTGT TTTGCAGGAC ATTGTTTATT TATTCCAATA 700 GATTGTGATG ATGTTGATGA TTGCACAGTA GATACGTAAG TTTTTTTATA 650 ATTTATTAAA AAAGGAAAAT TAATTTTTAT TTGTTTAACA ATATCATTTT 600 TTTAATAATA ACACAGATGT GATGAAACTT TAGGTTGTGT CCATACTCCT 550 TTGGACAATT GTATTGCTTG TACTGGACTT GCTTGTATTA CCACTGACCT 500 TTGTAACCAA AAATTGTAAG ATTTTTTACA AAAAAAAAAA AAAAAAAAAA 450 AAAAAAAAAA AAAAACCAAA TGTTGATTTC CTTTTTTACT GATAAAATAG 400 A TGT ACT GAT AAT GGT ACT AAA TGT ACA GAA GTT CCA AAA GTA TGT GAT G 350 AT GGT AAT GCC TGT TCA AAT GAT AGA TGT ATT AGT CCC AAT GGT ACT TGT 300 GCA CAT GAA ATA TTA CAG AAT TGT ACT GAT TGT GGT ACA TTT AAT TGT AT 250 A ACA CTA GAT TTA TGT TCA CCA TTA TCT TGT CCA ACT GAT GGT TCA ACA A 200 CA TGT GTC AGT ATA CCT AAA ACT TGT AAT GAT AAT AAA CCA TGT ACT TTA 150 AAT CAA TGT CAT TCA CCA GAT GGT ATG TAA ATTAATTTTA TAATATGAAA 100 TAATTTTAGT TTAATTATAA TTAAATCTCT CTCTATCATT TTTAAAAATA 50 TAATAGGTAT ATGCACAGCT GTACCAATTG AAAACTGTGT AAAGTGTAAT end of file 3737 9 3738 4 3739 9 3740 9 3741 4 3742 3 3744 9 Date: Monday, 3/11/2002 Time: 16:55 c3745.txt chrblob_3745|2001.10.15|GENOMIC|Sanger FEATURES Location CDS complement(267..473) /gene="chrblob_3745.glm_2|24oct01" /note="(protein coding) No NR protein Similarities" /codon_start=1 CDS complement(718..2661) /gene="chrblob_3745.glm_1|24oct01" /note="(protein coding) 28% identity to CIGB PROTEIN (FRAGMENT)" /codon_start=1 ORIGIN watson strand 1 ACAAAAAATT TAAAACCCAA ATTATTATAA TATTACTACA AAAATTTTAA 51 TTTACTTCCT CTTGTTCTTT TATTTATAAA TTTAACTAAA AAAATAACAA 101 AAAAAAGGTT TATCCAAATT TTTTTTTTTT TTTTAATTTT TTCACTTCCA 151 TTTAGATATT TGAACCAATC TATTTATTAA TCTTAAATAT TGTAAATCTT 201 TTTCTAAATC TTTTCTTATT TCTAAATCAT GATAATTCAT TATTTTAAAA 251 ACATTACATG GTTGAA "chrblob_3745.glm_2|24oct01" 267 CTAA AATATATATA TATATATAAT TAGAATATTG 301 ATATCTTTTA ATTTGAAATA ATTATAATTA TTATACATAC CAGGTAATTC 351 ATAATTAGAA GTGACTAAAC CTGCATATTC GGATGTTGAA ACTTGATCAG 401 AAAAAGTGAT AGCTAAAATG GGAACAATAC CCAAAGCAAT TGATTCTTTC 451 ATTCTTTTTT CCATTTTTCT CAT 473 "chrblob_3745.glm_2|24oct01" TGTTTCA ACACTGGTGA AACTTTTTAT 501 TGATACAACA AATAAGAATA CATTAACTGA AAATTCTGGT TTAGGAATAC 551 TGCCAATATT AAATTTTTCA TTAATTGCTA AATTATTATA AACTCTACCC 601 TGAACTTTAT ATTTTAATTC TATATCACTA TCACATAATC CCCACTATTT 651 ATAAAAAAAA AAAAAACCCA TTGATTAGTT TTATTATAAT TAAATAATTA 701 AACAATTATA ATAATAA "chrblob_3745.glm_1|24oct01" 718 TTA ACTTACAGTA TCTACGAATG AAATATCAAA 751 ACCACTTAAA AATGAATTTG AAAATGGATC ATTTGAATAA TTTGAATCGA 801 TAATACTTTT AATTGATCTA TAAGTGATAC GATTAGTTGA GAAATAAGTG 851 CTACCACCAT GTTCTTCAGA GAAATTTTGT TGAATTGTAG AAGATAAATT 901 GAAAAGATTA ATTAAACCCA TAATTAAAGA AGTTTTACCT GAAGAAGCAC 951 AACCTTCCAA ACCAATGGTT AAACGTTTAT TTGGTTTTAA ATCACCTAAA 1001 TACCAACTGA TATTTGGATA CATATTACTG AAATAATTAA CACCAATATC 1051 CAAAGTAAAT TGTACATTTA TATTAAACAT TGGCTGAAAT GAACAACCTA 1101 AATTTCGTTG AAATTCATTA AAAGTTATTA ATTGTTTATA ATATGTACCT 1151 GTTGTTGAAG TTGTTGATGC AATGATTGCT GCTGCTGCTG CTGATGTTAT 1201 TGATGATGAT GATGATGATG TTGTTGTTGT TGTAGTCATT GTTGAAGTAT 1251 TTGTAATTGA TGGATGAAGA CTTAGTGTAT TAGGTATTTC AATTGATTGA 1301 GAACCATAAA ATTTATTTGT AAATATAATT TTCGTACCTT TTACAACATT 1351 ATTTTGAATA TCTTTTGGTG AAACTATAAC CATAATCTCC AAATTATCCT 1401 TAATTGGTGA TAATGTTTGA CTTGAAATTA AAAATGCTTC AATTCTAATT 1451 GGTAAATTAT AAACTTCTCT AAAATGAATT TTAAATTGAT AAAGTTTATT 1501 ATTCTCCTGA TGATTTGTTA ATGAAATATT TGAATTAGAA GAGGATGATA 1551 TCGGTATTGG TTGTGGTAAT ATATTTAAAC TATTACTATT ATTACTATTA 1601 TTATTATTAT TATTATTATT ATTATTATTA TTATTATTAT TATTATTATT 1651 ACTAATACTA TTATTATTTG TACATTTTGT ATTTTTATTA TTTAAATTTG 1701 CTGATAATAA TTCATTTGAA AAATTATTAA ATGGTTTAAT ATCTTTACTT 1751 GAAATATTTT CATTTTCTTC TTTATTTTCT TCTTTATTTT CTTCTTTATT 1801 TTCTTCATTT TCTTCATCAT CAGTATCTTC ATCATTATCA TTATCATTAT 1851 TATTATTACT ATTAATTAAT ACATTTTGAT TTATTGAATA AATTGTTTTT 1901 AAAGTTGATT TTATATTATC AATAATATCA TTTTTAAATG AGAGGGTAGT 1951 TTCTTTAAAA GGTTCATTAT TATTTTTATC TTTAATAATA TTTAAAAGTT 2001 GATAATTATC TTTAAGTATT GATAAATGTT GTTTATTTGA TTGATTATAA 2051 ATTTGATCGA TTGAGTAGTC TGTTATTTTA AAGATTGGTG GTATTGTTGG 2101 AGGTGATTGA GTGGTTGAAT GTTTGGTAAT GAGTGAATTG ATTAATTGAA 2151 CTTTATTATC TAATAAAGAT TTGGTTTTTA AATATAGTTC TTCATTATCT 2201 GTAAATAGGG TTTCTAAAGT TCTTTTAATA TCAAGCTCTA AAATTTGTAA 2251 AATTTGATGT AACTGTTTGA ATTTATCCGA TAATTGATTC ATATTACTTT 2301 GATGATTTAA TTTAATTTTT TGGAATTGTT GTTCAACAAT TTGTATTTTT 2351 TTTTTACTTT TTTCTTTAAA TCTTTGAGAT TTGTTATAAG TTTCATTTAA 2401 ATCTTTTAAT GTATTTTGTA TCATTGATTT TGAAATTAAT GAAAATGAGT 2451 GACCTTTATG TCCAATACTA CAGATACAAA CTAAACATAC AGGAATTTTA 2501 CAATCTTCAC AAAAACTACA AATTTCACTA TCACTATGTT CAAAACATTT 2551 TATATCAAAT ATTGTTGTTG GTATTATTGT TGTTGTTGTG GTTGATGATG 2601 ATGTTGTTGT AGTGGTAGTT GTCATCGTTT GTAATGGTGA TTTTTGTGAA 2651 TCATTTTCCA T 2661 "chrblob_3745.glm_1|24oct01" TATATTTTT AAAAACCAAC TTTTGTTAAT ATATATATAT 2701 AGATATTTTG TTTTGTTTTG TTTTGTTTAT TATTAAATTT TTGTTGTGTT 2751 ATATTTTTTT TTTTTTTTTT TTTTTTTTTT CCAACCCTTG TGTTGGCGGT 2801 TTGATGACAT ATTTTTTAAT TTTTTTTAAT TTTTTTTTTT TTTTTAATTT 2851 TTTTTTTTTT TAATAATTTT TTTAATAATT TTTTTTTTTA AAGTTTTTTT 2901 TTTCCTCTTT ACATTTTTAC ATTTTTAAAA ACAGGGGGGG TTTTTTAACC 2951 TTTTTTTTTT TTTTTTTTTT AAAAAAAAAA TTAAAAAATT TGATTTTGGG 3001 GATTGGGATT GACAACCCCC AAATAATTTC CCAAATTTTT TATTTTGGGT 3051 TTTTTTAAAA A // crick strand 3061 T TTTTAAAAAA 3050 ACCCAAAATA AAAAATTTGG GAAATTATTT GGGGGTTGTC AATCCCAATC 3000 CCCAAAATCA AATTTTTTAA TTTTTTTTTT AAAAAAAAAA AAAAAAAAAA 2950 GGTTAAAAAA CCCCCCCTGT TTTTAAAAAT GTAAAAATGT AAAGAGGAAA 2900 AAAAAAACTT TAAAAAAAAA AATTATTAAA AAAATTATTA AAAAAAAAAA 2850 AAATTAAAAA AAAAAAAAAA ATTAAAAAAA ATTAAAAAAT ATGTCATCAA 2800 ACCGCCAACA CAAGGGTTGG AAAAAAAAAA AAAAAAAAAA AAAAAAATAT 2750 AACACAACAA AAATTTAATA ATAAACAAAA CAAAACAAAA CAAAATATCT 2700 ATATATATAT ATTAACAAAA GTTGGTTTTT AAAAATATA start chrblob_3745.glm_1+2|24oct01 vbc exon 1 2661 ATG GAA AAT GA 2650 T TCA CAA AAA TCA CCA TTA CAA ACG ATG ACA ACT ACC ACT ACA ACA ACA T 2600 CA TCA TCA ACC ACA ACA ACA ACA ATA ATA CCA ACA ACA ATA TTT GAT ATA 2550 AAA TGT TTT GAA CAT AGT GAT AGT GAA ATT TGT AGT TTT TGT GAA GAT TG 2500 T AAA ATT CCT GTA TGT TTA GTT TGT ATC TGT AGT ATT GGA CAT AAA GGT C 2450 AC TCA TTT TCA TTA ATT TCA AAA TCA ATG ATA CAA AAT ACA TTA AAA GAT 2400 TTA AAT GAA ACT TAT AAC AAA TCT CAA AGA TTT AAA GAA AAA AGT AAA AA 2350 A AAA ATA CAA ATT GTT GAA CAA CAA TTC CAA AAA ATT AAA TTA AAT CAT C 2300 AA AGT AAT ATG AAT CAA TTA TCG GAT AAA TTC AAA CAG TTA CAT CAA ATT 2250 TTA CAA ATT TTA GAG CTT GAT ATT AAA AGA ACT TTA GAA ACC CTA TTT AC 2200 A GAT AAT GAA GAA CTA TAT TTA AAA ACC AAA TCT TTA TTA GAT AAT AAA G 2150 TT CAA TTA ATC AAT TCA CTC ATT ACC AAA CAT TCA ACC ACT CAA TCA CCT 2100 CCA ACA ATA CCA CCA ATC TTT AAA ATA ACA GAC TAC TCA ATC GAT CAA AT 2050 T TAT AAT CAA TCA AAT AAA CAA CAT TTA TCA ATA CTT AAA GAT AAT TAT C 2000 AA CTT TTA AAT ATT ATT AAA GAT AAA AAT AAT AAT GAA CCT TTT AAA GAA 1950 ACT ACC CTC TCA TTT AAA AAT GAT ATT ATT GAT AAT ATA AAA TCA ACT TT 1900 A AAA ACA ATT TAT TCA ATA AAT CAA AAT GTA TTA ATT AAT AGT AAT AAT A 1850 AT AAT GAT AAT GAT AAT GAT GAA GAT ACT GAT GAT GAA GAA AAT GAA GAA 1800 AAT AAA GAA GAA AAT AAA GAA GAA AAT AAA GAA GAA AAT GAA AAT ATT TC 1750 A AGT AAA GAT ATT AAA CCA TTT AAT AAT TTT TCA AAT GAA TTA TTA TCA G 1700 CA AAT TTA AAT AAT AAA AAT ACA AAA TGT ACA AAT AAT AAT AGT ATT AGT 1650 AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AA 1600 T AAT AGT AAT AAT AGT AAT AGT TTA AAT ATA TTA CCA CAA CCA ATA CCG A 1550 TA TCA TCC TCT TCT AAT TCA AAT ATT TCA TTA ACA AAT CAT CAG GAG AAT 1500 AAT AAA CTT TAT CAA TTT AAA ATT CAT TTT AGA GAA GTT TAT AAT TTA CC 1450 A ATT AGA ATT GAA GCA TTT TTA ATT TCA AGT CAA ACA TTA TCA CCA ATT A 1400 AG GAT AAT TTG GAG ATT ATG GTT ATA GTT TCA CCA AAA GAT ATT CAA AAT 1350 AAT GTT GTA AAA GGT ACG AAA ATT ATA TTT ACA AAT AAA TTT TAT GGT TC 1300 T CAA TCA ATT GAA ATA CCT AAT ACA CTA AGT CTT CAT CCA TCA ATT ACA A 1250 AT ACT TCA ACA ATG ACT ACA ACA ACA ACA ACA TCA TCA TCA TCA TCA TCA 1200 ATA ACA TCA GCA GCA GCA GCA GCA ATC ATT GCA TCA ACA ACT TCA ACA AC 1150 A GGT ACA TAT TAT AAA CAA TTA ATA ACT TTT AAT GAA TTT CAA CGA AAT T 1100 TA GGT TGT TCA TTT CAG CCA ATG TTT AAT ATA AAT GTA CAA TTT ACT TTG 1050 GAT ATT GGT GTT AAT TAT TTC AGT AAT ATG TAT CCA AAT ATC AGT TGG TA 1000 T TTA GGT GAT TTA AAA CCA AAT AAA CGT TTA ACC ATT GGT TTG GAA GGT T 950 GT GCT TCT TCA GGT AAA ACT TCT TTA ATT ATG GGT TTA ATT AAT CTT TTC 900 AAT TTA TCT TCT ACA ATT CAA CAA AAT TTC TCT GAA GAA CAT GGT GGT AG 850 C ACT TAT TTC TCA ACT AAT CGT ATC ACT TAT AGA TCA ATT AAA AGT ATT A 800 TC GAT TCA AAT TAT TCA AAT GAT CCA TTT TCA AAT TCA TTT TTA AGT GGT 750 TTT GAT ATT TCA TTC GTA GAT ACT intron GTAAGT TAATTATTAT TATAATTGTT 700 TAATTATTTA ATTATAATAA AACTAATCAA TGGGTTTTTT TTTTTTTTAT 650 AAATAG exon 2 TGG GGA TTA TGT GAT AGT GAT ATA GAA TTA AAA TAT AAA GTT CA 600 G GGT AGA GTT TAT AAT AAT TTA GCA ATT AAT GAA AAA TTT AAT ATT GGC A 550 GT ATT CCT AAA CCA GAA TTT TCA GTT AAT GTA TTC TTA TTT GTT GTA TCA 500 ATA AAA AGT TTC ACC AGT GTT GAA ACA ATG AGA AAA ATG GAA AAA AGA AT 450 G AAA GAA TCA ATT GCT TTG GGT ATT GTT CCC ATT TTA GCT ATC ACT TTT T 400 CT GAT CAA GTT TCA ACA TCC GAA TAT GCA GGT TTA GTC ACT TCT AAT TAT 350 GAA TTA CCT G intron GTATGTATAA TAATTATAAT TATTTCAAAT TAAAAGATAT 300 CAATATTCTA ATTATATATA TATATATATT TTAGTTCAAC CATGTAATGT 250 TTTTAAAATA ATGAATTATC ATGATTTAG exon 3 AA ATA AGA AAA GAT TTA GAA A 200 AA GAT TTA CAA TAT TTA AGA TTA ATA AAT AGA TTG GTT CAA ATA TCT AAA 150 TGG AAG TGA 142 stop chrblob_3745.glm_1|24oct01 A AAAATTAAAA AAAAAAAAAA AATTTGGATA AACCTTTTTT 100 TTGTTATTTT TTTAGTTAAA TTTATAAATA AAAGAACAAG AGGAAGTAAA 50 TTAAAATTTT TGTAGTAATA TTATAATAAT TTGGGTTTTA AATTTTTTGT end of file 3747 4 3748 12 3750 4 3751 9 3752 3 3753 3 3754 9 3757 4 3758 9 3759 3 3760 14 3761 9 3762 9 3763 9 3764 10 3765 9 3768 14 3769 9 3770 3 3772 4 3775 5 only five 3777 7 3778 14 3779 13 3782 2 3784 4 3786 9 3787 8 3790 11 pfemp1 exon 2 2031591..2032796 ? misassembly in c11 3791 9 3792 9 3793 4 3794 10 3795 9 3796 10 3797 8 3798 10 3800 4 Date: Thursday, 3/14/2002 Time: 11:36 c3801.txt chrblob_3801|2001.10.15|GENOMIC|Sanger FEATURES Location CDS 556..786 /gene="chrblob_3801.glm_1|24oct01" /note="(protein coding) 53% identity to (AK007678) putative [Mus musculus]" /codon_start=1 CDS complement(2089..2388) /gene="chrblob_3801.glm_2|24oct01" /note="(protein coding) No NR protein Similarities" /codon_start=1 ORIGIN watson strand 1 AATTACATAC ATTCGATCAT ATGATTGATA TTAGTAGAAC CATTTGTACA 51 AAATGTGAAA AAAAGAGAAA ATATTTTTGT TATGACTGTT GTTTACCATT 101 AGGTGATCCT GAAAACTCAC CAAAATTAAA ATTACCTTTA AATGTTGA TG 151 T GTA AGT AAT TAT AAT AAT AAT AAT AAA AAT AAT AAT AAT AAT AAT AAT A 201 AT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT 251 AAT AAT TAC TAA TTA TTT TTA TTT AAA GTA TTC ATC ATC CAA CCG AAT TA 301 ATTAGTAAAA GTACAGCAAT TCATTCCAAA GTTATAGCAT ATGAGGATGT 351 AAAATTTATA GAATTTCCAG AGGAAATACC AGATTATAAT TTAGATGAAA 401 CTATATTGTT ATATCCTTCA GAAGATTCAT GTTTTGTAAA GGATATTGAT 451 TTTAGTAATA TTAAGAAAGT GTTATTCGTT GAATCACAAT GGCATAATGC 501 AAGAAAGATA TTAAAACATC CAAAATTACA AGGTATAAAA TGTGTAAAGA 551 TCGAT no gene chrblob_3801.glm_1|24oct01 556 ATG CAA AAA ACA ATG TTT TGG AGA CAC CAA CGT CAT GGT GAC AGT 601 TAT CTA GCA ACC ATA GAA GCA ATC TAT TAC TTT TTC AAA GAA TTT CAT TT 651 A TCT CAA AAT AAT AAT CAA TAC AAT GGT GAA TAT GAT AAT CTC TTA TTC T 701 AT TAC ACA TTT TTT TAT AAT TTA ATT CAA ACA ACC TAT AAA CAA CAA AAT 751 AGA GAT TTT ATT AGA AAA GAT AAT TAT ATT CAA TAA* 786 AATA AAATAAACTT 801 TTTTTTTTAT ATATATAAGT TTTATTTTTT TTTTTTTTAT TTTTATTATT 851 TTTTATT "chrblob_3801.glm_2|24oct01" 863 TTA TTTTAAATTT GTTTTGATTT TGAAATTGAT AAATCAAAAC 901 GTGAATATAA AATAATGAAA ATACAAAGTG TAAAGACAGC ACCAATAACT 951 AATAATGGTT CATGGAAGAT AGAGAGTGAT GAGAGGTTAT AGGTGACTTG 1001 AATGTAACGA TAGTTTTCAG AGGCGGTATC TTTGATGTTG ATGACGACAA 1051 CTGGACGACC GATGGTGTCG AGATAAGTTT TACGATTTTC TTCAGATTGA 1101 GTGAAAGCGA ATGGAGCGTG GACTTTGATA TCGGTGGCAC CTTCTGGGAG 1151 TACGACTTTC AAGATATGAT TCTCAACGTA AACATTGTCA ATACCAACAC 1201 CAAAGGTAAC ATTGAGATGA TATTGACCGG TGAGGGTATC GACAGAGAGG 1251 AATTTCTCAA TTGGGAGATT GTAACCAGTG TAAAAGGTAT TCTTCCAACC 1301 ACCCATCAAT GGGAAACGTG GTTGAATCTT AAAGTTGATA CGATTGGCGA 1351 GATATTGGTA GGAGGAGGTG GAAATGTTGC CAATCGAGTC ACGATAGTAG 1401 AAATCGGTGG CTGAAAGTGG CACGGCTTCG TTTACCTCTG CGATTTGGTT 1451 TGGGTTTACT GATGGGTTAC GTTGGTAGTC CAAACGAGAG AATGCGCCTA 1501 CCAAATGGGC ACCCTTATTC TCCAATTGGT AATGAGTCTC CACAGCGAGG 1551 TTGCCCCAAT GTGAGACTTC ATACTCTTTC AATAGATTGG TGAGTACGAA 1601 AAATGGTGAC CCATTCTCAT AGTGAATACG CATTGGGCTT ACTGAGAATG 1651 CTTCAATTGC ACTGTATGGA CCATAGGTGA CTGTCATTCC CTTCAATGAG 1701 GTTGGTTGCT CCTCACTGTA AGATTCAACC TTACTTGATG CTAATTTAAC 1751 AGTTGTCTTT TGGGTCTCTG TCTTGTATGG GGATGTAAAG TAATGATTAT 1801 TCAAATATAA TACCAATTGA GTTTGACCTT GTTTAATCTC ACTTGGATAT 1851 GGTATCATTT GTTCAATCAT TGATGTAACT TTAACTTTTA ATTGTACAAT 1901 TTCATCTTTT TTAACTTTAT TTTTTAATTC AATATTATAA GTTTTAAATC 1951 TAAATTATTT AATATTAGTA TTAATACTGA TATATATATA TGTGTGTGTG 2001 TGTGTGTGTG TGAGTGTGGG TGGGTGTGTG ATATTTAATA TTTAAATCTT 2051 TTATTTTTTT TTTTTTTTTT AATTTTTTTT TTTTTTACTC ACCCTTCTTT 2101 AATATTGATT GAATTTGGTG ATAAATAAAC TTTTAATTCA TTATTTTGAG 2151 AATCTAATGC TTGAATTGAA ACATGATATT TAGAGTTGAA TGAAATTTGA 2201 TAGATATCAT TTTTATCGGT TAATGATTTT GCTTTGATTG AGATACTCTC 2251 TTTAGAGAGG TGAGTTGTAA CATCGATTGA ACGTTGAACA TCTTGATTTA 2301 TCCATGTTTG GCTTGTTGAA TTAACAACAT TTGAACCAAC TAAGAATATT 2351 AAAAATACAA ATAATAATAA ATTATTTAAA ACTTTCAT 2388 "chrblob_3801.glm_2|24oct01" TA TTATTATTAT 2401 TTTTTTTTTT TTTTTTTTTT TTTTTTATTT TCACAAATTG ATGGTCAAAA 2451 AAAAAAAATT AATAATGAAG TGAAAATCAA AAATTTTTTT TTTTTTTTTT 2501 AATTTTTTTT // crick strand 2510 AAAAAAAATT 2500 AAAAAAAAAA AAAAAAATTT TTGATTTTCA CTTCATTATT AATTTTTTTT 2450 TTTTGACCAT CAATTTGTGA AAATAAAAAA AAAAAAAAAA AAAAAAAAAA 2400 ATAATAATAA TA start chrblob_3801.glm_2|24oct01 vbc exon 1 2388 ATG AAA GTT TTA AAT AAT TTA TTA TTA TTT GTA TTT TT 2350 A ATA TTC TTA GTT GGT TCA AAT GTT GTT AAT TCA ACA AGC CAA ACA TGG A 2300 TA AAT CAA GAT GTT CAA CGT TCA ATC GAT GTT ACA ACT CAC CTC TCT AAA 2250 GAG AGT ATC TCA ATC AAA GCA AAA TCA TTA ACC GAT AAA AAT GAT ATC TA 2200 T CAA ATT TCA TTC AAC TCT AAA TAT CAT GTT TCA ATT CAA GCA TTA GAT T 2150 CT CAA AAT AAT GAA TTA AAA GTT TAT TTA TCA CCA AAT TCA ATC AAT ATT 2100 AAA GAA GG intron GT GAGTAAAAAA AAAAAAAATT AAAAAAAAAA AAAAAAATAA 2050 AAGATTTAAA TATTAAATAT CACACACCCA CCCACACTCA CACACACACA 2000 CACACACACA TATATATATA TCAG exon 2 T ATT AAT ACT AAT ATT AAA TAATTT A 1950 GA TTT AAA ACT TAT AAT ATT GAA TTA AAA AAT AAA GTT AAA AAA GAT GAA 1900 ATT GTA CAA TTA AAA GTT AAA GTT ACA TCA ATG ATT GAA CAA ATG ATA CC 1850 A TAT CCA AGT GAG ATT AAA CAA GGT CAA ACT CAA TTG GTA TTA TAT TTG A 1800 AT AAT CAT TAC TTT ACA TCC CCA TAC AAG ACA GAG ACC CAA AAG ACA ACT 1750 GTT AAA TTA GCA TCA AGT AAG GTT GAA TCT TAC AGT GAG GAG CAA CCA AC 1700 C TCA TTG AAG GGA ATG ACA GTC ACC TAT GGT CCA TAC AGT GCA ATT GAA G 1650 CA TTC TCA GTA AGC CCA ATG CGT ATT CAC TAT GAG AAT GGG TCA CCA TTT 1600 TTC GTA CTC ACC AAT CTA TTG AAA GAG TAT GAA GTC TCA CAT TGG GGC AA 1550 C CTC GCT GTG GAG ACT CAT TAC CAA TTG GAG AAT AAG GGT GCC CAT TTG G 1500 TA GGC GCA TTC TCT CGT TTG GAC TAC CAA CGT AAC CCA TCA GTA AAC CCA 1450 AAC CAA ATC GCA GAG GTA AAC GAA GCC GTG CCA CTT TCA GCC ACC GAT TT 1400 C TAC TAT CGT GAC TCG ATT GGC AAC ATT TCC ACC TCC TCC TAC CAA TAT C 1350 TC GCC AAT CGT ATC AAC TTT AAG ATT CAA CCA CGT TTC CCA TTG ATG GGT 1300 GGT TGG AAG AAT ACC TTT TAC ACT GGT TAC AAT CTC CCA ATT GAG AAA TT 1250 C CTC TCT GTC GAT ACC CTC ACC GGT CAA TAT CAT CTC AAT GTT ACC TTT G 1200 GT GTT GGT ATT GAC AAT GTT TAC GTT GAG AAT CAT ATC TTG AAA GTC GTA 1150 CTC CCA GAA GGT GCC ACC GAT ATC AAA GTC CAC GCT CCA TTC GCT TTC AC 1100 T CAA TCT GAA GAA AAT CGT AAA ACT TAT CTC GAC ACC ATC GGT CGT CCA G 1050 TT GTC GTC ATC AAC ATC AAA GAT ACC GCC TCT GAA AAC TAT CGT TAC ATT 1000 CAA GTC ACC TAT AAC CTC TCA TCA CTC TCT ATC TTC CAT GAA CCA TTA TT 950 A GTT ATT GGT GCT GTC TTT ACA CTT TGT ATT TTC ATT ATT TTA TAT TCA C 900 GT TTT GAT TTA TCA ATT TCA AAA TCA AAA CAA ATT TAA* 863 stop chrblob_3801.glm_2|24oct01 AA TAAAATAAAA 850 AATAATAAAA ATAAAAAAAA AAAAAATAAA ACTTATATAT ATAAAAAAAA 800 AAGTTTATTT TATT "chrblob_3801.glm_1|24oct01" 786 TTATTG AATATAATTA TCTTTTCTAA TAAAATCTCT 750 ATTTTGTTGT TTATAGGTTG TTTGAATTAA ATTATAAAAA AATGTGTAAT 700 AGAATAAGAG ATTATCATAT TCACCATTGT ATTGATTATT ATTTTGAGAT 650 AAATGAAATT CTTTGAAAAA GTAATAGATT GCTTCTATGG TTGCTAGATA 600 ACTGTCACCA TGACGTTGGT GTCTCCAAAA CATTGTTTTT TGCAT 556 "chrblob_3801.glm_1|24oct01" ATCGA 550 TCTTTACACA TTTTATACCT TGTAATTTTG GATGTTTTAA TATCTTTCTT 500 GCATTATGCC ATTGTGATTC AACGAATAAC ACTTTCTTAA TATTACTAAA 450 ATCAATATCC TTTACAAAAC ATGAATCTTC TGAAGGATAT AACAATATAG 400 TTTCATCTAA ATTATAATCT GGTATTTCCT CTGGAAATTC TATAAATTTT 350 ACATCCTCAT ATGCTATAAC TTTGGAATGA ATTGCTGTAC TTTTACTAAT 300 TAATTCGGTT GGATGATGAA TACTTTAAAT AAAAATAATT AGTAATTATT 250 ATTATTATTA TTATTATTAT TATTATTATT ATTATTATTA TTATTATTAT 200 TATTATTATT ATTATTATTA TTTTTATTAT TATTATTATA ATTACTTACA 150 CATCAACATT TAAAGGTAAT TTTAATTTTG GTGAGTTTTC AGGATCACCT 100 AATGGTAAAC AACAGTCATA ACAAAAATAT TTTCTCTTTT TTTCACATTT no orf 50 TGTACAAATG GTTCTACTAA TATCAATCAT ATGATCGAAT GTATGTAATT end of file 3803 13 3804 11 3805 4 3806 4 3808 4 Date: Friday, 3/15/2002 Time: 09:20 c3809.txt chrblob_3809|2001.10.15|GENOMIC|Sanger FEATURES Location CDS 123..1163 /gene="chrblob_3809.glm_1|24oct01" /note="(protein coding) No NR protein Similarities" /codon_start=1 CDS 1698..2597 /gene="chrblob_3809.glm_2|24oct01" /note="(protein coding) No NR protein Similarities" /codon_start=1 ORIGIN watson strand start chrblob_3809.glm_1+2|24oct01 vbc note partial gene i n t r o n continued 1 TAAATAAATT TATTAATAAT TTTTATTTTT TTTTATTTAG (exon 2) 41 [...G] GAA TAT TTA 51 ATT GAT AGT GAT TTA ATT TTA AAA TGT TTT GAA GCA GTT TCA AAT AAT CC 101 A AAA TTA GTT GAA GAT TTT TTA >ATG GTT TTA GAT GAA ATG TTT ACA TTT A 151 TG GGT GGA AAG ATA TTT AGA AGT TAT ACA TCG GCA TTT AGT TTG GTT TTA 201 AGT AGA ATT TTG ATG ATT TTT CCA TCA TTT TAC ATT TTA GCA TTA CAA GA 251 A GAG AAT CAA ATC TTT AAT CAA ATC TTT TTA TTA TTT TCA CAT ATA GCA G 301 AG AAT CAT ATT AAA ACC TTA TTA AAG AAT CCT GAA CTT TCA AAT AAC TTT 351 TTT AAA GCA TTA ATA CAA ATG GCA TTA AAA GGT GAT TTT GAA ACA TGT GA 401 A CTT TTA TCA CCT GTT ATT ACA GAG ATT GCA GCT TTA CAC GAA CTT CAT T 451 CA ACA TCA TCA ACA ACA GAA GCA ACA ACA ACT ACA ATA GCA ACA ACA ACT 501 ACA CCA ACA ACA ACA TCT GAT TGT GAT ATT AGT GGA TGG TAT CAA TAT TT 551 A GGG GAA ATG GTT GAA GTA TTT AGA TTG AAA TCA ATG TAT CCA TTG GAT A 601 AG GAT ATT TCA GAC CTC TAC GAA GAG GAT GCT GAG AAA TTC TTT GCA TTT 651 AGA GTT ATA GCA GGT GAT AGT GTA TTA GAG GTG TAC AAT ATA TTG GAG GG 701 T AAA ATA TTA CAA CAA CTA CTC AAT AGT CTT TGG TCG GAT ATT CAA TCT T 751 TC CCA ACT ACC AAA TGT TGG CAA TCT ATT GAA GCA ACC ATC TAT CTA TTA 801 AGT TGT CTA TCA GAG AGT ATA ACA GAG GAT ACA GAA TTT GTA CCA CAA CT 851 A TTC TCA ATT TTA GGT CAA TTA CCA ATT CAA TCG ACA CCA CTC ATT AAA A 901 GT ACA ATG ACT TTG GCA GGT AAC TAT TCA AAT CTA ATC GAT AAA AGT ACA 951 ATA TTC CTT GAG AAG ATT GTA AAA GAT TTC TTC CCA GCT TTT GAA AAT CC 1001 A GAT TTA AAA TCA GTT GCA AGT CAA TCT TTC CTT TCA ATC TCT AAA AAT T 1051 CA AAA TGT GCT TCA ATA CTT TCA AAT AGT ATT ACT CAA TTA ATT TCT TTA 1101 TGT GCT CCA ATT TTA TCA AAT AAT intron GTAAAA AAAAAAAAAT TATTATTTTT 1151 TTTTTTTAAT TAAAAAAAAT ACAATTTAAA CTAATTAATT ATATTAATAT 1201 ATATATAG exon 2 AAT AAA ATT TTA GAT GAC CCA TCA AAT TTT AAT ATT TTA GAA 1251 GCT TTA TTA TAC ATT ATA TCA ACA TTA CCA TCA GAT TCT CAA GTT TTA AA 1301 T TAT TCA ACT CAA TTA CTT TAT CCA TTC ATA CTT TTT ATT AAA AAT TAT T 1351 AT ACA AAT CAA CTG CAA CAA CAG CAA CAA CAA CAA CAG CAA CAA CAA ACT 1401 GAA TTA CGA TTA TTA TTA TCA TCA ATT AAT CTA TTA ACA AAA TTC TGT AA 1451 A ATA TAT GAC GAT GAG CAA GTT AAT GAA TAT GGA ACA ACG CAA CAA GAA A 1501 AT AAT AAT AAT AAT AAC AAT AAT AAT AAT AAC AAT AAT AAT AAT AAT AAC 1551 AAT AAT AAT AAT AAT AAT AAT AAT AAT ATT AAA CCA GTT TTT GAA ATT AT 1601 T AAC AAT ATA ATA CCG ATT TAT GGA GAG TTA TTA AGT TTA AAT ACG TTA G 1651 AG AGT TCA ATT ATC GAA GCG ATT AGT ATA TTT TAT AAA AAA GCG ATA ATG 1701 ATA AAT AAT AAC CAT CAA AAT ATA ACA AAT ATA CCA GAA ATT AAT AGG CA 1751 A CTT ACA TTA GCA TTT TTA AAA CAT AAA CCA TTA AGT TTA GTA TTA AGT A 1801 CA CTT TCA ATC TCA ATA GTT AAT TTA CCA AAA GAA CAA CAT TTA GAT TTT 1851 TTA GCA GAT TCA TTA TCC TCT ATC TCT TCT AAA ATG ATT CAA ATT TGG AG 1901 C GAA AAA TCA AAT CAA AAT AAT AAA AAG AAT AAT AAA AAA ATA AAT AAT A 1951 AT ATT GAT ATT GAT AAT GAT AAT GAA AAT AAT AAT AAT AAT AAT CAA ATT 2001 CAA TTT GAA AAT AAT GAA TTA AAT GAA TTT AAA AAT TTA AAA ATT TCA AT 2051 T TAT CCA GAT ATA ACA AAG GAA TAT TTT ACA ATG ATT ACA CAG TAT ATA A 2101 GG TAT AAT GCT GTA TCA ATT CCT CAA GGA GTT ATA TCA CAT TTG TTT AGT 2151 ATC ATT TTA GTA AAC ATT ACA AAG ATA CAT GAT AAA GTT ACA GCA CGT GC 2201 T TGC TTT TCA TTT ATG GCT TTG ATA ATC ACA AAA TCA AAA GAA ATG AAA A 2251 GT CAA ATC AAA TGG GAA CCA CTA TTA AAT GAA ATC AAT GGT TGG TTA AGT 2301 ATT CAT GGT GAA CTA TTT ATT AAA CAA ATA CTT TAT TCC GCT GGT GGT GG 2351 T ATA CCA AGA AGT GTT GTA CAA TTT ATT TCA GAG GTT ATA GCA TCT TTA G 2401 TA TCT TCG TAT CCT GAT GTA TTT AGA ATT AGT GCA CTC AAA TGT TTA TCA 2451 GTT GAT GGT TTC CCT TCA AGT AAT ATA ACA AAA GAA CAA AAA GAG AAA TT 2501 T TTA AAT TCT TTA ATG TTG TAT AGA TCA AAG AAA TTA CCT TTA AAA ATT G 2551 TT ACT GAT TTT TCT TTA GTT TCT TTA GGT ATT GCA ACA AAT CAA TAA* 2597 stop chrblob_3809.glm_1+2|24oct01 TAA 2601 TAATAATAAT AATAATAATA ATAATAATAA TAATAATAAT AATAAAATAC 2651 ATATAAAAAA AAAAAAAAAA AACAATATAA TAAAATAAAA AATCAATTAA 2701 ATCAAATAAA AAAAAAAAAT TAAATAAAAA AGATAAATAA ATAAAAAAAA 2751 AAATAAAAAA TATTGTAACG ATATAATACA ATATCTACCT GTTTTTATTT 2801 TATATCTCTC TTCGTCTCCC TTCAAATAAT TTTGTTCTCG AGATCCCAAC 2851 AATATCTCAA TAAATTGAAA CGATAAATTT GGTTTGAATT TTGTTTTTTT 2901 TTTTTTTAAT TGGATAGAAA AAAAAAAAAA GAAAAAAAAA AGGAATGAAT 2951 TTATCAAAAA TGATAGATTT ATCTTTATTA AAAAA // crick strand 2985 TTTTT TAATAAAGAT AAATCTATCA TTTTTGATAA 2950 ATTCATTCCT TTTTTTTTTC TTTTTTTTTT TTTCTATCCA ATTAAAAAAA 2900 AAAAAAACAA AATTCAAACC AAATTTATCG TTTCAATTTA TTGAGATATT 2850 GTTGGGATCT CGAGAACAAA ATTATTTGAA GGGAGACGAA GAGAGATATA 2800 AAATAAAAAC AGGTAGATAT TGTATTATAT CGTTACAATA TTTTTTATTT 2750 TTTTTTTTAT TTATTTATCT TTTTTATTTA ATTTTTTTTT TTTATTTGAT 2700 TTAATTGATT TTTTATTTTA TTATATTGTT TTTTTTTTTT TTTTTTATAT 2650 GTATTTTATT ATTATTATTA TTATTATTAT TATTATTATT ATTATTATTA 2600 TTA "chrblob_3809.glm_2|24oct01" 2597 TTATTGA TTTGTTGCAA TACCTAAAGA AACTAAAGAA AAATCAGTAA 2550 CAATTTTTAA AGGTAATTTC TTTGATCTAT ACAACATTAA AGAATTTAAA 2500 AATTTCTCTT TTTGTTCTTT TGTTATATTA CTTGAAGGGA AACCATCAAC 2450 TGATAAACAT TTGAGTGCAC TAATTCTAAA TACATCAGGA TACGAAGATA 2400 CTAAAGATGC TATAACCTCT GAAATAAATT GTACAACACT TCTTGGTATA 2350 CCACCACCAG CGGAATAAAG TATTTGTTTA ATAAATAGTT CACCATGAAT 2300 ACTTAACCAA CCATTGATTT CATTTAATAG TGGTTCCCAT TTGATTTGAC 2250 TTTTCATTTC TTTTGATTTT GTGATTATCA AAGCCATAAA TGAAAAGCAA 2200 GCACGTGCTG TAACTTTATC ATGTATCTTT GTAATGTTTA CTAAAATGAT 2150 ACTAAACAAA TGTGATATAA CTCCTTGAGG AATTGATACA GCATTATACC 2100 TTATATACTG TGTAATCATT GTAAAATATT CCTTTGTTAT ATCTGGATAA 2050 ATTGAAATTT TTAAATTTTT AAATTCATTT AATTCATTAT TTTCAAATTG 2000 AATTTGATTA TTATTATTAT TATTTTCATT ATCATTATCA ATATCAATAT 1950 TATTATTTAT TTTTTTATTA TTCTTTTTAT TATTTTGATT TGATTTTTCG 1900 CTCCAAATTT GAATCATTTT AGAAGAGATA GAGGATAATG AATCTGCTAA 1850 AAAATCTAAA TGTTGTTCTT TTGGTAAATT AACTATTGAG ATTGAAAGTG 1800 TACTTAATAC TAAACTTAAT GGTTTATGTT TTAAAAATGC TAATGTAAGT 1750 TGCCTATTAA TTTCTGGTAT ATTTGTTATA TTTTGATGGT TATTATTTAT 1700 CAT 1698 "chrblob_3809.glm_2|24oct01" TATCGCT TTTTTATAAA ATATACTAAT CGCTTCGATA ATTGAACTCT 1650 CTAACGTATT TAAACTTAAT AACTCTCCAT AAATCGGTAT TATATTGTTA 1600 ATAATTTCAA AAACTGGTTT AATATTATTA TTATTATTAT TATTATTATT 1550 GTTATTATTA TTATTATTGT TATTATTATT ATTGTTATTA TTATTATTAT 1500 TTTCTTGTTG CGTTGTTCCA TATTCATTAA CTTGCTCATC GTCATATATT 1450 TTACAGAATT TTGTTAATAG ATTAATTGAT GATAATAATA ATCGTAATTC 1400 AGTTTGTTGT TGCTGTTGTT GTTGTTGCTG TTGTTGCAGT TGATTTGTAT 1350 AATAATTTTT AATAAAAAGT ATGAATGGAT AAAGTAATTG AGTTGAATAA 1300 TTTAAAACTT GAGAATCTGA TGGTAATGTT GATATAATGT ATAATAAAGC 1250 TTCTAAAATA TTAAAATTTG ATGGGTCATC TAAAATTTTA TTCTATATAT 1200 ATATTAATAT AATTAATTAG TTTAAATTGT ATTTTTT "chrblob_3809.glm_1|24oct01" 1163 TTA ATTAAAAAAA 1150 AAAAATAATA ATTTTTTTTT TTTTACATTA TTTGATAAAA TTGGAGCACA 1100 TAAAGAAATT AATTGAGTAA TACTATTTGA AAGTATTGAA GCACATTTTG 1050 AATTTTTAGA GATTGAAAGG AAAGATTGAC TTGCAACTGA TTTTAAATCT 1000 GGATTTTCAA AAGCTGGGAA GAAATCTTTT ACAATCTTCT CAAGGAATAT 950 TGTACTTTTA TCGATTAGAT TTGAATAGTT ACCTGCCAAA GTCATTGTAC 900 TTTTAATGAG TGGTGTCGAT TGAATTGGTA ATTGACCTAA AATTGAGAAT 850 AGTTGTGGTA CAAATTCTGT ATCCTCTGTT ATACTCTCTG ATAGACAACT 800 TAATAGATAG ATGGTTGCTT CAATAGATTG CCAACATTTG GTAGTTGGGA 750 AAGATTGAAT ATCCGACCAA AGACTATTGA GTAGTTGTTG TAATATTTTA 700 CCCTCCAATA TATTGTACAC CTCTAATACA CTATCACCTG CTATAACTCT 650 AAATGCAAAG AATTTCTCAG CATCCTCTTC GTAGAGGTCT GAAATATCCT 600 TATCCAATGG ATACATTGAT TTCAATCTAA ATACTTCAAC CATTTCCCCT 550 AAATATTGAT ACCATCCACT AATATCACAA TCAGATGTTG TTGTTGGTGT 500 AGTTGTTGTT GCTATTGTAG TTGTTGTTGC TTCTGTTGTT GATGATGTTG 450 AATGAAGTTC GTGTAAAGCT GCAATCTCTG TAATAACAGG TGATAAAAGT 400 TCACATGTTT CAAAATCACC TTTTAATGCC ATTTGTATTA ATGCTTTAAA 350 AAAGTTATTT GAAAGTTCAG GATTCTTTAA TAAGGTTTTA ATATGATTCT 300 CTGCTATATG TGAAAATAAT AAAAAGATTT GATTAAAGAT TTGATTCTCT 250 TCTTGTAATG CTAAAATGTA AAATGATGGA AAAATCATCA AAATTCTACT 200 TAAAACCAAA CTAAATGCCG ATGTATAACT TCTAAATATC TTTCCACCCA 150 TAAATGTAAA CATTTCATCT AAAACCAT 123 "chrblob_3809.glm_1|24oct01" TA AAAAATCTTC AACTAATTTT 100 GGATTATTTG AAACTGCTTC AAAACATTTT AAAATTAAAT CACTATCAAT 50 TAAATATTCC CTAAATAAAA AAAAATAAAA ATTATTAATA AATTTATTTA end of file 3810 9 3811 9 + 13 chimera see c678data.txt 3812 5 3813 14 occurs in many chromosomes but not this exact form Date: Friday, 3/15/2002 Time: 09:21 c3814.txt chrblob_3814|2001.10.15|GENOMIC|Sanger FEATURES Location CDS complement(join(2700..2845,3060..3195)) /gene="chrblob_3814.glm_1|24oct01" /note="(protein coding) 54% identity to (AL031747) hypothetical protein/exon, MAL1P4. [Plasmodium falciparum]" /codon_start=1 ORIGIN watson strand 1 TTCGAGCTTG AAATCCTCTT CTGCTGCTTT AATTGTTGCT GTTTCAGTGG 51 CTTTAACAAA CTTTGCGGCT GCATTAGCAG GTCCTTCGGC CTCTGACACC 101 ATAGTTTCTA CAGTTCTTTT TATAACATCT TTATGTGAAA TATAGTGTCC 151 TGTTTTTGAT ACAACTGAAG TTTGTTGCCA CACCGACTGG TACATAATAA 201 TATCACGGCT AGGATCACCG ACAGGGGTGA ACCCCTCCTT TAAGTAACCA 251 AATTCACATT TCTCAAAATG TTGTTCATAA ACAGCTTGAG CAATGCTTGC 301 GACTTTTTTA TAAGATGTTG TATCAAAATA CGATTCCAAA TTCTTACCAC 351 CTACAGTTGA TATACCCATT TTTTTTAATC CTGAAATAAC TAATACCTTA 401 CCTGTAGCCT CACCTGCCTT AACACCTGCA GCCGAAATAT TAGCAGTACC 451 CTCAGTTATA GCTTTCGCAA TAGCGGCATC AAGTGCCGCA GGTTTCCATA 501 TATTTATAGC AACCGCACCA AATAATCCAA TACTTCCTGC AACACTTCCT 551 AGCCCACATC CACACCTAAG ACAACCTTTT TCTATTTTTT CTGCTAAGTT 601 TTTCTCCATT TTATCTTTAT GAATAATTTT TTGTATATCT TTGTCACGTT 651 GTTCTTTATA TTTTTGTCGT TGTGTTATCA TACGTTCTTC GTATTCTTCA 701 AAACGTCGTG ATGTTTGTCG TTCGAAAATT TCCTTCACTG AATTGATTTC 751 CTCATCACTA TCATAAATTG ACGATTCTGT GTCACATTCG CTTAACAATC 801 GTGACGTAGT AGTTCGTGTA TGATGTGGTG TGATGGATGG TTTATTTTTA 851 TTATGTGCCT ATAAAGAAGG TAATTTATAA TTCTATATAT ATTTGTTATA 901 ATTATGTATA TGGTATATTT ACCATACATT ATAAAATACT ATATATATAT 951 ATTTATAAAT ATTTGATTCG TACATAATAT GATGTTAACA ATATATTTAA 1001 TGCAAGAGCG AACAATAATA TATTAGAGTA GAGCAGTTTC ATATTTATTG 1051 TGATACTTAT ATAATTTTAT GATTAAAATT ATAACTAAAA AAATTCATAT 1101 ATAAAATACT TATTTTGTTT TATTAAAAGA ATAACAGGTG TTTAATATAA 1151 AATATTATTA TTGCTCTAGA GTATAATACA CAATTGTTTT CTCATTATGA 1201 AAATAATATT TTTTTTTATA ACCATATTTT TCCCTTTTAT TTAAAACAAA 1251 AAAAAAATTA AAAAATACTA AATAGGGGGG GAAAATAATT AATTAAAATT 1301 TTTAGAAAAT AATATAATGA AAGCTTTTAC ATTTTTTATA ATTTCGAATT 1351 CTAATTTCTA ATAAAATATA ATTTTATATC ATAAGATAAA TTGTAATATT 1401 AATTTTTTTT TTTTTTTTTG TACTTAAAAA TTTATATAAC CAGTAAAACT 1451 ATTCTTTTAA ACAACTTGTT TTTTGTTCTA AATAACATAA AGGTGTGTAG 1501 AGAATTAATG GCTAAAGGTG CACAATATAT ATATTACAAC GAATTCGAGC 1551 ATGTATGTAT AAAATAGATA TTCCAAGATA TAACTTTGTA TCATTGCAAT 1601 TATATAAAAC AATTTTACAA TAAACATTTT TTATGATAAT AAAACAAAAA 1651 AAAAAAATTT TAAACTAATA GTAGTTTTAT TTTTTTTTTT GTTCTAAAAA 1701 TTCTTGTATG TTATACCTTT CTCTCTACTT TATCTACGTA GTTGCAAATA 1751 TTAATATTAT TATTTTTATA AAAAAAATTG AATTTATTTA AAAAAATTAT 1801 TAATTATTAA TCTATTAAAT TATATAATTA TCACAAAAAA AATTTTAATA 1851 TTTATAATAA TTATAAAAAA AATTCAAAAA CAAAATTAAA AAAAAAAAAA 1901 AAATAAATAA CGAAATGAGA AATTATATAT ACTATTACAC AATATATTGT 1951 ATTGCTTATA TATAGCGTTT TATCTTATAC AAATATATTA TATTTATTTT 2001 TATTATATAT ATATATATTT CTTAAAATAG TAATAGCATT TCTCAACTTA 2051 TACATTAATT GCATTATTAC ATATTGTAAC AAAATTAATA ATTACTATAT 2101 ATTTTAATAA TTATTTTGTA ATAAATTGTA TTATTATATA TATATTAAAA 2151 CAATAACACA ACATTATATA TACTATGAAA AAACAAGGAA TCAGATATAT 2201 TTATTTTATA CTAAATTAGA AACATTAAAA AAAAATGAGG TTATTTCCTA 2251 TAATGAGGAT GATAGTACGT ATTAGTACAA AAAAATAAAT AAATAAAAAC 2301 AAAAAAAAAC AAAACAATAA TTAGAAAAAA ATGAAGAAGC ATGAACGAAA 2351 AAAGAACAAA GTAAATATAA AAAATAAAAT TATTATTATA ATATTATGAA 2401 TCTGGTGATA CCATATATTA TTTATATTTT AGAAAAAAAA ACTTTTAACG 2451 ATATGTTAAA CGAATAACCT ATAGATGCAT GGATACTATT TAAAATGTGT 2501 TTTGAAATTG TTGATGGATA CTCACAAATA ATTATATATT ATAATATAAT 2551 AAATATATAT TATATTTCTT TTATTGTATA TGCTAAATAA AGAATTTAAT 2601 AAAGATAGGT TATATTAATA TTTCATCTAA TATAGTAAAA TTATACACAC 2651 ATGAATTTTC CCATAAAACA ACATAATTTA CATTCATGTA AATTCGGTT "chrblob_3814.glm_1|24oct01" 2700 T 2701 CAAATCTCTA ATCTTTTGGG ATTTTTCATC CTTTCTGTAA ATCTTGCCCT 2751 TTGTTCATTA TATAATTCAT TTTTTAATAT ATCATAATAT TTTATAGATG 2801 AATAGATATA ATTTTTTATT TCATCAATGG ATGCTCCATC TTTAACTAAA 2851 TTATAAAAAT TAAGAGTATC TTCCCTATCT GTAGATGATA GTGCAACACC 2901 AATATCATGC ATTGAATTAT AGCATGTATG GTATTTAGTA TTTACACATA 2951 TAGGATTAAC GGTATCTCAA ACATGATAAC ATTGATATTC ATATTTTTTT 3001 AAATAATCTT CTATATAAAG CCACAAATAT TTTATCTTCA AAACCTTCTT 3051 TAGTTATACC CAAAACATGA TTCCATATGT CATAAAAATC TTCATTAGAT 3101 GGACGTTCTT CTAAATTATC TAATACAGTA TGTAATTCTT CTAGCGTGAA 3151 TTGTTTTGAT AAATCATTAT AATTTATATT ATTACATTTT TTCAT 3195 "chrblob_3814.glm_1|24oct01" AGTAC 3201 TAACACCATT ATATTTTAAA TGATCTTTAC TATTATAACC TTCTGAACTG 3251 AAAGCTATAT TATTTTTTAA TTCAACCTTT CCATTGTTAC CCCTT // crick strand start chrblob_3814.glm_1|24oct01 vbc note partial gene note frameshifts near 2968 and 2998 (exon 1) 3295 [...A] AGG GGT AAC AAT GGA AAG GTT GAA TTA AAA AAT AAT ATA GCT TT 3250 C AGT TCA GAA GGT TAT AAT AGT AAA GAT CAT TTA AAA TAT AAT GGT GTT A 3200 GT ACT ATG AAA AAA TGT AAT AAT ATA AAT TAT AAT GAT TTA TCA AAA CAA 3150 TTC ACG CTA GAA GAA TTA CAT ACT GTA TTA GAT AAT TTA GAA GAA CGT CC 3100 A TCT AAT GAA GAT TTT TAT GAC ATA TGG AAT CAT GTT TTG GGT ATA ACT A 3050 AA GAA GGT TTT GAA GAT AAA ATA TTT GTG GCT TTA TAT AGA AGA TTA TTT 3000 [AAAAA] AAT ATG AAT ATC AAT GTT ATC ATG TTT [GA] GAT ACC GTT AAT CCT A 2950 TA TGT GTA AAT ACT AAA TAC CAT ACA TGC TAT AAT TCA ATG CAT GAT ATT 2900 GGT GTT GCA CTA TCA TCT ACA GAT AGG GAA GAT ACT CTT AAT TTT TAT AA 2850 T TTA GTT AAA GAT GGA GCA TCC ATT GAT GAA ATA AAA AAT TAT ATC TAT T 2800 CA TCT ATA AAA TAT TAT GAT ATA TTA AAA AAT GAA TTA TAT AAT GAA CAA 2750 AGG GCA AGA TTT ACA GAA AGG ATG AAA AAT CCC AAA AGA TTA GAG ATT TG 2700 A* stop chrblob_3814.glm_1|24oct01 AACCGAATT TACATGAATG TAAATTATGT TGTTTTATGG GAAAATTCAT 2650 GTGTGTATAA TTTTACTATA TTAGATGAAA TATTAATATA ACCTATCTTT 2600 ATTAAATTCT TTATTTAGCA TATACAATAA AAGAAATATA ATATATATTT 2550 ATTATATTAT AATATATAAT TATTTGTGAG TATCCATCAA CAATTTCAAA 2500 ACACATTTTA AATAGTATCC ATGCATCTAT AGGTTATTCG TTTAACATAT 2450 CGTTAAAAGT TTTTTTTTCT AAAATATAAA TAATATATGG TATCACCAGA 2400 TTCATAATAT TATAATAATA ATTTTATTTT TTATATTTAC TTTGTTCTTT 2350 TTTCGTTCAT GCTTCTTCAT TTTTTTCTAA TTATTGTTTT GTTTTTTTTT 2300 GTTTTTATTT ATTTATTTTT TTGTACTAAT ACGTACTATC ATCCTCATTA 2250 TAGGAAATAA CCTCATTTTT TTTTAATGTT TCTAATTTAG TATAAAATAA 2200 ATATATCTGA TTCCTTGTTT TTTCATAGTA TATATAATGT TGTGTTATTG 2150 TTTTAATATA TATATAATAA TACAATTTAT TACAAAATAA TTATTAAAAT 2100 ATATAGTAAT TATTAATTTT GTTACAATAT GTAATAATGC AATTAATGTA 2050 TAAGTTGAGA AATGCTATTA CTATTTTAAG AAATATATAT ATATATAATA 2000 AAAATAAATA TAATATATTT GTATAAGATA AAACGCTATA TATAAGCAAT 1950 ACAATATATT GTGTAATAGT ATATATAATT TCTCATTTCG TTATTTATTT 1900 TTTTTTTTTT TTTAATTTTG TTTTTGAATT TTTTTTATAA TTATTATAAA 1850 TATTAAAATT TTTTTTGTGA TAATTATATA ATTTAATAGA TTAATAATTA 1800 ATAATTTTTT TAAATAAATT CAATTTTTTT TATAAAAATA ATAATATTAA 1750 TATTTGCAAC TACGTAGATA AAGTAGAGAG AAAGGTATAA CATACAAGAA 1700 TTTTTAGAAC AAAAAAAAAA ATAAAACTAC TATTAGTTTA AAATTTTTTT 1650 TTTTTGTTTT ATTATCATAA AAAATGTTTA TTGTAAAATT GTTTTATATA 1600 ATTGCAATGA TACAAAGTTA TATCTTGGAA TATCTATTTT ATACATACAT 1550 GCTCGAATTC GTTGTAATAT ATATATTGTG CACCTTTAGC CATTAATTCT 1500 CTACACACCT TTATGTTATT TAGAACAAAA AACAAGTTGT TTAAAAGAAT 1450 AGTTTTACTG GTTATATAAA TTTTTAAGTA CAAAAAAAAA AAAAAAAATT 1400 AATATTACAA TTTATCTTAT GATATAAAAT TATATTTTAT TAGAAATTAG 1350 AATTCGAAAT TATAAAAAAT GTAAAAGCTT TCATTATATT ATTTTCTAAA 1300 AATTTTAATT AATTATTTTC CCCCCCTATT TAGTATTTTT TAATTTTTTT 1250 TTTGTTTTAA ATAAAAGGGA AAAATATGGT TATAAAAAAA AATATTATTT 1200 TCATAATGAG AAAACAATTG TGTATTATAC TCTAGAGCAA TAATAATATT 1150 TTATATTAAA CACCTGTTAT TCTTTTAATA AAACAAAATA AGTATTTTAT 1100 ATATGAATTT TTTTAGTTAT AATTTTAATC ATAAAATTAT ATAAGTATCA 1050 CAATAAAT start chrblob_3814.glm_1.1|24oct01 vbc stevor note partial gene exon 1 1042 ATG AAA CTG CTC TAC TCT AAT ATA TTA TTG TTC GCT CTT GCA 1000 TTA AAT ATA TTG TTA ACA TCA TAT TAT 974 intron GTA CGAATCAAAT ATTTATAAAT 950 ATATATATAT AGTATTTTAT AATGTATGGT AAATATACCA TATACATAAT 900 TATAACAAAT ATATATAGAA TTATAAATTA CCTTCTTTAT AG exon 2 858 GCA CAT AA 850 T AAA AAT AAA CCA TCC ATC ACA CCA CAT CAT ACA CGA ACT ACT ACG TCA C 800 GA TTG TTA AGC GAA TGT GAC ACA GAA TCG TCA ATT TAT GAT AGT GAT GAG 750 GAA ATC AAT TCA GTG AAG GAA ATT TTC GAA CGA CAA ACA TCA CGA CGT TT 700 T GAA GAA TAC GAA GAA CGT ATG ATA ACA CAA CGA CAA AAA TAT AAA GAA C 650 AA CGT GAC AAA GAT ATA CAA AAA ATT ATT CAT AAA GAT AAA ATG GAG AAA 600 AAC TTA GCA GAA AAA ATA GAA AAA GGT TGT CTT AGG TGT GGA TGT GGG CT 550 A GGA AGT GTT GCA GGA AGT ATT GGA TTA TTT GGT GCG GTT GCT ATA AAT A 500 TA TGG AAA CCT GCG GCA CTT GAT GCC GCT ATT GCG AAA GCT ATA ACT GAG 450 GGT ACT GCT AAT ATT TCG GCT GCA GGT GTT AAG GCA GGT GAG GCT ACA GG 400 T AAG GTA TTA GTT ATT TCA GGA TTA AAA AAA ATG GGT ATA TCA ACT GTA G 350 GT GGT AAG AAT TTG GAA TCG TAT TTT GAT ACA ACA TCT TAT AAA AAA GTC 300 GCA AGC ATT GCT CAA GCT GTT TAT GAA CAA CAT TTT GAG AAA TGT GAA TT 250 T GGT TAC TTA AAG GAG GGG TTC ACC CCT GTC GGT GAT CCT AGC CGT GAT A 200 TT ATT ATG TAC CAG TCG GTG TGG CAA CAA ACT TCA GTT GTA TCA AAA ACA 150 GGA CAC TAT ATT TCA CAT AAA GAT GTT ATA AAA AGA ACT GTA GAA ACT AT 100 G GTG TCA GAG GCC GAA GGA CCT GCT AAT GCA GCC GCA AAG TTT GTT AAA G 50 CC ACT GAA ACA GCA ACA ATT AAA GCA GCA GAA GAG GAT TTC AAG CTC GAA ... stop chrblob_3814.glm_1.1|24oct01 vbc stevor end of file 3815 10 3816 9 3817 9 3818 10 3819 2 stevor 3821 9 3822 10 3823 9 Date: Friday, 3/15/2002 Time: 09:21 c3824.txt chrblob_3824|2001.10.15|GENOMIC|Sanger FEATURES Location CDS complement(1207..2268) /gene="chrblob_3824.glm_1|24oct01" /note="(protein coding) No NR protein Similarities" /codon_start=1 ORIGIN watson strand 1 TATAATGTTT GATCTGGAAT ATATTTGGTT TGTATAAATC TAAAATATTA 51 TAAATTAAAA ATCCAATTTT TATAAATGAA TATGAATTAT TCAAATCATA 101 GTTGAATATT TTACTTGAAG AATCCATTCC ATTGAGACCA TAATCAACAA 151 GTGATGAATA ATAAAATTTC TTTAGATAAT AGAGAATATT TGGGAAATCA 201 ATATCAACAC TATTATGAGT ATTTTTTGTT TGATAATCAA ATAAGCACTG 251 TAATAAATAA AAAAATGATA AAACTTTAAT TTTTTTAACA TTTTCATCGC 301 CATAAACCCA TGCACCTATA TCAAAGAATG ATTGAACTAA ACCTGAACCA 351 TTTTTACCTA CAAAACTAAA ATAATAATGT ATATCACAAT CATTTGAAAT 401 AATTATATTA TATTGATCTT TTTTTATTTT ATTTTTAAAA AAAATTAAAA 451 AAAAATTGTG TATTTTAATA CATAAATAGT TGTAATGAAT ATATATATTT 501 ATTTATTTTG TTTTTTAACT TACATTCCGT GAAGCTTAAT TTTTTACTTG 551 TTAAATCAGT TCCATTTAGT TTATATCTAT TATTTTGAAT ATTTTGATAA 601 TATGAGAGAT GTTGATTTAA TAAATTTCTA AATGTTTTAT CTTTATCTAA 651 TATATTTTTA TTTTCACATG ATTTTCTTGT AGTTTGATAA GAATTAATTA 701 AGGATGATGG TAATTCGAAT ATTGTATACA CTAATCCAAA AGATTCGTTG 751 ACATCAACAA AAGTTGAAAT GAATTTGAAA TGTTGATTAA AATCATCGAT 801 TGCTTTATTT GAAAATGGTT CCAATATTTC AAAAAGACCG GGTATATGTT 851 CAAATTTATC AATTGCATAA TATTTTCCTT TAAACTCTGA AATATAAATA 901 TCTGCATCTG AATTTGAATG ACCATTTCTA AAACCTCTTA TCTTTTCAAT 951 TTTCTTTGTT GTATCTATCT TTGAAACTAA TAATTTATCT GATACAATAC 1001 CCTCTAAAGC AATTTCATTT TTAATTATTT CATTAAACTC TTTGAAATAA 1051 ATCTCTAAAC CTAAATTTGA ATATGATTTT AAAATTCTTT TCTCTTCTTT 1101 TAAAATAATT GATATTAATT TAATTAAAAT GCTTTTATAT TGTAAATTGT 1151 TTGGAGCTAA TATCTGATAA AATAAAAATT ACATTAATAA TACAATTTTA 1201 AAATAA "chrblob_3824.glm_1|24oct01" 1207 TTAT AAATAATAAT AAATAATAAT AATAATAATA AATACATTCA 1251 ATGTTTGAAT AAGATTTGAT ATTAAAGTAT CCTTTATTTC ACCACCAAAA 1301 AACAAATTTA AATAGTTTGG GTTTAAAGGT ACTTTTACAC CATAGATATG 1351 AGCCCTATGG TTGAAAGGGA AAGAAATCTT TAGTTCATAA GAAGAGAGTG 1401 GTTCTTTAAT TGGTGAAATT TGTGATGGTG GTGGTAGTGA CGGTGATTTC 1451 ACAAAATAAA TATGTTCCAT GAGTTTATCA AATAGTGTAC CGGTTAAAAA 1501 ATCATTTTCA TCGTTTGAGA TTTTAAAAGC TACCAATAAA GATAAGAAGA 1551 CAGCTTTTAA TTGAACATCT GGAGTGATTT CGTCTTCTCT TTCTAAGAAT 1601 ATCTTTTTCC AAGATAAATT GACTGGTTTA TAAATTAAAT GTGCATTTTC 1651 AATGAATAAA CCTTCGGTAT TAGTAATATT AGAGTGAGCC TTTATTTCAA 1701 AACCTTTTAC CCTATCACAT TTAGTCTTGA TAATTATATC AGGATGTAAT 1751 AGTGATCTAA TAGATCCATT AATACCACCA TCTCTAATGT AATTTATATG 1801 ATTTATTAAT ACATTCTCAA AATCTTTGGA GAGATCCTGT AATGGTGGTT 1851 GAATTAATTC AACAATGGAT AAAACATTTG GAATTGATTG TTGATTTTCT 1901 TCCTTTTGAT ATTCTTCCTT TTCTTTCTCC TCTTCTTCAA CTATATATTC 1951 ATTATAAGCG AAACCCCTAT ATACACTAAT ACAATTGTAA AATTTACTTT 2001 GAATGTCAAT TTTAAAATTG ATTTTTTCAC CTTCTTTGAG TATATTGAAT 2051 TTTTTATCTT TAAAATACTT TATGATTGAT CTTGTGTTTG GATGAGTATA 2101 ACTTGACAAT GATATAGTAT ATCTTGATTG ATCATACTGT CTACAAACAA 2151 ATTCAATTAA TTGATCTATT GATGGCCTTA TTTTGAAATT CTCTAATGTA 2201 CATAATTGAA ATAATGATTC AAAAATTGAA TTCATTGGTG AATGAACTAA 2251 AGTGATAAGT GATAACAT 2268 "chrblob_3824.glm_1|24oct01" TG TTTTACCTAG ACTATAAATA TCAACTTTAC 2301 ATGTATATCC ACCTAAATCA ATTTCCTATA AATTAAAAAT AAATGTTTTC 2351 AGTTTAATAT TGTTAATATA TGAGTTTTTA TAAAAAAAAA AAAGAAATCT 2401 TACAGGCGCC ATATATTGAT TTGTACCAAT AAGTGTATTT TTTTGATCAG 2451 TTATAACCAT TGAGGAACTT CCCATATCTC CTAAATAAAA TTCTAGATCT 2501 GGTCCATTTT TAACGAAAAA TATATTCTCT TTATTTTTAT TATTAAGGAG 2551 TTAGGGGTTT ATACTTTAAT TTTTTTTTTT TTTTTTTTTT TTTTTTTTTT 2601 TTTTTTTTTT TTTTTTTTTT TTTTTTTTTT TTTTTTTTTT AAAAATTCAA 2651 TTTTTTCCCC CCCGGGTTAA ATTTTTTTAA AAAAAAAGAA ATTTTAAAAT 2701 TTTTTAAAAA // crick strand 2710 TTTTTAAAAA 2700 ATTTTAAAAT TTCTTTTTTT TTAAAAAAAT TTAACCCGGG GGGGAAAAAA 2650 TTGAATTTTT AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA 2600 AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA ATTAAAGTAT AAACCCCTAA 2550 CTCCTTAATA ATAAAAATAA AGAGAATATA TTTTTCGTTA AAAATGGACC 2500 AGATCTAGAA TTTTATTTAG GAGATATGGG AAGTTCCTCA ATGGTTATAA 2450 CTGATCAAAA AAATACACTT ATTGGTACAA ATCAATATAT GGCGCCTGTA 2400 AGATTTCTTT TTTTTTTTTA TAAAAACTCA TATATTAACA ATATTAAACT 2350 GAAAACATTT ATTTTTAATT TATAGGAAAT TGATTTAGGT GGATATACAT 2300 GTAAAGTTGA TATTTATAGT CTAGGTAAAA CA start chrblob_3824.glm_1|24oct01 glm exon 1 2268 ATG TTA TCA CTT ATC ACT 2250 TTA GTT CAT TCA CCA ATG AAT TCA ATT TTT GAA TCA TTA TTT CAA TTA TG 2200 T ACA TTA GAG AAT TTC AAA ATA AGG CCA TCA ATA GAT CAA TTA ATT GAA T 2150 TT GTT TGT AGA CAG TAT GAT CAA TCA AGA TAT ACT ATA TCA TTG TCA AGT 2100 TAT ACT CAT CCA AAC ACA AGA TCA ATC ATA AAG TAT TTT AAA GAT AAA AA 2050 A TTC AAT ATA CTC AAA GAA GGT GAA AAA ATC AAT TTT AAA ATT GAC ATT C 2000 AA AGT AAA TTT TAC AAT TGT ATT AGT GTA TAT AGG GGT TTC GCT TAT AAT 1950 GAA TAT ATA GTT GAA GAA GAG GAG AAA GAA AAG GAA GAA TAT CAA AAG GA 1900 A GAA AAT CAA CAA TCA ATT CCA AAT GTT TTA TCC ATT GTT GAA TTA ATT C 1850 AA CCA CCA TTA CAG GAT CTC TCC AAA GAT TTT GAG AAT GTA TTA ATA AAT 1800 CAT ATA AAT TAC ATT AGA GAT GGT GGT ATT AAT GGA TCT ATT AGA TCA CT 1750 A TTA CAT CCT GAT ATA ATT ATC AAG ACT AAA TGT GAT AGG GTA AAA GGT T 1700 TT GAA ATA AAG GCT CAC TCT AAT ATT ACT AAT ACC GAA GGT TTA TTC ATT 1650 GAA AAT GCA CAT TTA ATT TAT AAA CCA GTC AAT TTA TCT TGG AAA AAG AT 1600 A TTC TTA GAA AGA GAA GAC GAA ATC ACT CCA GAT GTT CAA TTA AAA GCT G 1550 TC TTC TTA TCT TTA TTG GTA GCT TTT AAA ATC TCA AAC GAT GAA AAT GAT 1500 TTT TTA ACC GGT ACA CTA TTT GAT AAA CTC ATG GAA CAT ATT TAT TTT GT 1450 G AAA TCA CCG TCA CTA CCA CCA CCA TCA CAA ATT TCA CCA ATT AAA GAA C 1400 CA CTC TCT TCT TAT GAA CTA AAG ATT TCT TTC CCT TTC AAC CAT AGG GCT 1350 CAT ATC TAT GGT GTA AAA GTA CCT TTA AAC CCA AAC TAT TTA AAT TTG TT 1300 T TTT GGT GGT GAA ATA AAG GAT ACT TTA ATA TCA AAT CTT ATT CAA ACA T 1250 TG AAT intron GTATT TATTATTATT ATTATTATTT ATTATTATTT ATAATTATTT 1200 TAAAATTGTA TTATTAATGT AATTTTTATT TTATCAG exon 2 ATA TTA GCT CCA A 1150 AC AAT TTA CAA TAT AAA AGC ATT TTA ATT AAA TTA ATA TCA ATT ATT TTA 1100 AAA GAA GAG AAA AGA ATT TTA AAA TCA TAT TCA AAT TTA GGT TTA GAG AT 1050 T TAT TTC AAA GAG TTT AAT GAA ATA ATT AAA AAT GAA ATT GCT TTA GAG G 1000 GT ATT GTA TCA GAT AAA TTA TTA GTT TCA AAG ATA GAT ACA ACA AAG AAA 950 ATT GAA AAG ATA AGA GGT TTT AGA AAT GGT CAT TCA AAT TCA GAT GCA GA 900 T ATT TAT ATT TCA GAG TTT AAA GGA AAA TAT TAT GCA ATT GAT AAA TTT G 850 AA CAT ATA CCC GGT CTT TTT GAA ATA TTG GAA CCA TTT TCA AAT AAA GCA 800 ATC GAT GAT TTT AAT CAA CAT TTC AAA TTC ATT TCA ACT TTT GTT GAT GT 750 C AAC GAA TCT TTT GGA TTA GTG TAT ACA ATA TTC GAA TTA CCA TCA TCC T 700 TA ATT AAT TCT TAT CAA ACT ACA AGA AAA TCA TGT GAA AAT AAA AAT ATA 650 TTA GAT AAA GAT AAA ACA TTT AGA AAT TTA TTA AAT CAA CAT CTC TCA TA 600 T TAT CAA AAT ATT CAA AAT AAT AGA TAT AAA CTA AAT GGA ACT GAT TTA A 550 CA AGT AAA AAA TTA AGC TTC ACG GAA TGT AAG TTA AAA AAC AAA ATA AAT 500 AAA TAT ATA TAT TCA TTA CAA CTA TTT ATG TAT TAA 465 stop chrblob_3824.glm_1|24oct01 AATA CACAATTTTT 450 TTTTAATTTT TTTTAAAAAT AAAATAAAAA AAGATCAATA TAATATAATT 400 ATTTCAAATG ATTGTGATAT ACATTATTAT TTTAGTTTTG TAGGTAAAAA 350 TGGTTCAGGT TTAGTTCAAT CATTCTTTGA TATAGGTGCA TGGGTTTATG 300 GCGATGAAAA TGTTAAAAAA ATTAAAGTTT TATCATTTTT TTATTTATTA 250 CAGTGCTTAT TTGATTATCA AACAAAAAAT ACTCATAATA GTGTTGATAT 200 TGATTTCCCA AATATTCTCT ATTATCTAAA GAAATTTTAT TATTCATCAC 150 TTGTTGATTA TGGTCTCAAT GGAATGGATT CTTCAAGTAA AATATTCAAC 100 TATGATTTGA ATAATTCATA TTCATTTATA AAAATTGGAT TTTTAATTTA 50 TAATATTTTA GATTTATACA AACCAAATAT ATTCCAGATC AAACATTATA end of file 3826 4 rifin 3827 4 Date: Friday, 3/15/2002 Time: 09:21 c3828.txt chrblob_3828|2001.10.15|GENOMIC|Sanger FEATURES Location CDS join(1481..1549,1651..2493) /gene="chrblob_3828.glm_1|24oct01" /note="(protein coding) 86% identity to rifin PFB1020w - malaria parasite (Plasmodium falciparum)" /codon_start=1 ORIGIN watson strand 1 TACAAATATG AAACTCTTTA ATAATAAATT AGTAAAAAAA GTATGTTATA 51 TATATATAAT TTTTTTAATA TACTAATCAC AAAAATGTTT TAAGCACGAT 101 ATATGTATAT ATCAACTCAT AATATAATAA GTATGAAGTA ACCTAATCTT 151 ATAATAAGCA TTATTATAAA ATAATAACAA TATGTTATAT ATAATAATTA 201 TAATTGTATT AGAATAATCA TATTTATATG ATATCCTTTT TATTTTAATA 251 TTCTAATACA TATAATTAAT ATGACAGTAA ATAGAAAACA ATATATAAAT 301 ATTATTAACT TGAAAAATAT TAAAAATAAA TATATAAATA ATTTAATTCT 351 TCTATTTATA TATTATTATA AAGAATTTAT CATTATTACT GTTTCATTTA 401 TATAATAGTA ATAGTAATAA TTAGTACAAG ATTATTTCTA AAAAGTGCAT 451 ATTTAAAAAT CTCCTATTAT AATGTAATCA TACTATTAAT TTCTTATTCA 501 CATTAAAAAT ATTATATGAT ATTTCGCATT ACATAAATAC TATATATGTA 551 CGTAATTTTT AAAACATAAA AAAAAATAAA TATATTATAA TTATAGTATT 601 TATATTTATA TACAGTCATA TAAAATACAG TATGTCACTA TGTGGTATCT 651 TTTGAAAATC TTTTAAGTTG TATTCTTGTA ATAATAATAT ATTTCTAATT 701 TATTCAAAAA TTATATTTCA CAATTACCAC ATATATAATT CATTTAAATA 751 TCCTATTATA TACATATTTA TAAATTACTA TATAATAATT AAGTAATATA 801 AAACAATAGA TACAATAGAG AGGATTTTCT ATCATAGAAT AATGCTTAGA 851 AACTAAAATG AAATAAACTA AAAAGAAAAA AATATAAATA ATAAAATAGA 901 TATAAAATTA TTTATTTTGT TAGTTTTAAG ATTAATATTA TATTTTATTA 951 ATTACAAGAA AATTTGTTGT TAGTTTCACC ATAGTAATTA TATTAGAATA 1001 TATTTTAGGA TATTTATTGG ATAAAAATCA TGAGAGCTAT TATTATATAT 1051 ATATTGTTTA CACCCATAAC AACTATTGTT ATACACATTT ATATGTGTAT 1101 TTTAAGGAAA ATATATTGTT ATTTATTAAA AATTTATAAT ATATATATAT 1151 ATCAGAAAAT TATTTTAATA AAAATTAAAA AAAAAAATAA ATAAAATAAA 1201 AATAACATAA TATAAAATAA AATATAAAAA AAAATTTATT TATTTTGTAT 1251 CATATTTAAA TTTTTTTTTT TTAATATTAA ATGAATATAG TCATAAATTA 1301 AATTATAAGT ATGATGAAAC TATAAGGTTA TTATATCATA AAATTACAAC 1351 AAAATTTCCG CTTATCAATA TATTATATAA AATATATATT AGAAAACAAA 1401 ATAGATAATT TTTTATGAAA TAGATTAATA CAATTTGACA TATAACATAT 1451 TATTTTTATT TTTTTTTTTT TGTATTAAAA start chrblob_3828.glm_1|24oct01 glm stevor exon 1 1481 ATG AAC ACA TAT TAT GTT AA 1501 A TTA TTA TTA TTT ACC TTT TTA ATA AAT ACA TTA GTA TTA CAA CAT TAT intron G 1551 TATGTAAAAA ATATACATTA TTATTACTAT GACATAAACA TATAATAAAA 1601 GAATTATTAC ATTTTCAGTA CATATTCATT AATTCTTTTT TTTTTTTTAG exon 2 1651 GAG AAT TAT CTA AAT AAC CAT TAT AAT ATA AGG CAT ATA CAA AAT AAC AC 1701 A CAA AGA ACA ACT ATA AAA TCA AGA TTA TTA GCA CAA ACG AAA AAC CAT A 1751 AT CCG CAT TAT CAT AAT GAT CCA GAA CTA AAA GAA ATA ATT GAT AAA ATG 1801 AAC GAG GAA GCA ATA AAA AAA TAC CAA AAA ACT CAT GAT CCA TAT AAA CA 1851 A TTG AAA GAA GTA GTA GAA AAA AAT GGA ACA AAA TAT ACA GGT GGT AAT G 1901 AT GCA GAA CCT ATG TCA ACG ATA GAA AAG GAA TTA TTG GAA ACG TAT GAA 1951 GAA ATT TTT GGT AAC GAA AGG AAT ATG TTG AAG TCA GGC ATG AGT CCA AA 2001 T GTT GAT GAC AAA TCA TCA ACA TGT GAA TGT ACT GAT ATT AAT AAT AGA G 2051 AT TTA ACA AAA ACG AAG GGC AAA GAT AAG TAT TTA AAA CAC TTA AAA GGG 2101 AGA TGT ACC CGT GGT ATA GGT GTA TGC TCA GTA GGT AGT GTA TTC TTA AC 2151 A TTT ATA GGT TTG ATA ACT GCA AAA AAT GCT GCT GTT GCT GCC ATT GCT A 2201 GC ATT GGA AAC GCG TAT AAG GTT TGC GTA TCC TCT ATT TCT GCA TTA AAT 2251 ATA TTT ACT CAT GAA TCT GTG ACT TTA TCT ATG CCA TCA GTT ACT GCA GC 2301 A GGT GGT GTA ACT TGT TAT TCT GAT TTA GCC GGA ACT ATT TCA AGT GCT G 2351 CT ATG GGT GTA TTT GAA CCT TGT GGT ATT GCA GCT TTG GTG CTA CTT ATA 2401 TTA GCT GTT GTG CTT ATA ATA TTA TAC ATA TGG TTA TAT AGA AGA AGG AA 2451 A AAT TCA TAC AAA CAT GAA TGC AAG AAA CAT TTA AGT AAG TAA* 2493 stop chrblob_3828.glm_1|24oct01 TGCTATT 2501 TTTGGAATAT AGATGATGTT ACTTAAGTGC ATATAAATTA TATTTTATAA 2551 TAATTGTTTT TTTTTTTTCG CATATATTAT TATTTAAATA ATATTTTCTG 2601 ATTTAAAAAA TATATTTATA GAAATTGATT CATACAAAAC ATAAAATCGT 2651 GCGAGACAAA TATTATATAT AATATATATT CATGGATTGA ATAATTTAAA 2701 CAAATATATA TAATTCTGAT GTTAATTTTA ATTACTATAA CTTATAATTC 2751 TTTTTATTCT TTTGAATTTT ATATTATAAT ATTTATTTTG AAAACCTTTA 2801 TTCAATTTTT ATATTAAATA AATATTATAC AATTAAATTA TAAAGAAAAA 2851 TTTTCCTATT AATAATATTA TTAGTGTTAA TTACCACGTA TTTATGCATC 2901 ATAGAAATGT TCTAAATATA TTGTTTTATA TCTAAATCAA ATAAAATAGT 2951 AACGTTTTTT AAAGAAAAAT ATGATTTTTA TTTTTTTAAA ATATTATATC 3001 CTATAAAATT CCATTTTATT TTATTTATAT TTTACCTTAA ACAAAAATAT 3051 AGACAAACGT TTCAAAATAA AAAGGAAATA AAATTCAATA TTCTATGTAA 3101 AAATATATAT TCTACGAAAA TATATGGTAA CATATTTCCA CATACCAATG 3151 AAAAAATGAA ATAAACAATT TTTTTGATTT GACAA // crick strand 3185 TTGTC AAATCAAAAA AATTGTTTAT TTCATTTTTT 3150 CATTGGTATG TGGAAATATG TTACCATATA TTTTCGTAGA ATATATATTT 3100 TTACATAGAA TATTGAATTT TATTTCCTTT TTATTTTGAA ACGTTTGTCT 3050 ATATTTTTGT TTAAGGTAAA ATATAAATAA AATAAAATGG AATTTTATAG 3000 GATATAATAT TTTAAAAAAA TAAAAATCAT ATTTTTCTTT AAAAAACGTT 2950 ACTATTTTAT TTGATTTAGA TATAAAACAA TATATTTAGA ACATTTCTAT 2900 GATGCATAAA TACGTGGTAA TTAACACTAA TAATATTATT AATAGGAAAA 2850 TTTTTCTTTA TAATTTAATT GTATAATATT TATTTAATAT AAAAATTGAA 2800 TAAAGGTTTT CAAAATAAAT ATTATAATAT AAAATTCAAA AGAATAAAAA 2750 GAATTATAAG TTATAGTAAT TAAAATTAAC ATCAGAATTA TATATATTTG 2700 TTTAAATTAT TCAATCCATG AATATATATT ATATATAATA TTTGTCTCGC 2650 ACGATTTTAT GTTTTGTATG AATCAATTTC TATAAATATA TTTTTTAAAT 2600 CAGAAAATAT TATTTAAATA ATAATATATG CGAAAAAAAA AAAACAATTA 2550 TTATAAAATA TAATTTATAT GCACTTAAGT AACATCATCT ATATTCCAAA 2500 AATAGCA "chrblob_3828.glm_1|24oct01" 2493 TTA CTTACTTAAA TGTTTCTTGC ATTCATGTTT GTATGAATTT 2450 TTCCTTCTTC TATATAACCA TATGTATAAT ATTATAAGCA CAACAGCTAA 2400 TATAAGTAGC ACCAAAGCTG CAATACCACA AGGTTCAAAT ACACCCATAG 2350 CAGCACTTGA AATAGTTCCG GCTAAATCAG AATAACAAGT TACACCACCT 2300 GCTGCAGTAA CTGATGGCAT AGATAAAGTC ACAGATTCAT GAGTAAATAT 2250 ATTTAATGCA GAAATAGAGG ATACGCAAAC CTTATACGCG TTTCCAATGC 2200 TAGCAATGGC AGCAACAGCA GCATTTTTTG CAGTTATCAA ACCTATAAAT 2150 GTTAAGAATA CACTACCTAC TGAGCATACA CCTATACCAC GGGTACATCT 2100 CCCTTTTAAG TGTTTTAAAT ACTTATCTTT GCCCTTCGTT TTTGTTAAAT 2050 CTCTATTATT AATATCAGTA CATTCACATG TTGATGATTT GTCATCAACA 2000 TTTGGACTCA TGCCTGACTT CAACATATTC CTTTCGTTAC CAAAAATTTC 1950 TTCATACGTT TCCAATAATT CCTTTTCTAT CGTTGACATA GGTTCTGCAT 1900 CATTACCACC TGTATATTTT GTTCCATTTT TTTCTACTAC TTCTTTCAAT 1850 TGTTTATATG GATCATGAGT TTTTTGGTAT TTTTTTATTG CTTCCTCGTT 1800 CATTTTATCA ATTATTTCTT TTAGTTCTGG ATCATTATGA TAATGCGGAT 1750 TATGGTTTTT CGTTTGTGCT AATAATCTTG ATTTTATAGT TGTTCTTTGT 1700 GTGTTATTTT GTATATGCCT TATATTATAA TGGTTATTTA GATAATTCTC 1650 CTAAAAAAAA AAAAAGAATT AATGAATATG TACTGAAAAT GTAATAATTC 1600 TTTTATTATA TGTTTATGTC ATAGTAATAA TAATGTATAT TTTTTACATA 1550 CATAATGTTG TAATACTAAT GTATTTATTA AAAAGGTAAA TAATAATAAT 1500 TTAACATAAT ATGTGTTCAT 1481 "chrblob_3828.glm_1|24oct01" TTTTAATACA AAAAAAAAAA AATAAAAATA 1450 ATATGTTATA TGTCAAATTG TATTAATCTA TTTCATAAAA AATTATCTAT 1400 TTTGTTTTCT AATATATATT TTATATAATA TATTGATAAG CGGAAATTTT 1350 GTTGTAATTT TATGATATAA TAACCTTATA GTTTCATCAT ACTTATAATT 1300 TAATTTATGA CTATATTCAT TTAATATTAA AAAAAAAAAA TTTAAATATG 1250 ATACAAAATA AATAAATTTT TTTTTATATT TTATTTTATA TTATGTTATT 1200 TTTATTTTAT TTATTTTTTT TTTTAATTTT TATTAAAATA ATTTTCTGAT 1150 ATATATATAT ATTATAAATT TTTAATAAAT AACAATATAT TTTCCTTAAA 1100 ATACACATAT AAATGTGTAT AACAATAGTT GTTATGGGTG TAAACAATAT 1050 ATATATAATA ATAGCTCTCA TGATTTTTAT CCAATAAATA TCCTAAAATA 1000 TATTCTAATA TAATTACTAT GGTGAAACTA ACAACAAATT TTCTTGTAAT 950 TAATAAAATA TAATATTAAT CTTAAAACTA ACAAAATAAA TAATTTTATA 900 TCTATTTTAT TATTTATATT TTTTTCTTTT TAGTTTATTT CATTTTAGTT 850 TCTAAGCATT ATTCTATGAT AGAAAATCCT CTCTATTGTA TCTATTGTTT 800 TATATTACTT AATTATTATA TAGTAATTTA TAAATATGTA TATAATAGGA 750 TATTTAAATG AATTATATAT GTGGTAATTG TGAAATATAA TTTTTGAATA 700 AATTAGAAAT ATATTATTAT TACAAGAATA CAACTTAAAA GATTTTCAAA 650 AGATACCACA TAGTGACATA CTGTATTTTA TATGACTGTA TATAAATATA 600 AATACTATAA TTATAATATA TTTATTTTTT TTTATGTTTT AAAAATTACG 550 TACATATATA GTATTTATGT AATGCGAAAT ATCATATAAT ATTTTTAATG 500 TGAATAAGAA ATTAATAGTA TGATTACATT ATAATAGGAG ATTTTTAAAT 450 ATGCACTTTT TAGAAATAAT CTTGTACTAA TTATTACTAT TACTATTATA 400 TAAATGAAAC AGTAATAATG ATAAATTCTT TATAATAATA TATAAATAGA 350 AGAATTAAAT TATTTATATA TTTATTTTTA ATATTTTTCA AGTTAATAAT 300 ATTTATATAT TGTTTTCTAT TTACTGTCAT ATTAATTATA TGTATTAGAA 250 TATTAAAATA AAAAGGATAT CATATAAATA TGATTATTCT AATACAATTA 200 TAATTATTAT ATATAACATA TTGTTATTAT TTTATAATAA TGCTTATTAT 150 AAGATTAGGT TACTTCATAC TTATTATATT ATGAGTTGAT ATATACATAT 100 ATCGTGCTTA AAACATTTTT GTGATTAGTA TATTAAAAAA ATTATATATA 50 TATAACATAC TTTTTTTACT AATTTATTAT TAAAGAGTTT CATATTTGTA end of file 3829 5 3830 8 3831 4 3832 4 3833 4 3834 2 3835 9 3836 4 3837 2 telomere 3838 12 pfemp1 var 3840 3 3841 10 3842 4 3843 7 3844 4 3945 9 3846 9 3847 3 3848 9 3849 9 3850 3 3851 4 3852 9 3854 4 3855 9 3856 3 3857 14 3858 4 rifin 3859 10 3860 3 3861 10 3864 4 3865 9 3866 9 3867 9 3869 12:46788c 13:2673361w 3871 11, 13_2 centromere 3872 12:2180046, 14 3873 1 3874 4 3875 9 3876 9 3877 4 3878 no match no gene 3879 4 3880 9 3881 9 3882 4 3883 9 no gene 3884 1 telomere 3885 3 + 10 chimera 3886 11 3887 7 3889 9 3890 4 3891 11 Date: Monday, 3/18/2002 Time: 09:21 c3892.txt chrblob_3892|2001.10.15|GENOMIC|Sanger FEATURES Location CDS 52..1146 /gene="chrblob_3892.glm_1|24oct01" /note="(protein coding) 33% identity to (AL080318) stress-induced protein sti1-like protein [Arabidopsis thaliana]" /codon_start=1 CDS 1247..1636 /gene="chrblob_3892.glm_2|24oct01" /note="(protein coding) 43% identity to unknown protein [Arabidopsis thaliana]" /codon_start=1 CDS 1839..2204 /gene="chrblob_3892.glm_3|24oct01" /note="(protein coding) No NR protein Similarities" /codon_start=1 ORIGIN watson strand 1 AATCATTTAA TTTTTTTTAA AAAACGAACG AAAAAAAAAA AAAAAAAAAA 51 A start chrblob_3892.glm_1+2|24oct01 vbc exon 1 52 ATG ACA CCA AGT TTA AAA GAT TTA GGT AAT CAA TTT TAT ACA AAA GGT G 101 AT TAT GAT AAA GCT ATT GAA TTA TAT AAA CAA GGT ATT CAA GAG ATA TTA 151 GAT GAT AAT AAT ATA GTA AAT GAA GAT AGT AAT AAT CAA TTA TCA TTA AT 201 A ACA AGT AAT TTA TCA ATT TCA TAT TAT CAA TTA AAA AGA TAT CAA GAA T 251 CA TTA GAA TGG GCA TTA AAA TCA ATA GAA TAT AAT CCA AAA TCA GCA AAA 301 CCA TAT TTA AGA GCT GGT GAT GCA TAT ATT GAA TTA TCA AAT TAT AAA GA 351 T GCA AAA GAG AAA TAT TTA TTA TGT ATT AAA AAT ATA AAT ACA AAT GAT G 401 AA ACC GCT AAA AAT TTA TTA AAT CAA GCT TCA AAC TCT TTA CAA AAT GCA 451 AAG ATG AAA CAA TTT TAT CAA CCA ATT CTA GAA GGT TCA CCA GCA TTA TA 501 T GAT CGT GTT GAA ATT AAA TAT TTA GAT TCC ATT AGA GAG AAA GCA TTA T 551 TT GCA AAA GTA CCA ATT CAA AAA GGT GAA ATC ATT TTC TCT GAT TTA CCA 601 TTC ATT CAT CAA TTA AGT GTT GAT AGT TTT AAA TTA CAT CAT AAT GAT AT 651 T TGT AAT CAT TGT ATT AAA TTC ATT GAT TCA TCA GCA GCA ATA ATA AAA T 701 GT AAT AAT ACA AAT GGT TGT AAA TAT CAA TAT TGT AGT GAA AAA TGT AAA 751 TTA GAA TCA TTT AGT TAT CAT AAT CAA TCA TGT ATG AAT AAT TCA GAT TT 801 G GTT TTA TCC TCA AAT CAT CCA ATT TCA AAA TAT AGA GCA ATG GTT GAA A 851 AT GTA CCA ACT TCA ACT CAA TTA CTT TTG GTT GAA TCT TTA ATT TCA ATG 901 ATT AGT CAT TTA TTA AAA ACA AAA CAA GCA AAA AAT TGT AAT TTA GCA CT 951 T GGT ACT ATC ACT CAT TTA AAA AGA GGT CCA TTA ATG GCT CAA CAA TCT T 1001 CT TTT AAT GGA AAG AAT CTT GAA GAT TTA CAA AAA CAA TAT CAA CCT TTA 1051 CTT TCA CTT TTA GAA GAT GCC TAT GGT TTA AAA TTA AAA GAA CAT TTA GA 1101 T GAT CAA TTA TTA AAA AAT GAA TTT AAA AAA T intron GTAAGATC ATTTAAAAAA 1151 ATAATATAAA TTATTAATTA ATTAATAATA ATAATAATAG ATACTAATTT 1201 TAAAATTATA GTATTTAGTG TTGATTTTTA TGATAATTTA TTAG exon 2 GT ATG A 1251 TT AAT TTT AAT TCA ACA TCA ACA GTT GTT AAA TCT GGA AAA AAA ATT GAA 1301 ATT CAA GTA CCA GTT ACA ACA ACA GGT AAG GGA AAG AAA TCT AAT AAT CA 1351 A GTA AAA ACT ACA ACT AAA ACA ATT GAA AAT TCT TGT TGG GGT GTT GGT T 1401 TA TTC CCA ATT TTC TCA TGT ATG AAT CAT TCT TGT TTT CCA AAT GTT GAA 1451 ATT TCA AAT GAA ATA ATT GAT GGT GTT ACT TCT GTT AGA ATG GTT GTA AA 1501 A GCT AAA AAG AAT ATA CCT GCT GGT TCT GAA ATA CTT CAT TCC TAT TGT G 1551 AT GAA ACT TTA TCA AAT AAA GAG AGA AAA GAT ATT TTA TTC TCT CAA TAT 1601 GGT TTT AAA TGT ACA TGT AAT AAA TGT TCA AAA TAA* 1636 stop chrblob_3892.glm_1+2|24oct01 AAAA AATTTAAAAT 1651 AAAAGTAAAA AAACGATATT AAAGTGTTTG TGGTTTTCGA TTTTTTATTT 1701 TTATTTTTAT TTTTATTTTT TATTTTTTAT TTTTTTTTTT CATTCGTTTT 1751 TTAAAAATTT TTTATTTTTT TTCATTTTTT TTTTTTTTTT TTTTTTTTTC 1801 ATTTGGTAAT TTTCTTTTAG AAATAAATAA AATAAATA start chrblob_3892.glm_3|24oct01 vbc exon 1 1839 ATG GAA CAA ATA 1851 AAA GAT GAA AAA ATT GTT GAA AAT GTA AAA TCA AAA GAT AAT AAT GTA GA 1901 A TTA ACA ACA GAA TCA AAA GAA AAT GTT AAA GAA GAA ACA AAA ACA ACA A 1951 AT GAA ACT TCC ACA GAA ACA CCA TCA GAT CAA ATT TAT GTA CCA AAT AGT 2001 ACT TTA CAT AGT ATG GTT ATA TTT GGA TTA CCA AAA TAT TTA GAC TCA AA 2051 A AAA TTT ACT AAA TTT TTA GAA CAA AAT AAT GTT CCA TTT AAA AAA ATT A 2101 AA AAA ATT GTT AAA GAG TCT TTT GGT ATT GTT AGT TTT GAT intron GTATGTTTC 2151 ATTTTTTTTA TTATATTATT TTTTTTTTTT TTTAATTTTT TTTTTCTTTA 2201 TTAATATAAA AGTAATAATA ATAATAATAA TAATAATAAT AATAATAATA 2251 ATAATAATAA TAATAATAAT AATAATAATA ATAATAATAA TAATAATAAT 2301 AATAATAATA ATAATAATAA TAATAATAAT AATAATAATA ATATAATTAA 2351 TTTTAAATAA ATTGTTATTA TTATTATTAG exon 2 TCA GTT GAA GAT AGA GAT AA 2401 A TAT TTA GAA TAT TTC CAA GGA TTT CAA TTT AAT GAT AAA ACT AAA TTA A 2451 AA ACA GAA GCA AAA GAA GAG AAA TCT GAT AGA ATG AAA AGA AAA TAT GAA 2501 GAG AAA GAA TTA GAT AAA AAA GAG GAT AAT AGA GAA TCA AAA TTA TTG AC 2551 T ATT GAG GAG ATA GTT TGT CCA TGG TAT AAT ATA CCA TAT GAA GAG CAA T 2601 TG AAA AAG AAA AAG AAT CAA ATT GAA AAA GTT ATG ATT AAT ATA AAA TCA 2651 ACA ACT AGA AAG GAG AGT TTA CAT AAT TTA CCA GAA TGG TTG GTA AAG AG 2701 A GAT AAA ACC AAA GAG GAG AAG ATG TGT TGT GGA TTG GAG GAG ATT GTA C 2751 CA TCA CCA GTC ACT GAA AAC TAT CGT AAC AAA GCA CAA TAC ACC ATT GGA 2801 TAT GAT GCA GAC AAT AAA CCA TGT GTT GGT TTT GCA TTG GGT CGT ACT GG 2851 T AAT GGT ATC ACA ATC GTT GCA GAT CCA TCC AAT GCG CCA TTG ATC TCA A 2901 AA CGT TCC AAT GAA ATT CGT CGT TTA TTC AAT GAG TAC ATT ACA GAG CCA 2951 AAT TTA GGT TCA AAT CGT AAA CCA TTC GAT AAG AAT TCT CAT AGT GGA TT 3001 T TGG CGT CAA TTA ACA GTT AGA GAT TTC ACC ACT GGT GAA ACT ATG GCC A 3051 CC GTT CAA TTC AAT CAT AAA GGT TTA ACA GCT GAA GAA CTT GAA ACT GAG 3101 AAA AAT AAC CTC AAA AAC TAT TTC GCA TCA TTA CCA GAG GAG CAA CGT AT 3151 C ACA AGT TTA TCA ATT CAA TTG TAT GAT GGT ATT TCA AAT TCT GCT TCA G 3201 TC GAT TTA GCC GTT GAA ACC ATT GAT GGT CCT GAA TTT ATT CAT GAG AAT 3251 TTA [T...] (stop) chrblob_3892.glm_3|24oct01 // crick strand 3254 ATAA 3250 ATTCTCATGA ATAAATTCAG GACCATCAAT GGTTTCAACG GCTAAATCGA 3200 CTGAAGCAGA ATTTGAAATA CCATCATACA ATTGAATTGA TAAACTTGTG 3150 ATACGTTGCT CCTCTGGTAA TGATGCGAAA TAGTTTTTGA GGTTATTTTT 3100 CTCAGTTTCA AGTTCTTCAG CTGTTAAACC TTTATGATTG AATTGAACGG 3050 TGGCCATAGT TTCACCAGTG GTGAAATCTC TAACTGTTAA TTGACGCCAA 3000 AATCCACTAT GAGAATTCTT ATCGAATGGT TTACGATTTG AACCTAAATT 2950 TGGCTCTGTA ATGTACTCAT TGAATAAACG ACGAATTTCA TTGGAACGTT 2900 TTGAGATCAA TGGCGCATTG GATGGATCTG CAACGATTGT GATACCATTA 2850 CCAGTACGAC CCAATGCAAA ACCAACACAT GGTTTATTGT CTGCATCATA 2800 TCCAATGGTG TATTGTGCTT TGTTACGATA GTTTTCAGTG ACTGGTGATG 2750 GTACAATCTC CTCCAATCCA CAACACATCT TCTCCTCTTT GGTTTTATCT 2700 CTCTTTACCA ACCATTCTGG TAAATTATGT AAACTCTCCT TTCTAGTTGT 2650 TGATTTTATA TTAATCATAA CTTTTTCAAT TTGATTCTTT TTCTTTTTCA 2600 ATTGCTCTTC ATATGGTATA TTATACCATG GACAAACTAT CTCCTCAATA 2550 GTCAATAATT TTGATTCTCT ATTATCCTCT TTTTTATCTA ATTCTTTCTC 2500 TTCATATTTT CTTTTCATTC TATCAGATTT CTCTTCTTTT GCTTCTGTTT 2450 TTAATTTAGT TTTATCATTA AATTGAAATC CTTGGAAATA TTCTAAATAT 2400 TTATCTCTAT CTTCAACTGA CTAATAATAA TAATAACAAT TTATTTAAAA 2350 TTAATTATAT TATTATTATT ATTATTATTA TTATTATTAT TATTATTATT 2300 ATTATTATTA TTATTATTAT TATTATTATT ATTATTATTA TTATTATTAT 2250 TATTATTATT ATTATTATTA TTATTATTAT TATTATTACT TTTATA "chrblob_3892.glm_3|24oct01" 2204 TTAA 2200 TAAAGAAAAA AAAAATTAAA AAAAAAAAAA AATAATATAA TAAAAAAAAT 2150 GAAACATACA TCAAAACTAA CAATACCAAA AGACTCTTTA ACAATTTTTT 2100 TAATTTTTTT AAATGGAACA TTATTTTGTT CTAAAAATTT AGTAAATTTT 2050 TTTGAGTCTA AATATTTTGG TAATCCAAAT ATAACCATAC TATGTAAAGT 2000 ACTATTTGGT ACATAAATTT GATCTGATGG TGTTTCTGTG GAAGTTTCAT 1950 TTGTTGTTTT TGTTTCTTCT TTAACATTTT CTTTTGATTC TGTTGTTAAT 1900 TCTACATTAT TATCTTTTGA TTTTACATTT TCAACAATTT TTTCATCTTT 1850 TATTTGTTCC AT 1839 "chrblob_3892.glm_3|24oct01" TATTTATT TTATTTATTT CTAAAAGAAA ATTACCAAAT 1800 GAAAAAAAAA AAAAAAAAAA AAAAAATGAA AAAAAATAAA AAATTTTTAA 1750 AAAACGAATG AAAAAAAAAA ATAAAAAATA AAAAATAAAA ATAAAAATAA 1700 AAATAAAAAA TCGAAAACCA CAAACACTTT AATATCGTTT TTTTACTTTT 1650 ATTTTAAATT TTTT "chrblob_3892.glm_2|24oct01" 1636 TTATTT TGAACATTTA TTACATGTAC ATTTAAAACC 1600 ATATTGAGAG AATAAAATAT CTTTTCTCTC TTTATTTGAT AAAGTTTCAT 1550 CACAATAGGA ATGAAGTATT TCAGAACCAG CAGGTATATT CTTTTTAGCT 1500 TTTACAACCA TTCTAACAGA AGTAACACCA TCAATTATTT CATTTGAAAT 1450 TTCAACATTT GGAAAACAAG AATGATTCAT ACATGAGAAA ATTGGGAATA 1400 AACCAACACC CCAACAAGAA TTTTCAATTG TTTTAGTTGT AGTTTTTACT 1350 TGATTATTAG ATTTCTTTCC CTTACCTGTT GTTGTAACTG GTACTTGAAT 1300 TTCAATTTTT TTTCCAGATT TAACAACTGT TGATGTTGAA TTAAAATTAA 1250 TCAT 1247 "chrblob_3892.glm_2|24oct01" ACCTAA TAAATTATCA TAAAAATCAA CACTAAATAC TATAATTTTA 1200 AAATTAGTAT CTATTATTAT TATTATTAAT TAATTAATAA TTTATATTAT 1150 TTTT "chrblob_3892.glm_1|24oct01" 1146 TTAAAT GATCTTACAT TTTTTAAATT CATTTTTTAA TAATTGATCA 1100 TCTAAATGTT CTTTTAATTT TAAACCATAG GCATCTTCTA AAAGTGAAAG 1050 TAAAGGTTGA TATTGTTTTT GTAAATCTTC AAGATTCTTT CCATTAAAAG 1000 AAGATTGTTG AGCCATTAAT GGACCTCTTT TTAAATGAGT GATAGTACCA 950 AGTGCTAAAT TACAATTTTT TGCTTGTTTT GTTTTTAATA AATGACTAAT 900 CATTGAAATT AAAGATTCAA CCAAAAGTAA TTGAGTTGAA GTTGGTACAT 850 TTTCAACCAT TGCTCTATAT TTTGAAATTG GATGATTTGA GGATAAAACC 800 AAATCTGAAT TATTCATACA TGATTGATTA TGATAACTAA ATGATTCTAA 750 TTTACATTTT TCACTACAAT ATTGATATTT ACAACCATTT GTATTATTAC 700 ATTTTATTAT TGCTGCTGAT GAATCAATGA ATTTAATACA ATGATTACAA 650 ATATCATTAT GATGTAATTT AAAACTATCA ACACTTAATT GATGAATGAA 600 TGGTAAATCA GAGAAAATGA TTTCACCTTT TTGAATTGGT ACTTTTGCAA 550 ATAATGCTTT CTCTCTAATG GAATCTAAAT ATTTAATTTC AACACGATCA 500 TATAATGCTG GTGAACCTTC TAGAATTGGT TGATAAAATT GTTTCATCTT 450 TGCATTTTGT AAAGAGTTTG AAGCTTGATT TAATAAATTT TTAGCGGTTT 400 CATCATTTGT ATTTATATTT TTAATACATA ATAAATATTT CTCTTTTGCA 350 TCTTTATAAT TTGATAATTC AATATATGCA TCACCAGCTC TTAAATATGG 300 TTTTGCTGAT TTTGGATTAT ATTCTATTGA TTTTAATGCC CATTCTAATG 250 ATTCTTGATA TCTTTTTAAT TGATAATATG AAATTGATAA ATTACTTGTT 200 ATTAATGATA ATTGATTATT ACTATCTTCA TTTACTATAT TATTATCATC 150 TAATATCTCT TGAATACCTT GTTTATATAA TTCAATAGCT TTATCATAAT 100 CACCTTTTGT ATAAAATTGA TTACCTAAAT CTTTTAAACT TGGTGTCAT 52 "chrblob_3892.glm_1|24oct01" T 50 TTTTTTTTTT TTTTTTTTTT CGTTCGTTTT TTAAAAAAAA TTAAATGATT end of file 3893 9 3896 9 3897 10 3898 6+4+12 rifin 3899 9 3900 4 3901 4 Date: Tuesday, 3/19/2002 Time: 10:52 c3902.txt chrblob_3902|2001.10.15|GENOMIC|Sanger FEATURES Location CDS join(276..2553,2643..3178) /gene="chrblob_3902.glm_1|24oct01" /note="(protein coding) 26% identity to (AE003728) CG4845 gene product [Drosophila melanogaster]" /codon_start=1 ORIGIN watson strand 1 TTTTTTTAAA ATTTTAAATC ATTTTTAGGG ATCTATTTAA AAAAACTAAA 51 TTCAAAATTA AATCATTTTT TTATTAAAAA AAAAAAAAAA AAAATCCAAA 101 ATTAAATTTG TTTTTTGTCA AAAAAAAAAA TAAAAACAAA AATCAAAATT 151 GAACGTTTTT GTGATCATTT TTTTTTTTTT TTTTTTTTTT TTTTTGGGGA 201 TTTTTTTTAA AAATGATTTT TTTTTTTTTT TTCATTTTTT TTTTTTTTTT 251 TTTCAATTAT CCAATTTAAA ATAAA start chrblob_3902.glm_1|24oct01 glm note frameshift near 2543 exon 1 276 ATG AGT AAT AAA TTA AGT GGA ATT T 301 AT TCA GCT TTA GAT TCT GGT AAT AAT AAA CAA TCA TTA AAA TTA TGT AAT 351 GCA CTT TTA ACA AAA AAG AAG GAT GAA AAT ACA AAT ATT GTC AAA GTT TT 401 A AAA GCA ATT ACA TTA ATT AAA TTG GGT GAA AAT GAA GAG GCA ATT AAA T 451 GT GCA GAT GAA GTT GCA TTC ATT GGA CAC TAT AAT GAA ACT TTA TTA TCA 501 AAT TTA AAT TAC TTT TAT AAA TCA GTT CAA CAA GGA TAC AAA ATG ACC AA 551 A GTT TAC GAA GCA TCA GTT AAA GCC TAT CCA AAG AAC GAA AAT CTA GCA G 601 AA GGT TTA TTT TTA GCA TAT GCA AAG GTT AGA GAT TAT AAA CAA CAA CAA 651 CAA GTC ATA CTA GAT TTA CAA AAG AAT TTC CCA TCT CAT CAA CAT AGT CT 701 T TGG TAT TTA ATG ACC ATT TTA TCG ATG GTT CAT GAC AAC CCT TCA AAC C 751 AA CTC TTT ATT GGT TTA TCA CAA AAG TTA GCA GAG AAA TTA GTA GAA GAA 801 GGT AAA ATC AAA ACA AGT GAA CAT CTT TAT ATG TAT GAA ACC GTA TTG GA 851 T ATT CAA GGT AAA ACC AGT GAA CAT CTT AAC CTT ATT AAA GGC AAA TTG G 901 GT GAA CTT TAT AAT GTT GCA ACT GAA CGT TTA AAG ATT TTA GGT GAC CTT 951 AAT CAA AAG TTG GGT AAT CAT CAA GAA GCA GCC AAT AAC TAC TCT GAA AT 1001 C CTT ACA AAA TAT GAA CCG GAT GAA TGG TCA TGC TAT ATG GGT TAT TTC G 1051 AT AAC ATT TGG TCA CTC AAT GAT ATC TCA AAG ATT GAC GAT GCC AAA CAA 1101 TTC ATT CAA AAT ATT CAA TCA CAA CAA ACC AGT AAA CAT TTA TTA CGT GG 1151 T CCA TTA TTA GCA GAG ATT GAA ATT TAC TAT AGA TTA TTG ACA ACT ACC A 1201 CC ACC GCC AAT GGT AAT CCT GCT GCA AAC ATC GAT GGT CCA GTC TTT AAT 1251 AAA TTC ATA GAG TTA ATT TTA AAT TAT TTC ACT AAA TTT GGT ACA AAA CC 1301 A GTA CTC TAT TCA GAT TTA AAG AAA TAT TTA CAA TTT ATT GAA ACT AAA A 1351 AA TCC ATT GAA CAA CGT AAA GAA ATT ATG GAT CGT ATT TAT AAA TTA GTA 1401 TCA TTG GAT AAA GAT GAA GCT AAT CAT ATT AGC CAA CTT TCA AAT TAT CA 1451 C AAG TTA TCC AGA GTT TTA GGT TTA CAA TTG GAA ATG AGT ATT GAA GAA T 1501 CA ATC AAA ATC ATT AAA GAA ATC CTT GAA GAA TAT CAA TAC AAT ACA AAG 1551 AAA TTC CCA TTG GCA ATT GAA TCT GAA CGT TAT CCA GGT GAT GAT TTA AT 1601 T TTA ATT TGT CAT TTC CTC TTA ATG GAT CAA TAT GAA AAA ACC AAA CAA G 1651 TT TCA TTA CTT TTA GAA AGT GCC GCT ATC TTG GAG TTT GCT CAT TCC ATT 1701 TCA ACC AAA AAC TAT CAA TTC AAT CTT TAC CTT CTT TCA TTA TAC TTT GA 1751 A TTG GGC GCA CAT CAA TTG GCA AGT AAT CAT TTC AAA ATT TTA AAC ATT A 1801 AA AAT ATT CAA TAT GAT ACA CTC GGT CAT TTA GTC GCT GAT CAA TTT ATT 1851 CGT GAA CCA ACT TGT TTC TCC AAT GCA ATT AAC GCT TTT GAA AAG TCT GC 1901 T AAA TTC TAC AAT GAA AAT GAA TCG ACA GCT GAT TAT GTT GCT GCT TGT T 1951 AT CAA AAT GGT TGT TAC AGT AAA ATC ACA GAG ATT CAA AAA TTC CAA GTT 2001 AAA GTT GCC AAC TCT TTC CAA AAA TCA GTT TAC GAA ACT GAA AGA CAA TT 2051 A TTT AAT TTC ATG TTA ATT CGT TTT AAA AAA TTA CCA AAT GCT AAT TTC A 2101 CT GCC TCT CAA TTC GTT GAA ATT TGT AAA TCT CAA ATC TCA AGT ACT GAT 2151 CCA ATT AAT TTC GAT TGT TCA AAT GAA GTA TTG AAT GCC CTT TCA TTC AA 2201 T CAT GAT AAT ACT ATC TTT GAT AAA TTT AAT CCA ACT ACC ACC TCT AAT T 2251 CC GAC TCT ATC AAA CAA GTT GAA AAT CAA ATT CAA GGT ATC ACT TCA CTC 2301 TAT TTT GAA AAT ACA GAG AAA TCA ACT CTT CTT TTA CAA TTA ACC TAT CG 2351 T AGA CAA ATT TTA AAT ATT CTA TAT TTA ATT TCA ACT CAA TCA CCA ATT G 2401 AT TTA AAT CAA TTT AAT CAA TTA TTA ATT TCA CTT GAA TCA ACT ACA ACT 2451 AAA TTA AAT TCT ATC AAT TCT CAT AAA ATT GAT AAT TTA ACT CGT ATT TC 2501 A ACT TTA AAT AAT TTT AAA TTA TTA AAT TTA ATT TTA AAT TTA TTA AAA G 2551 AA TGT AAT GTA TTT AAA TTA TTA TTA TTA TTA TCA TTA TTA [AA] ATT TTT A 2601 TA ATT ATT AAT TCA TTT TTA TTA TTT TTT ATA AAA TAT TTA GTT AAT GAA 2651 GAG AAA TTA AAA CAA GTT AAA GAA TTA TTA GAA TTA ATT AAT AAT GAA AT 2701 T ACT GAA ATT GTT AAA GTT TTA AGT GAT AAT ATT AGA GAA TCT GTT GTT T 2751 TA GGT AAT AGT TTG AAT AGT TTA TCT AGA TCA AGT CGT ATG GTT GTA TCA 2801 AGT TTT ATT GAA CCA ATC ACT TGG TTC TCA TTC ATA GCA TTA TTA GTG AA 2851 C TCT GCA TTA CCA GGT AAA AGA GCA AAG AAG AAA GAA GAA TAT CAT ACT A 2901 CT ATT CGC ACA GAT TTA GAA ACA TTA GTT AAA AAA CTT TCT GAT GAT TCT 2951 TTA AAT TTA TCA AAT ATT ATT AAT GAA AAA TCA TTA TCA AAA TTA TCT TT 3001 A ACT GAA GAT GAT AAT AAC AAA TCA ACT ATT CTT GAA ACT TTA AAT ACT C 3051 AA TCA ATT GCC AAA AAT GTT TCT GAA AAT TCA ATT AAA TCA GTC ACT GAA 3101 TTA CAA GAA TAT TTA AAT TCA ATG AAA ACT TTA TTA ACT TTC TCA ATT AA 3151 T AAT ACT AAT AAC ACA ACA AAT GCC TAA* 3178 stop chrblob_3902.glm_1|24oct01 AT AAGAAAAAAA TAAGAAAATA 3201 AATAAATAAA TAAAAATAAA TAAATTATTA CTTTTTTAAA AAAACACAAG 3251 ATAAATAATT TGGGAAATTA TTTGGTGCTT GTCAATCACA ATCACCATAA 3301 TCATATTTAT TAATATATAT ATAAAAAAAA AAAAAAAAAA AAAAGTAAAA 3351 AAAACAACAC TGTCTTGAAA GATGTAAAAA TGTAAAGAGG AAAAAAAAAA 3401 ACTAAAAAAA AAAAATAATA AAAAAAATAA TAAAAAAAAA AAAAATTAAA 3451 AAAAAAAAAA AAATTAAAAA AAATTAAAAA ATTTTGTCTT CAAACCGCCA 3501 ACCCAAAAGT TGAAAAAAAA AAAAAAAAAA AAAAAAAATT TAAACCCCCC 3551 CAAAATTTTA TTTTTAACCA AACCAAACCA AACCAAATTT TTTTTTTTTT 3601 TTTTTTAACA AAAGTGGGTT TTTAAAAATA TAAGGGAAAA TGATTCACAA 3651 AAATCCCCTT TACAAAC // crick strand 3667 GTTTGTA AAGGGGATTT 3650 TTGTGAATCA TTTTCCCTTA TATTTTTAAA AACCCACTTT TGTTAAAAAA 3600 AAAAAAAAAA AAATTTGGTT TGGTTTGGTT TGGTTAAAAA TAAAATTTTG 3550 GGGGGGTTTA AATTTTTTTT TTTTTTTTTT TTTTTTTTCA ACTTTTGGGT 3500 TGGCGGTTTG AAGACAAAAT TTTTTAATTT TTTTTAATTT TTTTTTTTTT 3450 TTTAATTTTT TTTTTTTTTA TTATTTTTTT TATTATTTTT TTTTTTTAGT 3400 TTTTTTTTTT CCTCTTTACA TTTTTACATC TTTCAAGACA GTGTTGTTTT 3350 TTTTACTTTT TTTTTTTTTT TTTTTTTTAT ATATATATTA ATAAATATGA 3300 TTATGGTGAT TGTGATTGAC AAGCACCAAA TAATTTCCCA AATTATTTAT 3250 CTTGTGTTTT TTTAAAAAAG TAATAATTTA TTTATTTTTA TTTATTTATT 3200 TATTTTCTTA TTTTTTTCTT AT "chrblob_3902.glm_1|24oct01" 3178 TTAGGCAT TTGTTGTGTT ATTAGTATTA 3150 TTAATTGAGA AAGTTAATAA AGTTTTCATT GAATTTAAAT ATTCTTGTAA 3100 TTCAGTGACT GATTTAATTG AATTTTCAGA AACATTTTTG GCAATTGATT 3050 GAGTATTTAA AGTTTCAAGA ATAGTTGATT TGTTATTATC ATCTTCAGTT 3000 AAAGATAATT TTGATAATGA TTTTTCATTA ATAATATTTG ATAAATTTAA 2950 AGAATCATCA GAAAGTTTTT TAACTAATGT TTCTAAATCT GTGCGAATAG 2900 TAGTATGATA TTCTTCTTTC TTCTTTGCTC TTTTACCTGG TAATGCAGAG 2850 TTCACTAATA ATGCTATGAA TGAGAACCAA GTGATTGGTT CAATAAAACT 2800 TGATACAACC ATACGACTTG ATCTAGATAA ACTATTCAAA CTATTACCTA 2750 AAACAACAGA TTCTCTAATA TTATCACTTA AAACTTTAAC AATTTCAGTA 2700 ATTTCATTAT TAATTAATTC TAATAATTCT TTAACTTGTT TTAATTTCTC 2650 TTCATTAACT AAATATTTTA TAAAAAATAA TAAAAATGAA TTAATAATTA 2600 TAAAAATTTT AATAATGATA ATAATAATAA TAATTTAAAT ACATTACATT 2550 CTTTTAATAA ATTTAAAATT AAATTTAATA ATTTAAAATT ATTTAAAGTT 2500 GAAATACGAG TTAAATTATC AATTTTATGA GAATTGATAG AATTTAATTT 2450 AGTTGTAGTT GATTCAAGTG AAATTAATAA TTGATTAAAT TGATTTAAAT 2400 CAATTGGTGA TTGAGTTGAA ATTAAATATA GAATATTTAA AATTTGTCTA 2350 CGATAGGTTA ATTGTAAAAG AAGAGTTGAT TTCTCTGTAT TTTCAAAATA 2300 GAGTGAAGTG ATACCTTGAA TTTGATTTTC AACTTGTTTG ATAGAGTCGG 2250 AATTAGAGGT GGTAGTTGGA TTAAATTTAT CAAAGATAGT ATTATCATGA 2200 TTGAATGAAA GGGCATTCAA TACTTCATTT GAACAATCGA AATTAATTGG 2150 ATCAGTACTT GAGATTTGAG ATTTACAAAT TTCAACGAAT TGAGAGGCAG 2100 TGAAATTAGC ATTTGGTAAT TTTTTAAAAC GAATTAACAT GAAATTAAAT 2050 AATTGTCTTT CAGTTTCGTA AACTGATTTT TGGAAAGAGT TGGCAACTTT 2000 AACTTGGAAT TTTTGAATCT CTGTGATTTT ACTGTAACAA CCATTTTGAT 1950 AACAAGCAGC AACATAATCA GCTGTCGATT CATTTTCATT GTAGAATTTA 1900 GCAGACTTTT CAAAAGCGTT AATTGCATTG GAGAAACAAG TTGGTTCACG 1850 AATAAATTGA TCAGCGACTA AATGACCGAG TGTATCATAT TGAATATTTT 1800 TAATGTTTAA AATTTTGAAA TGATTACTTG CCAATTGATG TGCGCCCAAT 1750 TCAAAGTATA ATGAAAGAAG GTAAAGATTG AATTGATAGT TTTTGGTTGA 1700 AATGGAATGA GCAAACTCCA AGATAGCGGC ACTTTCTAAA AGTAATGAAA 1650 CTTGTTTGGT TTTTTCATAT TGATCCATTA AGAGGAAATG ACAAATTAAA 1600 ATTAAATCAT CACCTGGATA ACGTTCAGAT TCAATTGCCA ATGGGAATTT 1550 CTTTGTATTG TATTGATATT CTTCAAGGAT TTCTTTAATG ATTTTGATTG 1500 ATTCTTCAAT ACTCATTTCC AATTGTAAAC CTAAAACTCT GGATAACTTG 1450 TGATAATTTG AAAGTTGGCT AATATGATTA GCTTCATCTT TATCCAATGA 1400 TACTAATTTA TAAATACGAT CCATAATTTC TTTACGTTGT TCAATGGATT 1350 TTTTAGTTTC AATAAATTGT AAATATTTCT TTAAATCTGA ATAGAGTACT 1300 GGTTTTGTAC CAAATTTAGT GAAATAATTT AAAATTAACT CTATGAATTT 1250 ATTAAAGACT GGACCATCGA TGTTTGCAGC AGGATTACCA TTGGCGGTGG 1200 TGGTAGTTGT CAATAATCTA TAGTAAATTT CAATCTCTGC TAATAATGGA 1150 CCACGTAATA AATGTTTACT GGTTTGTTGT GATTGAATAT TTTGAATGAA 1100 TTGTTTGGCA TCGTCAATCT TTGAGATATC ATTGAGTGAC CAAATGTTAT 1050 CGAAATAACC CATATAGCAT GACCATTCAT CCGGTTCATA TTTTGTAAGG 1000 ATTTCAGAGT AGTTATTGGC TGCTTCTTGA TGATTACCCA ACTTTTGATT 950 AAGGTCACCT AAAATCTTTA AACGTTCAGT TGCAACATTA TAAAGTTCAC 900 CCAATTTGCC TTTAATAAGG TTAAGATGTT CACTGGTTTT ACCTTGAATA 850 TCCAATACGG TTTCATACAT ATAAAGATGT TCACTTGTTT TGATTTTACC 800 TTCTTCTACT AATTTCTCTG CTAACTTTTG TGATAAACCA ATAAAGAGTT 750 GGTTTGAAGG GTTGTCATGA ACCATCGATA AAATGGTCAT TAAATACCAA 700 AGACTATGTT GATGAGATGG GAAATTCTTT TGTAAATCTA GTATGACTTG 650 TTGTTGTTGT TTATAATCTC TAACCTTTGC ATATGCTAAA AATAAACCTT 600 CTGCTAGATT TTCGTTCTTT GGATAGGCTT TAACTGATGC TTCGTAAACT 550 TTGGTCATTT TGTATCCTTG TTGAACTGAT TTATAAAAGT AATTTAAATT 500 TGATAATAAA GTTTCATTAT AGTGTCCAAT GAATGCAACT TCATCTGCAC 450 ATTTAATTGC CTCTTCATTT TCACCCAATT TAATTAATGT AATTGCTTTT 400 AAAACTTTGA CAATATTTGT ATTTTCATCC TTCTTTTTTG TTAAAAGTGC 350 ATTACATAAT TTTAATGATT GTTTATTATT ACCAGAATCT AAAGCTGAAT 300 AAATTCCACT TAATTTATTA CTCAT 276 "chrblob_3902.glm_1|24oct01" TTTAT TTTAAATTGG ATAATTGAAA 250 AAAAAAAAAA AAAAAATGAA AAAAAAAAAA AAAATCATTT TTAAAAAAAA 200 TCCCCAAAAA AAAAAAAAAA AAAAAAAAAA AAATGATCAC AAAAACGTTC 150 AATTTTGATT TTTGTTTTTA TTTTTTTTTT TGACAAAAAA CAAATTTAAT 100 TTTGGATTTT TTTTTTTTTT TTTTTAATAA AAAAATGATT TAATTTTGAA 50 TTTAGTTTTT TTAAATAGAT CCCTAAAAAT GATTTAAAAT TTTAAAAAAA end of file 3904 9 3905 10 3907 4 3908 9 stevor 3910 3 3912 4 rifin pseudogene family Date: Tuesday, 3/19/2002 Time: 10:55 c3913.txt chrblob_3913|2001.10.15|GENOMIC|Sanger FEATURES Location CDS complement(147..1406) /gene="chrblob_3913.glm_1|24oct01" /note="(protein coding) 36% identity to (AF036171) homeobox-containing protein [Dictyostelium discoideum]" /codon_start=1 CDS complement(1946..2143) /gene="chrblob_3913.glm_2|24oct01" /note="(protein coding) No NR protein Similarities" /codon_start=1 ORIGIN watson strand 1 TTTTTTTTTT TTTTTTGCTT AATATATGAT TGATTATTAT TATTATTATT 51 ATTTGAATTT TTTTTTGATT TTTTTTTTTT TTTTACAAAA TTCGGTAAAG 101 ATGTGAAAAT AAAGAATCGG AAATTTTTTA AAATGTAATC GAGGAA "chrblob_3913.glm_1|24oct01" 147 TTAA 151 TTGCCAATAC ATTTAGTACC AGTTAAATTA ATTCCATTTC TCATTTTAAA 201 GTTTTCCAAC CAACCACTAC TAGCCTTGAA AGTGTTATTA TTTAATTGTT 251 TTGATAAATC GAGAGCAAAC TTTTTAATGG TTTCACCGCT AACCATTTCA 301 CCATTAGCAC GAGCTTGATT AATTTTTTCA ATTATTAAAT TTTCTTGTTC 351 AATTGAGAAG GAGGCTTTTG GACCTTTGTG TAATTTCTTT AAATTCTTTT 401 TACCAAAACT TCTATATTTA TCAATGTTTG AAATCCAACG AGAAATAATA 451 CTACGAGAGA TATGATATTT CTTTACAACA TGATTCATAC CAAACTTATT 501 TTTCTCTTCA AGAATTTCCA ACTTTTTATA CACCTCATAT GATTTTCTTG 551 GTTTCTTACC ATTAATAGCG GCAGCACTAA CTCTTTTACT CACTTTACCA 601 CTATTTGTAA TTTGGTTATT AATATTATTA TTATTATTAT TATTAAATTC 651 ACTACCACTA CAAATTGGTG AATTTGGAAC TTGCATCATT GGGCTACTTG 701 GTTCATCTCT TCTTGATGAA CAATCATCAC TATCATATTC ACTATCATCA 751 TCTGAAAAAT TATTATTGTT ATTATTATTA TTGTTATTAT TATTATTATT 801 ATTATAATTA TTATTATTAT TATAATCAAT AAAATTATTA TTATTATTAT 851 TATTATTATT ATTATTATTA TTATTATTAT AAAAAATATT ATTATTAAAA 901 TTATTATTAT TTGAGGATGG AACTTTAACT GGTGAAGAAG AAACTATTGG 951 TGAATGAACT GGAGTTGTTT GAGTTGAATA ATAATAATTT GGAGAGGTAC 1001 TTGTTGGAGA TGATGGTGAT GATGGTGTTT TGGTTTTTAA GCTTGCAATT 1051 GTATTTATAA TGGTTTCATC TGATGTATCT TCAATAAGTG ATGATTGATC 1101 TGAATTATTA TAGGATTGAA TATACATATT TACATTATTA AAACTACTAT 1151 TTAAACTATT ATTTTTAATT GAAACTCTTG AAATTTTATT GAAATTATTA 1201 TGATTATTAT TATTATTATT ATTAAAATTA TTATTATTAA AATTATTAAA 1251 ATTATTATTA TTATTATTAT TATTATTATT TGTATTGTTA TCTGAAATAT 1301 TTATTATTTG TATTAATGGT GTTGTTGTTG TTGTTGTTGT TGTTGTAGTT 1351 GGTGTTGGTA ATGTAATTGG TTTTGAAATA TTATTTAAAA TATAATGTAA 1401 TTCCAT 1406 "chrblob_3913.glm_1|24oct01" TTTT TTTTTTTTTA TTTTTTTTTT TTTTTTTTTA TTTATTTATA 1451 TACTATTAAT TATTATTATT GAAAAATTAT TTTATGTGTA AAAATTATTA 1501 CTATTTATTA TTTATTGGGT ATGAAAAAGA ATTATCTGAA TGATAAAATT 1551 ATTTTTTTTT TTTGAATTGT TTTTTTTTTT ATATTTTGTA AAAGGTAAAA 1601 AAAAATAAAA ATTAAAAAAA TAAAAATTAA TTTAATTGAA AATTTGAAAA 1651 TGTAGACTCT GAAAAAATTG AGAAAAGGGA AAAAAAAAAA TAAAAAAAAA 1701 ATTAATATAA AATTATTTAA TATTTGAAAA GGTAATGTTG AAGTGGAATA 1751 ATTTTTTTTT TTTTTAAAAT AAAATTAAAT TAATTAAAAT AAAAAAAAAA 1801 CTGAAAATAA TGTTTTTATA TAAATGATGG ATGAAATAAA ATTTGTTGTT 1851 TTAGGACAAA AAAAAAAAGA ATTTTAAAAA AAAAAAAATA AAAATAAATT 1901 TATAAAATTA AAAAAAATAA AAAAAAATAA ATTAAAAAAT CAAAA "chrblob_3913.glm_2|24oct01" 1946 TTAAA 1951 TTTTTTTTTT TTTTGTTTTT TTTAATTTCA TTCCAAAAAC AAAAGAATTT 2001 ATTTCGATGA ATTGGTTTCG AGCAAGAAAA AAAAAAATTT TAGGTGTGAA 2051 AAAACAGTGT TGAGAAATCT TTAGAAAAAA ATTGCATGTG CATGATTGTG 2101 TGGTGTAAAA ATGTGGGATT TTTTTTTGAA TTAACCCGCT CAT 2143 "chrblob_3913.glm_2|24oct01" TCACAGA 2151 GTTTTCGATT AATTTTATTT TTTTTTGATG CAAACGAAAA AAAAAAATAA 2201 AAAAAAAATA AAAATAAAAA TAAATTTAAA TTAAAAAAAA AGATTGTTTG 2251 GCGAGCTCGC CGATGCGTGT TTTTTTTTTG GGGTTTTTTT TTTTTTTTAT 2301 AAGTATTTTT AATTTTATGC AAAGGAGCTT ACTCTTATTT TTAAAAATAG 2351 TAATTTTTTT AAAAATTTGA GAAATATAAA TAATAAAAAA AAATTATACA 2401 ATTTTAACAA AGATTTTTTT ATTTTTTTTT TATTTTTTTT TTATTTTTAT 2451 TTTTTTTTGA CAATGCAAAT TTAACAAATC ATTTTTTATG TTGGTTTTTT 2501 ACAGTCAATA TTATGACTGT ATTAATGATT TTTTTTAATT TTTTTTTTTA 2551 ATTTTTTTTA ATTTTATTTT TTATTTTTAA TTTTTTTTTT TTTTTTTTTT 2601 TTTTTTTTGG GGAAACAACA ATTTTTTGAA AAAATAATCA CCATGGCCAA 2651 AAAAAATTTA TGAAATCGAA TGATATTTTT TTTTTTTTAA TTTTTTTTTT 2701 TTTTTTTTTT TTTTTTTTTT TTTTTTGGGT TAAAAAAAAA TTCAATTTCC 2751 AAAAACTTGG GGAAAAAAAA AATTTTTTTT TTTTTTTTGG GGTAGGGGGC 2801 CCAAACTTTA TTATTTTTAT TATTTAATAT TTTTTATTTT TTTTTTGGGG 2851 GGGGGGAAAA AAAAAAAAAA AAAATTGGGG GAAAAGGGGA AAAAAAAAAT 2901 TTAAAAAAAA AATTTTTTTT CCATTTTTGG GGGGGGGGGG TTTAAAAGGG 2951 AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA 3001 AAAAAAAATT TTTTTTTTTT TTTTTTTTTT TT // crick strand 3032 AA AAAAAAAAAA AAAAAAAAAA AATTTTTTTT 3000 TTTTTTTTTT TTTTTTTTTT TTTTTTTTTT TTTTTTTTTT TTTTTTTTTT 2950 CCCTTTTAAA CCCCCCCCCC CCAAAAATGG AAAAAAAATT TTTTTTTTAA 2900 ATTTTTTTTT TCCCCTTTTC CCCCAATTTT TTTTTTTTTT TTTTCCCCCC 2850 CCCCAAAAAA AAAATAAAAA ATATTAAATA ATAAAAATAA TAAAGTTTGG 2800 GCCCCCTACC CCAAAAAAAA AAAAAAAATT TTTTTTTTCC CCAAGTTTTT 2750 GGAAATTGAA TTTTTTTTTA ACCCAAAAAA AAAAAAAAAA AAAAAAAAAA 2700 AAAAAAAAAA TTAAAAAAAA AAAAATATCA TTCGATTTCA TAAATTTTTT 2650 TTGGCCATGG TGATTATTTT TTCAAAAAAT TGTTGTTTCC CCAAAAAAAA 2600 AAAAAAAAAA AAAAAAAAAA TTAAAAATAA AAAATAAAAT TAAAAAAAAT 2550 TAAAAAAAAA AATTAAAAAA AATCATTAAT ACAGTCATAA TATTGACTGT 2500 AAAAAACCAA CATAAAAAAT GATTTGTTAA ATTTGCATTG TCAAAAAAAA 2450 ATAAAAATAA AAAAAAAATA AAAAAAAAAT AAAAAAATCT TTGTTAAAAT 2400 TGTATAATTT TTTTTTATTA TTTATATTTC TCAAATTTTT AAAAAAATTA 2350 CTATTTTTAA AAATAAGAGT AAGCTCCTTT GCATAAAATT AAAAATACTT 2300 ATAAAAAAAA AAAAAAACCC CAAAAAAAAA ACACGCATCG GCGAGCTCGC 2250 CAAACAATCT TTTTTTTTAA TTTAAATTTA TTTTTATTTT TATTTTTTTT 2200 TTATTTTTTT TTTTCGTTTG CATCAAAAAA AAATAAAATT AATCGAAAAC 2150 TCTGTGA no gene chrblob_3913.glm_2|24oct01 2143 ATG AGC GGG TTA ATT CAA AAA AAA ATC CCA CAT TTT TAC ACC A 2100 CA CAA TCA TGC ACA TGC AAT TTT TTT CTA AAG ATT TCT CAA CAC TGT TTT 2050 TTC ACA CCT AAA ATT TTT TTT TTT CTT GCT CGA AAC CAA TTC ATC GAA AT 2000 A AAT TCT TTT GTT TTT GGA ATG AAA TTA AAA AAA ACA AAA AAA AAA AAA A 1950 TT TAA* 1946 TTTTG ATTTTTTAAT TTATTTTTTT TTATTTTTTT TAATTTTATA 1900 AATTTATTTT TATTTTTTTT TTTTTAAAAT TCTTTTTTTT TTTGTCCTAA 1850 AACAACAAAT TTTATTTCAT CCATCATTTA TATAAAAACA TTATTTTCAG 1800 TTTTTTTTTT ATTTTAATTA ATTTAATTTT ATTTTAAAAA AAAAAAAAAT 1750 TATTCCACTT CAACATTACC TTTTCAAATA TTAAATAATT TTATATTAAT 1700 TTTTTTTTTA TTTTTTTTTT TCCCTTTTCT CAATTTTTTC AGAGTCTACA 1650 TTTTCAAATT TTCAATTAAA TTAATTTTTA TTTTTTTAAT TTTTATTTTT 1600 TTTTACCTTT TACAAAATAT AAAAAAAAAA ACAATTCAAA AAAAAAAAAT 1550 AATTTTATCA TTCAGATAAT TCTTTTTCAT ACCCAATAAA TAATAAATAG 1500 TAATAATTTT TACACATAAA ATAATTTTTC AATAATAATA ATTAATAGTA 1450 TATAAATAAA TAAAAAAAAA AAAAAAAAAA TAAAAAAAAA AAAA start chrblob_3913.glm_1|24oct01 glm exon 1 1406 ATG GAA 1400 TTA CAT TAT ATT TTA AAT AAT ATT TCA AAA CCA ATT ACA TTA CCA ACA CC 1350 A ACT ACA ACA ACA ACA ACA ACA ACA ACA ACA CCA TTA ATA CAA ATA ATA A 1300 AT ATT TCA GAT AAC AAT ACA AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT 1250 TTT AAT AAT TTT AAT AAT AAT AAT TTT AAT AAT AAT AAT AAT AAT AAT CA 1200 T AAT AAT TTC AAT AAA ATT TCA AGA GTT TCA ATT AAA AAT AAT AGT TTA A 1150 AT AGT AGT TTT AAT AAT GTA AAT ATG TAT ATT CAA TCC TAT AAT AAT TCA 1100 GAT CAA TCA TCA CTT ATT GAA GAT ACA TCA GAT GAA ACC ATT ATA AAT AC 1050 A ATT GCA AGC TTA AAA ACC AAA ACA CCA TCA TCA CCA TCA TCT CCA ACA A 1000 GT ACC TCT CCA AAT TAT TAT TAT TCA ACT CAA ACA ACT CCA GTT CAT TCA 950 CCA ATA GTT TCT TCT TCA CCA GTT AAA GTT CCA TCC TCA AAT AAT AAT AA 900 T TTT AAT AAT AAT ATT TTT TAT AAT AAT AAT AAT AAT AAT AAT AAT AAT A 850 AT AAT AAT AAT AAT AAT TTT ATT GAT TAT AAT AAT AAT AAT AAT TAT AAT 800 AAT AAT AAT AAT AAT AAC AAT AAT AAT AAT AAC AAT AAT AAT TTT TCA GA 750 T GAT GAT AGT GAA TAT GAT AGT GAT GAT TGT TCA TCA AGA AGA GAT GAA C 700 CA AGT AGC CCA ATG ATG CAA GTT CCA AAT TCA CCA ATT TGT AGT GGT AGT 650 GAA TTT AAT AAT AAT AAT AAT AAT AAT ATT AAT AAC CAA ATT ACA AAT AG 600 T GGT AAA GTG AGT AAA AGA GTT AGT GCT GCC GCT ATT AAT GGT AAG AAA C 550 CA AGA AAA TCA TAT GAG GTG TAT AAA AAG TTG GAA ATT CTT GAA GAG AAA 500 AAT AAG TTT GGT ATG AAT CAT GTT GTA AAG AAA TAT CAT ATC TCT CGT AG 450 T ATT ATT TCT CGT TGG ATT TCA AAC ATT GAT AAA TAT AGA AGT TTT GGT A 400 AA AAG AAT TTA AAG AAA TTA CAC AAA GGT CCA AAA GCC TCC TTC TCA ATT 350 GAA CAA GAA AAT TTA ATA ATT GAA AAA ATT AAT CAA GCT CGT GCT AAT GG 300 T GAA ATG GTT AGC GGT GAA ACC ATT AAA AAG TTT GCT CTC GAT TTA TCA A 250 AA CAA TTA AAT AAT AAC ACT TTC AAG GCT AGT AGT GGT TGG TTG GAA AAC 200 TTT AAA ATG AGA AAT GGA ATT AAT TTA ACT GGT ACT AAA TGT ATT GGC AA 150 T TAA* 147 stop chrblob_3913.glm_1|24oct01 TTCCTC GATTACATTT TAAAAAATTT CCGATTCTTT ATTTTCACAT 100 CTTTACCGAA TTTTGTAAAA AAAAAAAAAA AATCAAAAAA AAATTCAAAT 50 AATAATAATA ATAATAATCA ATCATATATT AAGCAAAAAA AAAAAAAAAA end of file 3914 4 3915 8 + 4 3916 2 3919 4 3920 2 + 11 3922 8 3923 3 3924 9 3925 9 3926 4 3927 3 3928 9 3929 9 3930 9 3931 4 3932 11 3935 4 3936 4 3938 4 3939 13 telomere 3940 9 3941 13 3942 4 Date: Wednesday, 3/20/2002 Time: 09:28 c3943.txt chrblob_3943|2001.10.15|GENOMIC|Sanger FEATURES Location CDS complement(1025..1600) /gene="chrblob_3943.glm_1|24oct01" /note="(protein coding) 85% identity to probable integral membrane protein PFB0985c - malaria parasite (Plasmodium falciparum)" /codon_start=1 ORIGIN watson strand 1 TTCAATTGTT TTGAGACAAT GTAAAAGTCG TTTTATATCT ATAATAACAA 51 ATTATTATCC TTTTAAAGAA CAAAATAATC CTTTTATAAA GCAGGCACAA 101 TATGTATCCT CATCTAATTA TGTATTGGAT GATATAATAA ATAATATAGA 151 CTATAGTATA GATAATATAC ATAGAGCCAT AGATAATTTA TACTATGAAC 201 ATATATTAAA TTTATTAGAG GAAGAAAAAA ATGAAATACT AGAAGAAATA 251 TTAAGGAATA TTCTAAAAAT TATTTTGTGT GATGTTGAAA CAACGGTAAG 301 AAGATCAGCA CAAAAAGTAT TACAAAATGC AGAAGGAGAT ACAAATTTGA 351 TGCTTAAAAG AGCTAAAGGA TTACAATCAT TGGGTAAAAT GATATTACAG 401 AAGGTTAATT GAGGATATAT TATATGTACA CACACATATA AGGGATTATA 451 TATATATATA TATATATATA TATAAAGGAT TAATAAAAAA ATTAAATTTT 501 ATTAAAGGAA AAATGTACAT ATAAATGAAT ATGTTATTTT TTTAAATAAT 551 ATTAGAAATA ACATTTTTTC ATAATATAAT AATAGAAGCA CCCACCCACC 601 ACCACCCACA CATATATATA TATATAAATG TTTTACTTTT AAATTTATAT 651 TTACAAAAGT TTTTTTTTTA TATAAACTTA AAAGTGAACA ATTTATTTTT 701 TTATCATAAT TTTTTTTTTT TCATTTTTAT AACAATTTAA GTATTTTCAC 751 AGATATATAT ATATATATAT ATATATATAT TTATTTATTT ATTTATTTAT 801 AATTATTTAT TTTGGCTAGC CATCTAGCTG TTTTATTATT TAGAAAAAAA 851 AAAAAAAATT ATGTGATACA TTGGCTAGTT ATATTATAAA CTTAAGAAAA 901 AAAAATAACA AATGGGTGAA TAAGTAATTT ATAATATTTA TAATAAATGA 951 AAATAAATAA AAAAACGTAT AAAAATTAAT TACATTATAT ATCATAATAT 1001 TAGATTAAAT AAATAACAAA ATAT "chrblob_3943.glm_1|24oct01 vbc stevor" 1025 TTATTT TGTTATTTGC TTTTTGTTTT 1051 GAAAAAATGT GTTCAATTTT GTTTTTAATT TTTTAAAACC TATTTTCATG 1101 TCAGGAAAAT AACGAGCAAC TATATAGATA ATAAAAATTA AAAGAAAAAA 1151 TGCAGGAAGA TATATAAGTT GAGCATCACC AAAACTAGCA AACATACATG 1201 CTATCATTAT AATGATTAAG GATAAGGTAA TAGAATTAAT CCCAATATTA 1251 TTCCACAAAT TTTTTCTTTT TAAACATTTT ATATCATTTT GCATACGAAG 1301 ATGCATTAAA TAACTATCCA TTTGTTCTTT ACATTCTTCG TTATTACTAT 1351 ATTTTTGAAG TTCATTAATT GATTCATTTT TTTCTTTTAC ATCTCTACTA 1401 TTTATATATT TTAATGAGAG ATTTTTGATT TTATCTTTTT TTTCTTGAGT 1451 TATATTCATA TTATCTACTA AACTGACTAG AGATGAAATT TGATCATCAG 1501 GATTTTTTTT TTTACTACCT TTTCCGCCTT TATCTTTTAA CAATATATTC 1551 GTTAAGGTAT TTCCGAATGG TTTTTTATTT GTGTTTTTTT GTGCTAACAT 1601 TCTGAATTGT ATCCCTCCAT TATGGTATGA TAATTTGTAT GTTCCAATTT 1651 CTACTACATT CTATAAATAA ATACACACAC ACTTATATAT ATATGTATAT 1701 TTTATATATA AATAAATATT TGAATAAAAC ATATAAAATA TTATTATATA 1751 TTACGTTATT AAATAGATTA GATGCACATA GTATTATGGT AAAAATATAT 1801 ATTTTATAAA TATAATGAAA CAT 1823 "chrblob_3943.glm_1|24oct01 vbc stevor" ATTTTAT TATTATTATT TCTTTATAGT 1851 GTATTCTAAT ATATAGATGT GAATTATTTA TATTATCTAT TCTTTTGAAT 1901 TATGTATATT ATGTAATAAT ATTATAAAAA AAATACTTTT TATCATTGAT 1951 TTTTTTTTTT AAATATTTGT ATATTATATA AATTAAAATA ATAATAATTA 2001 TAATTTTATA AATAATAAAT TTCATGTAAT GCTATATTAT TACATGTATG 2051 TGATATATGA AAAAGTGCTG GATTCTAAAG AAAAAAAAAA AAAAAATAAT 2101 AATAATTAAA AAAAAAAAAT AATAATAATT AAAAAAAAAA AATAATAATA 2151 ATTAAAAAAA AAAAATAATA ATAATTAAAA AAAAAAAATA AAAAAAAAAT 2201 TATTAT // crick strand 2206 ATAATA 2200 ATTTTTTTTT TATTTTTTTT TTTTAATTAT TATTATTTTT TTTTTTTAAT 2150 TATTATTATT TTTTTTTTTT AATTATTATT ATTTTTTTTT TTTAATTATT 2100 ATTATTTTTT TTTTTTTTTT CTTTAGAATC CAGCACTTTT TCATATATCA 2050 CATACATGTA ATAATATAGC ATTACATGAA ATTTATTATT TATAAAATTA 2000 TAATTATTAT TATTTTAATT TATATAATAT ACAAATATTT AAAAAAAAAA 1950 ATCAATGATA AAAAGTATTT TTTTTATAAT ATTATTACAT AATATACATA 1900 ATTCAAAAGA ATAGATAATA TAAATAATTC ACATCTATAT ATTAGAATAC 1850 ACTATAAAGA AATAATAATA ATAAAAT start chrblob_3943.glm_1|24oct01 vbc stevor exon 1 1823 ATG TTT CAT TAT ATT TAT AAA AT 1800 A TAT ATT TTT ACC ATA ATA CTA TGT GCA TCT AAT CTA TTT AAT AAC 1755 intron GTAA 1750 TATATAATAA TATTTTATAT GTTTTATTCA AATATTTATT TATATATAAA 1700 ATATACATAT ATATATAAGT GTGTGTGTAT TTATTTATAG exon 2 1660 AAT GTA GTA G 1650 AA ATT GGA ACA TAC AAA TTA TCA TAC CAT AAT GGA GGG ATA CAA TTC AGA 1600 ATG TTA GCA CAA AAA AAC ACA AAT AAA AAA CCA TTC GGA AAT ACC TTA AC 1550 G AAT ATA TTG TTA AAA GAT AAA GGC GGA AAA GGT AGT AAA AAA AAA AAT C 1500 CT GAT GAT CAA ATT TCA TCT CTA GTC AGT TTA GTA GAT AAT ATG AAT ATA 1450 ACT CAA GAA AAA AAA GAT AAA ATC AAA AAT CTC TCA TTA AAA TAT ATA AA 1400 T AGT AGA GAT GTA AAA GAA AAA AAT GAA TCA ATT AAT GAA CTT CAA AAA T 1350 AT AGT AAT AAC GAA GAA TGT AAA GAA CAA ATG GAT AGT TAT TTA ATG CAT 1300 CTT CGT ATG CAA AAT GAT ATA AAA TGT TTA AAA AGA AAA AAT TTG TGG AA 1250 T AAT ATT GGG ATT AAT TCT ATT ACC TTA TCC TTA ATC ATT ATA ATG ATA G 1200 CA TGT ATG TTT GCT AGT TTT GGT GAT GCT CAA CTT ATA TAT CTT CCT GCA 1150 TTT TTT CTT TTA ATT TTT ATT ATC TAT ATA GTT GCT CGT TAT TTT CCT GA 1100 C ATG AAA ATA GGT TTT AAA AAA TTA AAA ACA AAA TTG AAC ACA TTT TTT C 1050 AA AAC AAA AAG CAA ATA ACA AAA TAA* 1025 stop chrblob_3943.glm_1|24oct01 vbc stevor ATAT TTTGTTATTT ATTTAATCTA 1000 ATATTATGAT ATATAATGTA ATTAATTTTT ATACGTTTTT TTATTTATTT 950 TCATTTATTA TAAATATTAT AAATTACTTA TTCACCCATT TGTTATTTTT 900 TTTTCTTAAG TTTATAATAT AACTAGCCAA TGTATCACAT AATTTTTTTT 850 TTTTTTTCTA AATAATAAAA CAGCTAGATG GCTAGCCAAA ATAAATAATT 800 ATAAATAAAT AAATAAATAA ATATATATAT ATATATATAT ATATATATCT 750 GTGAAAATAC TTAAATTGTT ATAAAAATGA AAAAAAAAAA ATTATGATAA 700 AAAAATAAAT TGTTCACTTT TAAGTTTATA TAAAAAAAAA ACTTTTGTAA 650 ATATAAATTT AAAAGTAAAA CATTTATATA TATATATATG TGTGGGTGGT 600 GGTGGGTGGG TGCTTCTATT ATTATATTAT GAAAAAATGT TATTTCTAAT 550 ATTATTTAAA AAAATAACAT ATTCATTTAT ATGTACATTT TTCCTTTAAT 500 AAAATTTAAT TTTTTTATTA ATCCTTTATA TATATATATA TATATATATA 450 TATAATCCCT TATATGTGTG TGTACATATA ATATATCCTC AATTAACCTT 400 CTGTAATATC ATTTTACCCA ATGATTGTAA TCCTTTAGCT CTTTTAAGCA 350 TCAAATTTGT ATCTCCTTCT GCATTTTGTA ATACTTTTTG TGCTGATCTT 300 CTTACCGTTG TTTCAACATC ACACAAAATA ATTTTTAGAA TATTCCTTAA 250 TATTTCTTCT AGTATTTCAT TTTTTTCTTC CTCTAATAAA TTTAATATAT 200 GTTCATAGTA TAAATTATCT ATGGCTCTAT GTATATTATC TATACTATAG 150 TCTATATTAT TTATTATATC ATCCAATACA TAATTAGATG AGGATACATA 100 TTGTGCCTGC TTTATAAAAG GATTATTTTG TTCTTTAAAA GGATAATAAT 50 TTGTTATTAT AGATATAAAA CGACTTTTAC ATTGTCTCAA AACAATTGAA end of file 3944 4 Date: Wednesday, 3/20/2002 Time: 09:28 c3945.txt chrblob_3945|2001.10.15|GENOMIC|Sanger FEATURES Location CDS 856..2121 /gene="chrblob_3945.gen_1|24oct01" /note="(protein coding) 27% identity to (AF036171) homeobox-containing protein [Dictyostelium discoideum]" /codon_start=1 ORIGIN watson strand 1 AAATAAATAA TCGTTTTTTT TTTTTTTTTT TTTTTTTTTT TTTTTTTTTT 51 TACAATCCAT ATTGTATGCC TTTTTAGCAT GTATTTCATT TTACTCTATT 101 TTATATTTTA CATTTTACAT TTTCTTTATT TTTATTGTCC ATTTTTTATT 151 TTTTATTTTT CATTTTTTAT TTTTTATTTT TCATTTTTCA TTTTTTATTT 201 TTCATTTTTC ATTTTTCATT TTTTTGTGTT TTTTGTTTTT TCTTGTATTT 251 TCGGAATATC CATTTATGTT TTTAAGTATA ATATATTTGT TGAAAATATT 301 TTGAAAATGT AATTTCATTT TTTCCCCTTT TTCTTTTTCT TATTTTTAAA 351 TGAAACAAAA GTATTTTTAA AAAGATACAA CTTTTATTTA ATATCATAAT 401 ATTTTTATAA AAATACAGCA ACTTTTGAAA AGGAGTTCAA ATTGTATTAT 451 TTCGTAGATT AATTTAAAAT TTGTTCACAA GTTATATACA TATTATATAT 501 ATATATATAT AATACATATA TATGTATATA TCGTATACAT TTCTTTTCTT 551 TTCTTATCTT TTTTTTCTTT CTTTTTTTTT TTCTTTTTTG TATATCCCAG 601 TAAATAATTT ATTTGAAATA TAAAACATAA CTTTTAAGAT AAAACAAAAT 651 TGTAAAATAA TATATTTTTA TATGTTATTT ATTTTCATGT CATCTTTTTA 701 TATGATTTTT AAAATATGTA AAAATAGATT AATGTAAATA TTATACTTAA 751 TCCATCTTGA TATTCTATTT TTTTTTTTTT TTTTGATTTT TTATATATTT 801 TATAAAATAT ATAAAAAAAT GAAAAAAGAA ATTTTATGAC ATTTTTTTAA 851 AAAAT start chrblob_3945.gen_1|24oct01 glm note partial gene exon 1 856 ATG AAC GAA GAA ACA ACC ACA CGA ACA TTA TTA GAT ATA CCA GGT 901 TAT TAT TAT GAT AAA AAA AAA AAT AGA TAT TTT CTA ATT AAT AAT GAA TT 951 A AAA AAG GAA TTA AAA AAA GAA GAA TTT AAC AAA TCA GTG AAT AAC GCC A 1001 AA AAA AAA AAC AGA GAT ACT AAT AAT GCG GAA ACT AAA AAA TGG GGG AAA 1051 AAG AAA TTC CAT CAA ATT CAT GGA ATA AAA GAA ATG AAA AAA AAA AAG AA 1101 A AAT GCA AAC AAT AAT AAA TTA AAT AAT AAT ATT AAA AAT TAT AAT GAA G 1151 AA GAT GGA ATA AAT ACT ATA TAT ACC AAA AAA AAA AGT TAT AAT ATT ATA 1201 AAT AGT AAA GAA ACA AAA TTA GAA TTA ATC AAC AAT GAA TTA AAT TTT TT 1251 A AAA AAA AAT ATC TGT GAA AAT CAA AAT ATA TTT AAT TTA ATT AAG AGG A 1301 TA AAA AAT TAT AAT TTT AAA GAA GAC TCC ATT TTA AGT TTG CCA CCC ATT 1351 TTT ATT AAT TCT AAT AGT TGT GAA TAT ATT CAA GTA GAA GAT TTA TGT GA 1401 A TAT TCA TCA AAT AAA AAT TCA TTT TGT CAT AAA GAA AAT GAT TGT TTA G 1451 AC ATT TTA AAA TCT CCA AGA TCT TTT AAT AAT AAA AGA ACA GAT AAT ATA 1501 GAT GTC TCT TTG AAC GAT TAT AAT TAC TTT AAT TCA AGT CAA AAA TTA AT 1551 A GAT AAA TAT AAA CGA AAA AAT AAA AAC GAA TTC GAT AAT TTT AAT AAA A 1601 AT GAA TCA TTT GAT ACA TAT AGA AAG TAT AGA AAA AAT AGC ATA TTC AGT 1651 AAT CAA ACT GAT GAA TAT AAT GTT TCA AAT TAT AAT TAC ACA AAC AAA AA 1701 A TAT TAT TGT GAT AAT AAA TAT AAT CTG ACA TAT TGT AAA AAT GGA AAT A 1751 AT ATG TTT TCT TGT ATT AAT CCT GAT TAT ATA GAA GAA AAT TTA TTA ATT 1801 CCC AAA CTA TAT GGG AGA ACA TAT GAA AAG TTA AAT TCA TGT AAT ATA AA 1851 A AAT ATA AAA TCA AAA ATA AGG GTA AAT AGA TAT AAA GCG AAT TTT TAT T 1901 AT TTT TAT AAT AAT ACT TAT GAT GCG TTT GCC TTA GAA GCA AAT AAC ACA 1951 TCC AGA GAA ATG AAC ATG AAC AAT AAT AAT GAT AAT GAT GCT AAT AAT GA 2001 T AGT AAT GAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AGT AAT ATT T 2051 AT AAT AAT AAT ATT TAT AAT AAC AAT ATT TAT AAT AAC AAT ATT TAT AAT 2101 AAT AAT AGT GGA AGG CAC TCA 2121 ... (stop) chrblob_3945.gen_1|24oct01 // crick strand 2121 T GAGTGCCTTC CACTATTATT 2100 ATTATAAATA TTGTTATTAT AAATATTGTT ATTATAAATA TTATTATTAT 2050 AAATATTACT ATTATTATTA TTATTATTAT TATTATTATT ATCATTACTA 2000 TCATTATTAG CATCATTATC ATTATTATTG TTCATGTTCA TTTCTCTGGA 1950 TGTGTTATTT GCTTCTAAGG CAAACGCATC ATAAGTATTA TTATAAAAAT 1900 AATAAAAATT CGCTTTATAT CTATTTACCC TTATTTTTGA TTTTATATTT 1850 TTTATATTAC ATGAATTTAA CTTTTCATAT GTTCTCCCAT ATAGTTTGGG 1800 AATTAATAAA TTTTCTTCTA TATAATCAGG ATTAATACAA GAAAACATAT 1750 TATTTCCATT TTTACAATAT GTCAGATTAT ATTTATTATC ACAATAATAT 1700 TTTTTGTTTG TGTAATTATA ATTTGAAACA TTATATTCAT CAGTTTGATT 1650 ACTGAATATG CTATTTTTTC TATACTTTCT ATATGTATCA AATGATTCAT 1600 TTTTATTAAA ATTATCGAAT TCGTTTTTAT TTTTTCGTTT ATATTTATCT 1550 ATTAATTTTT GACTTGAATT AAAGTAATTA TAATCGTTCA AAGAGACATC 1500 TATATTATCT GTTCTTTTAT TATTAAAAGA TCTTGGAGAT TTTAAAATGT 1450 CTAAACAATC ATTTTCTTTA TGACAAAATG AATTTTTATT TGATGAATAT 1400 TCACATAAAT CTTCTACTTG AATATATTCA CAACTATTAG AATTAATAAA 1350 AATGGGTGGC AAACTTAAAA TGGAGTCTTC TTTAAAATTA TAATTTTTTA 1300 TCCTCTTAAT TAAATTAAAT ATATTTTGAT TTTCACAGAT ATTTTTTTTT 1250 AAAAAATTTA ATTCATTGTT GATTAATTCT AATTTTGTTT CTTTACTATT 1200 TATAATATTA TAACTTTTTT TTTTGGTATA TATAGTATTT ATTCCATCTT 1150 CTTCATTATA ATTTTTAATA TTATTATTTA ATTTATTATT GTTTGCATTT 1100 TTCTTTTTTT TTTTCATTTC TTTTATTCCA TGAATTTGAT GGAATTTCTT 1050 TTTCCCCCAT TTTTTAGTTT CCGCATTATT AGTATCTCTG TTTTTTTTTT 1000 TGGCGTTATT CACTGATTTG TTAAATTCTT CTTTTTTTAA TTCCTTTTTT 950 AATTCATTAT TAATTAGAAA ATATCTATTT TTTTTTTTAT CATAATAATA 900 ACCTGGTATA TCTAATAATG TTCGTGTGGT TGTTTCTTCG TTCAT 856 "chrblob_3945.gen_1|24oct01" ATTTT 850 TTAAAAAAAT GTCATAAAAT TTCTTTTTTC ATTTTTTTAT ATATTTTATA 800 AAATATATAA AAAATCAAAA AAAAAAAAAA AAATAGAATA TCAAGATGGA 750 TTAAGTATAA TATTTACATT AATCTATTTT TACATATTTT AAAAATCATA 700 TAAAAAGATG ACATGAAAAT AAATAACATA TAAAAATATA TTATTTTACA 650 ATTTTGTTTT ATCTTAAAAG TTATGTTTTA TATTTCAAAT AAATTATTTA 600 CTGGGATATA CAAAAAAGAA AAAAAAAAAG AAAGAAAAAA AAGATAAGAA 550 AAGAAAAGAA ATGTATACGA TATATACATA TATATGTATT ATATATATAT 500 ATATATAATA TGTATATAAC TTGTGAACAA ATTTTAAATT AATCTACGAA 450 ATAATACAAT TTGAACTCCT TTTCAAAAGT TGCTGTATTT TTATAAAAAT 400 ATTATGATAT TAAATAAAAG TTGTATCTTT TTAAAAATAC TTTTGTTTCA 350 TTTAAAAATA AGAAAAAGAA AAAGGGGAAA AAATGAAATT ACATTTTCAA 300 AATATTTTCA ACAAATATAT TATACTTAAA AACATAAATG GATATTCCGA 250 AAATACAAGA AAAAACAAAA AACACAAAAA AATGAAAAAT GAAAAATGAA 200 AAATAAAAAA TGAAAAATGA AAAATAAAAA ATAAAAAATG AAAAATAAAA 150 AATAAAAAAT GGACAATAAA AATAAAGAAA ATGTAAAATG TAAAATATAA 100 AATAGAGTAA AATGAAATAC ATGCTAAAAA GGCATACAAT ATGGATTGTA 50 AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAACGA TTATTTATTT end of file 3946 12 telomere 3947 4 3948 12 + 8 3949 9 3951 9 3954 8 variant in intron & utr 3956 4 3958 1 telomere 3959 4 3960 4 3961 4 3962 4 3963 9 3965 4 3966 10 Date: Thursday, 3/21/2002 Time: 15:55 c3967.txt chrblob_3967|2001.10.15|GENOMIC|Sanger FEATURES Location CDS 252..710 /gene="chrblob_3967.glm_1|24oct01" /note="(protein coding) 63% identity to hypothetical protein PH1804 - Pyrococcus horikoshii" /codon_start=1 CDS 760..1812 /gene="chrblob_3967.glm_2|24oct01" /note="(protein coding) 77% identity to (AF218072) pontin [Xenopus laevis]" /codon_start=1 CDS join(2157..2569,2657..3695) /gene="chrblob_3967.glm_3|24oct01" /note="(protein coding) 39% identity to (AE003530) CG7764 gene product [Drosophila melanogaster]" /codon_start=1 CDS complement(3917..4126) /gene="chrblob_3967.glm_4|24oct01" /note="(protein coding) No NR protein Similarities" /codon_start=1 ORIGIN watson strand 1 TTCATAAATA ATAATTATTT ACACTTTTTT TATATTTATA TCAACAAATA 51 AATCTATTAA TTTATTTTTT CATTTCCATT TTTTTTATTT TATTTTTATT 101 TTTATTTTAT TTTTTATTTT TTTTTTTTTT TATTTTTCAA AAAATTTTTG 151 AAAAACTGCC AGTTTTTTTT TTATTTTTAT TTTTTTCGAA TTCGTTGGTT 201 TGGAAAAAAC AAATAAAAAA AAACACACCT ATATATATAC ATTTAAATAA 251 A start chrblob_3967.glm_1+2|24oct01 vbc exon 1 252 ATG TCA GAA AAT AAT ACA GAT ACA GTT ATG GGT GAT TCA AAT CCA TCA A 301 CT AAA ATT ACA GAA ACA CCA ATG AAT GAG ACA CCA TCA TCT ACC ACC ACC 351 ACC ACC GCA ACT ACT ACA ACT ACA GCC ACA ACA CCA CCA CAA CAA ACT CA 401 A CAA CCA CCA CAA CCA CAA CTT TCA ACC ACA GTA ACA GAA ACC ACA CCA A 451 CC ACT AGA ATA GAA GAA ATT AAA TCA GTT AAA TCA CAA AGA GTT GCA ACA 501 CAT AGT CAT ATT AAA GGT TTA GGT TTA TTA GAA AAT GGT ACA GCT TCA AA 551 T ATT GCA GAT GGT TTA GTA GGC CAA TGT AAA GCA AGA GAA intron GTAAGTCTTT 601 TTTTTTTTTT TATTTTTTTT TTTATTTTTT TTATTTATTT TTTAATTAAA 651 TATTTAAATT TAAAAATTAA TTTTCATTTA TTTATTTTAT TTTTTTATTT 701 TTTTTTTTAA AAAAAAAAAG exon 2 GCA GCA GGT ATT GTT ACA GAA TTA ATT AAA 751 TCA AAA AAA ATG GCA GGT AAA GCA TTA TTA TTA GCA GGA CCA CCA GGT AC 801 A GGT AAA ACA GCA TTA GCA TTA GCA ATT TCA CAA GAG TTA GGT ACA AAA G 851 TA CCA TTT TGT CCA ATG GTA GGA TCA GAG GTA TAT TCA TCA GAA GTT AAA 901 AAG ACA GAG ATA TTG ATG GAG AAT TTT AGA CGT TCA ATT GGA TTG AGA GT 951 T AAA GAG ATT AAA GAG GTT TAT GAG GGT GAA GTT ACA GAG ATA ACA CCA G 1001 AG GAA ACA GAT AAT CCA TTG GGT GGT TAT GGA AAG ACT ATA GCA CAT GTT 1051 GTA ATT GGA TTA AAG ACA ACC AAA GGT ACA AAA CAG TTG AAA TTG GAT CC 1101 A ACC ATC TAC GAA TCC ATT CAA AAG GAG AAG ATC ACA GTA GGA GAT GTA A 1151 TC TAC ATC GAG GCC AAC AGT GGA TCA GTA AAG AGA GTC GGT CGT TCA GAT 1201 TTC TAT GCG ACC GAG CAT GAT TTA GAG GCA GAG GAA TAC GTG CCA TTA CC 1251 A AAG GGT GAG GTA TTC AAA AAG AAA GAT ATC ATT CAG GAT GTA ACC CTC C 1301 AC GAT TTA GAT TTA GCA AAT GCA AAG CCA CAA GGT GGT CAG GAT ATC ATG 1351 TCG ATG ATG GGT CAA ATG ATG AAA CCC AAG AGA ACA GAG ATC ACA GAG AA 1401 A GTT CGT TTG GAA ATT AAT AAA ATT GTA AAT CGT TAC ATT GAG CAA GGT G 1451 AA GCA GAG TTG GTA CCA GGT GTT TTG TTC ATT GAT AAG GTT CAC ATG TTG 1501 GAT ATA GAA TGT TTT TCA TAC TTA AAT CGT GCA TTG GAG TCA ACA TTG GC 1551 A CCA ATT GTA GTT TTT GCA ACC AAT CGT GGC AAT TGT GTA ATC AAA GGC A 1601 CC GAT AAC GAT ATT CAA TGT CCA CAT GGC ATC CAT GTG GAT CTT TTA GAT 1651 AGA AAT ATG ATC ATT CGT ACC CTT CCA TAT AAT TAC AAT GAA ATC GTT CA 1701 A ATT CTC ACC ATT CGT GCC TCA ATT GAA AAT CAT AAA ATC GAT GCC GAA G 1751 CA TTG ATG TAT CAG CTG AAA TTG GTA ATA CAG ATT CAC TTC GTT ATG CAA 1801 TTC AAT AAT TAA* 1812 stop chrblob_3967.glm_1+2|24oct01 CACCAGCT TCAATCCTTT CAAAAACTTA TTCAAGACCA 1851 TCAATTACAA AAGAAGATAT TGAAGAAGTT ACATCATTAT TTAATGATGG 1901 TAAAACTTTT GCAAAATTAT TAGAACAAAA TTAATCAAAA TATTTATATT 1951 TAAAAAAAAT TAAAATTTAA ATTTAAAAAA AAAAAAAAAA TCTATTTTCT 2001 TGGTTTCATA TGAAATTCAT AAAAAAAACA ATTTTTATTT TTATTTTTAT 2051 TTTTTCATTT TTTTTTTTTT TTTTTTTTTT TTTTTAATTT TTTTTTTTTT 2101 TATTTTTTTT ATTTTTCATT TATTTATTGG GGTTTGGAAA AGAGAGAGAG 2151 ATAAAT start chrblob_3967.glm_3|24oct01 vbc exon 1 2157 ATG ACA CTT TCA AAA GTA TTT CAA TAT TTA GCA AGT TTA GAT TC 2201 A AAA GAT TTA GAA GAA TTA TAT AAA GAT CCA TGG ACA TGT CAA GCA ATT C 2251 TA AGA TCA TTA CCA CCA AGA TCA AAA CAA TAT ATA TTA AAG ATG TTA TTA 2301 GTT GAT ACT TAT CCT CTA AGT TTA GCA AAG GAT TGG TCA ACA CAA GCA TC 2351 A ATA CAA CAA CAT AAA GAA TCA TTA AAG AAA TTA TTT GAT TTA AAA ATT A 2401 TC TTT TTA GAT AAA ATT AAT AAA CCA ATT CAA CCA CAA CAA CAA CAA TCA 2451 TCA CAA CAA TCA TCA TCA CAA CAA CAA CAG CAA CAA CAA CAG CAA CAA CA 2501 A CAA ACT GAA CAA ACA ATT AGA TTA AAT CCA TTA TTT CAA GAT AAT ATA A 2551 AG AG intron GTCATT AGTTCAAGTG TAAATTTTAA TTATTATTTA TTATTTATTT 2601 TTTTATTTTT ATTATTATTT ACTAATTTTT TTATTTATTT TTTTATTTTT 2651 TTAAAG exon 2 2657 C AAT CAA GTA ATA TTT TCA AAT AAT AGT AGT ATA AAA GAT AAT C 2701 AT AAA CCA CCA AGT ATT GAT GAT TTA GAT TCA TAT TCA AAA TCA CAA TGG 2751 GAG AAA GTT TTA TAT TTT TTA TCG GAT GAT ACA GTT CAA CCA TCA AAG TT 2801 A ATA TCG GAA TTA TTG TTA TCA TCA AAT TTA ACG AAA CAA GAG GGT GAT G 2851 GA TTA TCA ATT ACA TCA GAG GGG TTT AAA TTT TTA TTA AAA GAT GTT TAT 2901 ACA CAA ATT TGG ACA TTG TTA ATT GTT TAT TTG GAT GAT TTG GAG AAA AA 2951 G AAA GGT AAA GGA AGC GGA TCG AGA AAT GAT TTG TTA AGT TTT TTA TTT A 3001 GG TTA TCA TTT TTG AAT TTG GGT AGA GGT TAT TTA GTT TCA GAA TTG TCT 3051 GAG CAG CAG AAA GAG TAT TTA TTC GCA TTG AAG CAG TTT GGC TTG ATT TA 3101 T ATG AGG ACT GAT AGC AGT ATA CTG TTT TAT CCA ACT CGG TTA ATC ATT T 3151 CA TTG ACC ACT GGT AAA ACG TTG TCG TTG ATA CAA AGT ATT TCG TCA GAG 3201 AGA ACT CAG ACT CAG AAG GAG CAG GGC TAT ATA GTG TTG GAG ACG AAT TA 3251 C AGA CTT TAC GCA TAC ACC TCT TCC TCT TTG CAA ATC TCG TTG TTG AGT T 3301 TG TTC GTC AAG ATG TTA TAT AGG TTA CCG AAT TTA GCG GTT GGT ATC ATT 3351 ACG AGG GAG AGT ATT AGA ACC GCT TTG ATT CAT GGT ATA ACT GCT GAC CA 3401 A ATC ATT GAC TTT GTT AGA CAT AAT AGT CAT CCA AAT GCT GCC AAC TCT G 3451 GT CAA CCA ATA CCA GAT GTC GTC GCT GAA CAA ATC TTA CTT TGG GAA GCT 3501 GAA AGA AAT CGT ATC ACT TAT ACT AAA TCT GTA CTC TAT AAT TCA TTT CC 3551 A ACA AAT GAT TGT TAT ATT GCA ACA TTA AAA TTT GCA AAA GAA CAA GAT T 3601 AT TAT ATT TGG TCT CAT GAT CCT TTA AAA ACT TTA GTT GTT AAA GAA GAA 3651 GGA AAT GAT CCC ATT AGA AAT TTT ATT AAA AAG AAT TTT GCT TGA* 3695 stop chrblob_3967.glm_3|24oct01 AAAAA 3701 AAAAAAAAAA AAAAAAATTA AACAAATAAA AAAAAAAGAT AATTATTATT 3751 ATTTTTATTT TGGTAATAAT ATATTACATT ATATATGGAT TTTATTTAAA 3801 TATTTTTTAA AATAATATAA AATAAAAGCA TCTAATCTAT TAGGATGATG 3851 TTTTTTTTTT TTTTTTTTTT GTATATATTA ATTATTAATT ATTAATTATT 3901 AATTATTAAT TATTAA "chrblob_3967.glm_4|24oct01" 3917 TTAT TGATCATAAC CAATGATTTG GGCAGTAGTT 3951 TTCTTTGGTG GTTGGGTAGT GTTTAAGAGT GGGTATTGTT TTGGGGTTGA 4001 AATTGTAGTT GGTTGTTGTT GTTGTTGCTG TTGTTTATAT GAATTAGTTT 4051 GTTCTTTTTT TAGTTGTTCA TACTCTTCAA TATCTTCCAT ATTTAATTCA 4101 ATTCTTGTTG GTTTTCTATT TATCAT 4126 "chrblob_3967.glm_4|24oct01" TTTT TTATTTTTTT ATTTATTTAT 4151 TTTTAATTAA TTAATCAATT AAATTTACAT ATAATTATTT TCACAGAACA 4201 AGTTCGATTA TTGGTGGAAA ACGTGAAAAA ATTTTAATAA AAAAAAAAAT 4251 AAAAATAATT ATTTTTTTAT TTTTTTTTTT ATTTTTTATC AATTTTTGTT 4301 TACCTCTCAT ATTACACAAT TCATTTTTTT TTTTTTAGGG GAAAGATATA 4351 TATGCACACT CACACACACA AAATAGAATT TTCTATTGGG TAAAAAAGGA 4401 AATTTGTAAA TTTAAAAATT TTTTACACTT TACAATTACT GAATATGCTT 4451 CAAAATAAAT GCAATAGGAA CTGTTTTGGG GTGAAGTAAA TTACAAAAAA 4501 AAAAATAAAA AATAAAAAAT AAAAAAACAG TTGAAAAATG GGTTAAATGG 4551 GGTTATACTC ACACAATGAT TTTTTGATTG TATAATATAT ATAATATATA 4601 TATTCAATTA TTTTTATTAC AATTATTATT TTTTATTATT TTTTTTTTTA 4651 TATTTTTTTT TATTTTTTTT TTTTTCGTAT AAAAAAATAG AATCAAAATT 4701 TTTTTTTATA ATAATTATCC CTTAAAATAA TAACAATAAA ATAGATTTTT 4751 ACATTTATTT TTATTTATTT CATATTTATT TTTGTTGGAA AAAAAAGAAA 4801 AAAAAGAAAA AAAGAAAAAA AAAAAAAAAA AAA // crick strand 4833 TTT TTTTTTTTTT TTTTTTCTTT TTTTCTTTTT 4800 TTTCTTTTTT TTCCAACAAA AATAAATATG AAATAAATAA AAATAAATGT 4750 AAAAATCTAT TTTATTGTTA TTATTTTAAG GGATAATTAT TATAAAAAAA 4700 AATTTTGATT CTATTTTTTT ATACGAAAAA AAAAAAAATA AAAAAAAATA 4650 TAAAAAAAAA AATAATAAAA AATAATAATT GTAATAAAAA TAATTGAATA 4600 TATATATTAT ATATATTATA CAATCAAAAA ATCATTGTGT GAGTATAACC 4550 CCATTTAACC CATTTTTCAA CTGTTTTTTT ATTTTTTATT TTTTATTTTT 4500 TTTTTTGTAA TTTACTTCAC CCCAAAACAG TTCCTATTGC ATTTATTTTG 4450 AAGCATATTC AGTAATTGTA AAGTGTAAAA AATTTTTAAA TTTACAAATT 4400 TCCTTTTTTA CCCAATAGAA AATTCTATTT TGTGTGTGTG AGTGTGCATA 4350 TATATCTTTC CCCTAAAAAA AAAAAAATGA ATTGTGTAAT ATGAGAGGTA 4300 AACAAAAATT GATAAAAAAT AAAAAAAAAA ATAAAAAAAT AATTATTTTT 4250 ATTTTTTTTT TTATTAAAAT TTTTTCACGT TTTCCACCAA TAATCGAACT 4200 TGTTCTGTGA AAATAATTAT ATGTAAATTT AATTGATTAA TTAATTAAAA 4150 ATAAATAAAT AAAAAAATAA AAAA start chrblob_3967.glm_4|24oct01 glm exon 1 4126 ATG ATA AAT AGA AAA CCA ACA AGA AT 4100 T GAA TTA AAT ATG GAA GAT ATT GAA GAG TAT GAA CAA CTA AAA AAA GAA C 4050 AA ACT AAT TCA TAT AAA CAA CAG CAA CAA CAA CAA CAA CCA ACT ACA ATT 4000 TCA ACC CCA AAA CAA TAC CCA CTC TTA AAC ACT ACC CAA CCA CCA AAG AA 3950 A ACT ACT GCC CAA ATC ATT GGT TAT GAT CAA TAA* 3917 stop chrblob_3967.glm_4|24oct01 TTAATA ATTAATAATT 3900 AATAATTAAT AATTAATAAT TAATATATAC AAAAAAAAAA AAAAAAAAAA 3850 CATCATCCTA ATAGATTAGA TGCTTTTATT TTATATTATT TTAAAAAATA 3800 TTTAAATAAA ATCCATATAT AATGTAATAT ATTATTACCA AAATAAAAAT 3750 AATAATAATT ATCTTTTTTT TTTATTTGTT TAATTTTTTT TTTTTTTTTT 3700 TTTTT "chrblob_3967.glm_3|24oct01" 3695 TCAAG CAAAATTCTT TTTAATAAAA TTTCTAATGG GATCATTTCC 3650 TTCTTCTTTA ACAACTAAAG TTTTTAAAGG ATCATGAGAC CAAATATAAT 3600 AATCTTGTTC TTTTGCAAAT TTTAATGTTG CAATATAACA ATCATTTGTT 3550 GGAAATGAAT TATAGAGTAC AGATTTAGTA TAAGTGATAC GATTTCTTTC 3500 AGCTTCCCAA AGTAAGATTT GTTCAGCGAC GACATCTGGT ATTGGTTGAC 3450 CAGAGTTGGC AGCATTTGGA TGACTATTAT GTCTAACAAA GTCAATGATT 3400 TGGTCAGCAG TTATACCATG AATCAAAGCG GTTCTAATAC TCTCCCTCGT 3350 AATGATACCA ACCGCTAAAT TCGGTAACCT ATATAACATC TTGACGAACA 3300 AACTCAACAA CGAGATTTGC AAAGAGGAAG AGGTGTATGC GTAAAGTCTG 3250 TAATTCGTCT CCAACACTAT ATAGCCCTGC TCCTTCTGAG TCTGAGTTCT 3200 CTCTGACGAA ATACTTTGTA TCAACGACAA CGTTTTACCA GTGGTCAATG 3150 AAATGATTAA CCGAGTTGGA TAAAACAGTA TACTGCTATC AGTCCTCATA 3100 TAAATCAAGC CAAACTGCTT CAATGCGAAT AAATACTCTT TCTGCTGCTC 3050 AGACAATTCT GAAACTAAAT AACCTCTACC CAAATTCAAA AATGATAACC 3000 TAAATAAAAA ACTTAACAAA TCATTTCTCG ATCCGCTTCC TTTACCTTTC 2950 TTTTTCTCCA AATCATCCAA ATAAACAATT AACAATGTCC AAATTTGTGT 2900 ATAAACATCT TTTAATAAAA ATTTAAACCC CTCTGATGTA ATTGATAATC 2850 CATCACCCTC TTGTTTCGTT AAATTTGATG ATAACAATAA TTCCGATATT 2800 AACTTTGATG GTTGAACTGT ATCATCCGAT AAAAAATATA AAACTTTCTC 2750 CCATTGTGAT TTTGAATATG AATCTAAATC ATCAATACTT GGTGGTTTAT 2700 GATTATCTTT TATACTACTA TTATTTGAAA ATATTACTTG ATTGCTTTAA 2650 AAAAATAAAA AAATAAATAA AAAAATTAGT AAATAATAAT AAAAATAAAA 2600 AAATAAATAA TAAATAATAA TTAAAATTTA CACTTGAACT AATGACCTCT 2550 TTATATTATC TTGAAATAAT GGATTTAATC TAATTGTTTG TTCAGTTTGT 2500 TGTTGTTGCT GTTGTTGTTG CTGTTGTTGT TGTGATGATG ATTGTTGTGA 2450 TGATTGTTGT TGTTGTGGTT GAATTGGTTT ATTAATTTTA TCTAAAAAGA 2400 TAATTTTTAA ATCAAATAAT TTCTTTAATG ATTCTTTATG TTGTTGTATT 2350 GATGCTTGTG TTGACCAATC CTTTGCTAAA CTTAGAGGAT AAGTATCAAC 2300 TAATAACATC TTTAATATAT ATTGTTTTGA TCTTGGTGGT AATGATCTTA 2250 GAATTGCTTG ACATGTCCAT GGATCTTTAT ATAATTCTTC TAAATCTTTT 2200 GAATCTAAAC TTGCTAAATA TTGAAATACT TTTGAAAGTG TCAT 2157 "chrblob_3967.glm_3|24oct01" ATTTAT 2150 CTCTCTCTCT TTTCCAAACC CCAATAAATA AATGAAAAAT AAAAAAAATA 2100 AAAAAAAAAA AAATTAAAAA AAAAAAAAAA AAAAAAAAAA AAATGAAAAA 2050 ATAAAAATAA AAATAAAAAT TGTTTTTTTT ATGAATTTCA TATGAAACCA 2000 AGAAAATAGA TTTTTTTTTT TTTTTTAAAT TTAAATTTTA ATTTTTTTTA 1950 AATATAAATA TTTTGATTAA TTTTGTTCTA ATAATTTTGC AAAAGTTTTA 1900 CCATCATTAA ATAATGATGT AACTTCTTCA ATATCTTCTT TTGTAATTGA 1850 TGGTCTTGAA TAAGTTTTTG AAAGGATTGA AGCTGGTG "chrblob_3967.glm_2|24oct01" 1812 TT AATTATTGAA 1800 TTGCATAACG AAGTGAATCT GTATTACCAA TTTCAGCTGA TACATCAATG 1750 CTTCGGCATC GATTTTATGA TTTTCAATTG AGGCACGAAT GGTGAGAATT 1700 TGAACGATTT CATTGTAATT ATATGGAAGG GTACGAATGA TCATATTTCT 1650 ATCTAAAAGA TCCACATGGA TGCCATGTGG ACATTGAATA TCGTTATCGG 1600 TGCCTTTGAT TACACAATTG CCACGATTGG TTGCAAAAAC TACAATTGGT 1550 GCCAATGTTG ACTCCAATGC ACGATTTAAG TATGAAAAAC ATTCTATATC 1500 CAACATGTGA ACCTTATCAA TGAACAAAAC ACCTGGTACC AACTCTGCTT 1450 CACCTTGCTC AATGTAACGA TTTACAATTT TATTAATTTC CAAACGAACT 1400 TTCTCTGTGA TCTCTGTTCT CTTGGGTTTC ATCATTTGAC CCATCATCGA 1350 CATGATATCC TGACCACCTT GTGGCTTTGC ATTTGCTAAA TCTAAATCGT 1300 GGAGGGTTAC ATCCTGAATG ATATCTTTCT TTTTGAATAC CTCACCCTTT 1250 GGTAATGGCA CGTATTCCTC TGCCTCTAAA TCATGCTCGG TCGCATAGAA 1200 ATCTGAACGA CCGACTCTCT TTACTGATCC ACTGTTGGCC TCGATGTAGA 1150 TTACATCTCC TACTGTGATC TTCTCCTTTT GAATGGATTC GTAGATGGTT 1100 GGATCCAATT TCAACTGTTT TGTACCTTTG GTTGTCTTTA ATCCAATTAC 1050 AACATGTGCT ATAGTCTTTC CATAACCACC CAATGGATTA TCTGTTTCCT 1000 CTGGTGTTAT CTCTGTAACT TCACCCTCAT AAACCTCTTT AATCTCTTTA 950 ACTCTCAATC CAATTGAACG TCTAAAATTC TCCATCAATA TCTCTGTCTT 900 TTTAACTTCT GATGAATATA CCTCTGATCC TACCATTGGA CAAAATGGTA 850 CTTTTGTACC TAACTCTTGT GAAATTGCTA ATGCTAATGC TGTTTTACCT 800 GTACCTGGTG GTCCTGCTAA TAATAATGCT TTACCTGCCA T 760 "chrblob_3967.glm_2|24oct01" TTTTTTTGA 750 TTTAATTAAT TCTGTAACAA TACCTGCTGC CTTTTTTTTT "chrblob_3967.glm_1|24oct01" 710 TTAAAAAAAA 700 AAATAAAAAA ATAAAATAAA TAAATGAAAA TTAATTTTTA AATTTAAATA 650 TTTAATTAAA AAATAAATAA AAAAAATAAA AAAAAAAATA AAAAAAAAAA 600 AAAGACTTAC TTCTCTTGCT TTACATTGGC CTACTAAACC ATCTGCAATA 550 TTTGAAGCTG TACCATTTTC TAATAAACCT AAACCTTTAA TATGACTATG 500 TGTTGCAACT CTTTGTGATT TAACTGATTT AATTTCTTCT ATTCTAGTGG 450 TTGGTGTGGT TTCTGTTACT GTGGTTGAAA GTTGTGGTTG TGGTGGTTGT 400 TGAGTTTGTT GTGGTGGTGT TGTGGCTGTA GTTGTAGTAG TTGCGGTGGT 350 GGTGGTGGTA GATGATGGTG TCTCATTCAT TGGTGTTTCT GTAATTTTAG 300 TTGATGGATT TGAATCACCC ATAACTGTAT CTGTATTATT TTCTGACAT 252 "chrblob_3967.glm_1|24oct01" T 250 TTATTTAAAT GTATATATAT AGGTGTGTTT TTTTTTATTT GTTTTTTCCA 200 AACCAACGAA TTCGAAAAAA ATAAAAATAA AAAAAAAACT GGCAGTTTTT 150 CAAAAATTTT TTGAAAAATA AAAAAAAAAA AAAATAAAAA ATAAAATAAA 100 AATAAAAATA AAATAAAAAA AATGGAAATG AAAAAATAAA TTAATAGATT 50 TATTTGTTGA TATAAATATA AAAAAAGTGT AAATAATTAT TATTTATGAA end of file 3968 12 copy in 13 3969 4 3970 4 3971 4 3972 7 3976 4 3977 2 telomere 3978 11 3979 4 3980 9 3981 9 3982 4 3983 7 3985 14 3987 3, 4, 14 3988 10 3989 4 3990 8 3992 3 Date: Friday, 3/22/2002 Time: 09:05 c3993.txt chrblob_3994|2001.10.15|GENOMIC|Sanger FEATURES Location CDS 1383..2135 /gene="chrblob_3994.glm_1|24oct01" /note="(protein coding) No NR protein Similarities" /codon_start=1 ORIGIN watson strand 1 CTAAAAAAAA ATTAAATTAA TAAAAAAAAT ATTGTTTCCA TGTAAACATA 51 TATTTTAATT ATTGAATAAT AATATATACG ATATATTTCC TTCTTATTAT 101 ATAAAATATA TACTTGGAAT TTTAAATAAT ACACAAGAAA TATAAAAAAG 151 GAAAAAAATA TAAAATTTAC TATTATATGT AAAAGTTGGT AAATCATAAA 201 ATATATCTAT ATATAACCAC ATAGGAATAA ATTAATAATA ATAATAATAA 251 TAATAATTTT TTTGTTTTGC ATTTTTGACT ACAAATATAA TTTAAGCTTG 301 AGAAAAATGT AGTTCCATTT TTATTATGTT TTTTTATATA TTTATACTTA 351 TAGATATAGA TAAACCTAAT ATTAAATTGC TTAAATGATG TTATAAAAAA 401 TTATGCACAT ATAATAATAT AATAGGATAT AATATTAAAT GCTTATAACA 451 TATTTTTACC TACTCATTAA ATTTATAGTG AATTTTATAC ACCTTAAAAC 501 TATATTCTAT TAATAAAATA TTATAATAAT ATTTTATAAG AACTATATAA 551 ATTCCCATAT ATCTATACAT ATATGTATGT ATATATATAT ATATATATAT 601 ATATATATAT TTATGGGAAT TTATATAGAT ATAGATTCCT ACAATACTTA 651 TATATTAATT TTGTTTCCAA CTAAGTTAAA AAAATGAATT AACATATTAT 701 CTTTATGTAA AATATAAAGT ATTCATATAT AAGATTAAAA ATATTTATTT 751 AATTTTTTGG GTTGGAATAT TATTAAAGTA ATAGGTATAA TAATTTCTTT 801 AAAATTATCA AAAGGAAAAA ATAAAAAACC ACAGGATAAC GAATTTTTGT 851 TAACACATCA TAAAAAAAAT AAATTTATAT TATCTACAAA AATAATAAAA 901 AAAAAAAATT AATATTTTGT ATATATATAA TTATATATAT ATATATATAT 951 ATATATTTAT TTATTTATAT TTTAAATTTC GTTATATTTA TGTATTAGAA 1001 TTATATATAT ATATAGTAAA TATTTTAAAT TATATATATT CATTTTATTA 1051 TA start chrblob_3994.glm_1|24oct01 vbc stevor exon 1 1053 ATG ATG AGA ATT TTA TAT ACC AAC GTA TTT CTA TTT ATT GCT GTA CTC pfc45 tta tca cat tat 1101 TTT TGC ATT CTA TCA CCT GGA AAT intron GTAAGA TTAGTTATAC ATATGTTCAA 1151 TATATATATG TATAATATAT ATATATATAT ATAGGGTCAT TCAGATATAA 1201 CTTTATGAAT TTAATTATTA TATAAATATA AATAATAATT TCTCATATGT 1251 AATGTTCCTT TTAATTATAT TTTATATTTA TAAACTTTTT ATTTTTAG exon 2 AA 1301 C CCA CTC CAT AAA TAT GTT GAA ATA AAA GAA GGA ATA AAT AAT TTA TCT A 1351 TT CAT GCA CAT TTA AGG CTA TTA ACA GAA ATA ATG GAA AAT TGT TCT TTA 1401 AAT GGA TTC AGA TTA AAT GAC AAA AAT GGA GAA CAT GAT GAA GAA GAA GA 1451 A CGT AAA TGT GAT GAT GAT CAA CAT AGT GAA AAC CAA GAA CAT GAA TGT G 1501 AT AAT GAT CAA CAT AGT GAA AAC CAA GAA CAT GAA TGT GAT AAT GAA CAA 1551 AAT GAT GAA TCT AAA TGT GAA GAG TCA AAT AAT ACT GAT CAA GCT GAT GT 1601 C AAT TAT CTA TCG ATG CCT ATA CAA ATA CCT TAC TTA AGA AAT GAA ATT A 1651 TG GAT GAT AAT TAT TAT AGT CGT TAT TTT GAT AGT AAT ATT ATG AGA ACA 1701 GAT GAA GTA ACT ACT CGA TTA AAT GAT CAA AAC TTA ATA GAA AAA TGT TT 1751 A TGT AAA TTA AAA GCA GGT AAA TAT ATA AAC GAG GCA AAA ATA AAA TAT G 1801 CA CAT GAA ATA ATA GAT TCC ATG AAA CTT ACA GAT AAA GTA AAA GAT ATA 1851 TTT AAA GAA TTC ATG CGT TAT TAT ATA TGG AAA AGA TAC CCA AGT CAT CA 1901 A CTT AGG TTA TAT AAG AAA ATT AAA AAG GAT ATC GAA AAA TAC ACA AGG A 1951 AT CAT GTT ATT TGT TCT CTT ATA GAT TTT GAA ACT ATA GAA GAT GAA CTA 2001 TAT TAT TTA ATA TAC CCT AAT AGA GAA ATG TAC ATG TCT TTT GAT ACA GC 2051 A GTG AAT ACT AAA AGA AGA AAA AAA ATT AAA AAA CTA ATG AGA GAA AAA G 2101 CA AGG AAA GAT AAA GAA AAA AAT GGA TAT ATT TAG* 2135 stop chrblob_3994.glm_1|24oct01 TATAA GAAATAAAAA 2151 TAAATTAAAA GTAAAAATAA AAGAAAATTT AAAAAAAAAA AAAAAAAAAA 2201 AAAATCAATA TAAAGAAAAC AAAATAATAC ACATAAAAAG AAATAAAATA 2251 TGTAACATAT ATATATATAT ATATATATAT ATATATATAT ATATACATAT 2301 ATATTATTAA ATAATTTTTA ATTTTAAACT TTTTTTTCTT TTCAATTAA // crick strand 2349 TTAATTGAA AAGAAAAAAA AGTTTAAAAT TAAAAATTAT TTAATAATAT 2300 ATATGTATAT ATATATATAT ATATATATAT ATATATATAT ATATGTTACA 2250 TATTTTATTT CTTTTTATGT GTATTATTTT GTTTTCTTTA TATTGATTTT 2200 TTTTTTTTTT TTTTTTTTTT AAATTTTCTT TTATTTTTAC TTTTAATTTA 2150 TTTTTATTTC TTATA "chrblob_3994.glm_1|24oct01" 2135 CTAAA TATATCCATT TTTTTCTTTA TCTTTCCTTG 2100 CTTTTTCTCT CATTAGTTTT TTAATTTTTT TTCTTCTTTT AGTATTCACT 2050 GCTGTATCAA AAGACATGTA CATTTCTCTA TTAGGGTATA TTAAATAATA 2000 TAGTTCATCT TCTATAGTTT CAAAATCTAT AAGAGAACAA ATAACATGAT 1950 TCCTTGTGTA TTTTTCGATA TCCTTTTTAA TTTTCTTATA TAACCTAAGT 1900 TGATGACTTG GGTATCTTTT CCATATATAA TAACGCATGA ATTCTTTAAA 1850 TATATCTTTT ACTTTATCTG TAAGTTTCAT GGAATCTATT ATTTCATGTG 1800 CATATTTTAT TTTTGCCTCG TTTATATATT TACCTGCTTT TAATTTACAT 1750 AAACATTTTT CTATTAAGTT TTGATCATTT AATCGAGTAG TTACTTCATC 1700 TGTTCTCATA ATATTACTAT CAAAATAACG ACTATAATAA TTATCATCCA 1650 TAATTTCATT TCTTAAGTAA GGTATTTGTA TAGGCATCGA TAGATAATTG 1600 ACATCAGCTT GATCAGTATT ATTTGACTCT TCACATTTAG ATTCATCATT 1550 TTGTTCATTA TCACATTCAT GTTCTTGGTT TTCACTATGT TGATCATTAT 1500 CACATTCATG TTCTTGGTTT TCACTATGTT GATCATCATC ACATTTACGT 1450 TCTTCTTCTT CATCATGTTC TCCATTTTTG TCATTTAATC TGAATCCATT 1400 TAAAGAACAA TTTTCCAT 1383 "chrblob_3994.glm_1|24oct01" TA TTTCTGTTAA TAGCCTTAAA TGTGCATGAA 1350 TAGATAAATT ATTTATTCCT TCTTTTATTT CAACATATTT ATGGAGTGGG 1300 TTCTAAAAAT AAAAAGTTTA TAAATATAAA ATATAATTAA AAGGAACATT 1250 ACATATGAGA AATTATTATT TATATTTATA TAATAATTAA ATTCATAAAG 1200 TTATATCTGA ATGACCCTAT ATATATATAT ATATATTATA CATATATATA 1150 TTGAACATAT GTATAACTAA TCTTACATTT CCAGGTGATA GAATGCAAAA 1100 GAGTACAGCA ATAAATAGAA ATACGTTGGT ATATAAAATT CTCATCATTA 1050 TAATAAAATG AATATATATA ATTTAAAATA TTTACTATAT ATATATATAA 1000 TTCTAATACA TAAATATAAC GAAATTTAAA ATATAAATAA ATAAATATAT 950 ATATATATAT ATATATATAA TTATATATAT ACAAAATATT AATTTTTTTT 900 TTTTATTATT TTTGTAGATA ATATAAATTT ATTTTTTTTA TGATGTGTTA 850 ACAAAAATTC GTTATCCTGT GGTTTTTTAT TTTTTCCTTT TGATAATTTT 800 AAAGAAATTA TTATACCTAT TACTTTAATA ATATTCCAAC CCAAAAAATT 750 AAATAAATAT TTTTAATCTT ATATATGAAT ACTTTATATT TTACATAAAG 700 ATAATATGTT AATTCATTTT TTTAACTTAG TTGGAAACAA AATTAATATA 650 TAAGTATTGT AGGAATCTAT ATCTATATAA ATTCCCATAA ATATATATAT 600 ATATATATAT ATATATATAT ACATACATAT ATGTATAGAT ATATGGGAAT 550 TTATATAGTT CTTATAAAAT ATTATTATAA TATTTTATTA ATAGAATATA 500 GTTTTAAGGT GTATAAAATT CACTATAAAT TTAATGAGTA GGTAAAAATA 450 TGTTATAAGC ATTTAATATT ATATCCTATT ATATTATTAT ATGTGCATAA 400 TTTTTTATAA CATCATTTAA GCAATTTAAT ATTAGGTTTA TCTATATCTA 350 TAAGTATAAA TATATAAAAA AACATAATAA AAATGGAACT ACATTTTTCT 300 CAAGCTTAAA TTATATTTGT AGTCAAAAAT GCAAAACAAA AAAATTATTA 250 TTATTATTAT TATTATTAAT TTATTCCTAT GTGGTTATAT ATAGATATAT 200 TTTATGATTT ACCAACTTTT ACATATAATA GTAAATTTTA TATTTTTTTC 150 CTTTTTTATA TTTCTTGTGT ATTATTTAAA ATTCCAAGTA TATATTTTAT 100 ATAATAAGAA GGAAATATAT CGTATATATT ATTATTCAAT AATTAAAATA 50 TATGTTTACA TGGAAACAAT ATTTTTTTTA TTAATTTAAT TTTTTTTTAG end of file 3995 9 3996 4 3997 9 3998 9 3999 4 4000 4 4001 10 4002 10 centromere 4003 4 4004 10 telomere 4005 4 4006 1 telomere 4007 9 4008 9 4009 8 4011 3 4012 4 4013 4 4015 4 4016 4 4017 9 4018 5 4019 4 4020 9 4023 3 4024 5 4025 4 Date: Saturday, 3/23/2002 Time: 23:18 c4027.txt chrblob_4027|2001.10.15|GENOMIC|Sanger FEATURES Location CDS 103..2019 /gene="chrblob_4027.gen_1|24oct01" /note="(protein coding) 23% identity to (AL034559) hypothetical protein, PFC0960c [Plasmodium falciparum]" /codon_start=1 ORIGIN watson strand i n t r o n continued 1 GGGCCTTAG start chrblob_4027.gen_1|24oct01 vbc note partial gene (exon 2) ... GGG AAA AAA CCC GTT TGG GTG GAG AAC CCC TTC GTT AAT AT 51 T TTC CGT GTT ACC TTT ATC AGA AAG GAA GTG CAA TCT TTG GAA GAC AGT C 101 AT >ATG CCC ATT GGA CAT TTA GAT GCC GTA ACA AAT GAA ACA CGT ATT TCT 151 AAA ACA CAT AAA CCA TCT GAA TCC TTT TTT CAT TTA TTC AGT AAT CCT CA 201 A TAT GAT GAT ATT GTT TTC AGT ACA ACC AAA GAG AAC AAT TTT TCA TTC A 251 GT TTA GGG GCT ATC GAT ATG AAT AAT TTC GTC CAA AAG AAT AAG AAA TCG 301 TCC ATA TAT GAT GTT ATT CAT GAA AAT GTC TAT TAT AGT ACA GAT ACT AA 351 A TAT TTG TGT AGT TAT TCT AAA GAA AAA AGT GAA CTA TTA TGT ATT TCT C 401 CA CAA ATA TTA TCC CAT TTT AAT ATA TTT AAT GGT GAA TAT GTT GCC TAT 451 TCC TCT TAT CCT AAT ACA AAA GAT GAA AAA AGT CTT CTA TGC TTA TTA AG 501 T ATA AAA TCA TTT TTT CAA TGT AAT CCC AAA ATA GAA ATA TAT AGT TTC C 551 CT GGA GAA GTT AAT TAT TTT AAA TTA TTT CCA TCC ATT CAA AGT GAT AAT 601 TAT AAT AAT AAT AAT TAT TCT CTA CAC CCA ACT TCT GAT GAT TAT TCT TT 651 T TAT CAT AAT AAT GAA ATT GAC AAG ATT TTT ATA TGT GGG TCA TAT CCA T 701 GT TTC AGT TTT AGT ACC TTA AAA AAT AAC GTT ACA TAT TGT ATA TGG GAT 751 AGT AAG AAA TTA AAA GTG CAA GAT TTA CTG TCA ATG AAC GAA GAT TTA AC 801 A TCA TAT ATT GAA AAT ATT ATT AAC GGA AAA CAA TTT AAT GTA TAC CAA C 851 AA TTT GAA AAT AAT TCT CAA AAG AAA TTA AGG TTA TTT TCT TCG AAA AAA 901 AGG AAA AAA AAA ATA TCC AAA GAA CAA AAT AAA AAT CAA CAC GAA ACA TT 951 C ACA GAT GAA TTA TAT GAA AAT AAT ACC AAA ATG AAT AAT GAT AAT AAA A 1001 TA AAA TTT TGT AAA AAA GAG TCA TAT AAT GAA AGC GAT TTA TAC AAA GGT 1051 AAT TCT GAA CAT TTT AAA AAT GTT CAT GGT ACT TTT AAC AAC AAA AAA AC 1101 A CAT GAT TAT TCA TAC CGT CAT TTT GAT AAT AAT AAT AAT AAT AAT AAT A 1151 AT TAC AAT CCA AAG AAA TCA CCA AAT TCA GCA AAT TCG ATT GAA AAA ATT 1201 AAA AAT AAA TGT TAT TTT TCA TAT AAT CAT TCT TCA CAA AGT TCA CTC AA 1251 G TAC AAT TAT AAT GAC AAT AAA AAA AAA GGA ATA TGT TGT GAA AAT ATA A 1301 AA AAA TCA GAT AAC AAT ATT TTT TTA TGT TGT AAT ACA GAA TAT TTA TAT 1351 TTA TGT GAT TTA CGT TGT AAT TTG TTA AAT ACA ATA TCA AAG TTA AAG CC 1401 A AAT GAA GGC TAT GTC AAT AAA ATT TAT TCA TTA AAT AAT AAT GTA CAA T 1451 AT GTT TCA TCT AAA ACA AAT AAT CAT ATA GGA TTG TAT GAT ATG CGA TAT 1501 ATA AAT TAC AAA CAT AAT GAT GAA ACA AAA AGT AAT TTA ATA GTC TCT TA 1551 T GAA AGA TTC ATA GAT AAT GAT AAT CTT AAA AAA CAT CTT AAT GAT TTT T 1601 AT GTT ATA GAT AAT GAA CAA TAT ATT GTT TCC CTA GAC ACG TAT ACA AGT 1651 TCT GTA TAT ATA TAT GAT ATA ATG GGT ACT ACA ACT AAA ATT ATA AAT TT 1701 G GAT GGA AAT TCT GAA TAT TCA AAA AAT AAT GTT TTA CAT TGT TAT ACA A 1751 AC TTA TCT AAA ATA CCA TAT ATA TAC TCA TGT AGA AAA TAC GAT GAT TAT 1801 TAT TAT AAT TAT TAT AAA CAA AAA ATT TAT GAA ACC AAA GCT ACT GAT AG 1851 T AAA TAT GTA AAT CAT TTT AAT CCA ATG AAA TCA TAT CCT AAA AAG GAC T 1901 TA TTT ATA GGA TTA AAT GTT CAA TCC ATT TTA CCT CTT TTT TAT ATA AAA 1951 CAA AAA TAT AAT AAA CAT AAT TTC ATT TCT ATA AAT GAA GGA GGC TTT AT 2001 T TGT ACA ATA AAT ATA TAA* 2019 stop chrblob_4027.gen_1|24oct01 A CATTCCTTTA TTGAAAATTT TAATATATTA 2051 TAATATATAT TTCTTTATTT TAATATTTTA TAATTTACTT ATTTTATTTT 2101 TTTCTTTTTT TTTTTCGTTT ATAAAAAAAT ATATTTGAAA GAAAATAATA 2151 AATTGAATTT TTTTTCTTTA TTTTTAAAAA GAATAAAATA TTTTATGTTT 2201 TTAATTCATA CATATATATA TATTATATAT ATATAAAATA TATTTTTTTT 2251 TTTTATAATA TATATATATA TAATATATAT GTATATCTTT TTTTTTTTAA 2301 GGTAAATAAA TTTTATATAT ATATATTTTT TATATACAAA TTTCATATAT 2351 GTCATATAGT TTCCTTTAAT TAACATATTT TTTTTATAAA GTTCATTATT 2401 TTATTTTTAT TTTTTTAAGT AATTTGTGAA TAAACATATA TTTGAAAAAC 2451 CAAATTCACG CATAAAATAC TTTATTATTT TTAAAAAGAT TATATTCTAT 2501 AATTGTTTTT TTTTTTTTTT TTTTTTTTCT TCTGGGGCCG TGAAATATTT 2551 TCTTTCCTTT TAAAGTACCA AAACAAAAAG GAAAAAAACC TATTTTTTTT 2601 TACACCAAAT TTAATATTTA CTAAAAAGCA ATTTGCATGA ATAAAAAATA 2651 TTTTTACAGG GATAATTTGC TCTTTTTAAA TTCAATAGGG GTATAAAGGG 2701 TAGTAAATTT CTCAAATGGA ATATCGAGGG TGTTTCACAA CAGGATGA // crick strand 2748 TCATCCTG TTGTGAAACA CCCTCGATAT TCCATTTGAG AAATTTACTA 2700 CCCTTTATAC CCCTATTGAA TTTAAAAAGA GCAAATTATC CCTGTAAAAA 2650 TATTTTTTAT TCATGCAAAT TGCTTTTTAG TAAATATTAA ATTTGGTGTA 2600 AAAAAAAATA GGTTTTTTTC CTTTTTGTTT TGGTACTTTA AAAGGAAAGA 2550 AAATATTTCA CGGCCCCAGA AGAAAAAAAA AAAAAAAAAA AAAAACAATT 2500 ATAGAATATA ATCTTTTTAA AAATAATAAA GTATTTTATG CGTGAATTTG 2450 GTTTTTCAAA TATATGTTTA TTCACAAATT ACTTAAAAAA ATAAAAATAA 2400 AATAATGAAC TTTATAAAAA AAATATGTTA ATTAAAGGAA ACTATATGAC 2350 ATATATGAAA TTTGTATATA AAAAATATAT ATATATAAAA TTTATTTACC 2300 TTAAAAAAAA AAAGATATAC ATATATATTA TATATATATA TATTATAAAA 2250 AAAAAAAATA TATTTTATAT ATATATAATA TATATATATG TATGAATTAA 2200 AAACATAAAA TATTTTATTC TTTTTAAAAA TAAAGAAAAA AAATTCAATT 2150 TATTATTTTC TTTCAAATAT ATTTTTTTAT AAACGAAAAA AAAAAAGAAA 2100 AAAATAAAAT AAGTAAATTA TAAAATATTA AAATAAAGAA ATATATATTA 2050 TAATATATTA AAATTTTCAA TAAAGGAATG T "chrblob_4027.gen_1|24oct01" 2019 TTATATATT TATTGTACAA 2000 ATAAAGCCTC CTTCATTTAT AGAAATGAAA TTATGTTTAT TATATTTTTG 1950 TTTTATATAA AAAAGAGGTA AAATGGATTG AACATTTAAT CCTATAAATA 1900 AGTCCTTTTT AGGATATGAT TTCATTGGAT TAAAATGATT TACATATTTA 1850 CTATCAGTAG CTTTGGTTTC ATAAATTTTT TGTTTATAAT AATTATAATA 1800 ATAATCATCG TATTTTCTAC ATGAGTATAT ATATGGTATT TTAGATAAGT 1750 TTGTATAACA ATGTAAAACA TTATTTTTTG AATATTCAGA ATTTCCATCC 1700 AAATTTATAA TTTTAGTTGT AGTACCCATT ATATCATATA TATATACAGA 1650 ACTTGTATAC GTGTCTAGGG AAACAATATA TTGTTCATTA TCTATAACAT 1600 AAAAATCATT AAGATGTTTT TTAAGATTAT CATTATCTAT GAATCTTTCA 1550 TAAGAGACTA TTAAATTACT TTTTGTTTCA TCATTATGTT TGTAATTTAT 1500 ATATCGCATA TCATACAATC CTATATGATT ATTTGTTTTA GATGAAACAT 1450 ATTGTACATT ATTATTTAAT GAATAAATTT TATTGACATA GCCTTCATTT 1400 GGCTTTAACT TTGATATTGT ATTTAACAAA TTACAACGTA AATCACATAA 1350 ATATAAATAT TCTGTATTAC AACATAAAAA AATATTGTTA TCTGATTTTT 1300 TTATATTTTC ACAACATATT CCTTTTTTTT TATTGTCATT ATAATTGTAC 1250 TTGAGTGAAC TTTGTGAAGA ATGATTATAT GAAAAATAAC ATTTATTTTT 1200 AATTTTTTCA ATCGAATTTG CTGAATTTGG TGATTTCTTT GGATTGTAAT 1150 TATTATTATT ATTATTATTA TTATCAAAAT GACGGTATGA ATAATCATGT 1100 GTTTTTTTGT TGTTAAAAGT ACCATGAACA TTTTTAAAAT GTTCAGAATT 1050 ACCTTTGTAT AAATCGCTTT CATTATATGA CTCTTTTTTA CAAAATTTTA 1000 TTTTATTATC ATTATTCATT TTGGTATTAT TTTCATATAA TTCATCTGTG 950 AATGTTTCGT GTTGATTTTT ATTTTGTTCT TTGGATATTT TTTTTTTCCT 900 TTTTTTCGAA GAAAATAACC TTAATTTCTT TTGAGAATTA TTTTCAAATT 850 GTTGGTATAC ATTAAATTGT TTTCCGTTAA TAATATTTTC AATATATGAT 800 GTTAAATCTT CGTTCATTGA CAGTAAATCT TGCACTTTTA ATTTCTTACT 750 ATCCCATATA CAATATGTAA CGTTATTTTT TAAGGTACTA AAACTGAAAC 700 ATGGATATGA CCCACATATA AAAATCTTGT CAATTTCATT ATTATGATAA 650 AAAGAATAAT CATCAGAAGT TGGGTGTAGA GAATAATTAT TATTATTATA 600 ATTATCACTT TGAATGGATG GAAATAATTT AAAATAATTA ACTTCTCCAG 550 GGAAACTATA TATTTCTATT TTGGGATTAC ATTGAAAAAA TGATTTTATA 500 CTTAATAAGC ATAGAAGACT TTTTTCATCT TTTGTATTAG GATAAGAGGA 450 ATAGGCAACA TATTCACCAT TAAATATATT AAAATGGGAT AATATTTGTG 400 GAGAAATACA TAATAGTTCA CTTTTTTCTT TAGAATAACT ACACAAATAT 350 TTAGTATCTG TACTATAATA GACATTTTCA TGAATAACAT CATATATGGA 300 CGATTTCTTA TTCTTTTGGA CGAAATTATT CATATCGATA GCCCCTAAAC 250 TGAATGAAAA ATTGTTCTCT TTGGTTGTAC TGAAAACAAT ATCATCATAT 200 TGAGGATTAC TGAATAAATG AAAAAAGGAT TCAGATGGTT TATGTGTTTT 150 AGAAATACGT GTTTCATTTG TTACGGCATC TAAATGTCCA ATGGGCAT 103 "chrblob_4027.gen_1|24oct01" AT 100 GACTGTCTTC CAAAGATTGC ACTTCCTTTC TGATAAAGGT AACACGGAAA 50 ATATTAACGA AGGGGTTCTC CACCCAAACG GGTTTTTTCC CCTAAGGCCC end of file 4028 9 4029 9 4030 1 telomere 4031 6 4032 9 4033 6 Date: Saturday, 3/23/2002 Time: 23:19 c4034.txt chrblob_4034|2001.10.15|GENOMIC|Sanger FEATURES Location CDS join(537..674,730..900) /gene="chrblob_4034.phat_1|24oct01" /note="(protein coding) No NR protein Similarities" /codon_start=1 ORIGIN watson strand 1 AGAATTCTGG TTGAGCTCGT TTTAAAAATG CGTAAAAAGA AAGAAGACGT 51 CTGCTACAAC CCTCTCAAGT CTCTTAAAGG ATAGTTCGAA ACTTGTCTGA 101 TTATCCTTGA ATAACGAACT TTGATTTTCA ATGTTTTATT TCCGGTCATT 151 GAGATATGAT AGCCTGTTCC TGGATATTAC GAGGGAATTT TCATATATTG 201 TATTGTATTT TTTTTTTTTT CATAACGAAT TCTAGAAAAG GCTTTGTTGG 251 CATGTGAGGA TGGCAGCGGT TGGAAACTTT GCCGAGAACA ATTTCTCACA 301 AGTTAACCTG AGATTTTCAC ACTTTTTACT TAGTGGTTGT TGGCACTTAA 351 GTAGAAGCTA ATAGTAGCAA TGATATCGAA ATAAAATGCT GTATCACGGG 401 CGATTATTCC ATGGCGAAAT GAGGTCCGTA ATTTCTTCGT CAGAGGGAGG 451 AAAGTGACTT TGGGAATACT CAAATGGAAT AGATGTGACA AGTTCTAGAA 501 TGACAATGTC AACCCAAGGG GAGCTAAGTT TCTAACATGG AAAGCAAAGA 551 A AGG CCC TCA GTA CCG TTC AAT CTA AAA TCA TCT TCA TTA ACT TCC AAA T 601 GT CTT ATC GCC CTT TCA CAT CCG TAT CTA ACA CCT ATA GAT GAT CTT ATC 651 ACG TTT GAA GAA TTA TGG AGA ATC GTGAAT ATGGGTAAAA AAACAATTAT 701 TTCGTATATT GCGCCTGGTA TTTTCTGAG CTT CAA ATA TGC TTA CAA GAA 751 CTC GAA TAC AGC ATA TAT AAA CAT ATT ATA GAT AAA GCA TAT AGT TCT GA 801 A CCC AAT TGT AAT CGT AGT GTT TTA GAT TGG AAG AGA AAT ATT ACT ATT C 851 TT AAC TCG CAA AGA TTT ATA TTT TTG CAT CCT CTG AAA AGA AAA AGT TAG* 901 ACTACTTTAT CTAATACTTG TTTTTCCTCG GTTGAAATAG AAAGCTTCTC 951 AAGGCGTGTT TCTTTAATTC CTTGTAGCAT GATAATGAAT ATTTTCATAT 1001 TAATGTTTAC TTTTCCCATT TATGCATTTT CGCAACAAAT ATTTAATTAA 1051 TTGTAAAAAT ATCATACAAA AAAGAGGAAC TCGGATCTAA GCCAATTTAG 1101 TATAAACGTC AAGAAGTAAG AAGAACTGGC AGTTTCAAAT TCAATTTTTT 1151 AATGTGGTAC GTACATCTCT AGTCCATATC GTATTCAGCA ATTTATAAAA 1201 AAGTCTGTCA CGATAAATTT TCGTTTGTGT GAGAAATTGG CTACTTAGGA 1251 AGAGTTTGCT ACATAATCGA AATTTTTATT AAGAGTAACA CATGTATATA 1301 TTCTTTTAGA ATCCTCTGAT TATTAAGTTG TTTGACAGAC CGGCGAGTCT 1351 AATGAGAGCT TATTACTTGA TAAAAAGGTT GCATAACCAT AATAAATCCA 1401 CAGTATAATG CTATATGGTG CAGAGCGAAG GATTGCGCAA AAAGCTCTTC 1451 CTTTCAAAAA TCATGAAAAA CGAACCTTGT AGAGTAATTT TGTAAGAAGA 1501 TTTAAACTCA TGTCTTTATC ACTATAAGTC GATATCATAC TCATATTATA 1551 ATGTCGAACC AGGATATCCG TACGACCTCA TGGGGAGATA AAACATCCAA 1601 ATAGTTCCTT TATTGAATAT TGTAGCTATG AAGTGCTAGT AAGTGGGGTA 1651 TCGACGTGAT GACACCCATG CTAAAGCTCC ACTAAAGACA AATACGAACC 1701 ACGTATGCCA TTTATAAAGA GCTAAAAAGC TTCCGAACAA CCTGCTCCGG 1751 AAACCTGAAG AAGTGTATCA TATATATTTA TTCTAATTTG CTCTCAAAAA 1801 TTTTCATTAA ACAACAGGAG AAACGATTGA GACATACAGC AAGCTATAGT 1851 GAAATCTGAA TATTACTTTT CTCTTTCAGT GTTACAGTAC TATATTAAAT 1901 CCCAAACAAA GTGTACTTGT TTAATTTGCT GCTTATCCTA CGCCAATTTT 1951 TCAAATGAAT CTGGAACAAT TGATAAGATA CCTTTATTAC AGCAATAGCA 2001 AGCGCGTGAC AGGCTTCATC GTTTTAGATA ACAATCTGTA TGGTCAACTC 2051 AACGATTCTT AGGGGCTACA ATTAAACTTG AAATAACTAT GATTCCTCAT 2101 GTAATGTTTA AGCTCTCAAG ATATTTGTCC TCACTTCCCG TTTGGCTCTC 2151 TTAACAATAG AAGGTATTAA AAGAATTCGA CAGTATGGTT GAGTACTAGT 2201 GTCTCCTTGT AGTTTTTTTC CCTTGTGATT TTGGGTTTGC TCATAATACG 2251 ATGTAGCGCA TATTCAATGA CTAAAGTTGT TATTGCTTCC TCTGACGACA 2301 AGTCCGCTCC CACTTATAGT GTCCTGAGTG ATTATTTATT TTTATGTGAA 2351 CACCAAAAGG AATAAAGTAG GTCCGTGTCC ATTTACTGCT TCTTTCACAC 2401 TTTTAGCCAA TCTTGACGTG GATATCTTGT TTTGCCTAAC CCATTCTCTG 2451 TGTTGTTAGT ATAATCCACC ATATCACTTA CCATATCAAC CATTATGTTC 2501 AGTTAACTCA CCTTTAAAGT ACTGTGCACA ACACCCTATT TCCATCTGAT 2551 CGGTCGCTTT ATCTGGAATA TCTGTTTTCA ATCTACGAAG ACATAAGTTT 2601 GAAAAATATA ACCAGAGTTC ATCGAGACCC TGCCCGCCAC AACCGCCATT 2651 AAAATATTGA AATATGAGCC AAAAGTTTCA GCCTGGTATT CTGAATGAAA 2701 TTGTAATCCG ACTATAGAGA ACGATTTATT TGGCTTTTGG GTAGTATGAT 2751 TATCCTTGTC TGGAGTTAGA TATAGAAGAA TTTAAGAAGG GCCACGAAAT 2801 TTATCCTATG GTATGGGAAA CGAGAAAAAC TCCAGTGCTG CTAATTAGAA 2851 CTAAAATATG AAAAGAAAAG GAAGAGGCGA GGATGAGTGT ATCTAACCCA 2901 CGTAGCTTGA AAGTTACTCG CTACATGCTA AAAGTTTACT TAAATTACAA 2951 ATCTTCACTT TCATGAACGT CCTCTACTAG CTATTATGAA GGCGCAGAGA 3001 GTAGTCTCGT TAACCAATTT TATGCAAGTC GTTGAAAAAA CGGCGACTCT 3051 TTAGTAGACT GGTCAAGCGG CATCGGAAAC AGTTCTCAGA ACAGAAAAGA 3101 AGAGATTATT GAGTTAAGGT CCGTTAAAGG GTCATGATAA GCCCAATAAG 3151 ATACCAAGTA GACATGTTAC ACCGTGAGTA GTAAACGGGG TTATATTTTA 3201 TTATGTTGCT AGTCTCATTT TATGGCCCTT GTAGTTTGGA GGAAAAATGA 3251 TCGGATAACC AAAACGAAAT TCCTTAAGTG ATTTGTGTCC CTAAAAGAAA 3301 ATCTTCAGGT ATAACCGCAA ACGCCAAATG CCACAAGCCC AAAAATTTCC 3351 GTGTCTTTTC CCGATGCTAT CCTTGATTAA AGAACTTTTG ATTGTCAAAG 3401 TGAAAATACC TATATGGACT CTTTTGAAGA ATTGAAAGAA ATAGGCAAAT 3451 CACTTGTGTA CATTACACTC TCTACTAAAC GATTTCGTAA CCTAGGCTAA 3501 TACGCGAAAC AAGCGCTTTT TTTATTTAGT GAAGCATCAT ATTACCTAAG 3551 CGCCACTTTG CTTGACGTTA GTAACAAAAA TGATGAAATT GTAATAGAAG 3601 AAACTTTTAT CCGCAAACTA TTGAGGTACC ATGCTAGTCC GTCTCAAGCT 3651 GTTTGATGCA A // crick strand 3661 T TGCATCAAAC 3650 AGCTTGAGAC GGACTAGCAT GGTACCTCAA TAGTTTGCGG ATAAAAGTTT 3600 CTTCTATTAC AATTTCATCA TTTTTGTTAC TAACGTCAAG CAAAGTGGCG 3550 CTTAGGTAAT ATGATGCTTC ACTAAATAAA AAAAGCGCTT GTTTCGCGTA 3500 TTAGCCTAGG TTACGAAATC GTTTAGTAGA GAGTGTAATG TACACAAGTG 3450 ATTTGCCTAT TTCTTTCAAT TCTTCAAAAG AGTCCATATA GGTATTTTCA 3400 CTTTGACAAT CAAAAGTTCT TTAATCAAGG ATAGCATCGG GAAAAGACAC 3350 GGAAATTTTT GGGCTTGTGG CATTTGGCGT TTGCGGTTAT ACCTGAAGAT 3300 TTTCTTTTAG GGACACAAAT CACTTAAGGA ATTTCGTTTT GGTTATCCGA 3250 TCATTTTTCC TCCAAACTAC AAGGGCCATA AAATGAGACT AGCAACATAA 3200 TAAAATATAA CCCCGTTTAC TACTCACGGT GTAACATGTC TACTTGGTAT 3150 CTTATTGGGC TTATCATGAC CCTTTAACGG ACCTTAACTC AATAATCTCT 3100 TCTTTTCTGT TCTGAGAACT GTTTCCGATG CCGCTTGACC AGTCTACTAA 3050 AGAGTCGCCG TTTTTTCAAC GACTTGCATA AAATTGGTTA ACGAGACTAC 3000 TCTCTGCGCC TTCATAATAG CTAGTAGAGG ACGTTCATGA AAGTGAAGAT 2950 TTGTAATTTA AGTAAACTTT TAGCATGTAG CGAGTAACTT TCAAGCTACG 2900 TGGGTTAGAT ACACTCATCC TCGCCTCTTC CTTTTCTTTT CATATTTTAG 2850 TTCTAATTAG CAGCACTGGA GTTTTTCTCG TTTCCCATAC CATAGGATAA 2800 ATTTCGTGGC CCTTCTTAAA TTCTTCTATA TCTAACTCCA GACAAGGATA 2750 ATCATACTAC CCAAAAGCCA AATAAATCGT TCTCTATAGT CGGATTACAA 2700 TTTCATTCAG AATACCAGGC TGAAACTTTT GGCTCATATT TCAATATTTT 2650 AATGGCGGTT GTGGCGGGCA GGGTCTCGAT GAACTCTGGT TATATTTTTC 2600 AAACTTATGT CTTCGTAGAT TGAAAACAGA TATTCCAGAT AAAGCGACCG 2550 ATCAGATGGA AATAGGGTGT TGTGCACAGT ACTTTAAAGG TGAGTTAACT 2500 GAACATAATG GTTGATATGG TAAGTGATAT GGTGGATTAT ACTAACAACA 2450 CAGAGAATGG GTTAGGCAAA ACAAGATATC CACGTCAAGA TTGGCTAAAA 2400 GTGTGAAAGA AGCAGTAAAT GGACACGGAC CTACTTTATT CCTTTTGGTG 2350 TTCACATAAA AATAAATAAT CACTCAGGAC ACTATAAGTG GGAGCGGACT 2300 TGTCGTCAGA GGAAGCAATA ACAACTTTAG TCATTGAATA TGCGCTACAT 2250 CGTATTATGA GCAAACCCAA AATCACAAGG GAAAAAAACT ACAAGGAGAC 2200 ACTAGTACTC AACCATACTG TCGAATTCTT TTAATACCTT CTATTGTTAA 2150 GAGAGCCAAA CGGGAAGTGA GGACAAATAT CTTGAGAGCT TAAACATTAC 2100 ATGAGGAATC ATAGTTATTT CAAGTTTAAT TGTAGCCCCT AAGAATCGTT 2050 GAGTTGACCA TACAGATTGT TATCTAAAAC GATGAAGCCT GTCACGCGCT 2000 TGCTATTGCT GTAATAAAGG TATCTTATCA ATTGTTCCAG ATTCATTTGA 1950 AAAATTGGCG TAGGATAAGC AGCAAATTAA ACAAGTACAC TTTGTTTGGG 1900 ATTTAATATA GTACTGTAAC ACTGAAAGAG AAAAGTAATA TTCAGATTTC 1850 ACTATAGCTT GCTGTATGTC TCAATCGTTT CTCCTGTTGT TTAATGAAAA 1800 TTTTTGAGAG CAAATTAGAA TAAATATATA TGATACACTT CTTCAGGTTT 1750 CCGGAGCAGG TTGTTCGGAA GCTTTTTAGC TCTTTATAAA TGGCATACGT 1700 GGTTCGTATT TGTCTTTAGT GGAGCTTTAG CATGGGTGTC ATCACGTCGA 1650 TACCCCACTT ACTAGCACTT CATAGCTACA ATATTCAATA AAGGAACTAT 1600 TTGGATGTTT TATCTCCCCA TGAGGTCGTA CGGATATCCT GGTTCGACAT 1550 TATAATATGA GTATGATATC GACTTATAGT GATAAAGACA TGAGTTTAAA 1500 TCTTCTTACA AAATTACTCT ACAAGGTTCG TTTTTCATGA TTTTTGAAAG 1450 GAAGAGCTTT TTGCGCAATC CTTCGCTCTG CACCATATAG CATTATACTG 1400 TGGATTTATT ATGGTTATGC AACCTTTTTA TCAAGTAATA AGCTCTCATT 1350 AGACTCGCCG GTCTGTCAAA CAACTTAATA ATCAGAGGAT TCTAAAAGAA 1300 TATATACATG TGTTACTCTT AATAAAAATT TCGATTATGT AGCAAACTCT 1250 TCCTAAGTAG CCAATTTCTC ACACAAACGA AAATTTATCG TGACAGACTT 1200 TTTTATAAAT TGCTGAATAC GATATGGACT AGAGATGTAC GTACCACATT 1150 AAAAAATTGA ATTTGAAACT GCCAGTTCTT CTTACTTCTT GACGTTTATA 1100 CTAAATTGGC TTAGATCCGA GTTCCTCTTT TTTGTATGAT ATTTTTACAA 1050 TTAATTAAAT ATTTGTTGCG AAAATGCATA AATGGGAAAA GTAAACATTA 1000 ATATGAAAAT ATTCATTATC ATGCTACAAG GAATTAAAGA AACACGCCTT 950 GAGAAGCTTT CTATTTCAAC CGAGGAAAAA CAAGTATTAG ATAAAGTAGT 900 CTAACTTTTT CTTTTCAGAG GATGCAAAAA TATAAATCTT TGCGAGTTAA 850 GAATAGTAAT ATTTCTCTTC CAATCTAAAA CACTACGATT ACAATTGGGT 800 TCAGAACTAT ATGCTTTATC TATAATATGT TTATATATGC TGTATTCGAG 750 TTCTTGTAAG CATATTTGAA GCTCAGAAAA TACCAGGCGC AATATACGAA 700 ATAATTGTTT TTTTACCCAT ATTCACGATT CTCCATAATT CTTCAAACGT 650 GATAAGATCA TCTATAGGTG TTAGATACGG ATGTGAAAGG GCGATAAGAC 600 ATTTGGAAGT TAATGAAGAT GATTTTAGAT TGAACGGTAC TGAGGGCCTT 550 TCTTTGCTTT CCATGTTAGA AACTTAGCTC CCCTTGGGTT GACATTGTCA 500 TTCTAGAACT TGTCACATCT ATTCCATTTG AGTATTCCCA AAGTCACTTT 450 CCTCCCTCTG ACGAAGAAAT TACGGACCTC ATTTCGCCAT GGAATAATCG 400 CCCGTGATAC AGCATTTTAT TTCGATATCA TTGCTACTAT TAGCTTCTAC 350 TTAAGTGCCA ACAACCACTA AGTAAAAAGT GTGAAAATCT CAGGTTAACT 300 TGTGAGAAAT TGTTCTCGGC AAAGTTTCCA ACCGCTGCCA TCCTCACATG 250 CCAACAAAGC CTTTTCTAGA ATTCGTTATG AAAAAAAAAA AAATACAATA 200 CAATATATGA AAATTCCCTC GTAATATCCA GGAACAGGCT ATCATATCTC 150 AATGACCGGA AATAAAACAT TGAAAATCAA AGTTCGTTAT TCAAGGATAA 100 TCAGACAAGT TTCGAACTAT CCTTTAAGAG ACTTGAGAGG GTTGTAGCAG 50 ACGTCTTCTT TCTTTTTACG CATTTTTAAA ACGAGCTCAA CCAGAATTCT end of file 4035 4 4036 4 4038 4 4039 4 4040 4 4041 9 4042 11 telomere 4043 9 4044 4 4045 4 ? assembly 4046 9 telomere anchored in chr13: Date: Saturday, 3/23/2002 Time: 23:19 c4047.txt chrblob_4047|2001.10.15|GENOMIC|Sanger FEATURES Location CDS complement(join(92..920,1096..1165,1423..1453)) /gene="chrblob_4047.gen_1|24oct01" /note="(protein coding) No NR protein Similarities" /codon_start=1 ORIGIN watson strand telomere anchored in chr13 1 ACTCTAGAGG ATCCCC chr13:2712186 --> CTAG TAACATGACT ACTAACAACA TCACTAACAT 51 AAGTACTAAC ATCATGACTA AGAACATGAC TACTAACAAC ATCAGGGAAC 101 ATGACTACTA ACAACATCAC TTACATGACT ACTAACAACA TCACTAACAT 151 GACTACTAAC ATCATCACTA AGAACATGAC TACTAACAGC ATGACTAAGA 201 ACATCACTGA TACCATAACT AACATAGTAA CTAACATGAC TACTTACATG 251 ATTACTTACA TGACTACTAA CAACATCACT TACATGACTA CTAACATCAT 301 CATTAACATC ATCACTAACA TGATCACTAA TATGACTACT AACATGACTA 351 CTAACAACAT CACTAACATT ACTACTAACA TCATCACTAA CATCATAACT 401 AACATGACTA CTTACATGAC TACTAACATA GTAACTAACA ACATCACTTA 451 CATGATTACT TACATGACTA CTAACATTAC TACTTACATG ACTACTTACA 501 TGACTACTTA CATGACTACT TACATGAATA CTAACTTGAC TACTAACATA 551 GTGACTAACA ACATCACTAA CATGACTACT AACAACATCA CTAACATGAT 601 TACTTACATG ACTACTAACA TTACTACTTA CATGACTACT AACAACATCA 651 CTTACATGAC TACTAACAAC ATCACAACTA ACATCATTAC TAACATGATT 701 ACTTACATGA CTACTAACAT GATCACTAAC ATGACTACTA ACATCATCAC 751 AACTAACATC ATTACTAACA TCAGTACTTA CATGACTACT AACATTACTA 801 CTTACATGAA TACTAACATC ATCATTAACA ACATCACTTA CATGATTACT 851 TACATGACTA CTAACTTGAA TACTAACTTG ATTACTTACA TCACTACTTA 901 CATGACTACT AACAACATCA CTAACATCAT GAGTGACATA ACTATTAACA 951 TGACTACTAA CTTGACTACT AACTTGACTA CTAACTTGAC TACTAACATA 1001 ACTACTAACA TCACTAGTAA CTTAGGTCTT AATTGTACTA ACGCAGTCTC 1051 ATCATTACTA AGGCCATTAC TTAAATAATA TAGATCTTAA CTGACTAGGG 1101 TCTTATCTTA ACTAACTGAG GTCTTAACTT AACTAATCTA GGTCTTAACT 1151 TCACTAACTC AGGTCCTAAC TTAAGTAATA TAGGTCATAA GTTTAATAAC 1201 CTAAGTCATT AAGGTACTAA CTTAGGTCTT AACTTGACTA ACATAAGGTC 1251 TTATGATTAC TAACTAAGGT CCTAACTTAA CTAATATAGG TCATAAGGTT 1301 ACTAACCTAG GTCATTAAGG TATTAACTTG GGTTTTATTT TCACTGATAT 1351 AGGTCTTAAC TTAGCTAACA TAGGTCTTAA CTTGACTAAC ATATGTCCTA 1401 ACATTAGTAA TGTAGGTCTT ACCTTCACTA ACATAGGTCT TACTCTCACT 1451 CATATAGGTC TTATGTTTAG TAACTTAGGT CCTAACTTCA CTAACATAGG approximate end of chr13 region 1501 TCTTAACTTG ACTAACTTAG GTCTTCATTT AACTAAACTG AGATCTTACA 1551 TTCACTAATA TAGGTCTTAA GTCATCTAAC TTAGACCTTA ATTTCACTAA 1601 TATAGATCTT AAGGTTACTA ACATACGTCT TAACTTCAGT AAGTTAGGTC 1651 TTACATTTAC TAACTTAGGT CTTAACTTAA CTAACTCAGA CCTTACTTTC 1701 ACTATTATAG GTCTTAAGTC ATCTAACTTA GGTCTTAAAT TCAGTAACTA 1751 AGGTCTTAAC ATAACTAACT TAGGTCTTAA CTTAACTAAC TAAGGTCTTA 1801 ACGTAACTAA CTAAGGTCTT AACGTAACTA ACTAAGGTCT TACTTTCACT 1851 AACCTAAGTC TTACTTTTAC TAACTTAGGT CTTACGTTCA CTAACATGGG 1901 TCATAACTTG ACTAACTAAG ATCTTACTTT CACTGATATA GGTCTTATGA 1951 TTACTAACTA AGGTCCTAAC TTAACTAATA CAGGTCTTAC GTTTACTAAC 2001 ATAGGTCTTA GGTTTTCTAA CTTTCGTCTT AACTTAACTA AACTTTGACC 2051 TTACTTTTAC TAATATAGGT CCTATCTTAA CTAACATAGG TCCTATCTTA 2101 ACTAACATAG GTCTTAACTT AGCTAACCTA AGTTTTACTT TACTAACTTA 2151 GGTCTTACAT TTACTAACTA AGGTCTTAAC ATGACTAACA TAGGTCTTAA 2201 GTTAACTAAC TAAGGTCATA CTTTTACTAA CTTAGATCTT AAATTAAGTA 2251 AGAAAGGTCA TACTTCAACT AACATACGTG TTAAGTTAAC TAACTAAGGT 2301 CACACTTCGA CTTATATAGG TCTTAACTTT ACTAACTCTG GTTCTGCGAT 2351 TACTAACTTA GGTCATACTT CGACTAACCT AGGTCTTACT TTTACTAACT 2401 GAGGTCTTAC TTTCACTAAC ACAGGTCTTA CTTTAAGTAA TATAGGTCCT 2451 AACTTAACTA ATATAGGTCA TAAGGTTACT AACTTAGGTC TTAACTTAAC 2501 TAACTAAGGT CTTAACTTGA CTAACATAGG TCTTAACTTA ACTAACATAG 2551 GTCTTATGTT AACTAACTCT GGTCCTACTA TTACTAATGT AGGTCTTAAC 2601 TTCACTAACA TAGGTCTTAT GTTAACTAAC TAAGGTCTTA CTTGGACTAA 2651 TATAGGTCTT ACTTTCACTA AGTGAGGTCC TTCTTTTACT AACATAGGAC 2701 TTAACTTGAC TAACTCTGTT CCTACTTTCA CGAACTTAGG TCTTACCTTC 2751 ATTCATATAA GTGATACTTG TACTGACATA GGTCATACTT CGACTAACTA 2801 AGGTCTTACG TTCACTAAGT GAGGTCCTTC TGTTACTAAC ATAGGTCTTA 2851 ACTTGACTAA CATAGGTCTT AACTTGACTA ATATAGGTCA TAAAATTACT 2901 AAGCTAAGTC ATTAAGGTAC TAACTTAGGT CTTAACTCAA CTAACTGAGG 2951 TCATACTTCT TCTAACTTAG GTCTTAACTT GACTAACTCA GGTCCTAACA 3001 TTAGTAATGT AGGTCTTAAC TTAACTAACT AAGGTCTTAA CTTAACTAAC 3051 TCAGACCTTA CTTTCAATAT TATTGGTCTT AATTCATCTA ACTTAGGTCT 3101 TAATTTCAAC TAACTTAGTT CTTAAATTGA GTAACATATG TCTTAACTTT 3151 ACTAACTAAG GTCATACTTC GACTAACATA GGTCTTAACT TGACTAACAT 3201 AGGTCTTACG TTTACTAACA GAGGTCCTAT CTTAACTAAC ATATGTCTTA 3251 CCTTTACTAA CTTAGGTCTT AACTTAACTA ACTTATGTCT TAACTTAGCT 3301 AACATAGGTC TTAACTTCAC TAACATAGGT CCTATTTTAA CTAACATAGG 3351 TCTTACTTTT ACTAACTTAA GTCATACTTC GACTAATGTA GATCTTACTT 3401 TCACTCATAT AGGTCTTAAT ATTACTCACT TAAGTCATTA AAATACTAAC 3451 TTAGGTCTTA CATTCACTGA TATAGGTCTT ATGATTACTA ACTAAGGTCC 3501 TAACTTGACT AACATAGGTC TTACGTTCAC TAACATAGGT CTTACGTTGA 3551 CTAACTAAGG TCATACTTCG ACTAACATAG GTCTTAACTT AGCTAACATA 3601 GGTCTTAACT TAACTAATAT AGGTCTTAAC TTAGATAACA TAGGTCTTAA 3651 CTTAGCTAAC ATAGGTCTTA CGTTTACTAA CATAGGTCTT AACTTAACTA 3701 ACTAAGGTCA CACTTCAACT TATATAGGTC TTAACTTAAC TAACTAAGGT 3751 CACACTTCAA CTTATATAGG TCTTAACTTT ACTAAGTGTG GTTCTACGAT 3801 TACTAACATA GGTCTTAACT TGACTAACAT AGGTCCTAAC TTGACTAACA 3851 TAGGTCTTAA CTTAGCTAAC ATAGGTCTTA ACTTGACTAA CATATGTCCT 3901 AACATTAGTA ATGTAGGTCT TACTTTCACT CATATAAGTC TTATGGTAAC 3951 TAACTAAGGT CTTACCTTTA CTGATATATG TCTTACTTTC ACTAACTTAG 4001 GTCTTAATTT CAACTAACTT AGGTCTTAAC TCAACTAACT GAGGTGATAT 4051 TTCGACTAAT GTAGGTCTTA CTTTCACTAA CTTAAGTCTT ACTTTCACTA 4101 ACCTAAGTCT TACTTTTACT AACATAGGTC TTACTTTTAC TAACCTAAGT 4151 CTTACTTTCA CTAACCTAAG TCTTACTTTA ACGAACTAAG GTCTTACCTT 4201 TACTGATATA GGTCCTAACT ACACTAACTT AGGTCTTAAT GTAAGTAATG 4251 TAGGTCTGAA GGTAAGTTAT GCAGGTCCTA ACTACAGGAA CATTGGTCTA 4301 TAGGTAAGTA ATATAGGTCC TAACAACAAT AACTTAGGTC TTAATGTAAC 4351 TAACATAAGT CGTAAGGTAA CTAATATAGG TCCTAATATT ACTAACATAG 4401 GTCTTAATAT TACTAACATA GGTCTTAGAT AAGTAATGTA GGTCTTAGAT 4451 AAGTAATGTA GGTCTTAGGT AAGTAATGTA GGTCTTACTT TCACTCATAT 4501 AAGTCTTATG GTAAATCACT AAGGTCTTAT GTCAACTAAC TAAGGTCCTA 4551 ACTTAACTAA TAAGGTCATA AGGTTAGTAA CCTAGGTCAT TAAGGTATTA 4601 ACTTGGGTCT TATCTTCACT GATATAGGTC TTACTTCTAC TAACTTAGGT 4651 CTTACTTTTA CTAACATAGG TCTTAACTTA ACTAATACAG GTCTTACGTT 4701 TACTAACGTA GGTCTTACGT TGACTAACTA AGGTCACACT TCAACTTATA 4751 TAGGTCTTAC TTTTACTAAC TTAGGTCCTA ACTTTACTAA GTGTGGTTCT 4801 ACGATTACTA ACATAGGTCA TACTTCTTCT AACTTAGGTC TTACTTTTAC 4851 TAACTTAGGT CTTAAATTGA TTAACTAAGG TCATACATGG ACTAACATAG 4901 GTCTTAAGTT AACTAACTAA GGTCATACTT TTACTAACTT AGATCTTAAA 4951 TTAAGTAAGA AAGGTCATAC TTCAACTAAC ATACGTGTTA AGTTAACTAA 5001 CTAAGGTCAC ACTTCGACTT ATATAGGTCT TCACTTAACT AACTTAGGTC 5051 TTAACTTAGC TAACATAGGT CTTCACTTGA CTAACTAAGG TCCTAACTTG 5101 ACTAACATAG GTCCTAACTT GACTAACTTA GGTCTTAACT CAACTAACTT 5151 AGGTCTTACT TTGACTAACT TAGGTCCTAA CTTTACTAAG TGTGGTTCTA 5201 CGATTACTAA CATAGGTCTT ACGTTCACTA ACATGGGTCA TAACTTGACT 5251 AACTAACGTC TTAAATCAAG TAACAAAGGT CTTACATTCA CTGATATAGG 5301 C // crick strand 5301 G 5300 CCTATATCAG TGAATGTAAG ACCTTTGTTA CTTGATTTAA GACGTTAGTT 5250 AGTCAAGTTA TGACCCATGT TAGTGAACGT AAGACCTATG TTAGTAATCG 5200 TAGAACCACA CTTAGTAAAG TTAGGACCTA AGTTAGTCAA AGTAAGACCT 5150 AAGTTAGTTG AGTTAAGACC TAAGTTAGTC AAGTTAGGAC CTATGTTAGT 5100 CAAGTTAGGA CCTTAGTTAG TCAAGTGAAG ACCTATGTTA GCTAAGTTAA 5050 GACCTAAGTT AGTTAAGTGA AGACCTATAT AAGTCGAAGT GTGACCTTAG 5000 TTAGTTAACT TAACACGTAT GTTAGTTGAA GTATGACCTT TCTTACTTAA 4950 TTTAAGATCT AAGTTAGTAA AAGTATGACC TTAGTTAGTT AACTTAAGAC 4900 CTATGTTAGT CCATGTATGA CCTTAGTTAA TCAATTTAAG ACCTAAGTTA 4850 GTAAAAGTAA GACCTAAGTT AGAAGAAGTA TGACCTATGT TAGTAATCGT 4800 AGAACCACAC TTAGTAAAGT TAGGACCTAA GTTAGTAAAA GTAAGACCTA 4750 TATAAGTTGA AGTGTGACCT TAGTTAGTCA ACGTAAGACC TACGTTAGTA 4700 AACGTAAGAC CTGTATTAGT TAAGTTAAGA CCTATGTTAG TAAAAGTAAG 4650 ACCTAAGTTA GTAGAAGTAA GACCTATATC AGTGAAGATA AGACCCAAGT 4600 TAATACCTTA ATGACCTAGG TTACTAACCT TATGACCTTA TTAGTTAAGT 4550 TAGGACCTTA GTTAGTTGAC ATAAGACCTT AGTGATTTAC CATAAGACTT 4500 ATATGAGTGA AAGTAAGACC TACATTACTT ACCTAAGACC TACATTACTT 4450 ATCTAAGACC TACATTACTT ATCTAAGACC TATGTTAGTA ATATTAAGAC 4400 CTATGTTAGT AATATTAGGA CCTATATTAG TTACCTTACG ACTTATGTTA 4350 GTTACATTAA GACCTAAGTT ATTGTTGTTA GGACCTATAT TACTTACCTA 4300 TAGACCAATG TTCCTGTAGT TAGGACCTGC ATAACTTACC TTCAGACCTA 4250 CATTACTTAC ATTAAGACCT AAGTTAGTGT AGTTAGGACC TATATCAGTA 4200 AAGGTAAGAC CTTAGTTCGT TAAAGTAAGA CTTAGGTTAG TGAAAGTAAG 4150 ACTTAGGTTA GTAAAAGTAA GACCTATGTT AGTAAAAGTA AGACTTAGGT 4100 TAGTGAAAGT AAGACTTAAG TTAGTGAAAG TAAGACCTAC ATTAGTCGAA 4050 ATATCACCTC AGTTAGTTGA GTTAAGACCT AAGTTAGTTG AAATTAAGAC 4000 CTAAGTTAGT GAAAGTAAGA CATATATCAG TAAAGGTAAG ACCTTAGTTA 3950 GTTACCATAA GACTTATATG AGTGAAAGTA AGACCTACAT TACTAATGTT 3900 AGGACATATG TTAGTCAAGT TAAGACCTAT GTTAGCTAAG TTAAGACCTA 3850 TGTTAGTCAA GTTAGGACCT ATGTTAGTCA AGTTAAGACC TATGTTAGTA 3800 ATCGTAGAAC CACACTTAGT AAAGTTAAGA CCTATATAAG TTGAAGTGTG 3750 ACCTTAGTTA GTTAAGTTAA GACCTATATA AGTTGAAGTG TGACCTTAGT 3700 TAGTTAAGTT AAGACCTATG TTAGTAAACG TAAGACCTAT GTTAGCTAAG 3650 TTAAGACCTA TGTTATCTAA GTTAAGACCT ATATTAGTTA AGTTAAGACC 3600 TATGTTAGCT AAGTTAAGAC CTATGTTAGT CGAAGTATGA CCTTAGTTAG 3550 TCAACGTAAG ACCTATGTTA GTGAACGTAA GACCTATGTT AGTCAAGTTA 3500 GGACCTTAGT TAGTAATCAT AAGACCTATA TCAGTGAATG TAAGACCTAA 3450 GTTAGTATTT TAATGACTTA AGTGAGTAAT ATTAAGACCT ATATGAGTGA 3400 AAGTAAGATC TACATTAGTC GAAGTATGAC TTAAGTTAGT AAAAGTAAGA 3350 CCTATGTTAG TTAAAATAGG ACCTATGTTA GTGAAGTTAA GACCTATGTT 3300 AGCTAAGTTA AGACATAAGT TAGTTAAGTT AAGACCTAAG TTAGTAAAGG 3250 TAAGACATAT GTTAGTTAAG ATAGGACCTC TGTTAGTAAA CGTAAGACCT 3200 ATGTTAGTCA AGTTAAGACC TATGTTAGTC GAAGTATGAC CTTAGTTAGT 3150 AAAGTTAAGA CATATGTTAC TCAATTTAAG AACTAAGTTA GTTGAAATTA 3100 AGACCTAAGT TAGATGAATT AAGACCAATA ATATTGAAAG TAAGGTCTGA 3050 GTTAGTTAAG TTAAGACCTT AGTTAGTTAA GTTAAGACCT ACATTACTAA 3000 TGTTAGGACC TGAGTTAGTC AAGTTAAGAC CTAAGTTAGA AGAAGTATGA 2950 CCTCAGTTAG TTGAGTTAAG ACCTAAGTTA GTACCTTAAT GACTTAGCTT 2900 AGTAATTTTA TGACCTATAT TAGTCAAGTT AAGACCTATG TTAGTCAAGT 2850 TAAGACCTAT GTTAGTAACA GAAGGACCTC ACTTAGTGAA CGTAAGACCT 2800 TAGTTAGTCG AAGTATGACC TATGTCAGTA CAAGTATCAC TTATATGAAT 2750 GAAGGTAAGA CCTAAGTTCG TGAAAGTAGG AACAGAGTTA GTCAAGTTAA 2700 GTCCTATGTT AGTAAAAGAA GGACCTCACT TAGTGAAAGT AAGACCTATA 2650 TTAGTCCAAG TAAGACCTTA GTTAGTTAAC ATAAGACCTA TGTTAGTGAA 2600 GTTAAGACCT ACATTAGTAA TAGTAGGACC AGAGTTAGTT AACATAAGAC 2550 CTATGTTAGT TAAGTTAAGA CCTATGTTAG TCAAGTTAAG ACCTTAGTTA 2500 GTTAAGTTAA GACCTAAGTT AGTAACCTTA TGACCTATAT TAGTTAAGTT 2450 AGGACCTATA TTACTTAAAG TAAGACCTGT GTTAGTGAAA GTAAGACCTC 2400 AGTTAGTAAA AGTAAGACCT AGGTTAGTCG AAGTATGACC TAAGTTAGTA 2350 ATCGCAGAAC CAGAGTTAGT AAAGTTAAGA CCTATATAAG TCGAAGTGTG 2300 ACCTTAGTTA GTTAACTTAA CACGTATGTT AGTTGAAGTA TGACCTTTCT 2250 TACTTAATTT AAGATCTAAG TTAGTAAAAG TATGACCTTA GTTAGTTAAC 2200 TTAAGACCTA TGTTAGTCAT GTTAAGACCT TAGTTAGTAA ATGTAAGACC 2150 TAAGTTAGTA AAGTAAAACT TAGGTTAGCT AAGTTAAGAC CTATGTTAGT 2100 TAAGATAGGA CCTATGTTAG TTAAGATAGG ACCTATATTA GTAAAAGTAA 2050 GGTCAAAGTT TAGTTAAGTT AAGACGAAAG TTAGAAAACC TAAGACCTAT 2000 GTTAGTAAAC GTAAGACCTG TATTAGTTAA GTTAGGACCT TAGTTAGTAA 1950 TCATAAGACC TATATCAGTG AAAGTAAGAT CTTAGTTAGT CAAGTTATGA 1900 CCCATGTTAG TGAACGTAAG ACCTAAGTTA GTAAAAGTAA GACTTAGGTT 1850 AGTGAAAGTA AGACCTTAGT TAGTTACGTT AAGACCTTAG TTAGTTACGT 1800 TAAGACCTTA GTTAGTTAAG TTAAGACCTA AGTTAGTTAT GTTAAGACCT 1750 TAGTTACTGA ATTTAAGACC TAAGTTAGAT GACTTAAGAC CTATAATAGT 1700 GAAAGTAAGG TCTGAGTTAG TTAAGTTAAG ACCTAAGTTA GTAAATGTAA 1650 GACCTAACTT ACTGAAGTTA AGACGTATGT TAGTAACCTT AAGATCTATA 1600 TTAGTGAAAT TAAGGTCTAA GTTAGATGAC TTAAGACCTA TATTAGTGAA 1550 TGTAAGATCT CAGTTTAGTT AAATGAAGAC CTAAGTTAGT CAAGTTAAGA 1500 CCTATGTTAG TGAAGTTAGG ACCTAAGTTA CTAAACATAA GACCTATATG 1450 AGTGAGAGTA AGACCTATGT TAGTGAAGGT AAGACCTACA TTACTAATGT 1400 TAGGACATAT GTTAGTCAAG TTAAGACCTA TGTTAGCTAA GTTAAGACCT 1350 ATATCAGTGA AAATAAAACC CAAGTTAATA CCTTAATGAC CTAGGTTAGT 1300 AACCTTATGA CCTATATTAG TTAAGTTAGG ACCTTAGTTA GTAATCATAA 1250 GACCTTATGT TAGTCAAGTT AAGACCTAAG TTAGTACCTT AATGACTTAG 1200 GTTATTAAAC TTATGACCTA TATTACTTAA GTTAGGACCT GAGTTAGTGA 1150 AGTTAAGACC TAGATTAGTT AAGTTAAGAC CTCAGTTAGT TAAGATAAGA 1100 CCCTAGTCAG TTAAGATCTA TATTATTTA AGTAATGGCCTT AGTAA TGAT 1050 GAGACTGC GTTAGTACAATT AAGACCTA AGTT ACTAGTGATGTT AGTAGT 1000 TATGTT AGTAGTCAAGTT AGTAGTCAAGTT AGTAGTCAAGTT AGTAGTCA 950 TGTT AAT AGTTATGTC ACTCATGATGTT AG 920 T GAT GTT GTT AGT AGT CAT G 900 TA AGT AGT GAT GTA AGT AAT CAA GTT AGT ATT CAA GTT AGT AGT CAT GTA 850 AGT AAT CAT GTA AGT GAT GTT GTT AAT GAT GAT GTT AGT ATT CAT GTA AG 800 T AGT AAT GTT AGT AGT CAT GTA AGT ACT GAT GTT AGT AAT GAT GTT AGT T 750 GT GAT GAT GTT AGT AGT CAT GTT AGT GAT CAT GTT AGT AGT CAT GTA AGT 700 AAT CAT GTT AGT AAT GAT GTT AGT TGT GAT GTT GTT AGT AGT CAT GTA AG 650 T GAT GTT GTT AGT AGT CAT GTA AGT AGT AAT GTT AGT AGT CAT GTA AGT A 600 AT CAT GTT AGT GAT GTT GTT AGT AGT CAT GTT AGT GAT GTT GTT AGT CAC 550 TAT GTT AGT AGT CAA GTT AGT ATT CAT GTA AGT AGT CAT GTA AGT AGT CA 500 T GTA AGT AGT CAT GTA AGT AGT AAT GTT AGT AGT CAT GTA AGT AAT CAT G 450 TA AGT GAT GTT GTT AGT TAC TAT GTT AGT AGT CAT GTA AGT AGT CAT GTT 400 AGT TAT GAT GTT AGT GAT GAT GTT AGT AGT AAT GTT AGT GAT GTT GTT AG 350 T AGT CAT GTT AGT AGT CAT ATT AGT GAT CAT GTT AGT GAT GAT GTT AAT G 300 AT GAT GTT AGT AGT CAT GTA AGT GAT GTT GTT AGT AGT CAT GTA AGT AAT 250 CAT GTA AGT AGT CAT GTT AGT TAC TAT GTT AGT TAT GGT ATC AGT GAT GT 200 T CTT AGT CAT GCT GTT AGT AGT CAT GTT CTT AGT GAT GAT GTT AGT AGT C 150 AT GTT AGT GAT GTT GTT AGT AGT CAT GTA AGT GAT GTT GTT AGT AGT CAT 100 GTTCCCTGAT GTTGTTAGTA GTCATGTTCT TAGTCATGAT GTTAGTACTT 50 ATGTTAGTGA TGTTGTTAGT AGTCATGTTA CTAGGGGGAT CCTCTAGAGT end of file 4049 5 4050 4 4051 12 + 3 + 12 4052 4 4053 9 + 3 + 9 4054 4 4055 4 4056 2 telomere or centromere Date: Sunday, 3/24/2002 Time: 23:59 c4057.txt chrblob_4057|2001.10.15|GENOMIC|Sanger FEATURES Location CDS 2390..2668 /gene="chrblob_4057.glm_1|24oct01" /note="(protein coding) 63% identity to ribosomal protein L37" /codon_start=1 ORIGIN watson strand 1 CAGACTTATA TGTTTATTCA TATAGATATA TATATATATG TATATATATA 51 TATATATATG TGAGTTGAGA TTTTGTTTAA TATAAAGTAT ATTTTTGAAT 101 GTAGCATTTT ATAATATGTT TATTTGTTAA ATACATAAGG AGAATTGTTT 151 ATTACAACAA TGTATTATTT GTTATGTGGA TCATAATTAT GTTTAAAACT 201 TTTTTCCATT TTTAAAAAAA CATAAAAAAT GCTTGACATA AATATATGTA 251 TACATAATTT TATTGTCAAT ATGTAAATAT ACAAAATTAT GGAGATTATA 301 AAAATTAATT TGTTATTATT ATTTTGGATT TATGAATATA TATATATATA 351 TATAAATATA TGTATATAAT ATAACCATAA CCTTTTTATA ATATTTATAG 401 ATATCATGTT TTTATTTAGA AAAATGAGAA ATATTGTAAC CATACATTTT 451 TATATGATGA AAAAATAAAA GAATAGAATA ACCATGATTT TTTTTTTTTT 501 TTTTTTTTCA TTAAATATAA ATGTAGAGGT GTTACTTTTT TAAAAAATTT 551 GTCCAAGAAA ATGTTCAAAA ATTTATTAAA TGAATATACA TTTTTTATTA 601 TGACAAAAAA AAAAAAAAAA AATTAAACCG TTTTAAAAAG ACCTAAAGGA 651 AATTCCATAA TGATATATAT ATAACATGTA AGTAAATAAA TAAATAAATA 701 AATATATATA TATATATATA TATATATATA TATATATATG TATAATATTT 751 TTTTTTTAAT TAAGCTTTTT TTTTTTTGTG TGTACAAAAT TTATGTATAA 801 GATGACAAAA ATATTTTTTA TAATAATTCC AATATTAAAT ATATATATAA 851 TATATATATA TATTTCTTTA TTTGTAGATT ACATAAAATA AAATATATAT 901 ATATTATATA TATTGTGACA TAAAAATATA AAGGCATAAT AATTTATTTA 951 TATTTTATAT TAATATAGCA CGAACAAAAT TAAATCTCAC ATATATATAT 1001 ATTTATATAT ATATATATTT TTTTTTATTG CCCCTTTTAA TAAAAGGCGT 1051 TTGGGGGATA AAGGGGGAGA ATTTTTATAT TATAAAAAAA AAAGAAAAAA 1101 AAAAAAAAAA AAAAAAAAAG AATAATTATT AACATATTTA TATTAAATAA 1151 TTGTATATTT TTCAAAAAGA ATAATTTAAA TTTTTTGTGT TTTTCTTTTA 1201 AAAAACTGTA ATTTTTTATT TTTTGAACAA TATAAATAAA AATAGCTTAT 1251 TCGGGAATAT ATAAAATTAA GAGAGGAAAA AGTATACCAT AAATATATAA 1301 TATATATATA TTATATATAT ATACAATATA TATTGTATGT ATTATAATAT 1351 ATAATTACAT ATTTAAAATT TTGCGCATAA ATTATTACTA TTTATATATA 1401 ATATATATTT ATTATATATA CCCCTTAAAT TAACAAGGCT TAATAATAAA 1451 ACATACGCAT ATAAAATATA TGATATGATA ATATATATAT ATATATATAT 1501 AATGAAGGGC GTATATTATT TTGTCATATA ATGAAAACAT TGATGTATTA 1551 AGAATATAGG AACTTAATAT ATATTATATA TATAACAATA TATGTATAAA 1601 ATAATTATTA TAATTATATA TATATTATAT TTATAGCACA GGGCTTGAGG 1651 TAGAAAAGGC TTACATATAT TTTATATTAA CCAATCGATC CAAAAAAAAA 1701 AAAAAACAAA AAGCAAAAAT ATTATAATAT ATTATAATAT AATATAATAT 1751 ATAATAAAAT ATAATTATGT ATTATATATA TATATATATA TATATATATA 1801 ATATATTTCT TTATAATAAA ATATTACCTT TATTTTATTC TTATGTAATA 1851 AATATATTAT ATACATAAAT ATTATCACGA TTATTTATAT ATATTATATT 1901 ATATATATAC AAATATATAT TTAAAATAAA GTAAAATATT TTTACTTCAA 1951 TTCGTAATAT TATTTTATAT ATAAATATTA TATTATATTA TACATATATA 2001 TATTATATTT TATGTATACA AAAAAAATAA ATTTAAAATT TTTTTAAATT 2051 AATAAACTTA TATTATATTA TATTATACAT ATAAATATAT TTTATAATGA 2101 TTATATAAAA TAATTCCTCG TTTTTTTTTT TTTTTTAAAA TGTAAATAAT 2151 ATTTTATACA TTTATAATAA TTTATATATA AAGGAAAAAA AAACAAAAAA 2201 AAAAGAAAAT TAATTTTTAA TGTCAAGAAT ATAATAAATT ATCTAACTGT 2251 TGAATATTTT ATGTTTATTA ATTAATTATT TTATATATAT TATTATTTAT 2301 TTTATTTTAT TTTTTTATCA TATATATTTA ATAATATTAT ATTTTTAAAT 2351 ATAATTTTAT ATATAATTTA ATATAAAATT TTATAAAAA start chrblob_4057.glm_1|24oct01 glm exon 1 2390 ATG GGT AAA GC 2401 C GGA AAA GGT ACA GGT TCT TTT GGT AAG AGG AAT GGA AAA ACA CAT TTC T 2451 TA TGT TTA AGA TGT GGA AAG AGA AGT TAC CAT TTA CAA AAA AAA AAA TGT 2501 GCT TCT TGT GGA TAT CCA AGT GCT AAA AAA AGA AGA TTT AAC TGG TCT GT 2551 A AAA GCA AAA AGA AGA AAC ACA ACA GGG ACA GGA AGA TGT AGA TAT ATA A 2601 AA ACA TTA AGA AGA AAA TTA AAA AAC AAA TTT ACA GAA GGA AGT ACT CCA 2651 AAA CCA AAA CAA AGA TAA* 2668 stop chrblob_4057.glm_1|24oct01 AT GATTTAGTAA ATAACATAAT GAAAATTTTG 2701 AAATAAAAAA TACATTTTTT TTAAATTTTA ATATTAGCGA CTTAAGAAAG 2751 ATAAAAAGGA AAAAAAAAAA AAAAAAAAAA AAATATATAT ATATATATAT 2801 ATATATATAT ATTATATTAA TTAATGCGTT GAATATATAA TATTTTTTAC 2851 TATTGTAGAA AGCGAAAAAA TATTACATAT ATATATATAT ATATATATGG 2901 GGAAATACTT ATATATTTGT ATATAGAATA GGAAGAATTT CCTTCTTTTT 2951 TTTTTTTTTT TTTTCTCTTA TTACTATTAT TAATATATAT TTTATATATA 3001 CATATTATAA TAACATTTAT GAAGTTATTT TTTCTTTTTC TTTTTTTTTT 3051 TTTTTTTTTT TTTTTTTCCC AAAAAAATTT TGGTTTATAT TTTCGGGATT 3101 TATTTTAAAA TCCATTTTTA TGAATTTATT ATAAAAACAT TTTTTTTTTT 3151 TGAATTAAAT AATTTTTTAA AAAAAAAAAA AAAAAAAAAA AAGTTTCCTT 3201 TAAAAGGGGG TTTGTGCCCA AATTTATAAA ATCATAATGT AAAAAACAGC 3251 TTTATAATGC CTTATGAATA AATAATAGGG AAAAATGCTT ACATCCATAC 3301 ATATGTATGG GTATGTATGT ATATATATAT ATGTTAACAA TCTCCTTTAT 3351 GGATATATAT ATTTATAAAA CATTCATTTA TTTTTTATAG CATGGATATA 3401 AAACTATCAG GATTAATTTT TTTGAACTGA ACAAAAAAAA AAAATTTTTT 3451 TTTTTTTTTT TTTTTTTAAA TGAGGAAGTT TTTTTTTGAT TCATCTTTTT 3501 AAAAGAAATT CAAATTTTGG GCCCTTTCCA CCCTTTAAA // crick strand 3539 TTTAAAGGG TGGAAAGGGC CCAAAATTTG AATTTCTTTT 3500 AAAAAGATGA ATCAAAAAAA AACTTCCTCA TTTAAAAAAA AAAAAAAAAA 3450 AAAAAATTTT TTTTTTTTGT TCAGTTCAAA AAAATTAATC CTGATAGTTT 3400 TATATCCATG CTATAAAAAA TAAATGAATG TTTTATAAAT ATATATATCC 3350 ATAAAGGAGA TTGTTAACAT ATATATATAT ACATACATAC CCATACATAT 3300 GTATGGATGT AAGCATTTTT CCCTATTATT TATTCATAAG GCATTATAAA 3250 GCTGTTTTTT ACATTATGAT TTTATAAATT TGGGCACAAA CCCCCTTTTA 3200 AAGGAAACTT TTTTTTTTTT TTTTTTTTTT TTAAAAAATT ATTTAATTCA 3150 AAAAAAAAAA ATGTTTTTAT AATAAATTCA TAAAAATGGA TTTTAAAATA 3100 AATCCCGAAA ATATAAACCA AAATTTTTTT GGGAAAAAAA AAAAAAAAAA 3050 AAAAAAAAAA GAAAAAGAAA AAATAACTTC ATAAATGTTA TTATAATATG 3000 TATATATAAA ATATATATTA ATAATAGTAA TAAGAGAAAA AAAAAAAAAA 2950 AAAAAGAAGG AAATTCTTCC TATTCTATAT ACAAATATAT AAGTATTTCC 2900 CCATATATAT ATATATATAT ATATGTAATA TTTTTTCGCT TTCTACAATA 2850 GTAAAAAATA TTATATATTC AACGCATTAA TTAATATAAT ATATATATAT 2800 ATATATATAT ATATATATTT TTTTTTTTTT TTTTTTTTTT TCCTTTTTAT 2750 CTTTCTTAAG TCGCTAATAT TAAAATTTAA AAAAAATGTA TTTTTTATTT 2700 CAAAATTTTC ATTATGTTAT TTACTAAATC AT "chrblob_4057.glm_1|24oct01" 2668 TTATCTTT GTTTTGGTTT 2650 TGGAGTACTT CCTTCTGTAA ATTTGTTTTT TAATTTTCTT CTTAATGTTT 2600 TTATATATCT ACATCTTCCT GTCCCTGTTG TGTTTCTTCT TTTTGCTTTT 2550 ACAGACCAGT TAAATCTTCT TTTTTTAGCA CTTGGATATC CACAAGAAGC 2500 ACATTTTTTT TTTTGTAAAT GGTAACTTCT CTTTCCACAT CTTAAACATA 2450 AGAAATGTGT TTTTCCATTC CTCTTACCAA AAGAACCTGT ACCTTTTCCG 2400 GCTTTACCCA T 2390 "chrblob_4057.glm_1|24oct01" TTTTTATAA AATTTTATAT TAAATTATAT ATAAAATTAT 2350 ATTTAAAAAT ATAATATTAT TAAATATATA TGATAAAAAA ATAAAATAAA 2300 ATAAATAATA ATATATATAA AATAATTAAT TAATAAACAT AAAATATTCA 2250 ACAGTTAGAT AATTTATTAT ATTCTTGACA TTAAAAATTA ATTTTCTTTT 2200 TTTTTTGTTT TTTTTTCCTT TATATATAAA TTATTATAAA TGTATAAAAT 2150 ATTATTTACA TTTTAAAAAA AAAAAAAAAA CGAGGAATTA TTTTATATAA 2100 TCATTATAAA ATATATTTAT ATGTATAATA TAATATAATA TAAGTTTATT 2050 AATTTAAAAA AATTTTAAAT TTATTTTTTT TGTATACATA AAATATAATA 2000 TATATATGTA TAATATAATA TAATATTTAT ATATAAAATA ATATTACGAA 1950 TTGAAGTAAA AATATTTTAC TTTATTTTAA ATATATATTT GTATATATAT 1900 AATATAATAT ATATAAATAA TCGTGATAAT ATTTATGTAT ATAATATATT 1850 TATTACATAA GAATAAAATA AAGGTAATAT TTTATTATAA AGAAATATAT 1800 TATATATATA TATATATATA TATATATAAT ACATAATTAT ATTTTATTAT 1750 ATATTATATT ATATTATAAT ATATTATAAT ATTTTTGCTT TTTGTTTTTT 1700 TTTTTTTTTG GATCGATTGG TTAATATAAA ATATATGTAA GCCTTTTCTA 1650 CCTCAAGCCC TGTGCTATAA ATATAATATA TATATAATTA TAATAATTAT 1600 TTTATACATA TATTGTTATA TATATAATAT ATATTAAGTT CCTATATTCT 1550 TAATACATCA ATGTTTTCAT TATATGACAA AATAATATAC GCCCTTCATT 1500 ATATATATAT ATATATATAT TATCATATCA TATATTTTAT ATGCGTATGT 1450 TTTATTATTA AGCCTTGTTA ATTTAAGGGG TATATATAAT AAATATATAT 1400 TATATATAAA TAGTAATAAT TTATGCGCAA AATTTTAAAT ATGTAATTAT 1350 ATATTATAAT ACATACAATA TATATTGTAT ATATATATAA TATATATATA 1300 TTATATATTT ATGGTATACT TTTTCCTCTC TTAATTTTAT ATATTCCCGA 1250 ATAAGCTATT TTTATTTATA TTGTTCAAAA AATAAAAAAT TACAGTTTTT 1200 TAAAAGAAAA ACACAAAAAA TTTAAATTAT TCTTTTTGAA AAATATACAA 1150 TTATTTAATA TAAATATGTT AATAATTATT CTTTTTTTTT TTTTTTTTTT 1100 TTTTTTCTTT TTTTTTTATA ATATAAAAAT TCTCCCCCTT TATCCCCCAA 1050 ACGCCTTTTA TTAAAAGGGG CAATAAAAAA AAATATATAT ATATATAAAT 1000 ATATATATAT GTGAGATTTA ATTTTGTTCG TGCTATATTA ATATAAAATA 950 TAAATAAATT ATTATGCCTT TATATTTTTA TGTCACAATA TATATAATAT 900 ATATATATTT TATTTTATGT AATCTACAAA TAAAGAAATA TATATATATA 850 TTATATATAT ATTTAATATT GGAATTATTA TAAAAAATAT TTTTGTCATC 800 TTATACATAA ATTTTGTACA CACAAAAAAA AAAAAGCTTA ATTAAAAAAA 750 AAATATTATA CATATATATA TATATATATA TATATATATA TATATATATT 700 TATTTATTTA TTTATTTACT TACATGTTAT ATATATATCA TTATGGAATT 650 TCCTTTAGGT CTTTTTAAAA CGGTTTAATT TTTTTTTTTT TTTTTTGTCA 600 TAATAAAAAA TGTATATTCA TTTAATAAAT TTTTGAACAT TTTCTTGGAC 550 AAATTTTTTA AAAAAGTAAC ACCTCTACAT TTATATTTAA TGAAAAAAAA 500 AAAAAAAAAA AAATCATGGT TATTCTATTC TTTTATTTTT TCATCATATA 450 AAAATGTATG GTTACAATAT TTCTCATTTT TCTAAATAAA AACATGATAT 400 CTATAAATAT TATAAAAAGG TTATGGTTAT ATTATATACA TATATTTATA 350 TATATATATA TATATTCATA AATCCAAAAT AATAATAACA AATTAATTTT 300 TATAATCTCC ATAATTTTGT ATATTTACAT ATTGACAATA AAATTATGTA 250 TACATATATT TATGTCAAGC ATTTTTTATG TTTTTTTAAA AATGGAAAAA 200 AGTTTTAAAC ATAATTATGA TCCACATAAC AAATAATACA TTGTTGTAAT 150 AAACAATTCT CCTTATGTAT TTAACAAATA AACATATTAT AAAATGCTAC 100 ATTCAAAAAT ATACTTTATA TTAAACAAAA TCTCAACTCA CATATATATA 50 TATATATATA CATATATATA TATATCTATA TGAATAAACA TATAAGTCTG end of file 4058 3 4060 4 4061 1 + 8 4062 9 4063 4 4066 9 4067 9 4068 4 Date: Monday, 3/25/2002 Time: 00:00 c4069.txt chrblob_4069|2001.10.15|GENOMIC|Sanger FEATURES Location CDS join(642..836,1044..1856) /gene="chrblob_4069.glm_1|24oct01" /note="(protein coding) 29% identity to hypothetical protein PFB0145c - malaria parasite (Plasmodium falciparum)" /codon_start=1 ORIGIN watson strand 1 TATATTATAT AATAAAATAT AAAAAAAAAA AAATTTCTAT ATATTTTCTC 51 ATTTTTTAAA TTTATTTTTA TACAACTGTA TTATATAACA TTTCTATTAT 101 TTTTTGAAAT GTTAATTATT ACTTCCAATT TTTTTTATTA AAAAAAAAAA 151 AGAAAAAGAG AAATTTAAAT GTACATTTGT TCTAAGTGTA GTGAAAATAT 201 TATGTAAATA GCCTATTTAT ATATTTTTAT AAAATATAAA AAACCGTAAT 251 TTTTGTGTAT ATGATATATA TATATATATA TATATATATA TTTATATATA 301 TATGTATGTA TAATATTATC TATATACTTG GTTATATCTA TTTTAAATAT 351 TACATAAATA AATATAGTAT TTAAAAGTTT TTCGTTACAT ATTTATGTAT 401 GTTATATATT ATATATATTT ATTATTTTAA TATGTACAAT TTTGGGGTAT 451 CTTTATAGAA ATAACTTAAA AATATAATAT TGTATTTATT TCAAAACACC 501 CCCCCCCCCC CCAAAAAAAA AAGGAAAAAA AAAAAAAAAA AAAAAAAAAA 551 AAATTAAAAT ATTATAAAAA AAAATAAAAC AAATTAGCAC CGTTTATAGG 601 AAATATTATA AAAATATTTA GAAGATAATT AATATTTAAA A start chrblob_4069.glm_1|24oct01 glm exon 1 642 ATG AGC TTA 651 TTT ACA AAA TTT AAT TCT CAA GAC TAT AAA AAT GGA ATT ACA AAA AAT TT 701 A TCA AAT ACA GAG CAA AAT AAT ATA ATT AAT ATA AAT AAT GGA TAT AAG A 751 AA AAG ACA TCA TGG AAC TGT TTA GGT TCT TTT AGA AAT ATA TGT TTA ACA 801 TTA TGT GTT ATA ACA GCA TTA TAT ATA CAA TTC AAA intron GTAA GTTCAAAAAA 851 AAAATTAATA TATGATGTTT TATTTTAGTA GTATTATTTT TATTTACATA 901 TACCCCAATA TGTATATATA TAATATATAT ATATATTAAT TATATGGTTG 951 AACTGTATAT ATCCCAATTT TTTTTTTTTT TTTTTTTTTT TTTTGAAAAA 1001 ACATATATTA TATATATATT TATTTTTTTT AATATTTTTA TAG exon 2 1044 AAT AAA T 1051 AT GGG GAG AAT AGT TCA TGT GTT GTA CAG TTG GAT AAG ATA AGT TCA AGA 1101 AAT TTA TCT GAT GTA CAA GTA GAA AAT TTT CCT TCT TTA AAT CAT GGT GA 1151 T AAA ACT TAT AAA AAA AAT GAT GAA AAA GAC GAA TCG AAT AAT GAG AAT T 1201 CA AAT ATA AAT AAA CAA GCA GAT GAA GAT AAT GAA GAG GTT TCA CAA AAC 1251 AAT AAT AAT AGT AAT AAT AAT AGT AAG AAT AAT AAC AGT AAT AAT AAT GT 1301 A AAT AAT AAT ATA AGT AAT GTT AGT AAT GAT TCA GGA AAT GTC GTA GGT A 1351 AA AAG ATT AAG AAG AAA ACA TAT TTA AAT TAT AAT GAT ATG ACA AAA CAA 1401 TTA ACA AAG GAA GAA TTA TTT TAT GTT CTT GAT TCT TTA AAA AAG GTA CC 1451 A GGA AGA AGA AAC CTT AAT AAT ATA TGG AAA CAT GCT CTT GGT GTA ATA A 1501 GC GAT ATA TTA GAT GAA AAA TTA ATT GAT CTA AAT GTA TAT ATA CAG AAA 1551 TAT AAA AAG AAA TAT GAA AGT AAA CGT GAT GAA CAA TCT TAT CGT ATT AG 1601 T AAA AGT GGT TTA ATG GAA AAA TAT TTA GAT GAA TTT GAT GAA AGA ATA A 1651 TG GAA CAA AGA ATG ACA TAT AGT AGT AAT TTT AAA CAT TTA ATA CAT AAA 1701 AGT CCT TCA TTA GAT GAT ATA AAA AAT TTC ATT CAT ACA TTT ATA GAT GA 1751 T TTA GAA AAG TTA ATA AAT TAT ATG TAT GGT AGT TAT AAA CAT ATA TTT C 1801 AA TTA GTA AAT GAA GAA CCA TCT AAA GCA AGT TTT AAT GAT TTT ATA TTT 1851 AAA TGA* 1856 stop chrblob_4069.glm_1|24oct01 ATAT ATATTTCTAA GATAAAACCC AAGGATAAAA ATTAAGAGCG 1901 TCATTATATT TACAGAAGCT TAATATGTGT TTAAAGTGTA ACATAAAGTA 1951 ATAGAAAAAA TTAAAATTAA ATAATATACT AATTATTATT AATATGGTAT 2001 TATATTATAT TATATTATAT TATATTATAT TATATTATAT TATATTATGT 2051 TATATTATAT TATATTATAT TATATTATAT TATATTATAT TTATTATTAT 2101 TATTATTATT TTTTTTTTGT TAGCCGTATT TTTTTTTAAT ATATATTTTA 2151 AATTATATAT TTATATATTA ATCCGAAACG TGAAAATAGG GAAAAAGAAC 2201 ATATATATAT ATATATATAT ATATATATAT ATATAATATT GATATCTTAT 2251 ATATTCATAT ATTTTACATT AATTAATGTT TCTTTTATTA TTTGATTTTT 2301 GTGGATTTGT ATTTTTATAA TCTTCTTAAA TTCAATTAAA ATCAATTATA 2351 AATTATTTAA ATGTGTATAG TTCCCTTTTT TTCTATGATG TTTTTTTTTT 2401 TTTTTTTTTT GTTATTTATA TAAAAAAAAA TTAACTATAA GTGATAATAT 2451 TTTACCGTAA TTTATTTAGT ATAATTAACT TATTTAAATT TATAATAATT 2501 TGTTCTGTGG CTAATATTTA ATATTGTCAT TAATAAAATA TGTAATGGAA 2551 AAAGAATGTT TATTATTATA TCTTTTTAGT TATAACATTA AATATTTATT 2601 TTATTTTGAT TATGAAATGG TGTTGTGAAA GGAAATTATA TATATATATA 2651 TATGTATATA TGTGAAACAT AAAATATATC TGTCTATTGA ATATATTATA 2701 GATATTTATT AGGTAACCAT TTATATATTA TAATAATTAT ATGAGTGTAG 2751 GTTTTTTTTT TTTTAATTTT TTTTTTTTTA TAGAATATAT TTAGCAATAT 2801 AACATAACTT ATATGATTTA ATTTTTTTAG AATGGTTCTA AGTTATATGA 2851 ATTTTATAAT TAATAATAAT TTCATTTTTT ATAACTATTT TGATATATGT 2901 TATAAAATTT ACATATTTAT TAAATATATA TATATATATA TATATATATA 2951 TATATATATC CCATTTTATG TGAATTTTAA TTATAATATT CTCATATAAT 3001 TTGTTATTTC TTGTAGAATA TATTTTTATT TTAATACAAT GCTACAAAAG 3051 TGCGATCAAT TTTATGATGC CCATTCAAAA AAAAAGTGTC CGAATTAAAA 3101 AGAAGA ATG AAT CTA GAG TTA ATA AGA AGT AGG GAA AAT TAA AATGAAAA 3151 GAGTAAAATA CACGAAACAA GTTATAGTAT TCTACAACTT TTAGGATATA 3201 AGAAAATAGT TACAGAAAAT AATTATAATG ATATAATAAA TGAAATAAGG 3251 TTATAAGAAT TACGTCATTT ATTAAATAGA TTTATTTAAA TTTGACCTAA 3301 AG ATG ATC TTT ATA ACA TCT GGT TTT AAT TAT TTG ATG TAC CTA AAG AAG 3351 ATA GGC ATA AAA AAT AAT GAA TAA TTTATA GCTTTACATA AAAAGATTAT 3401 TAAAATGAAT ATGAATGTTC TAATTCCAAA AAGGGGATTT AAAATGCAAA 3451 GTTGAAGAAT AAATATTTAA ATATTGTACT AGGTATAATT GAATACATGA 3501 TATTTTTTTT TTTTTTTTTT CATATGAATT GTATAAATAA AATATATTGA 3551 TCATTTTTAG AATTTAGTTA GTATGGGAGT ATTATTTGAA GAAATAAAAA 3601 GTTTGATTTA TTCCTATATG TATTAATGTG GTATATTAAT AATAGAATTA 3651 TATAATAAAT ATAAAAAAAT ATATTACGAA AGAATAAATA ACCATAGAAG 3701 ATTGAATAGA AATTAGAATT ATATGTAATG TTGATTTTTT TTTTTTTTTT 3751 TTTTTTTTTT TATATTGTTT TGTGTGATAT TTTATATTTT CCTTTTTCCT 3801 AGCTTAAAGA TGTGCTCTTT TTGAAATTAC AAAAAATAAA ATGTAAATAA 3851 ATAAATAAAT ATAAATTTAT ATATATATAT ATATATATAT ATATATATAT 3901 ATGTTGCGAA GTGATAATTG AAACGTATTT TATAAATAAC ATTAACGATT 3951 TATTAAATAA TAATAAAGTA GAAATATATT TCGTTAATTC AAATACATAT 4001 ATTATATTTA GTAAATATTT AATATACTAA TTAAAAGGAA CTTTGTATTT 4051 AATTTTATAA TACATTTATT ATTATGTGTA TAATATTTTA TTATCTGTCA 4101 CGTGCATATT ATTTTAATTA TGAAAACTAT ACACATACAG TTTATATTTA 4151 CTTAAATATT AAGAGAAAAA AGAATAAATC TAATATAATA TGGATTACAA 4201 ATAGGTTGTA CGTTTTTTTT TTTTTCTTTC TTTAATTTGA ATAAAATTAA 4251 TTCAATATGA ATATGGTCAT ATAATAATGA ATTATTTTGA AGGTTTTTAT 4301 GTATATATTA TATAGTACTA AAAAAAAAAA ATACATATAT ATATATATAT 4351 ATATATATAT AAATTAATAT ATTTAAATAT TATGTATCAA AAATATATGT 4401 AAATATAATA TATATGATAA TTCCTTTTTT GAAAAAAGAA AAATTACATT 4451 TTATATTAAT TAATATTTTG AACGTAAAAA AATATAAATA TTATGAATTA 4501 ATTTCTTTTA CGTAATATTT ATTTTTACCT TAATATATAA TATTTATTTA 4551 TGTTTGAATT // crick strand 4560 AATTCAAACA 4550 TAAATAAATA TTATATATTA AGGTAAAAAT AAATATTACG TAAAAGAAAT 4500 TAATTCATAA TATTTATATT TTTTTACGTT CAAAATATTA ATTAATATAA 4450 AATGTAATTT TTCTTTTTTC AAAAAAGGAA TTATCATATA TATTATATTT 4400 ACATATATTT TTGATACATA ATATTTAAAT ATATTAATTT ATATATATAT 4350 ATATATATAT ATATATGTAT TTTTTTTTTT TAGTACTATA TAATATATAC 4300 ATAAAAACCT TCAAAATAAT TCATTATTAT ATGACCATAT TCATATTGAA 4250 TTAATTTTAT TCAAATTAAA GAAAGAAAAA AAAAAAAACG TACAACCTAT 4200 TTGTAATCCA TATTATATTA GATTTATTCT TTTTTCTCTT AATATTTAAG 4150 TAAATATAAA CTGTATGTGT ATAGTTTTCA TAATTAAAAT AATATGCACG 4100 TGACAGATAA TAAAATATTA TACACATAAT AATAAATGTA TTATAAAATT 4050 AAATACAAAG TTCCTTTTAA TTAGTATATT AAATATTTAC TAAATATAAT 4000 ATATGTATTT GAATTAACGA AATATATTTC TACTTTATTA TTATTTAATA 3950 AATCGTTAAT GTTATTTATA AAATACGTTT CAATTATCAC TTCGCAACAT 3900 ATATATATAT ATATATATAT ATATATATAT ATAAATTTAT ATTTATTTAT 3850 TTATTTACAT TTTATTTTTT GTAATTTCAA AAAGAGCACA TCTTTAAGCT 3800 AGGAAAAAGG AAAATATAAA ATATCACACA AAACAATATA AAAAAAAAAA 3750 AAAAAAAAAA AAAAAATCAA CATTACATAT AATTCTAATT TCTATTCAAT 3700 CTTCTATGGT TATTTATTCT TTCGTAATAT ATTTTTTTAT ATTTATTATA 3650 TAATTCTATT ATTAATATAC CACATTAATA CATATAGGAA TAAATCAAAC 3600 TTTTTATTTC TTCAAATAAT ACTCCCATAC TAACTAAATT CTAAAAATGA 3550 TCAATATATT TTATTTATAC AATTCATATG AAAAAAAAAA AAAAAAAATA 3500 TCATGTATTC AATTATACCT AGTACAATAT TTAAATATTT ATTCTTCAAC 3450 TTTGCATTTT AAATCCCCTT TTTGGAATTA GAACATTCAT ATTCATTTTA 3400 ATAATCTTTT TATGTAAAGC TATAAATTAT TCATTATTTT TTATGCCTAT 3350 CTTCTTTAGG TACATCAAAT AATTAAAACC AGATGTTATA AAGATCATCT 3300 TTAGGTCAAA TTTAAATAAA TCTATTTAAT AAATGACGTA ATTCTTATAA 3250 CCTTATTTCA TTTATTATAT CATTATAATT ATTTTCTGTA ACTATTTTCT 3200 TATATCCTAA AAGTTGTAGA ATACTATAAC TTGTTTCGTG TATTTTACTC 3150 TTTTCATTTT AATTTTCCCT ACTTCTTATT AACTCTAGAT TCATTCTTCT 3100 TTTTAATTCG GACACTTTTT TTTTGAATGG GCATCATAAA ATTGATCGCA 3050 CTTTTGTAGC ATTGTATTAA AATAAAAATA TATTCTACAA GAAATAACAA 3000 ATTATATGAG AATATTATAA TTAAAATTCA CATAAAATGG GATATATATA 2950 TATATATATA TATATATATA TATATATTTA ATAAATATGT AAATTTTATA 2900 ACATATATCA AAATAGTTAT AAAAAATGAA ATTATTATTA ATTATAAAAT 2850 TCATATAACT TAGAACCATT CTAAAAAAAT TAAATCATAT AAGTTATGTT 2800 ATATTGCTAA ATATATTCTA TAAAAAAAAA AAAATTAAAA AAAAAAAAAC 2750 CTACACTCAT ATAATTATTA TAATATATAA ATGGTTACCT AATAAATATC 2700 TATAATATAT TCAATAGACA GATATATTTT ATGTTTCACA TATATACATA 2650 TATATATATA TATAATTTCC TTTCACAACA CCATTTCATA ATCAAAATAA 2600 AATAAATATT TAATGTTATA ACTAAAAAGA TATAATAATA AACATTCTTT 2550 TTCCATTACA TATTTTATTA ATGACAATAT TAAATATTAG CCACAGAACA 2500 AATTATTATA AATTTAAATA AGTTAATTAT ACTAAATAAA TTACGGTAAA 2450 ATATTATCAC TTATAGTTAA TTTTTTTTTA TATAAATAAC AAAAAAAAAA 2400 AAAAAAAAAA CATCATAGAA AAAAAGGGAA CTATACACAT TTAAATAATT 2350 TATAATTGAT TTTAATTGAA TTTAAGAAGA TTATAAAAAT ACAAATCCAC 2300 AAAAATCAAA TAATAAAAGA AACATTAATT AATGTAAAAT ATATGAATAT 2250 ATAAGATATC AATATTATAT ATATATATAT ATATATATAT ATATATATAT 2200 GTTCTTTTTC CCTATTTTCA CGTTTCGGAT TAATATATAA ATATATAATT 2150 TAAAATATAT ATTAAAAAAA AATACGGCTA ACAAAAAAAA AATAATAATA 2100 ATAATAATAA ATATAATATA ATATAATATA ATATAATATA ATATAATATA 2050 ACATAATATA ATATAATATA ATATAATATA ATATAATATA ATATAATATA 2000 ATACCATATT AATAATAATT AGTATATTAT TTAATTTTAA TTTTTTCTAT 1950 TACTTTATGT TACACTTTAA ACACATATTA AGCTTCTGTA AATATAATGA 1900 CGCTCTTAAT TTTTATCCTT GGGTTTTATC TTAGAAATAT ATAT "chrblob_4069.glm_1|24oct01" 1856 TCATTT 1850 AAATATAAAA TCATTAAAAC TTGCTTTAGA TGGTTCTTCA TTTACTAATT 1800 GAAATATATG TTTATAACTA CCATACATAT AATTTATTAA CTTTTCTAAA 1750 TCATCTATAA ATGTATGAAT GAAATTTTTT ATATCATCTA ATGAAGGACT 1700 TTTATGTATT AAATGTTTAA AATTACTACT ATATGTCATT CTTTGTTCCA 1650 TTATTCTTTC ATCAAATTCA TCTAAATATT TTTCCATTAA ACCACTTTTA 1600 CTAATACGAT AAGATTGTTC ATCACGTTTA CTTTCATATT TCTTTTTATA 1550 TTTCTGTATA TATACATTTA GATCAATTAA TTTTTCATCT AATATATCGC 1500 TTATTACACC AAGAGCATGT TTCCATATAT TATTAAGGTT TCTTCTTCCT 1450 GGTACCTTTT TTAAAGAATC AAGAACATAA AATAATTCTT CCTTTGTTAA 1400 TTGTTTTGTC ATATCATTAT AATTTAAATA TGTTTTCTTC TTAATCTTTT 1350 TACCTACGAC ATTTCCTGAA TCATTACTAA CATTACTTAT ATTATTATTT 1300 ACATTATTAT TACTGTTATT ATTCTTACTA TTATTATTAC TATTATTATT 1250 GTTTTGTGAA ACCTCTTCAT TATCTTCATC TGCTTGTTTA TTTATATTTG 1200 AATTCTCATT ATTCGATTCG TCTTTTTCAT CATTTTTTTT ATAAGTTTTA 1150 TCACCATGAT TTAAAGAAGG AAAATTTTCT ACTTGTACAT CAGATAAATT 1100 TCTTGAACTT ATCTTATCCA ACTGTACAAC ACATGAACTA TTCTCCCCAT 1050 ATTTATTCTA TAAAAATATT AAAAAAAATA AATATATATA TAATATATGT 1000 TTTTTCAAAA AAAAAAAAAA AAAAAAAAAA AAATTGGGAT ATATACAGTT 950 CAACCATATA ATTAATATAT ATATATATTA TATATATACA TATTGGGGTA 900 TATGTAAATA AAAATAATAC TACTAAAATA AAACATCATA TATTAATTTT 850 TTTTTTGAAC TTACTTTGAA TTGTATATAT AATGCTGTTA TAACACATAA 800 TGTTAAACAT ATATTTCTAA AAGAACCTAA ACAGTTCCAT GATGTCTTTT 750 TCTTATATCC ATTATTTATA TTAATTATAT TATTTTGCTC TGTATTTGAT 700 AAATTTTTTG TAATTCCATT TTTATAGTCT TGAGAATTAA ATTTTGTAAA 650 TAAGCTCAT 642 "chrblob_4069.glm_1|24oct01" T TTTAAATATT AATTATCTTC TAAATATTTT TATAATATTT 600 CCTATAAACG GTGCTAATTT GTTTTATTTT TTTTTATAAT ATTTTAATTT 550 TTTTTTTTTT TTTTTTTTTT TTTTTTCCTT TTTTTTTTGG GGGGGGGGGG 500 GGTGTTTTGA AATAAATACA ATATTATATT TTTAAGTTAT TTCTATAAAG 450 ATACCCCAAA ATTGTACATA TTAAAATAAT AAATATATAT AATATATAAC 400 ATACATAAAT ATGTAACGAA AAACTTTTAA ATACTATATT TATTTATGTA 350 ATATTTAAAA TAGATATAAC CAAGTATATA GATAATATTA TACATACATA 300 TATATATAAA TATATATATA TATATATATA TATATATCAT ATACACAAAA 250 ATTACGGTTT TTTATATTTT ATAAAAATAT ATAAATAGGC TATTTACATA 200 ATATTTTCAC TACACTTAGA ACAAATGTAC ATTTAAATTT CTCTTTTTCT 150 TTTTTTTTTT TAATAAAAAA AATTGGAAGT AATAATTAAC ATTTCAAAAA 100 ATAATAGAAA TGTTATATAA TACAGTTGTA TAAAAATAAA TTTAAAAAAT 50 GAGAAAATAT ATAGAAATTT TTTTTTTTTT ATATTTTATT ATATAATATA end of file 4070 4 4071 4 4072 8 4073 9 4074 4 4075 5 4076 4 + 14 4077 4 4078 7 4079 5 4080 4 4081 9 4082 9 4083 10 centromere 4084 5 4085 7 4086 5 4088 10 4089 9 4091 11 telomere 4092 5 4093 9 Date: Tuesday, 3/26/2002 Time: 09:23 c4094.txt chrblob_4094|2001.10.15|GENOMIC|Sanger FEATURES Location CDS 103..1536 /gene="chrblob_4094.glm_1|24oct01" /note="(protein coding) No NR protein Similarities" /codon_start=1 CDS 2240..3043 /gene="chrblob_4094.glm_2|24oct01" /note="(protein coding) No NR protein Similarities" /codon_start=1 cds 3667..3954 /gene="chrblob_4094.glm_3|24oct01" /note="(protein coding) No NR protein Similarities" /codon_start=1 CDS join(3225..3302,4020..4796) /gene="chrblob_4094.glm_4|24oct01" /note="(protein coding) 32% identity to (AL161491) hypothetical protein [Arabidopsis thaliana]" /codon_start=1 ORIGIN watson strand 1 TTTCAATTTT TTTTCTTTTT TTTTTTTTTT TTCACCGAAT TCAAAACCCA 51 AACTATTTCT TTTTTTTTTT ATTTTTTAAA AAATAATTTA AAAAAACAGA 101 TA start chrblob_4094.glm_1|24oct01 glm exon 1 103 ATG GAA GAA ATT ATA ACA TTT TCA ACA TAT GAA TCA CAA ATT TAT GGT 151 TTT TCA TGT GAT TAT CCG AGT AAT TGG ATA AAA ACA GAT AAT TCA TTT TT 201 T GTA GTT GGA TTT AAA GAA AAA GAA GAA TTA ACT TAT CCT TCA TTC AAT A 251 TT CAA ATT ATA GAT TTA TCA ATG TTT TCA AGG GAT ACA TCA TTG GTG AAA 301 GTT GAT CAG TTT CAA CAA ATG ATA ATG GGT GAA ATA TTA AGA GTT GGT GC 351 A AAA CCA TCA AGT TTC TCT GAC GAA TTA ATT GGT GGC AAA TAT AAT GGT C 401 GT TCA ATT ATT TAT TAC TTA CCA AAT GAT CAT ATG AAA TCC AAA CAA TCC 451 TTC TTT TTC GAT CAA GGT CAT GCC TAT ATA ATT TCA TAT ACA TCA AAA GC 501 A GAC GAA TTC TTT CAA CAA CAT TTA TAT GTT CAC GAT CAT GCA ATT AGT T 551 CT TTT AAT CTA TTT AAA TGT AAA GGT TAT AAA TTT TTA CAA TTA TCA ATG 601 AAT TCA TTA TTA TTA TCA TCA TCG TCA TCG TCA TCA ACA TCA AAT TCA AA 651 T GAA ATA TAT TTA GAG TAT TTT TAC CCA AAA GAT TGG TCA AAG AAA ATT A 701 AT GGA GAT ATA CAA CAT ATT TAT AAG GAT GAA AAG GTG GTG CTT GAT GGA 751 GGT TTA GTA TTT AGT ATT ACA AAA AGT GAT AGT GAA TTT ACA AAT GAT GG 801 T AGT TTA GGT GAT GAA TGC AAA GAC ATT CAA ATC AAT TTG AAT TAT CGT G 851 AT GGT AAT GGT AAA AAG TTA GTG GTT GTA GCC AAA CAG TAT GAT AGT GAC 901 AAT GGT AGA GAT GTT TTA TTC CAA TTC GAT CAA TGG ATA AGA TTA TCA TT 951 T AGA GTA CCA AAT GGA GAT AAA GCT TAC TAT GTT AAA GTA TTC GAT AGA C 1001 TA ATC AAT TAT TTA GGT GTA ACA AGT GGA CAT ATA CTA AAA GCA AGA TCA 1051 CCA TTA CCT TAT GAT ATA TTC GAT AAT TTA ATG GTT GGC TAT AAT TTA AA 1101 T ATA CCA AAA TCA TTT GAA CTC GCA TCA ATT AAA CCA AAT GGT GAA ATG A 1151 TA TCA TTC AAA GAT ACA ACC AAG AAT ACT AAT GAT TTA CCA TAC TGT GTA 1201 AGA ATT GCA GTT GAA GAT ATC TCA TCA GCA GGT ATT ATT AGG CTA AAT GA 1251 A TAT AGT AAT GAT GTC ATT GGT AGA ATG TTA CAA TTA TTA CCA GAA TCG A 1301 AA TTG TTA ACT GAA GAA CCA AGT TTC ATT CGT TTA GAT AAA CAT CTA GCC 1351 TCA ACA GCT TCC ATT CAA TGC TAT GAT GTT GAA TTA GGA CAA CCA TCA AT 1401 T CAA TTA ATT GCT ACC TCT GTT CAA AAA TCT CAT GGT ATA GTA ATC ACA A 1451 TG AGA ACA AAA GCC TCA AAT CAA TTT GGT ATA ATT TAT AAA AAA TCA TTT 1501 TAT ATT TTC GAT TCA TTT TGT TAT TAT TAT GAA TAA* 1536 stop chrblob_4094.glm_1|24oct01 ATTT TAAAAATTAT 1551 TTTTATTTAA AAAAAAAAAT AAAATAAAAA AATAAAAAAT AAATAAAAAA 1601 AAAAATCTTT TTTCTTTTTT TCATTTTTTT TTTTTTAAAT TTTATTTTTC 1651 TTTTTTCTTT TTTTTCTTCC ACACATAAA start chrblob_4094.glm_2+4.1|24oct01|alt1 vbc exon 1 1680 >ATG TTC AAG AAG GTA TTA GGT 1701 TTA ATG GGT GAT AGT TTA AAT AAC TAT ATG AAC CCA AAC CTA AAT AAT AC 1751 T GAT AAT AAA AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT A 1801 GT ACA AAA AAT AAC TCA CCA CCA CAA CAA AGT ACA ACA CCA CAA CAA CAA 1851 AGA AAT AAT AAT AAT GAT GAT AGT GAA GAT GAG GAT GAA TAT GGT TTA AA 1901 A AAT GAA ATA GAA TTA TTT AAA AAT ACA TTA GTA AGT AAT AAT AAT AAT A 1951 AT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT 2001 AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AA 2051 T AAT AAT TTT TTT TAT TTT TTT ATT TTT TTT TTT TTT TAA* stop chrblob_4094.glm_2+4.1|24oct01|alt1 start chrblob_4094.glm_2+4.1|24oct01|alt2 vbc note frameshift near 3014 note possible sequence error at end of intron exon 1 1680 atg ttc aag aag gta tta ggt 1701 tta atg ggt gat agt tta aat aac tat atg aac cca aac cta aat aat ac 1751 t gat aat aaa aat aat aat aat aat aat aat aat aat aat aat aat aat a 1801 gt aca aaa aat aac tca cca cca caa caa agt aca aca cca caa caa caa 1851 aga aat aat aat aat gat gat agt gaa gat gag gat gaa tat ggt tta aa 1901 a aat gaa ata gaa tta ttt aaa aat aca tta repeating intron note possible sequence error gtaagtaat aataataata 1951 ataataataa taataataat aataataata ataataataa taataataat 2001 aataataata ataataataa taataataat aataataata ataataataa 2051 taataatttt ttttattttt ttattttttt ttttttttaa AAAAATAAAA 2101 CTTATTTTAT TTTTAAAAAA AG exon 2 AAA GTT AAT AAT ACA TCA TCA AGT TTA G 2151 AT ATT TTA ATA ATT AGA ATT ATA GAT AAA GTT AAT AAG AAT GAA TTT GAA 2201 GAA GGA TTA AAA TTA TTA AAA CAA TTT GTA TAT ATA GTT ATG GAA GCA AT 2251 T AGT AAA CCA ATT GTA ACA CCA TCT ACC AAT GAT AAT AAT AAT ATG ACC T 2301 AT AAT ACA ATT TAT GAA AAA TAT CAT ATA CCA CCA TTA AAT AAA ATT GAA 2351 GAA CTT TAT CAA ATT ACA AGA TCA AAA ACT GAA GAA ACC ATG AGA ACA AA 2401 T AAT GAG CAA TCA GTT ATA CAA TTA TCA TTA ATT TTA TCA ATT GTA CAA C 2451 AA ATT AAA TAT AAA TTA GTT TCT AGA AGT ATA CCT AAT CAA CAT CAA AAT 2501 ATA ATC ACA TTT GAA AAT AGT GGT GAA GAA GAT GAG GGC TTA GTA ATC TA 2551 C ATT CAG TTT CAA AGA AAG GTG ATT CTA CAA GAT AGT GGT CCC ATC ATT A 2601 AA GAT ATG TTA AGA ATT AAT CAA CAA TTA TCA GAG AGT TAT TCA GAT GCA 2651 TCT ACC AAT AGT TTA AAT GAT ATT AAA TAT AAA GTG AAA TCA ATA GAT AA 2701 C TGT CTA ATG GCT TTG AAA AAA GTT TTA TCA AGT GTT GTT CAA AAA GTT T 2751 CA GAC TCA ATT CGT GTT GGT AAT GAT CAA TGG CGA TGG AAT GAT ATG ATC 2801 CTC TTT GAA AAG TAT AAA ACT AAA TTG GTT GAA TGG AAT TCA AAT AAT TT 2851 A ACA TTA CCA CTT CAT AAT CAA TCT GCA CAA TAT TTA GAT CAA ATT TAT T 2901 CA ATC ATT TTA GAA AAA TTA AAA GAT TCA AAT TTA GTA AGT GGG GTA ATC 2951 ATA TAT ATA CTT TTT GTT TTT GAT TTT ATA ATA TTA ACA AAT GAT TAT TT 3001 A ATA ATA GTT AAA [A] AAA TTA ACA GAT GCA AAT ATA TCA ATT GAA GAT TTA 3051 ATT AAT AAT TTT AAA TAT AGT CAA AGT GAA ATT GAA TTA ATT CAA CCA TT 3101 G TTG GGA ATT GAT GAA TTG TTA AAT CAA ATT TCA TCA ATT TCA GAG ATA T 3151 CA GAA CGT TAC ATT TCA TAT ATT CAA ACT CAT TGT AAT ACA AGT ACA AAT 3201 AAA AAA GTA CCC CAA TTA AAT GAT ATG AAA AGT AAA ATT CAA GAG ATT AT 3251 G ACA AAC TAT TCT TCT TTT GAA ACT CAA TAT TTT CAA CTT TCA TTT TCA T 3301 TT GTA TGT ATA CAT TCA TAT ATT ATA TAA 3329 stop chrblob_4094.glm_2+4.1|24oct01|alt2 A TATATAATAT ATAATTTTAT 3351 TATTTGTTTT TACTTTTGAA ACATTCTCTT CTCCAATCTT TTTTTCTGAT 3401 GTGACATTTC AAATGACAAA GAATTTTTTA TTTTTTTCTT TATTCTTTTT 3451 AATTAAAACT AAAGATTAAT TAAAAAATTC TTATCTTTTG AAATGTGACT 3501 CAGCAAAAAA AGATTGGAGA AGAGAATGTT TAAACAGTAA AATGAGTAAT 3551 AAAAAATAAT AAAAAAAAAA AAAAAAAAAG AAAAAAGTTA ATAATAACAA 3601 CATCAAACTT ACTTTTAAAT TTAGTCAATA TATAATGATG ATTTAAGAAG 3651 ATTTATTGTC AATCAA start chrblob_4094.glm_3+4.2|24oct01 vbc exon 1 3667 ATG AAT CAT AAC CAT AAT AAT AAC AAT AAT AAT A 3701 AT AAT AAT AAT AAA AAT GTA CAT CAA TCA CAG CAG CAA CAA CAG CAA TTA 3751 TTA CAA CAA CAA CAA CAA TTA CAT CAA CAA CAA TTA ATA TTT GAA CAA GA 3801 A AAT AAT ACA TCT AGT ATG GTT GAT AAT ATA TTT TTT GTT TTT AGA AAA G 3851 TA GCA GGA AGA GCA ATC TCT TCA TCA AAT TCA CCT ACG ACT TGT GCT GTC 3901 ATT AAT TTG ACT TTA GCA AAT TTT GAT ATG ATT TAT ATG CCT intron GTAAGTAA 3951 ATAAATTCAA TTTTTAAAAA ATAATTCTAT ATATACTAAT TTAATTTTTT 4001 TTTTTTTTAT TTTTTAAAG exon 2 4020 TAT TTT GAA AAT TTA TTA GAA TAT AAT TAT T 4051 CA GAT GAT TTT GAT AAA AAG AGA GAT ATA TTT TTA ATT ATA TTA AAT AAT 4101 TTA ACA TTA ACT AAA GAG TAT ATT TAT AAA GTT AAG GAT CAA TTA AAA GA 4151 A ACA ACA TTT TTA AAA TTT AAA GAT GAA AAT GAT AGA AAA GCA ATC ACT A 4201 TG TGT ATA GAA GGT AAT GGT GAT GGA TTT TCA ACG GTT ACC AAG AGT ATT 4251 GAT AAT ATA TTA AAG GAG AAT ATT AAA AAG ATT GTT CAG GTG AAT TCT CC 4301 A TCA CTT ACA AGA TTA ATT TGG CCA TTT AGG AAT ACA AAC TAT GAA ATT G 4351 GT GAT GAG GAA TTT GAA AAT TAT GAA ATT AAT GAC CCT TTT GCA ATG GAT 4401 TTC TTG TCC GAG TTG ATG GCA TTA TTG CAA CCC TAT AAA AGA AAA TTC AT 4451 A GCA GAG AAT TTC GAT CAA CTC ATT CAT CTA ATG TCA ACT TTT ATC GCA A 4501 AA ACC ATG GAA GAT TTC ATA ATG CAA AAA CGT TTC AAT CAA TTG GGT GGA 4551 ATT CAA TTG TCA AAG GAT ATT AGA AAA ATC ATT GAT TTC CTT TGT AAT AT 4601 A ACA ACT GAA CAA AAT ATT AGA CAT AAA TTC ACA AGA TTA TCA CAA GTT G 4651 TT CAT TTA TTA ACT TTT GAT AAG GTA AAT GAT ATT TTA GAA TAT TGG AAT 4701 CAA CCA GAT TAT AAA TGG AAT TTA AAT GTA TTA GAA ATT AAA TTA GTT TT 4751 A GGT AGA AGA TCT GAT TTT AAT GTT CAT AAT TTA AAT TTA AAA TAA* 4796 stop chrblob_4094.glm_3+4.2|24oct01 ATAA 4801 AATAAACCAA AAAAAACCAA AAAAAAAAAA AAAAAAAAAT TATAATATTA 4851 ATAATAATGA TAATAAAAAT AATAATGAAA ATAATAATAA TAATAATAAA 4901 TAAATTTTTA ATATTTGTAA ACTGATACAT AAATATTTTC TAATAAAAAA 4951 ATTAAAAATA ATAATAAAAA TAAAAAAAAT AAAAAATATT GAATTCCTTT 5001 AAATTTATTA TTAAAATTTT ATTGGAATCC CAATAATCAA CATTATTTTT 5051 ATTTTTATTT TTAAATCGCT GATTAACAGT TTTATCAACA TTAAATTATT 5101 GAAAAACATA AATTATGTCA TGGAATAAAA AAGAGATTTA AAACCTTAAA 5151 TTGTTAATAA TTTCGAAAAA ATAAAAAAAA AAAGGTTTGT AATAAAATGT 5201 GTTAGTTGGT TGGTATTTAG ATTTAATTAT TTATTTTCTT TTTGTTTGTA 5251 TGGCGCAATT TTAAAATAAA AGATAAAACA ATATCAGTGG ATATATATAA 5301 ATTTAATCAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAATGG 5351 GAAAAAAAAA AAAAAAAATT GGAAAACCAC TATTAGAATA ATCAATTGAT 5401 TTCCCATCAT ATCACATACT CGTGTACACC CAAATAAAAC TCATATATAT 5451 AAAGAGTGGA ATAAAAGGTA ATATAAAATA AAAATAATTT TAACGGTTTT 5501 TTAAAATAAA AAAAATCAAA CAAAACAATA TGATTTAACC CCAACCCAAT 5551 ATTTCGAGAG TGTAAAAATT GTTTAGGTGT GTGAGTGTGT TTGTTTTTCA 5601 TTAAATAAAA ACCCTCATTC ACTCTGTTTT TCATAATTTT ATTCACACAA 5651 ACAGAAATTC ACTTAAATTT TAAAAAAAGG CCAATTACAA AATAAAGCTG 5701 GAGTTTGTTA TTGATAAAAA AAAATTTTTT TTATTAAATC CCCCATTAAA 5751 TCAAATATAT ATTTATAAAA AATTTTTTTT TTTTTTTTTT TTTTAAATGT 5801 CAAATTTTAT TATTATTTTC TATTGATCTA TTAAGATAAA AATGGAAGGA 5851 ATTTGTATAT CAAATACAAG TAAACCATTA TTTGAAATAA TTTTTAATAA 5901 AAAAAAAAAA AAAAAGGATT TCTTCTATTA GCTGAATAAA ATTCAACAAA 5951 AAAATCATTA GATATATCAT TTTTAGTGGT ATGGGTGTGT TGTTTTTAAA 6001 AAAAAAAAAA AAAAAATTTA AAAAAAAACT TAAATAAATA CATAATAAAA 6051 AAATCAAATT TCTATTTTTT TTCCACACAA TCTTTTACCA CACACAAATT 6101 GATTAGTGTT GATATAAATT TAACAAGGTG AAAAAACTCA CAATGACGCC 6151 AAATCACCTT GTAAAATAAT AAAGAAAAAA AAAAGTCAAT AAAAATTAAA 6201 GCAAATCTAT TTTTAAATAG GAATATTTGT AAATATTCAA TTAAAATATG 6251 TGAACATAAT ATTTATAATT ATTATCATCA TAATAATTAA CACATATAAA 6301 CACACACACA CTGGGATTAA CAATGTGTAT AAAGGCTTTT TTAAATATTT 6351 TTTTTGTTTT TTGTATTTTA CTATCTAAAC ATTATGAGAT AATCTATTTT 6401 TTTTTTAAAA AAAAAAAATA TATATATATA TTTTAATTAT ATATTTATAA 6451 TTCTTTAAAT AAGGTACTCA CCCCATTCTT AAAAATTACT CAAAAACAAA 6501 TTTGTTTTGT AAAAAAACAA AATTATATAT GTATATATAA TTTATATTTA 6551 TTATTTTTTT TCCTTTCTTC ATTTGAGTCA ACGTCAACTG TGTACATAAT 6601 TATTACCACC CCCCACCACC ACTACCTCAC ACTTGTATTT TTAAATTTTT 6651 ATTTATTTTA ATTATTTTTG TTTTTTTTTT AATTAAATAT ATAACACCTT 6701 TTTCCAAGTA TTTTTACTTA TACAAACACC ACCACGTTCT TACGATAAAC 6751 AATAATTATA GAATCAAAAA TAGTATAAAC TGAATTGAAA TCACCTAAAA 6801 TTTTACAACT ATAATCATGG TTATTTAAAT TTTAATTTTT TTTTTATTTA 6851 TTTATTTATT TTTATTAATT TAAAAATTGG TTTCTTATAT ACTTAATTTT 6901 AAAAAAAAAC AAATAATTTA AAAAAAACGC CATTTATTAT TTTATCTATA 6951 AATCTAATTC CTTGATTAAT CAACACAAAA ATAGAACTTT TATTAAAAAA 7001 AAATACTAAA AGTACTGGCT TTTCATCACA TTATACATAA CACTATAAAT 7051 CTAATAAAAT AATAGTTTAG TAAAATATTA AGAAATAAAT TCAAACTATC 7101 AATAAAATTA AATTTATAAT AAAAAAATAA TAATAAAAAT AATTAATTAA 7151 AGAATTAAAA ATAAATTTTT AA // crick strand 7172 TT AAAAATTTAT TTTTAATTCT 7150 TTAATTAATT ATTTTTATTA TTATTTTTTT ATTATAAATT TAATTTTATT 7100 GATAGTTTGA ATTTATTTCT TAATATTTTA CTAAACTATT ATTTTATTAG 7050 ATTTATAGTG TTATGTATAA TGTGATGAAA AGCCAGTACT TTTAGTATTT 7000 TTTTTTAATA AAAGTTCTAT TTTTGTGTTG ATTAATCAAG GAATTAGATT 6950 TATAGATAAA ATAATAAATG GCGTTTTTTT TAAATTATTT GTTTTTTTTT 6900 AAAATTAAGT ATATAAGAAA CCAATTTTTA AATTAATAAA AATAAATAAA 6850 TAAATAAAAA AAAAATTAAA ATTTAAATAA CCATGATTAT AGTTGTAAAA 6800 TTTTAGGTGA TTTCAATTCA GTTTATACTA TTTTTGATTC TATAATTATT 6750 GTTTATCGTA AGAACGTGGT GGTGTTTGTA TAAGTAAAAA TACTTGGAAA 6700 AAGGTGTTAT ATATTTAATT AAAAAAAAAA CAAAAATAAT TAAAATAAAT 6650 AAAAATTTAA AAATACAAGT GTGAGGTAGT GGTGGTGGGG GGTGGTAATA 6600 ATTATGTACA CAGTTGACGT TGACTCAAAT GAAGAAAGGA AAAAAAATAA 6550 TAAATATAAA TTATATATAC ATATATAATT TTGTTTTTTT ACAAAACAAA 6500 TTTGTTTTTG AGTAATTTTT AAGAATGGGG TGAGTACCTT ATTTAAAGAA 6450 TTATAAATAT ATAATTAAAA TATATATATA TATTTTTTTT TTTTAAAAAA 6400 AAAATAGATT ATCTCATAAT GTTTAGATAG TAAAATACAA AAAACAAAAA 6350 AAATATTTAA AAAAGCCTTT ATACACATTG TTAATCCCAG TGTGTGTGTG 6300 TTTATATGTG TTAATTATTA TGATGATAAT AATTATAAAT ATTATGTTCA 6250 CATATTTTAA TTGAATATTT ACAAATATTC CTATTTAAAA ATAGATTTGC 6200 TTTAATTTTT ATTGACTTTT TTTTTTCTTT ATTATTTTAC AAGGTGATTT 6150 GGCGTCATTG TGAGTTTTTT CACCTTGTTA AATTTATATC AACACTAATC 6100 AATTTGTGTG TGGTAAAAGA TTGTGTGGAA AAAAAATAGA AATTTGATTT 6050 TTTTATTATG TATTTATTTA AGTTTTTTTT TAAATTTTTT TTTTTTTTTT 6000 TTTAAAAACA ACACACCCAT ACCACTAAAA ATGATATATC TAATGATTTT 5950 TTTGTTGAAT TTTATTCAGC TAATAGAAGA AATCCTTTTT TTTTTTTTTT 5900 TTATTAAAAA TTATTTCAAA TAATGGTTTA CTTGTATTTG ATATACAAAT 5850 TCCTTCCATT TTTATCTTAA TAGATCAATA GAAAATAATA ATAAAATTTG 5800 ACATTTAAAA AAAAAAAAAA AAAAAAAATT TTTTATAAAT ATATATTTGA 5750 TTTAATGGGG GATTTAATAA AAAAAATTTT TTTTTATCAA TAACAAACTC 5700 CAGCTTTATT TTGTAATTGG CCTTTTTTTA AAATTTAAGT GAATTTCTGT 5650 TTGTGTGAAT AAAATTATGA AAAACAGAGT GAATGAGGGT TTTTATTTAA 5600 TGAAAAACAA ACACACTCAC ACACCTAAAC AATTTTTACA CTCTCGAAAT 5550 ATTGGGTTGG GGTTAAATCA TATTGTTTTG TTTGATTTTT TTTATTTTAA 5500 AAAACCGTTA AAATTATTTT TATTTTATAT TACCTTTTAT TCCACTCTTT 5450 ATATATATGA GTTTTATTTG GGTGTACACG AGTATGTGAT ATGATGGGAA 5400 ATCAATTGAT TATTCTAATA GTGGTTTTCC AATTTTTTTT TTTTTTTTTC 5350 CCATTTTTTT TTTTTTTTTT TTTTTTTTTT TTTTTTTTTT TTGATTAAAT 5300 TTATATATAT CCACTGATAT TGTTTTATCT TTTATTTTAA AATTGCGCCA 5250 TACAAACAAA AAGAAAATAA ATAATTAAAT CTAAATACCA ACCAACTAAC 5200 ACATTTTATT ACAAACCTTT TTTTTTTTAT TTTTTCGAAA TTATTAACAA 5150 TTTAAGGTTT TAAATCTCTT TTTTATTCCA TGACATAATT TATGTTTTTC 5100 AATAATTTAA TGTTGATAAA ACTGTTAATC AGCGATTTAA AAATAAAAAT 5050 AAAAATAATG TTGATTATTG GGATTCCAAT AAAATTTTAA TAATAAATTT 5000 AAAGGAATTC AATATTTTTT ATTTTTTTTA TTTTTATTAT TATTTTTAAT 4950 TTTTTTATTA GAAAATATTT ATGTATCAGT TTACAAATAT TAAAAATTTA 4900 TTTATTATTA TTATTATTAT TTTCATTATT ATTTTTATTA TCATTATTAT 4850 TAATATTATA ATTTTTTTTT TTTTTTTTTT TTGGTTTTTT TTGGTTTATT 4800 TTAT "chrblob_4094.glm_4|24oct01" 4796 TTATTT TAAATTTAAA TTATGAACAT TAAAATCAGA TCTTCTACCT 4750 AAAACTAATT TAATTTCTAA TACATTTAAA TTCCATTTAT AATCTGGTTG 4700 ATTCCAATAT TCTAAAATAT CATTTACCTT ATCAAAAGTT AATAAATGAA 4650 CAACTTGTGA TAATCTTGTG AATTTATGTC TAATATTTTG TTCAGTTGTT 4600 ATATTACAAA GGAAATCAAT GATTTTTCTA ATATCCTTTG ACAATTGAAT 4550 TCCACCCAAT TGATTGAAAC GTTTTTGCAT TATGAAATCT TCCATGGTTT 4500 TTGCGATAAA AGTTGACATT AGATGAATGA GTTGATCGAA ATTCTCTGCT 4450 ATGAATTTTC TTTTATAGGG TTGCAATAAT GCCATCAACT CGGACAAGAA 4400 ATCCATTGCA AAAGGGTCAT TAATTTCATA ATTTTCAAAT TCCTCATCAC 4350 CAATTTCATA GTTTGTATTC CTAAATGGCC AAATTAATCT TGTAAGTGAT 4300 GGAGAATTCA CCTGAACAAT CTTTTTAATA TTCTCCTTTA ATATATTATC 4250 AATACTCTTG GTAACCGTTG AAAATCCATC ACCATTACCT TCTATACACA 4200 TAGTGATTGC TTTTCTATCA TTTTCATCTT TAAATTTTAA AAATGTTGTT 4150 TCTTTTAATT GATCCTTAAC TTTATAAATA TACTCTTTAG TTAATGTTAA 4100 ATTATTTAAT ATAATTAAAA ATATATCTCT CTTTTTATCA AAATCATCTG 4050 AATAATTATA TTCTAATAAA TTTTCAAAAT ACTTTAAAAA ATAAAAAAAA 4000 AAAAAATTAA ATTAGTATAT ATAGAATTAT TTTTTAAAAA TTGAATTTAT 3950 TTACTTACAG GCATATAAAT CATATCAAAA TTTGCTAAAG TCAAATTAAT 3900 GACAGCACAA GTCGTAGGTG AATTTGATGA AGAGATTGCT CTTCCTGCTA 3850 CTTTTCTAAA AACAAAAAAT ATATTATCAA CCATACTAGA TGTATTATTT 3800 TCTTGTTCAA ATATTAATTG TTGTTGATGT AATTGTTGTT GTTGTTGTAA 3750 TAATTGCTGT TGTTGCTGCT GTGATTGATG TACATTTTTA TTATTATTAT 3700 TATTATTATT GTTATTATTA TGGTTATGAT TCATTTGATT GACAATAAAT 3650 CTTCTTAAAT CATCATTATA TATTGACTAA ATTTAAAAGT AAGTTTGATG 3600 TTGTTATTAT TAACTTTTTT CTTTTTTTTT TTTTTTTTTT ATTATTTTTT 3550 ATTACTCATT TTACTGTTTA AACATTCTCT TCTCCAATCT TTTTTTGCTG 3500 AGTCACATTT CAAAAGATAA GAATTTTTTA ATTAATCTTT AGTTTTAATT 3450 AAAAAGAATA AAGAAAAAAA TAAAAAATTC TTTGTCATTT GAAATGTCAC 3400 ATCAGAAAAA AAGATTGGAG AAGAGAATGT TTCAAAAGTA AAAACAAATA 3350 ATAAAATTAT ATATTATATA TTTATATAAT ATATGAATGT ATACATACAA 3300 ATGAAAATGA AAGTTGAAAA TATTGAGTTT CAAAAGAAGA ATAGTTTGTC 3250 ATAATCTCTT GAATTTTACT TTTCAT 3225 "chrblob_4094.glm_4|24oct01" ATCA TTTAATTGGG GTACTTTTTT 3200 ATTTGTACTT GTATTACAAT GAGTTTGAAT ATATGAAATG TAACGTTCTG 3150 ATATCTCTGA AATTGATGAA ATTTGATTTA ACAATTCATC AATTCCCAAC 3100 AATGGTTGAA TTAATTCAAT TTCACTTTGA CTATATTTAA AATTATTAAT 3050 TAAATCT "chrblob_4094.glm_2|24oct01" 3043 TCA ATTGATATAT TTGCATCTGT TAATTTTTTT AACTATTATT 3000 AAATAATCAT TTGTTAATAT TATAAAATCA AAAACAAAAA GTATATATAT 2950 GATTACCCCA CTTACTAAAT TTGAATCTTT TAATTTTTCT AAAATGATTG 2900 AATAAATTTG ATCTAAATAT TGTGCAGATT GATTATGAAG TGGTAATGTT 2850 AAATTATTTG AATTCCATTC AACCAATTTA GTTTTATACT TTTCAAAGAG 2800 GATCATATCA TTCCATCGCC ATTGATCATT ACCAACACGA ATTGAGTCTG 2750 AAACTTTTTG AACAACACTT GATAAAACTT TTTTCAAAGC CATTAGACAG 2700 TTATCTATTG ATTTCACTTT ATATTTAATA TCATTTAAAC TATTGGTAGA 2650 TGCATCTGAA TAACTCTCTG ATAATTGTTG ATTAATTCTT AACATATCTT 2600 TAATGATGGG ACCACTATCT TGTAGAATCA CCTTTCTTTG AAACTGAATG 2550 TAGATTACTA AGCCCTCATC TTCTTCACCA CTATTTTCAA ATGTGATTAT 2500 ATTTTGATGT TGATTAGGTA TACTTCTAGA AACTAATTTA TATTTAATTT 2450 GTTGTACAAT TGATAAAATT AATGATAATT GTATAACTGA TTGCTCATTA 2400 TTTGTTCTCA TGGTTTCTTC AGTTTTTGAT CTTGTAATTT GATAAAGTTC 2350 TTCAATTTTA TTTAATGGTG GTATATGATA TTTTTCATAA ATTGTATTAT 2300 AGGTCATATT ATTATTATCA TTGGTAGATG GTGTTACAAT TGGTTTACTA 2250 ATTGCTTCCA T 2240 "chrblob_4094.glm_2|24oct01" AACTATATA TACAAATTGT TTTAATAATT TTAATCCTTC 2200 TTCAAATTCA TTCTTATTAA CTTTATCTAT AATTCTAATT ATTAAAATAT 2150 CTAAACTTGA TGATGTATTA TTAACTTTCT TTTTTTAAAA ATAAAATAAG 2100 TTTTATTTTT TTAAAAAAAA AAAAAAATAA AAAAATAAAA AAAATTATTA 2050 TTATTATTAT TATTATTATT ATTATTATTA TTATTATTAT TATTATTATT 2000 ATTATTATTA TTATTATTAT TATTATTATT ATTATTATTA TTATTATTAT 1950 TATTATTATT ATTACTTACT AATGTATTTT TAAATAATTC TATTTCATTT 1900 TTTAAACCAT ATTCATCCTC ATCTTCACTA TCATCATTAT TATTATTTCT 1850 TTGTTGTTGT GGTGTTGTAC TTTGTTGTGG TGGTGAGTTA TTTTTTGTAC 1800 TATTATTATT ATTATTATTA TTATTATTAT TATTATTATT TTTATTATCA 1750 GTATTATTTA GGTTTGGGTT CATATAGTTA TTTAAACTAT CACCCATTAA 1700 ACCTAATACC TTCTTGAACA TTTTATGTGT GGAAGAAAAA AAAGAAAAAA 1650 GAAAAATAAA ATTTAAAAAA AAAAAAATGA AAAAAAGAAA AAAGATTTTT 1600 TTTTTTATTT ATTTTTTATT TTTTTATTTT ATTTTTTTTT TTAAATAAAA 1550 ATAATTTTTA AAAT "chrblob_4094.glm_1|24oct01" 1536 TTATTC ATAATAATAA CAAAATGAAT CGAAAATATA 1500 AAATGATTTT TTATAAATTA TACCAAATTG ATTTGAGGCT TTTGTTCTCA 1450 TTGTGATTAC TATACCATGA GATTTTTGAA CAGAGGTAGC AATTAATTGA 1400 ATTGATGGTT GTCCTAATTC AACATCATAG CATTGAATGG AAGCTGTTGA 1350 GGCTAGATGT TTATCTAAAC GAATGAAACT TGGTTCTTCA GTTAACAATT 1300 TCGATTCTGG TAATAATTGT AACATTCTAC CAATGACATC ATTACTATAT 1250 TCATTTAGCC TAATAATACC TGCTGATGAG ATATCTTCAA CTGCAATTCT 1200 TACACAGTAT GGTAAATCAT TAGTATTCTT GGTTGTATCT TTGAATGATA 1150 TCATTTCACC ATTTGGTTTA ATTGATGCGA GTTCAAATGA TTTTGGTATA 1100 TTTAAATTAT AGCCAACCAT TAAATTATCG AATATATCAT AAGGTAATGG 1050 TGATCTTGCT TTTAGTATAT GTCCACTTGT TACACCTAAA TAATTGATTA 1000 GTCTATCGAA TACTTTAACA TAGTAAGCTT TATCTCCATT TGGTACTCTA 950 AATGATAATC TTATCCATTG ATCGAATTGG AATAAAACAT CTCTACCATT 900 GTCACTATCA TACTGTTTGG CTACAACCAC TAACTTTTTA CCATTACCAT 850 CACGATAATT CAAATTGATT TGAATGTCTT TGCATTCATC ACCTAAACTA 800 CCATCATTTG TAAATTCACT ATCACTTTTT GTAATACTAA ATACTAAACC 750 TCCATCAAGC ACCACCTTTT CATCCTTATA AATATGTTGT ATATCTCCAT 700 TAATTTTCTT TGACCAATCT TTTGGGTAAA AATACTCTAA ATATATTTCA 650 TTTGAATTTG ATGTTGATGA CGATGACGAT GATGATAATA ATAATGAATT 600 CATTGATAAT TGTAAAAATT TATAACCTTT ACATTTAAAT AGATTAAAAG 550 AACTAATTGC ATGATCGTGA ACATATAAAT GTTGTTGAAA GAATTCGTCT 500 GCTTTTGATG TATATGAAAT TATATAGGCA TGACCTTGAT CGAAAAAGAA 450 GGATTGTTTG GATTTCATAT GATCATTTGG TAAGTAATAA ATAATTGAAC 400 GACCATTATA TTTGCCACCA ATTAATTCGT CAGAGAAACT TGATGGTTTT 350 GCACCAACTC TTAATATTTC ACCCATTATC ATTTGTTGAA ACTGATCAAC 300 TTTCACCAAT GATGTATCCC TTGAAAACAT TGATAAATCT ATAATTTGAA 250 TATTGAATGA AGGATAAGTT AATTCTTCTT TTTCTTTAAA TCCAACTACA 200 AAAAATGAAT TATCTGTTTT TATCCAATTA CTCGGATAAT CACATGAAAA 150 ACCATAAATT TGTGATTCAT ATGTTGAAAA TGTTATAATT TCTTCCAT 103 "chrblob_4094.glm_1|24oct01" TA 100 TCTGTTTTTT TAAATTATTT TTTAAAAAAT AAAAAAAAAA AGAAATAGTT 50 TGGGTTTTGA ATTCGGTGAA AAAAAAAAAA AAAAAGAAAA AAAATTGAAA end of file 4095 3 + 12 4096 6:61394..62872 = var e x o n 2 4097 9 4098 12 + 3 telomere 4099 4 4100 5 4101 6 4102 6 4103 4 Date: Wednesday, 3/27/2002 Time: 10:06 c4104.txt chrblob_4104|2001.10.15|GENOMIC|Sanger FEATURES Location CDS complement(join(2301..2371,2675..2765,2873..3223)) /gene="chrblob_4104.glm_1|24oct01" /note="(protein coding) No NR protein Similarities" /codon_start=1 ORIGIN watson strand 1 TAATTCTTTA TATTTAATTT TTTAATAATA GACATATATT AATTTAACAT 51 TTTTATGCTA TATTATATTA TTATTATTTA AAATTATATA TTTTTTTTAT 101 TAAACATTCC TTTATTTATT TATTTATTTA TTTATTATTA TTTCTATACT 151 TTATTTTTAT TTTATTTACA TTTTTGTGAA TTATTATTTA TATAAGAAAA 201 TATGACTTTA ATTTATATAA TTAATTTTTT GTTTAATTAT TGTATATTTT 251 ATATAATATA TTAAGTGTAA TATTAGTTAT TATATAAAAT TGTATATTTA 301 AAAAAAATAA ATATAATGTA CTTCCAAATA TATAGAAATA TGATATAAAC 351 AAAATTTTAT CTTTCTTAAA ATGATTAGTG TTTTTTTATT TATTTATTAT 401 ATATTAAAGA AGATATAATT TTATAATAAT ATTAAAAACT ATAAAATATT 451 TTTAAATAAA TTTTAAATGT GTAGAAAGAA TCAACTTTTA TTATACGATA 501 TTTTATATGT TTATATTTAA AAAAGAAAGA ATAACTTTGT ATTAAATTAA 551 TATAAGAAAA TATATTATGT TAGTATGACA TTTAGAGTGA TATAAATTTA 601 TTTCTTTTAT GAATTAGAAA CAAAATGTAA ATTTATACTC CATCTTATAA 651 AATTATCTTT ATATGGTTAA ATATATATGA AGTAACTTCT TTTTATTTCA 701 ATGAAGATCC AACTTATAAG AAATATATAT TTATTATATA TTTATAGAAG 751 GAATATAAGT ACAACAATCT TATTATAATA CAAAAGTTTT AATATATCTT 801 TTTGGAATGT CGAATTAATA TATGTTTTTC AATTATATCT TATATTAGAT 851 CATATTCCAT AAAACTATAT TATATGAAAC GGACATTAAA AAAAAAGTTC 901 ATCCAAAAAT GTTAACCATT TATTTGATAT TGTAGAATAT AAATACATTT 951 AGTATAATAT ATGTTTTTTA TTCAAACTAA TAAAAATTAC ATATGAAGTT 1001 ATATTCTTAT AACATAAAGA ATAAACTATT ACATTTGAAT AAATACCGGT 1051 GTGTACTTAA ATCATTCACG AATTTTCAGG TAATGTTCAT TCATGAACAC 1101 GCACAAATTA ATAATATTTT TACTTAATAT TGACAAAACA CAACAATAAG 1151 GCAGAATATT TTATTAAGCT TTTTTATTAA ATTATATAAT TATTCAAAAT 1201 ATTTTAAATC TATATTTTGC ACATTATCCC TATCCCTATA TAATTGTCCC 1251 AATTTTAAAC ATATTCTTAA CATTTTTAAA AAACTTTAGC TTAGTAAAAT 1301 TTACATACGA TTATGTAGAT GAACAAAAAT AAATGTCAAT GATAATTTAT 1351 TATTCATTAA CGAACAAAAA CTTTCTTTAT AAACTTTTTA AAAGGACAAT 1401 TATTCTATTG ATATTTGAAT AATTAAACGT TCACATGAAG AATTTCTACA 1451 TTCATTCAAG GTTCAAATAA ATATTTCTAA ATATTATTAT GTATAAAATA 1501 TATATTAATA TGTCTTTAAT TATTATTACC TTTTTATTTT GAATTTATTT 1551 CACAAATTTA AGAAAAAAAA AAATAGATTA TGAACATAAT AATAAAATTT 1601 ATTGATTATT TTAAAATTCA AAATTATAAC AAAAAAAAGA AAAAAAAACC 1651 ATGTATAATT TATAAAATAT CTATAAAATA TTTCTCATGT TGCTTATGTT 1701 ACATGTAAAA TTTTGCATTT ATTTATATAT TTTTTGTATT GTTTAAAAAG 1751 GATAATTATA ATAAATGAAA CAAATTATAT TTAAATAAGT TTTTCATTTA 1801 ATGTATAAAT TAAAAAATAA ACAAAAGGAA AAAAAAACAA AGTTGTATTT 1851 TTTTTTTTAA ATCAATAAAA GAAAGGGAAA AGTTAAAATT AACATAAGTG 1901 GCATGTAATA AACGTCTTAA TGATTTAAAT ATTTATTTAT ATCAAAAAAC 1951 AAAAACAGTT TGATAAAAGA CAAAAAAAAA CAAATGTATA TATATATTAT 2001 AATATTTTCT TTAATTTGAA GGCATCAACA CCGCTTAAAT AATAATAGGG 2051 TTTCCTTTTT ACTCTAATAA AACCGTTTTT TTCATAAAAT CCTAAAAAAT 2101 ATATATATGC ATATAAATAA TTATTATATA TATAATAGAA TAAATAAATT 2151 TTTTTTGAAT AATAAAATAA TTCTTACGTA ATGTAGGATA ATTTGTTGCT 2201 TCTGCCTCAA GATGAATCTG ATGAAAAATA TATAAATGTA AATAAAAATT 2251 ATTTTTTTTA TATAAGAAAA AAAAAAAAAA ATTTATTTTT TCGTCTTTTT "chrblob_4104.glm_1|24oct01" 2301 TTAAAGAATT ACCTCATTTA TGCCATAAAT GTTTTGCATT AATTTAATAC 2351 TCTCATTTAA TAAATAAGAA CCTAAAAAAT AAAAATTTTC ACATATTATA 2401 AAATTACAAT AAAACAAAAA AAAATAATTT AAATAATATT TTAACCTAAG 2451 CCCAAACTTC TAATGGATTT GTGAACAGCT ATCATACCTA TAAATTTTTT 2501 TATTTTTATT TAAAAGAAAA AGAAGAGAAA TGTATATTAA TTAAAATTCA 2551 ATACAATTCA AATATATATA TATTTATTTA TAAAACACAG AAGACAATAC 2601 AACATTATAC AATTTTTCAT ATTATACATG ATTATTATTA TAATATATAT 2651 ATATATATTT TGTTTTTTTT TTACATATAT ATCCAAAAGT GATTGTTTCA 2701 TCATTTTTAC ATTTGGTAGT AATTTTGCTT ATTACTGCAC CAACACATTG 2751 TTCCTCAAAT ATACACTATA TAGAATAAAA AGATAAAAAA ATATGTATAG 2801 TTTTTTTTTT TTTTATTACA GGACAAAACT GCATATAATA TTTTTGTTTA 2851 ATATATAAAG AAAATGTCAT ACCATTAATG CAATTTCACC GTAATCATTT 2901 AAAACGGTTT TGAGTAAGAA AATATTATAT GGTTCTGATA ATTCTGTGCT 2951 TAATAAATTA TACATACTAT TTAAATAATT TTTTGGGAAT GTTCTAAATT 3001 GATATATATC AATTTCTTTT TCATCAAAAA ACATTGTATG ATATACATCT 3051 TTTTTAGGTA AACTTTCATT ATAAAATTCA CTAATTGTAG TATTACATTC 3101 AAATGATTTC TCAATACTTT TTTCGAAATC CAAATCCGAT ATATCTGCTA 3151 AAACAAAAGG GTTTATGTAA TTTTCTACTT TATTATTTAT TTCATCCTGT 3201 TCTGATACAA CTTCATTATT CAT 3223 "chrblob_4104.glm_1|24oct01" TTTAGAA ATTTACTAAA CTTTATATAA 3251 CTATTGAATT TAAAAAAAGC AAATAATACA TGTAAAAATA TTATTTATTC 3301 ATGAAAATTG CTTTTTAGTA AATATTATAA TTTGTTGTAA AATATATTAG 3351 GTTTTTTTCT TTTTTTTTTT GTTATTTTAT AATGAAAGAA AATATTACAA 3401 GGCACTGGAA TTCTATAAAA TTACCATAAT TACAATATTT TAAAATATAT 3451 TCTTTTTAAA AATAATAAAG AGTTTTATGC GTGAATTTGG TTTTTCAAAT 3501 ATATGTTTAT TCACAAATTT CTTACTAAAA TAAAATTAAA GTAATGACCT 3551 TTATAAAAAA TATATGTTAA TTAAAGGAAC CTATCTGACA TTTTTGAAAT 3601 TTGTATATAA AAAATATATA TATTTAAAAT TTATTTACCT TAAAAAAAA // crick strand 3649 TTTTTTTTA AGGTAAATAA ATTTTAAATA TATATATTTT TTATATACAA 3600 ATTTCAAAAA TGTCAGATAG GTTCCTTTAA TTAACATATA TTTTTTATAA 3550 AGGTCATTAC TTTAATTTTA TTTTAGTAAG AAATTTGTGA ATAAACATAT 3500 ATTTGAAAAA CCAAATTCAC GCATAAAACT CTTTATTATT TTTAAAAAGA 3450 ATATATTTTA AAATATTGTA ATTATGGTAA TTTTATAGAA TTCCAGTGCC 3400 TTGTAATATT TTCTTTCATT ATAAAATAAC AAAAAAAAAA AGAAAAAAAC 3350 CTAATATATT TTACAACAAA TTATAATATT TACTAAAAAG CAATTTTCAT 3300 GAATAAATAA TATTTTTACA TGTATTATTT GCTTTTTTTA AATTCAATAG 3250 TTATATAAAG TTTAG TAA ATT TCT AAA start chrblob_4104.glm_1|24oct01 vbc exon 1 3223 ATG AAT AAT GAA GTT GTA TCA GA 3200 A CAG GAT GAA ATA AAT AAT AAA GTA GAA AAT TAC ATA AAC CCT TTT GTT T 3150 TA GCA GAT ATA TCG GAT TTG GAT TTC GAA AAA AGT ATT GAG AAA TCA TTT 3100 GAA TGT AAT ACT ACA ATT AGT GAA TTT TAT AAT GAA AGT TTA CCT AAA AA 3050 A GAT GTA TAT CAT ACA ATG TTT TTT GAT GAA AAA GAA ATT GAT ATA TAT C 3000 AA TTT AGA ACA TTC CCA AAA AAT TAT TTA AAT AGT ATG TAT AAT TTA TTA 2950 AGC ACA GAA TTA TCA GAA CCA TAT AAT ATT TTC TTA CTC AAA ACC GTT TT 2900 A AAT GAT TAC GGT GAA ATT GCA TTA ATG intron GT ATGACATTTT CTTTATATAT 2850 TAAACAAAAA TATTATATGC AGTTTTGTCC TGTAATAAAA AAAAAAAAAA 2800 CTATACATAT TTTTTTATCT TTTTATTCTA TATAG exon 2 2765 TGT ATA TTT GAG GAA 2750 CAA TGT GTT GGT GCA GTA ATA AGC AAA ATT ACT ACC AAA TGT AAA AAT GA 2700 T GAA ACA ATC ACT TTT GGA TAT ATA T intron GTAA AAAAAAAACA AAATATATAT 2650 ATATATATTA TAATAATAAT CATGTATAAT ATGAAAAATT GTATAATGTT 2600 GTATTGTCTT CTGTGTTTTA TAAATAAATA TATATATATT TGAATTGTAT 2550 TGAATTTTAA TTAATATACA TTTCTCTTCT TTTTCTTTTA AATAAAAATA 2500 AAAAAATTTA TAG exon 3 GT ATG ATA GCT GTT CAC AAA TCC ATT AGA AGT TTG GG 2450 C TTA G intron GTTAA AATATTATTT AAATTATTTT TTTTTGTTTT ATTGTAATTT 2400 TATAATATGT GAAAATTTTT ATTTTTTAG exon 4 2371 GT TCT TAT TTA TTA AAT GAG A 2350 GT ATT AAA TTA ATG CAA AAC ATT TAT GGC ATA AAT GAG intron GT AATTCTTTAA 2300 AAAAAGACGA AAAAATAAAT TTTTTTTTTT TTTTCTTATA TAAAAAAAAT 2250 AATTTTTATT TACATTTATA TATTTTTCAT CAG exon 5 ATT CAT CTT GAG GCA GA 2200 A GCA ACA AAT TAT CCT ACA TTA CGT AAG AAT TAT TTT ATT ATT CAA AAA A 2150 AA TTT ATT TAT TCT ATT ATA TAT ATA ATA ATT ATT TAT ATG CAT ATA TAT 2100 ATT TTT TAG 2092 stop chrblob_4104.glm_1|24oct01 G ATTTTATGAA AAAAACGGTT TTATTAGAGT AAAAAGGAAA 2050 CCCTATTATT ATTTAAGCGG TGTTGATGCC TTCAAATTAA AGAAAATATT 2000 ATAATATATA TATACATTTG TTTTTTTTTG TCTTTTATCA AACTGTTTTT 1950 GTTTTTTGAT ATAAATAAAT ATTTAAATCA TTAAGACGTT TATTACATGC 1900 CACTTATGTT AATTTTAACT TTTCCCTTTC TTTTATTGAT TTAAAAAAAA 1850 AAATACAACT TTGTTTTTTT TTCCTTTTGT TTATTTTTTA ATTTATACAT 1800 TAAATGAAAA ACTTATTTAA ATATAATTTG TTTCATTTAT TATAATTATC 1750 CTTTTTAAAC AATACAAAAA ATATATAAAT AAATGCAAAA TTTTACATGT 1700 AACATAAGCA ACATGAGAAA TATTTTATAG ATATTTTATA AATTATACAT 1650 GGTTTTTTTT TCTTTTTTTT GTTATAATTT TGAATTTTAA AATAATCAAT 1600 AAATTTTATT ATTATGTTCA TAATCTATTT TTTTTTTTCT TAAATTTGTG 1550 AAATAAATTC AAAATAAAAA GGTAATAATA ATTAAAGACA TATTAATATA 1500 TATTTTATAC ATAATAATAT TTAGAAATAT TTATTTGAAC CTTGAATGAA 1450 TGTAGAAATT CTTCATGTGA ACGTTTAATT ATTCAAATAT CAATAGAATA 1400 ATTGTCCTTT TAAAAAGTTT ATAAAGAAAG TTTTTGTTCG TTAATGAATA 1350 ATAAATTATC ATTGACATTT ATTTTTGTTC ATCTACATAA TCGTATGTAA 1300 ATTTTACTAA GCTAAAGTTT TTTAAAAATG TTAAGAATAT GTTTAAAATT 1250 GGGACAATTA TATAGGGATA GGGATAATGT GCAAAATATA GATTTAAAAT 1200 ATTTTGAATA ATTATATAAT TTAATAAAAA AGCTTAATAA AATATTCTGC 1150 CTTATTGTTG TGTTTTGTCA ATATTAAGTA AAAATATTAT TAATTTGTGC 1100 GTGTTCATGA ATGAACATTA CCTGAAAATT CGTGAATGAT TTAAGTACAC 1050 ACCGGTATTT ATTCAAATGT AATAGTTTAT TCTTTATGTT ATAAGAATAT 1000 AACTTCATAT GTAATTTTTA TTAGTTTGAA TAAAAAACAT ATATTATACT 950 AAATGTATTT ATATTCTACA ATATCAAATA AATGGTTAAC ATTTTTGGAT 900 GAACTTTTTT TTTAATGTCC GTTTCATATA ATATAGTTTT ATGGAATATG 850 ATCTAATATA AGATATAATT GAAAAACATA TATTAATTCG ACATTCCAAA 800 AAGATATATT AAAACTTTTG TATTATAATA AGATTGTTGT ACTTATATTC 750 CTTCTATAAA TATATAATAA ATATATATTT CTTATAAGTT GGATCTTCAT 700 TGAAATAAAA AGAAGTTACT TCATATATAT TTAACCATAT AAAGATAATT 650 TTATAAGATG GAGTATAAAT TTACATTTTG TTTCTAATTC ATAAAAGAAA 600 TAAATTTATA TCACTCTAAA TGTCATACTA ACATAATATA TTTTCTTATA 550 TTAATTTAAT ACAAAGTTAT TCTTTCTTTT TTAAATATAA ACATATAAAA 500 TATCGTATAA TAAAAGTTGA TTCTTTCTAC ACATTTAAAA TTTATTTAAA 450 AATATTTTAT AGTTTTTAAT ATTATTATAA AATTATATCT TCTTTAATAT 400 ATAATAAATA AATAAAAAAA CACTAATCAT TTTAAGAAAG ATAAAATTTT 350 GTTTATATCA TATTTCTATA TATTTGGAAG TACATTATAT TTATTTTTTT 300 TAAATATACA ATTTTATATA ATAACTAATA TTACACTTAA TATATTATAT 250 AAAATATACA ATAATTAAAC AAAAAATTAA TTATATAAAT TAAAGTCATA 200 TTTTCTTATA TAAATAATAA TTCACAAAAA TGTAAATAAA ATAAAAATAA 150 AGTATAGAAA TAATAATAAA TAAATAAATA AATAAATAAA GGAATGTTTA 100 ATAAAAAAAA TATATAATTT TAAATAATAA TAATATAATA TAGCATAAAA 50 ATGTTAAATT AATATATGTC TATTATTAAA AAATTAAATA TAAAGAATTA end of file 4106 9 4107 8 4108 4 4109 9 4110 4 + 7 joins in stevor 4111 4 L18785 4112 9 4113 4 4114 5 4116 13 telomere 4117 9 + 3 pfemp1 var e x o n 1 = 9; e x o n 2 = 3 4118 4 pfemp1 var pseudogene 4119 9 4120 9 4121 3 telomere 4123 5 Date: Wednesday, 3/27/2002 Time: 09:50 c4124.txt chrblob_4125|2001.10.15|GENOMIC|Sanger FEATURES Location CDS complement(join(1056..1180,1225..1288, 1426..1490,1535..1645,1690..1753,1891..1955,2000..2110,2155..2218,2512..2576, 2621..2731,2776..2829,2930..2993,3046..3156,3450..3637,4139..4516)) /gene="chrblob_4125.gen_1|24oct01" /note="(protein coding) No NR protein Similarities" /codon_start=1 ORIGIN watson strand 1 CTTATAAAAA TATTTTTAAA ATGTTATTTT TTTATTTTTT TTTTTTTTTG 51 AAATATGTAA AATATTGATA ACTTATAAGA TAATCACAGG AAATATATAA 101 CTAACATATT ATAATATTAT AATATTATAA TAAAAAAATT ATATTTCCAA 151 ATGCTTAAAA TTAAATAAAT GTATACATTT TCATATATAT TTTTTAACCT 201 TATTATATTT ATATTGGTTA AAAATATATG ATTTTTTTTT GTATTCAATA 251 AAAAGAATTT TATTTACACT TTTTCAATAT ACTTTTATTA GATTCTATTG 301 AATAAAATAA AAACATAAAA ATATGTGGTG GTATATATTC TATCACACAT 351 ATTTCCATGA AAATATTTAT TTTCTTAAAT ATATATATAA GAAATAAAAT 401 ATTTTTTCTT AAGTAATTAA AAAAAAAAAA CCTCAATCAA AAAAGATCAA 451 ATATTTCTAA TCATATTATA TTAGAACAAT TAAATTATCA ATAATTCAAT 501 ATTCCAATAT ATATTAGCAA TATTTAATAT TATTATATAA AAGCTAATGT 551 TTTGGGAATC CGTTTATGGC ACAAATGAAA TTTTCATATT GTACTATTAA 601 AAATATATTT ATTGTAGTAA TGTGGTGTAT AAGATTATAT ATGTACCTCA 651 CTTCCTTTAT GTTCTTTAAA AGAACATATA TAGAAAGATC ATTGGTGCCC 701 CCTCCTTTCT CGTTCCCTAG GAGAACTTAT GGAGAGAGAA TTTTATGTAC 751 TCCCCTCCTT AACATTTCTT AAAGAAACAC ATAAAGAGGG ATATTTAAAG 801 TACAATTCCC TCTTTATTGC TCCTTAAAGA AACATATAAA GAGGGGGATA 851 TTTATAAAGC ACCTCCTCCT CTTCACGTTC TTAGAACAGA TAAAGAGGTA 901 TCACAAGTAC TTACCTCCTT TATGCTCCAT AAAAGAACAT ACAAAGGAGG 951 ATTTTATTAC CTCTCCCTCT TCAAGTTCCT TAGAAGAACA TTTAAAGAGG 1001 GATATATTTA AAGCACCTCC TCCCCTTTAT GTTCCTTAGA ACATATAAAG 1051 AGGGA no gene chrblob_4125.gen_1|24oct01 1056 TCATA AGTACTTACC TCCTTTATGT TCCTTAAAAG AACATACAAA 1101 GGAGGATTTT ATTACCTCTC CCTCTTTATT GCTCCTTAGA AGAACATATA 1151 AAAAGGGATA TTTATAAAGC ACCTCCTCCT CTTCACGTTC TTAGAACAGA 1201 TAAAGAGGTA TCACAAGTAC TTACCTCCTT TATGCTCCAT AAAAGAACAT 1251 ACAAAGGAGG ATTTTATTAC CTCTCCCTCT TCAAGTTCCT TAGAAGAACA 1301 TTTAAAGAGG GATATATTTA AAGCACCTCC TCCCCTTTAT GTTCCTTAGA 1351 ACATATAAAG AGGGATCATA AGTACTTACC TCCTTTATGT TCCTTAAAAG 1401 AACATACAAA GGAGGATTTT ATTACCTCTC CCTCTTTATT GCTCCTTAAA 1451 GAAACATATA AAGAGGGATA TTTATAAAGC ACCTCCTCCT CTTCACGTTC 1501 TTAGAACAGA TAAAGAGGTA TCACAAGTAC TTACCTCCTT TATGCTCCAT 1551 AAAAGAACAT ACAAAGGAGG ATTTTATTAC CTCTCCCTCT TTATTGCTCC 1601 TTAGAAGAAC ATATAAAAAG GGATATTTAT AAAGCACCTC CTCCTCTTCA 1651 CGTTCTTAGA ACAGATAAAG AGGTATCACA AGTACTTACC TCCTTTATGC 1701 TCCATAAAAG AACATACAAA GGAGGATTTT ATTACCTCTC CCTCTTCAAG 1751 TTCCTTAGAA GAACATTTAA AGAGGGATAT ATTTAAAGCA CCTCCTCCCC 1801 TTTATGTTCC TTAGAACATA TAAAGAGGGA TCATAAGTAC TTACCTCCTT 1851 TATGTTCCTT AAAAGAACAT ACAAAGGAGG ATTTTATTAC CTCTCCCTCT 1901 TTATTGCTCC TTAAAGAAAC ATATAAAGAG GGATATTTAT AAAGCACCTC 1951 CTCCTCTTCA CGTTCTTAGA ACAGATAAAG AGGTATCACA AGTACTTACC 2001 TCCTTTATGC TCCATAAAAG AACATACAAA GGAGGATTTT ATTACCTCTC 2051 CCTCTTTATT GCTCCTTAGA AGAACATATA AAAAGGGATA TTTATAAAGC 2101 ACCTCCTCCT CTTCACGTTC TTAGAACAGA TAAAGAGGTA TCACAAGTAC 2151 TTACCTCCTT TATGCTCCAT AAAAGAACAT ACAAAGGAGG ATTTTATTAC 2201 CTCTCCCTCT TCAAGTTCCT TAGAAGAACA TTTAAAGAGG GATATATTTA 2251 AAGCACCTCC TCCCCTTTAT GTTCCTTAGA ACATATAAAG AGGGATCATA 2301 AGTACTTACC TCCTTTATGC TCCATAAAAG AACATACAAA GGAGGATTTT 2351 ATTACCTCTC CCTCTTTATT GCTCCTTAGA AGAACATTTA AAGAGGGATA 2401 TATTTAAAGC ACCTCCTCCC CTTTATGTTC CTTAGAACAT ATAAAGAGGG 2451 ATCATAAGTA CTTACCTCCT TTATGTTCCT TAAAAGAACA TACAAAGGAG 2501 GATTTTATTA CCTCTCCCTC TTTATTGCTC CTTAAAGAAA CATATAAAGA 2551 GGGATATTTA TAAAGCACCT CCTCCTCTTC ACGTTCTTAG AACAGATAAA 2601 GAGGTATCAC AAGTACTTAC CTCCTTTATG TTCCTTAAAA GAACATACAA 2651 AGGAGGATTT TATTACCTCT CCCTCTTTAT TGCTCCTTAA AGAAACATAT 2701 AAAGAGGGAT ATTTATAAAG CACCTCCTCC TCTTCACGTT CTTAGAACAG 2751 ATAAAGAGGT ATCACAAGTA CTTACCTCCT TTATGCTCCA TAAAAGAACA 2801 TACAAAGGAG GATTTTATTA CCTCTCCCTC TTCAAGTTCC TTAGAAGAAC 2851 ATATAAAGAG GGATATTTAT AAAGTACCTC CTCCTCTTCA CGTTCTTAGA 2901 ACAGATAAAG AGGTATCACA AGTACTTACC TCCTTTATGC TCCATAAAAG 2951 AACATACAAA GGAGGATTTT ATTACCTCTC CCTCTTCAAG TTCCTTAGAA 3001 GAACATATAA AGAGGGATAT TTATAAAGTA CCTCCTCCTC TTCACATTCT 3051 TAGAAGAAGC ATGTAAAGAG GAATCCTCAG TACCTCCCCC CCTATATTGC 3101 CCCTGGAAAA AACATATAGA GGGGGGAACT AATGTACCTC CTCCCCTTAA 3151 TTGCTCCTTA GGAGAACATA TAAAAAGGAA TCTTAAGTAC CATCCTTGTA 3201 GCTACTTGAC ACCATAGGTG ATGTCCTTTG TAGGACATAT ACAAATCCTG 3251 GATCCTGTCC TCCAGACTTT TCTACCACTC GTATAGTTTT CTGGGTACTG 3301 TGAACTGACC TCCAGACTGA TCTCTACAAT CCGTAGAGTT TCTGGGTACT 3351 GTGAACTGAC CTCCAGACTG ATCTCTACAA TCCGTAGAGT TTCTGGGTAC 3401 TGTGAACTGT CCTCCAGACT TTTCTACCAC TCGTACAGTT TCTGGGTACT 3451 GTGAACTGAC CTCCAGCCTC CTCTCTACAA TCCGTAGATT TCCTGTGTAC 3501 TGTGAACTGA CCTCCAGCCT CCTCTCTACA ATCCGCAGAT TTCCTGTGTA 3551 CTGTGAACTG TCCTCCTGAC TGCTCTCTAC TATCCGTCAG AAGTTTTCTT 3601 AAACCCCTTT TGGGGAGGGA GGGGTTTTTA AAACCCCCTT TGGGGGTTTT 3651 TTGGGAAAAA AAAAAAACAA CCCCTTTTTT GTGGGGGGTT TTTTTTCTCC 3701 AGACTGCTCT CTACAATCCG TAGAGTTACT GGGTACTGTG AACTGTCCTC 3751 TCGACAGATC TCTACAATCC GTATAGTTAC TGGGTACTGT GAACTGTCCT 3801 CTCGACAGCT CTCTACAATC CGTAGATTTC CTGGGTACTG TGTACTGTCC 3851 TCTCGACAGA TCTCTACAAT CCGTAGATTC CCTGGGTACT GTGTACTGTC 3901 CTCTCGACAG ATCTCTACAA TCCGTAGAGT TACTGGGTAC TGTGAACTGA 3951 CCTCCAGACT GATCTCTACA ATCCGTAGAG TTTCTGGGTA CTGTGAACTG 4001 TCCTCCAGAC TTTTCTACCA CTCGTAGAGT TTCTGGGTAC TGTGAACTGA 4051 CCTCCAGACT TTTCTACCAC TCGTAGAGTT TCTGGGTACT GTGAACTGAC 4101 CTCCAGACTT TTCTACCACT CGTAGAGTTT CTGGGTACTG TGAACTGACC 4151 TCCAGACTTT TCTACCACTC GTAGAGTTTC TGGGTACTGT GAACTGACCT 4201 CCAGACTTTT CTACCACTCG TAGAGTTTCT GGGTACTGTG AACTGACCTC 4251 CAGCCTCCTC TCTACAATCC GTAGAGTTAC TGGGTACTGT GAACTGTCCT 4301 CTCGACAGAT CTCTACAATC CGTAGATTTC CTGGGTACTG TCTACTGTCC 4351 TCCTGACTGC TCTCTACAAT CCGTAGAGTT ACTGGGTACT GTGAACTGTC 4401 CTCTCGACAG ATCTCTACAA TCCGTAGATT TCCTGGGTAC TGTGTACTGT 4451 CCTCTCGACA GATCTCTACA ATCCGTAGAT TTCCTGGGTA CTGTGAACTG 4501 ACCTCCAGAC TGCTCT 4516 no gene chrblob_4125.gen_1|24oct01 CTAC AATCCGTAGA GTTACTGAGT ACTGTGAACT 4551 GTCCTCTCGA CAGATCTCTA CAATCCGTAG ATTTCCTGGG TACTGTGTAC 4601 TGTCCTCCCG ACTGATCTCT ACAATCCGTA CAGTTACTGG GTACTGTGAA 4651 CTGACCTCCA GCCTACTCTC TACAATCCGT ACAGCTACCA GATACTGTGT 4701 ACATTTCTCC AGACTACTCT CTACGACTCG TACAGCTACC AGATACTATG 4751 TACTCTTCTC CAGACTACAC TCTACCATTC GTAGGGTTAT CAGATACTAT 4801 GTACTTTTCT CCAGACTACA CTCTACGACT CGTACAGCTA CCAGGTACTA 4851 TGTACTCTTC TCCAGACTAC TCTCTACCAT TCGTAGGGTT ATCAGATACT 4901 ATGTACTTTT CTCCAGACTA CACTCTACGA CTCATACAGC TACCAGGTAC 4951 TATGTACTTT TCTCCAGACT ACACTCTACG ACTCGTACAG CTACCAGATA 5001 CTATGTACTT TTCTCCAGAC TACTCTCTAC CATTCGTAGG GTTATCAGAC 5051 ACTATGTACT TTTCTCCAGA CTACACTATA CGACTCATAC AGCTACCAGG 5101 TACTATGTAC GTTTCTCCAG ACTACACTCT ACGACTCGTA CAGCTACCAG 5151 GTACTATGTA CTCTTCTCCA GACTACTCTC TACCATTCGT AGGGTTATCA 5201 GATACTATGT ACTTTTCTCC AGACTACACT CTACGACTCG TACAGCTACC 5251 AGATACTATG TACGTTTCTC CAGACTGCAC TCTACGACTC GTACAGCTAC 5301 CAGATACTAT GTACTCTTCT CCAGACTACA CTCTACGACT CATACAGCTA 5351 CCAGATACTA TGTACTTTTC TCCAGACTAC ACTCTACGAC TCGTACAGCT 5401 ACCAGATACT ATGTACTTTT CTCCAGACTA CTCTCTACCA TTCGTAGTGT 5451 TACCAGATAC TGTGTACGTT TCTCCAGACT ACACTCTACG ACTCATACAG 5501 CTACCAGGTA CTATGTACTT TTCTCCAGAC TACACTCTAC GACTCATACA 5551 GCTACCAGAT ACTATGTACT TTTCTCCAGA CTACTCTCTA CGACTCGTAC 5601 AGCTACCAGA TACTATGTAC TTTTCTCCAG ACTGCACTCT ACGACTCGTA 5651 CAGATACCAG ATACTATGTA CTCTTCTCCA GACTACTCTC TACGACTCAT 5701 ACAGCTACCA GGTACTATGT ACTTTTCTCC AGACTACTCT CTACGACTCA 5751 TGCAGCTACC AGATACTGTG ACTCTTCTCC AGACTACTCT CTACGACTCG 5801 TACAGCTACC AGATACTATG ACTTTTCT // crick strand 5828 AGAAAAGT CATAGTATCT GGTAGCTGTA 5800 CGAGTCGTAG AGAGTAGTCT GGAGAAGAGT CACAGTATCT GGTAGCTGCA 5750 TGAGTCGTAG AGAGTAGTCT GGAGAAAAGT ACATAGTACC TGGTAGCTGT 5700 ATGAGTCGTA GAGAGTAGTC TGGAGAAGAG TACATAGTAT CTGGTATCTG 5650 TACGAGTCGT AGAGTGCAGT CTGGAGAAAA GTACATAGTA TCTGGTAGCT 5600 GTACGAGTCG TAGAGAGTAG TCTGGAGAAA AGTACATAGT ATCTGGTAGC 5550 TGTATGAGTC GTAGAGTGTA GTCTGGAGAA AAGTACATAG TACCTGGTAG 5500 CTGTATGAGT CGTAGAGTGT AGTCTGGAGA AACGTACACA GTATCTGGTA 5450 ACACTACGAA TGGTAGAGAG TAGTCTGGAG AAAAGTACAT AGTATCTGGT 5400 AGCTGTACGA GTCGTAGAGT GTAGTCTGGA GAAAAGTACA TAGTATCTGG 5350 TAGCTGTATG AGTCGTAGAG TGTAGTCTGG AGAAGAGTAC ATAGTATCTG 5300 GTAGCTGTAC GAGTCGTAGA GTGCAGTCTG GAGAAACGTA CATAGTATCT 5250 GGTAGCTGTA CGAGTCGTAG AGTGTAGTCT GGAGAAAAGT ACATAGTATC 5200 TGATAACCCT ACGAATGGTA GAGAGTAGTC TGGAGAAGAG TACATAGTAC 5150 CTGGTAGCTG TACGAGTCGT AGAGTGTAGT CTGGAGAAAC GTACATAGTA 5100 CCTGGTAGCT GTATGAGTCG TATAGTGTAG TCTGGAGAAA AGTACATAGT 5050 GTCTGATAAC CCTACGAATG GTAGAGAGTA GTCTGGAGAA AAGTACATAG 5000 TATCTGGTAG CTGTACGAGT CGTAGAGTGT AGTCTGGAGA AAAGTACATA 4950 GTACCTGGTA GCTGTATGAG TCGTAGAGTG TAGTCTGGAG AAAAGTACAT 4900 AGTATCTGAT AACCCTACGA ATGGTAGAGA GTAGTCTGGA GAAGAGTACA 4850 TAGTACCTGG TAGCTGTACG AGTCGTAGAG TGTAGTCTGG AGAAAAGTAC 4800 ATAGTATCTG ATAACCCTAC GAATGGTAGA GTGTAGTCTG GAGAAGAGTA 4750 CATAGTATCT GGTAGCTGTA CGAGTCGTAG AGAGTAGTCT GGAGAAATGT 4700 ACACAGTATC TGGTAGCTGT ACGGATTGTA GAGAGTAGGC TGGAGGTCAG 4650 TTCACAGTAC CCAGTAACTG TACGGATTGT AGAGATCAGT CGGGAGGACA 4600 GTACACAGTA CCCAGGAAAT CTACGGATTG TAGAGATCTG TCGAGAGGAC 4550 AGTTCACAGT ACTCAGTAAC TCTACGGATT GTAG no gene chrblob_4125.gen_1|24oct01 4516 AG AGC AGT CTG GAG GT 4500 C AGT TCA CAG TAC CCA GGA AAT CTA CGG ATT GTA GAG ATC TGT CGA GAG G 4450 AC AGT ACA CAG TAC CCA GGA AAT CTA CGG ATT GTA GAG ATC TGT CGA GAG 4400 GAC AGT TCA CAG TAC CCA GTA ACT CTA CGG ATT GTA GAG AGC AGT CAG GA 4350 G GAC AGT AGA CAG TAC CCA GGA AAT CTA CGG ATT GTA GAG ATC TGT CGA G 4300 AG GAC AGT TCA CAG TAC CCA GTA ACT CTA CGG ATT GTA GAG AGG AGG CTG 4250 GAG GTC AGT TCA CAG TAC CCA GAA ACT CTA CGA GTG GTA GAA AAG TCT GG 4200 A GGT CAG TTC ACA GTA CCC AGA AAC TCT ACG AGT GGT AGA AAA GTC TGG A 4150 GG TCA GTT CAC A 4139 GTACCCAG AAACTCTACG AGTGGTAGAA AAGTCTGGAG 4100 GTCAGTTCAC AGTACCCAGA AACTCTACGA GTGGTAGAAA AGTCTGGAGG 4050 TCAGTTCACA GTACCCAGAA ACTCTACGAG TGGTAGAAAA GTCTGGAGGA 4000 CAGTTCACAG TACCCAGAAA CTCTACGGAT TGTAGAGATC AGTCTGGAGG 3950 TCAGTTCACA GTACCCAGTA ACTCTACGGA TTGTAGAGAT CTGTCGAGAG 3900 GACAGTACAC AGTACCCAGG GAATCTACGG ATTGTAGAGA TCTGTCGAGA 3850 GGACAGTACA CAGTACCCAG GAAATCTACG GATTGTAGAG AGCTGTCGAG 3800 AGGACAGTTC ACAGTACCCA GTAACTATAC GGATTGTAGA GATCTGTCGA 3750 GAGGACAGTT CACAGTACCC AGTAACTCTA CGGATTGTAG AGAGCAGTCT 3700 GGAGAAAAAA AACCCCCCAC AAAAAAGGGG TTGTTTTTTT TTTTTCCCAA 3650 AAAACCCCCA AAG 3637 GG GGT TTT AAA AAC CCC TCC CTC CCC AAA AGG GGT TT 3600 A AGA AAA CTT CTG ACG GAT AGT AGA GAG CAG TCA GGA GGA CAG TTC ACA G 3550 TA CAC AGG AAA TCT GCG GAT TGT AGA GAG GAG GCT GGA GGT CAG TTC ACA 3500 GTA CAC AGG AAA TCT ACG GAT TGT AGA GAG GAG GCT GGA GGT CAG TTC AC 3450 A 3450 GTACCCAGA AACTGTACGA GTGGTAGAAA AGTCTGGAGG ACAGTTCACA 3400 GTACCCAGAA ACTCTACGGA TTGTAGAGAT CAGTCTGGAG GTCAGTTCAC 3350 AGTACCCAGA AACTCTACGG ATTGTAGAGA TCAGTCTGGA GGTCAGTTCA 3300 CAGTACCCAG AAAACTATAC GAGTGGTAGA AAAGTCTGGA GGACAGGATC 3250 CAGGATTTGT ATATGTCCTA CAAAGGACAT CACCTATGGT GTCAAGTAGC 3200 TACAAGGATG GTACTTAAGA TTCCTTTTTA TATGTTCTCC TAAG 3156 GAG CAA 3150 TTA AGG GGA GGA GGT ACA TTA GTT CCC CCC TCT ATA TGT TTT TTC CAG GG 3100 G CAA TAT AGG GGG GGA GGT ACT GAG GAT TCC TCT TTA CAT GCT TCT TCT A 3050 AG AAT 3046 GTGAA GAGGAGGAGG TACTTTATAA ATATCCCTCT TTATATGTTC 3000 TTCTAAG 2993 GAA CTT GAA GAG GGA GAG GTA ATA AAA TCC TCC TTT GTA TGT T 2950 CT TTT ATG GAG CAT AAA GGA G 2930 GTAAGTACT TGTGATACCT CTTTATCTGT 2900 TCTAAGAACG TGAAGAGGAG GAGGTACTTT ATAAATATCC CTCTTTATAT 2850 GTTCTTCTAA GGAACTTGAA G 2829 AG GGA GAG GTA ATA AAA TCC TCC TTT GTA 2800 TGT TCT TTT ATG GAG CAT AAA GGA G 2776 GTAAG TACTTGTGAT ACCTCTTTAT 2750 CTGTTCTAAG AACGTGAAG 2731 AG GAG GAG GTG CTT TAT AAA TAT CCC TCT TT 2700 A TAT GTT TCT TTA AGG AGC AAT AAA GAG GGA GAG GTA ATA AAA TCC TCC T 2650 TT GTA TGT TCT TTT AAG GAA CAT AAA GGA G 2621 GTAAGTACTT GTGATACCTC 2600 TTTATCTGTT CTAAGAACGT GAAG 2576 AG GAG GAG GTG CTT TAT AAA TAT CCC 2550 TCT TTA TAT GTT TCT TTA AGG AGC AAT AAA GAG GGA GAG 2512 G TAATAAAATC 2500 CTCCTTTGTA TGTTCTTTTA AGGAACATAA AGGAGGTAAG TACTTATGAT 2450 CCCTCTTTAT ATGTTCTAAG GAACATAAAG GGGAGGAGGT GCTTTAAATA 2400 TATCCCTCTT TAAATGTTCT TCTAAGGAGC AATAAAGAGG GAGAGGTAAT 2350 AAAATCCTCC TTTGTATGTT CTTTTATGGA GCATAAAGGA GGTAAGTACT 2300 TATGATCCCT CTTTATATGT TCTAAGGAAC ATAAAGGGGA GGAGGTGCTT 2250 TAAATATATC CCTCTTTAAA TGTTCTTCTA AG 2218 GAA CTT GAA GAG GGA GAG 2200 GTA ATA AAA TCC TCC TTT GTA TGT TCT TTT ATG GAG CAT AAA GGA G 2155 GTAA 2150 GTACTTGTGA TACCTCTTTA TCTGTTCTAA GAACGTGAAG 2110 AG GAG GAG GT 2100 G CTT TAT AAA TAT CCC TTT TTA TAT GTT CTT CTA AGG AGC AAT AAA GAG G 2050 GA GAG GTA ATA AAA TCC TCC TTT GTA TGT TCT TTT ATG GAG CAT AAA GGA 2000 G 2000 GTAAGTACT TGTGATACCT CTTTATCTGT TCTAAGAACG TGAAG 1955 AG GAG 1950 GAG GTG CTT TAT AAA TAT CCC TCT TTA TAT GTT TCT TTA AGG AGC AAT AA 1900 A GAG GGA GAG 1891 GTAATAAAAT CCTCCTTTGT ATGTTCTTTT AAGGAACATA 1850 AAGGAGGTAA GTACTTATGA TCCCTCTTTA TATGTTCTAA GGAACATAAA 1800 GGGGAGGAGG TGCTTTAAAT ATATCCCTCT TTAAATGTTC TTCTAAG 1753 GAA 1750 CTT GAA GAG GGA GAG GTA ATA AAA TCC TCC TTT GTA TGT TCT TTT ATG GA 1700 G CAT AAA GGA G 1690 GTAAGTACT TGTGATACCT CTTTATCTGT TCTAAGAACG 1650 TGAAG 1645 AG GAG GAG GTG CTT TAT AAA TAT CCC TTT TTA TAT GTT CTT CTA A 1600 GG AGC AAT AAA GAG GGA GAG GTA ATA AAA TCC TCC TTT GTA TGT TCT TTT 1550 ATG GAG CAT AAA GGA G 1535 GTAA GTACTTGTGA TACCTCTTTA TCTGTTCTAA 1500 GAACGTGAAG 1490 AG GAG GAG GTG CTT TAT AAA TAT CCC TCT TTA TAT GTT TC 1450 T TTA AGG AGC AAT AAA GAG GGA GAG 1426 GTAAT AAAATCCTCC TTTGTATGTT 1400 CTTTTAAGGA ACATAAAGGA GGTAAGTACT TATGATCCCT CTTTATATGT 1350 TCTAAGGAAC ATAAAGGGGA GGAGGTGCTT TAAATATATC CCTCTTTAAA 1300 TGTTCTTCTA AG 1288 GAA CTT GAA GAG GGA GAG GTA ATA AAA TCC TCC TTT GT 1250 A TGT TCT TTT ATG GAG CAT AAA GGA G 1225 GTAA GTACTTGTGA TACCTCTTTA 1200 TCTGTTCTAA GAACGTGAAG 1180 AG GAG GAG GTG CTT TAT AAA TAT CCC TTT T 1150 TA TAT GTT CTT CTA AGG AGC AAT AAA GAG GGA GAG GTA ATA AAA TCC TCC 1100 TTT GTA TGT TCT TTT AAG GAA CAT AAA GGA GGT AAG TAC TTA TGA* 1056 no gene chrblob_4125.gen_1|24oct01 TCCCT 1050 CTTTATATGT TCTAAGGAAC ATAAAGGGGA GGAGGTGCTT TAAATATATC 1000 CCTCTTTAAA TGTTCTTCTA AGGAACTTGA AGAGGGAGAG GTAATAAAAT 950 CCTCCTTTGT ATGTTCTTTT ATGGAGCATA AAGGAGGTAA GTACTTGTGA 900 TACCTCTTTA TCTGTTCTAA GAACGTGAAG AGGAGGAGGT GCTTTATAAA 850 TATCCCCCTC TTTATATGTT TCTTTAAGGA GCAATAAAGA GGGAATTGTA 800 CTTTAAATAT CCCTCTTTAT GTGTTTCTTT AAGAAATGTT AAGGAGGGGA 750 GTACATAAAA TTCTCTCTCC ATAAGTTCTC CTAGGGAACG AGAAAGGAGG 700 GGGCACCAAT GATCTTTCTA TATATGTTCT TTTAAAGAAC ATAAAGGAAG 650 TGAGGTACAT ATATAATCTT ATACACCACA TTACTACAAT AAATATATTT 600 TTAATAGTAC AATATGAAAA TTTCATTTGT GCCATAAACG GATTCCCAAA 550 ACATTAGCTT TTATATAATA ATATTAAATA TTGCTAATAT ATATTGGAAT 500 ATTGAATTAT TGATAATTTA ATTGTTCTAA TATAATATGA TTAGAAATAT 450 TTGATCTTTT TTGATTGAGG TTTTTTTTTT TTAATTACTT AAGAAAAAAT 400 ATTTTATTTC TTATATATAT ATTTAAGAAA ATAAATATTT TCATGGAAAT 350 ATGTGTGATA GAATATATAC CACCACATAT TTTTATGTTT TTATTTTATT 300 CAATAGAATC TAATAAAAGT ATATTGAAAA AGTGTAAATA AAATTCTTTT 250 TATTGAATAC AAAAAAAAAT CATATATTTT TAACCAATAT AAATATAATA 200 AGGTTAAAAA ATATATATGA AAATGTATAC ATTTATTTAA TTTTAAGCAT 150 TTGGAAATAT AATTTTTTTA TTATAATATT ATAATATTAT AATATGTTAG 100 TTATATATTT CCTGTGATTA TCTTATAAGT TATCAATATT TTACATATTT 50 CAAAAAAAAA AAAAAATAAA AAAATAACAT TTTAAAAATA TTTTTATAAG end of file 4126 4 telomere or centromere Date: Wednesday, 3/27/2002 Time: 09:55 c4127.txt chrblob_4129|2001.10.15|GENOMIC|Sanger FEATURES Location CDS 1960..2157 /gene="chrblob_4129.gen_1|24oct01" /note="(protein coding) No NR protein Similarities" /codon_start=1 ORIGIN watson strand 1 ATATAGGTCC TAACATACAT AGTATAGGTC TTAATATAAG TACTATAGGT 51 TTTAACTTAA CCAACATAGG TCCTAACATA AGTTATATAG GTCTTAATGT 101 CACTAGCATA ATTCATTAAG TTACTAAGTT TCGTCTTAAC GTAACTAACA 151 TAGGTCCTAA CTTCACTAAC TTAGGTCTTA AGGTAAGTAA TATAGGTCCT 201 CAATACAGTA ACGTATGTCT TAAGGTAACC AATATAGGTC CTAACTACAC 251 TAACTTAGGT CTTAACTTCA CTAACATAGG TCTTAACTTC ACTAACATAG 301 GTCTTAACGT AACTAACTAA GGTCTTACCT TCACTGATAT AGGTCTTAAC 351 TTGACTAACA TAGGTGCTAA CATTAGTAAT GTAGGTCTTA CTTTCACTAA 401 CTCAGGTTTT ATTTTCACTC ATATAGGTCT TAATATTACT CACTTAAGTC 451 ATTAAAATAC TAACTTAGGT CCTAACGTAG ATGCTAACAT AACCAATATA 501 GGTCCTAACT ACACTAACTT AGGTCTTACC TTTACTAACA TAGGTGCTAA 551 CATTAGTAAT GTAGGTCTTA CCTTTACTAA CTTAGATCTT AACTCAACTA 601 ACTGAGACAT TACTTTCACT AATATAGGTC CTATCATAAC TAACATAGGA 651 CTTATCTTAA CTAACTCTGG TCTTACTTTC ACTAACTTAA GTCTTACTTT 701 GCCTAAGTGA GGTCATAATT TAACTAATAT AGGTCTTAGG TTTTCTAACT 751 TTCGTCTTAA CTTAACTAAA CTTTGACCTT ACTTTTACTA ATATAGGTCC 801 TATCTTAACT AACATAGGTC CTATCTTAAC TAACATAGGT CTTAACTTAA 851 CTAACTAAGG TCTTAACTTA ACTAACTTAG GTCTTAACTT AGCTAACATA 901 GGTCTTCATT TAACTAAACT GAGACCTTAC ATTCACTAAT ATAGGTCTTA 951 AGGTTACTAA CATACGTCTT AACTTCAGTA AGTTAGATCT TACTTTTACT 1001 AACTTAGGTG TTACTTTTAC TAACTTAGGT CTTAAATTGA GTAACTAAGG 1051 TCATATTTCG ACTAATATGA GTCTTAACTT CACTAACTCT GGTCATACTA 1101 TTACTAACTT AAGTCTTACT TTCACTAACC TAAGTCTTAC TTTTACTAAC 1151 ATAGGTCTTA CATTCACTAA TTGAGGTCTT AACTTAGCTA ACATAGGTCC 1201 TAACTTCACT AACATAGGTC CTAACTTCAC TAACATAGGT CCTACTTTCA 1251 CTAACATAGG TCTTACTTTC ACTAACTAAG GTCATACTTT TACTAACTTA 1301 GGTCTTAGGT TGACTAACTT AGCTCTTACT TTTACTAACT TAGGTCTTAA 1351 CTTGACTAAC ATAGGTCTTA ACTTGACTAA CTAAGTTCTT ACTTTAACGA 1401 ACTAAGGTCT TACGTTCACT GATATAGGTC TTATGATTAC TAACTAAGGT 1451 CTTACCTTCA CTGATATAAG TCTTACCTTT ACTAACTTAG GTCTTACGTG 1501 GACTAATATA GGTCTTACTT TCACTAAGTG AGGTCCTTCT GTTACTAACA 1551 TAGGTCCTAC GTTAACTAAC AAAGGTCCTA ATATAGCTAA TATAGATCCA 1601 AAGATACCTA ATATAGGTCT TAAGAAACTA ACCTAGGTCT TAGGTTAACT 1651 AATATAGGTC CTAAGATAAC TAATATAGGT CTCAACAAAC TAACATATGT 1701 CTTAAGGTAA CTAACGTAGG CCCTAATATA CCTAATATAG GTCCTAAGCT 1751 TACTAATTTA GGTTATAGAG GTACTAATAT AGGTCTTAAG CTTACTAATT 1801 TATGTTATAC AGGTACTAAT ATAGGTCTTA ATAAACTAAA GTAGGTCTTA 1851 AGTTAACTAA TATAGGTCTT AAGCTTACTA ATTTAGGTTA TAGAGGTGCT 1901 AATATAGGTC TCGATAAACT AACCTAGGTC TTAAGTTAAC TAATATAGGT 1951 CCTAAGGTA no gene chrblob_4129.gen_1|24oct01 1960 ATG AAA GTA CGT CCA GAG ATA CCT AAT GTA GGT CCT AAG AT 2001 C ATG AAA GTA GGT CCA GAG ATA CCT AAT GTA CGT CCT AAT GTA GGT AAT A 2051 TA GGT CTT AAG CTT ACT AAT CTA GGT CCT AAG ATC ATG AAA GTA GAT CCA 2101 GAG ATA CCT AAT GTA GGT CCT AAC ATA ACT AAT ATA GGT CTT AAT AAA CT 2151 A ACC TAG* 2157 GTC TTAGGTTAAC TAATATAGGT CTTACGTTGA CTAACTAAGG 2201 TCATACTTCG ACTAACATAG GTCTTACATT AACTAACATA TGTCCTAACA 2251 TTAGTAATGT AGGTCTTACT TTCACTAACT TCGGTCTTAA CTTAACTAAT 2301 ACAGGTCTTA CGTTTACTAA CATAGGTCTT AACTTAACTA ATACAGGTCT 2351 TACGTTTACT AACATAGGTC ATACTTCGAC TAACTAAGGT CTTACCTTCA 2401 CTGATATTGG TCTTAAGCTT ACTAATTTAG GTCATGTAGG TACTAACATA 2451 GGTCTTAATT GTACTTATGT AGCTCTTACT TTCACAAAAG TAGGCCTTGA 2501 AATGATTAAT ATAAGACTTA GTATAAGTAA AAACTAGGTC TTACTATTAC 2551 TAATATAGGT CATAAGGTTA CTGACCTAAG TCATTAAGGT ACTAAGTTTG 2601 GTCTTAACTT AACAAATATA GGTCCTAGCT ACAGTAACAT AGGTCTTAAT 2651 GTAACTAACT TAGGTCCTAA CGACAGTAAC GTACGTCTTA AGGTAAGTAA 2701 TGTAGGTCTT AGGTAAGTAA TGTAAGTCTT AAGGTAAGTA ATATAGGTCC 2751 TAACATTACT GATGTAGGTC TTACCTTCAC TAACATAGGT CCTACTTTCA 2801 CTAACTCAGG TCATACGTTT ACTAACTTAG GTCTTAATTT CACAGATATA 2851 GGTCTTATGA TTACTAACTA AGGTCCTAAC TTAACTAACT CAGATCTTAC 2901 TTTCACTAAC CTAAGTCTTA CTTTCACTAA CATAGGTCAT ACTTCGACTA 2951 ACTAAGGTCT TAACATGACT AACTAAGGTC TTAACATGAC TAACTAAGGT 3001 CTTAACTTAA CTAACTGAGG TCTTAAAGTA ACTAATATAG GTCTTACTTT 3051 CACTGTTATT GGTCTTAATT CATCTAACTT AGGTCTAAAC TTGACTAACA 3101 TAAGGTCTTA TGATTACTAA CTTAGGTCTT AACTTAGCTA ACATAGGTCT 3151 TCATTTAACT AAACTGAGAC CTTACATTCA CTAATATAGG TCTTAAGTCA 3201 TCTAACTTAG ACCTTAATTT CACTAATATA GGTCTTAAGT CATCTAACTT 3251 AGACCTTAAT TTCACTAATA TAGGTCTTAA CTTCAGTAAC TTAGGTCTTA 3301 ACTCAACTAA CTAAGGTCAT ACTTGGACTA ACATAGGTCT TAACTTGACT 3351 AACTAAGTTC TTACTTTAAC GAACTAAGGT CTTACTTTTA CTAACGTAGG 3401 TCTTAACTTG ACTAACTAAG GTCTGAACTT GACTAACTAA GGTCATACTT 3451 GGACTAACAT AGGTCTTACT TCTACTAACT TAGGTCTTAC ATTCACTGAT 3501 ATAGGTCTTA ACTTAACTAA CTTATGTCTT AACTTAACTA ACTTATGTCT 3551 TAACTTAGCT AACATAGGTC TTAACTTCAC TAACATAGGT CCTAACATTG 3601 GTAATGTAGG TCTTAATTTC ACTCATATGG GTCTTATGGT AACTAACTAA 3651 GGTCTTTCCT TCACTGATAT AAGTCTTATC ATTACTAGCT AAGGTCCTAA 3701 CTTAACAAAT ATAGGTCATA AGATTACTAA GCTAAGTCAT TAAGGTACTA 3751 ACTTAGGTCG TAATGTAACT AATATAGGTC TTAAGTTTAC AAAACTAAGT 3801 CATTAAGGTA CTAACTTAGG TCTGACATTC ATTAAATGAA GTCTGAACTT 3851 GACTAACTTA TGTCTTATCT TAACTAACAT AGGTCCTATC TTGACTAACT 3901 TAGGTTTTAA CTCAACTAAC TGAGGTCATA CTTCGACTAA TGTAGGTCTT 3951 ACTTTCACTA ACATAGGTCC TAAGTTGACT AACTTAGGTC TTACATTTAC 4001 TAACTTAGGT CTTAACTTAA CTAACTGAGA CCTTACTTTC ACTAATATAG 4051 GTCTTAAGTC ATCTAACGTA GGTCTTAATT TCAACTAACT TAGGTCTTAA 4101 ATTGAGAAAC TAAGGTCATA CTTCGACTAA CCTAGGTCTT ACTTTTACTA 4151 ACTGAGGTCT TACTTTCACT AACACAGGTC TTACTTTAAG TAATATAGGT 4201 CCTAACTTAA CTAATATAGG TCATAAGGTT ACTAACTTAG GTCATTAAGG 4251 TACTAACATA AGTCATTAAG GTACTAACTT ATGTCGTAAG GTAACTAATA 4301 TATAGGTCTT AACTACAGAA ACGTAGGTCT TAAGGTAACT AATATAAGTC 4351 CTAACTACAG CAACATAGGC CTATAGGTAA GTAATATAGG TCCTAACATT 4401 ACATACTTAG GTCTTGACTG GAGTAATGTA GGTCCTAACA TTACTAGCTT 4451 TCGTCTTAGG GTTACTAACT TAGGTCTTAA GGTCACTAAC ATAAGTCATT 4501 AAGGTACTAA GTTTGGTCTT ACATTCACTG ATATAGGTCT TACTTTCAGT 4551 AGAATAGGTC TTAAATTCAC TAACTCAGGT CATACTTTTA CTAACTTAGA 4601 TCTTAAATTA ACTAAGGTCA TACTTCAACT AATATAGGTC TTACTTTAAC 4651 TAAAATAGGT CTTACATTCA CTGATATAGG TCTTATGATT ACTAACTAAG 4701 GTCCTAACTT AACTAATATA GGTCACAAGT TTACTAACCT AGGTCTTACT 4751 TTTACTAACT TATGTCTTAC ATTTACTAAC AGAGGTCTTA ACTTAACTAA 4801 GTAAGGTCTT ACCTTAACTA ACTCAGGTCT TAACATAACT AAGTAAGGTC 4851 ATACTTCGAC TAACATAGGT CTTAACTTGA CTAACATAGG TCTTAGGTTA 4901 ACTAACTTAG GTCTTAACTT AGCTAACATA GGTCTTCATT TAACTAAACT 4951 GAGACCTTAC ATTCACTAAT ATAGGTCTTA AGTCATCTAA CTTAGGTCTT 5001 AATTTCAACT AACTTAGGTC TTAACGTAAC TAACTCAGAC CTTACTTTTA 5051 CTAATATAGG TCCTAATTTA ACTAACATAG GTCCTAACAT TACTAATGTA 5101 CGTCTTACCT TCACTAACAT AGGTCTTAAT TTCAACTAAC TAAGGTCTTA 5151 CTTTCACTAA CCTAAGTCTT ACTTTCACTA ACTTAGGTCT TAAATTGAGT 5201 AACTAAGGTC TTAACTTCAG TAACTTAGGT CTTACTTTCA CTAATATAGG 5251 TCTTAACTTC AGTAACTTAG GTCTTAACTT GACTAACTAA GGTCTTAACT 5301 TAACTAACTT AGGTCTTAAC ATAACTAACT TAGGTCTTAA CTTCACTAAC 5351 TAAGGTCATA CTTCTACTAA CTAAGGTCTT AACTTAACTA ATCTAGGTAT 5401 GAACTTCAAT AACTAAGGTC TTACTTTTAC TAACTTAGGT CCTAACTTGA 5451 CTAACATAGG TCCTAACATT AGTAATGTAG GTCTTACTTT CATTCATATA 5501 GGTCTTATGG TAACTAACTA ACGTCTTACC TTCACTGATA TAGGTCTTAC 5551 GTTCACTAAG TGAGGTCCTT CTGTTACTAA CATAGGTCTT AAATTGACTA 5601 ACATAGGTCT TAACTTGACT AACATAGGTC TTAACTTGAC TAACTAAGAT 5651 CTTACATTCA CTCATATAGG TCTTATGTTT GCTAACTTAG GTCCTAACTT 5701 AACTAATATA GGTCATAAAA TTACTAACCT AAGTCATTAA GGTACTAACT 5751 TAGGTCTTAA TTTCAACTAA CTAAGGTCTT AACATGACTA ACATAGGTCC 5801 TAACTTGACT AACATAGGTC TTAGGTTAAC TAACTAAGGT CAGACTTGGA 5851 CTAACTTAGG TCTTACTTTC ACTAAGTGAG GTCCTTCTTT TACTAACATA 5901 GGTCTTACAT TCACTAATTG AGGTCTTAAC TTGACTAACA TAGGTCTTAC 5951 TTTCATTAAT TGAGGTCTTA ACTTGACTAA CATAGGTCCT AACTTCAATA 6001 ACTAAGGTCT TACTTTTACT AACTTAGGTC ATACTTCTAC TAACATAAGT 6051 CTAAACTTGA CTAACTAAGG TCATGCTTCG ACTAACATAG GTCTTACTTT 6101 TACTCACTTA GGTCTTAACT TCAGTAACTA AGGTCTTAAC TTAACTAAAT 6151 TAGGTCTTAA CTTAACTAAG TAAGGTCATA CTTCGACTAA CATAGGTCAT 6201 ACTTCGACTA ACTAAGGTCT TCATTTAACT AAACTGAGAC CTTACATTCA 6251 CTAATATAGG TCTTAAGTCA TCTAACTTAG ACCTTAATTT CAACTAACTT 6301 AGGTCTTAAC TTAACTAACT TAGGTCTTAC TTTCACTAAC ATAGGTCTTA 6351 ACTTCACTAA CTAAGTTCTT ACTTTAACGA ACTAAGGTCT TACTTTTACT 6401 AACATAGGTC TTAACCTGAC TAACTAAGGT CATACTTGGA CTAACACAGG 6451 TCTTAACTTG ACTAACTTAG GTCTTAACTT AGCTAACATA GATCTTACTT 6501 TCACTAACCT AAGTCTTACT TTCACTAACT TAGGTCATAC TTCTACTAAC 6551 ATAAGTCTAA ACTTGACTAA CTAAGGTCAT GCTTCGACTA ACATAGGTCT 6601 TACTTTTACT CACTTAGGTC TTAACTTCAG TAACTAAGGT CTTAACTTAA 6651 CTAAATTAGG TCTTAACTTA ACTAAGTAAG GTCATACTTC GACTAACATA 6701 GGTCATACTT CGACTAACTA AGGTCTTATC TTCACTGATA TAGGTCTTAT 6751 GGTTACTAAC TAAGGTCTTA CTCTCACTGA TATAGGTCTT ATGGTTACTA 6801 ACTAAGGTCT TACTGTTACT AATATTGGTC TTTACCTTAC TAATTTAGGT 6851 TATAGAGGTA CTAATATAGG TCTTAATTGT ACTTATGTAG CTCTTACTTT 6901 CACAAAAGTA GGCCTTGAAA TGATTAATAT AAGACTTAGT ATAAGTAAAA 6951 ACTAGGTCTT ACTATTACTA ATATAGGTCA TAAGGTTACT GACCTAAGTC 7001 ATTAAGGTAC TAACTTAGGT TCTAACGTCA AAAACATAGG TCCTATAATA 7051 ACTAATATAG GTCCTAACAT AACCAATATA GGTTCTAACA TAAACAATAT 7101 AGGTCTTAAG TTTACTAACA TAAGTCATTA AGGTACTAAC TTAGGTCGTA 7151 ATGTAACTAA TATAGGTCTT AAGTTTACAA AACTAAGTCA TTAAGGTACT 7201 AACTTAGGTC TTACATTCAT TAAATGAAGT CTTAACTTGA CTAACATAGG 7251 TCCTAACATT AGTAATGTAG GTCTTACTTT CACTCATATA GGTCTTATAT 7301 CAACTAACTA AGTTCTTTTC TTCACTGATA TAGGTCTTAT GATTACTAAC 7351 GTAGGTCTTA ACATAACTAA CTAAGGTTTT AACTTAACTA ACATAGGTCT 7401 TTACTTCAGT AACTAAGGTC ATACAATTAC TAACCTAAGT CATTAAGGTA 7451 CTAACTTAGG TCTTACATTC ACTGATATAG GTCTTAACGT AACTAGCTAA 7501 GGTCATACAA TTACTAACCT AAGTCATTAA GGTACTAAGT TTGGTCTTAA 7551 CCTAACTAAT ATAGGTCCTA ACATTACCAA TATAGGTCTT AAGTTTACAA 7601 AACTAAGTCA TTAAGGTACT AACTTAGGTC CTAACATAAC CAATATAGGT 7651 CTTAGGTTTA CAAAACTAAG TCATTAAGGT ACTAACTTAG GTACTAACAT 7701 AACCAATATA GGTCTTAAGT TTACAAAACT AAGTCATTAA GGTACTAACT 7751 TAGGTACTAA CATAACCAAT ATAGGTCTTA AGGTTACAAA CCTAAGTCAT 7801 TAACGTACTA ACTT // crick strand 7814 AAGT TAGTACGTTA 7800 ATGACTTAGG TTTGTAACCT TAAGACCTAT ATTGGTTATG TTAGTACCTA 7750 AGTTAGTACC TTAATGACTT AGTTTTGTAA ACTTAAGACC TATATTGGTT 7700 ATGTTAGTAC CTAAGTTAGT ACCTTAATGA CTTAGTTTTG TAAACCTAAG 7650 ACCTATATTG GTTATGTTAG GACCTAAGTT AGTACCTTAA TGACTTAGTT 7600 TTGTAAACTT AAGACCTATA TTGGTAATGT TAGGACCTAT ATTAGTTAGG 7550 TTAAGACCAA ACTTAGTACC TTAATGACTT AGGTTAGTAA TTGTATGACC 7500 TTAGCTAGTT ACGTTAAGAC CTATATCAGT GAATGTAAGA CCTAAGTTAG 7450 TACCTTAATG ACTTAGGTTA GTAATTGTAT GACCTTAGTT ACTGAAGTAA 7400 AGACCTATGT TAGTTAAGTT AAAACCTTAG TTAGTTATGT TAAGACCTAC 7350 GTTAGTAATC ATAAGACCTA TATCAGTGAA GAAAAGAACT TAGTTAGTTG 7300 ATATAAGACC TATATGAGTG AAAGTAAGAC CTACATTACT AATGTTAGGA 7250 CCTATGTTAG TCAAGTTAAG ACTTCATTTA ATGAATGTAA GACCTAAGTT 7200 AGTACCTTAA TGACTTAGTT TTGTAAACTT AAGACCTATA TTAGTTACAT 7150 TACGACCTAA GTTAGTACCT TAATGACTTA TGTTAGTAAA CTTAAGACCT 7100 ATATTGTTTA TGTTAGAACC TATATTGGTT ATGTTAGGAC CTATATTAGT 7050 TATTATAGGA CCTATGTTTT TGACGTTAGA ACCTAAGTTA GTACCTTAAT 7000 GACTTAGGTC AGTAACCTTA TGACCTATAT TAGTAATAGT AAGACCTAGT 6950 TTTTACTTAT ACTAAGTCTT ATATTAATCA TTTCAAGGCC TACTTTTGTG 6900 AAAGTAAGAG CTACATAAGT ACAATTAAGA CCTATATTAG TACCTCTATA 6850 ACCTAAATTA GTAAGGTAAA GACCAATATT AGTAACAGTA AGACCTTAGT 6800 TAGTAACCAT AAGACCTATA TCAGTGAGAG TAAGACCTTA GTTAGTAACC 6750 ATAAGACCTA TATCAGTGAA GATAAGACCT TAGTTAGTCG AAGTATGACC 6700 TATGTTAGTC GAAGTATGAC CTTACTTAGT TAAGTTAAGA CCTAATTTAG 6650 TTAAGTTAAG ACCTTAGTTA CTGAAGTTAA GACCTAAGTG AGTAAAAGTA 6600 AGACCTATGT TAGTCGAAGC ATGACCTTAG TTAGTCAAGT TTAGACTTAT 6550 GTTAGTAGAA GTATGACCTA AGTTAGTGAA AGTAAGACTT AGGTTAGTGA 6500 AAGTAAGATC TATGTTAGCT AAGTTAAGAC CTAAGTTAGT CAAGTTAAGA 6450 CCTGTGTTAG TCCAAGTATG ACCTTAGTTA GTCAGGTTAA GACCTATGTT 6400 AGTAAAAGTA AGACCTTAGT TCGTTAAAGT AAGAACTTAG TTAGTGAAGT 6350 TAAGACCTAT GTTAGTGAAA GTAAGACCTA AGTTAGTTAA GTTAAGACCT 6300 AAGTTAGTTG AAATTAAGGT CTAAGTTAGA TGACTTAAGA CCTATATTAG 6250 TGAATGTAAG GTCTCAGTTT AGTTAAATGA AGACCTTAGT TAGTCGAAGT 6200 ATGACCTATG TTAGTCGAAG TATGACCTTA CTTAGTTAAG TTAAGACCTA 6150 ATTTAGTTAA GTTAAGACCT TAGTTACTGA AGTTAAGACC TAAGTGAGTA 6100 AAAGTAAGAC CTATGTTAGT CGAAGCATGA CCTTAGTTAG TCAAGTTTAG 6050 ACTTATGTTA GTAGAAGTAT GACCTAAGTT AGTAAAAGTA AGACCTTAGT 6000 TATTGAAGTT AGGACCTATG TTAGTCAAGT TAAGACCTCA ATTAATGAAA 5950 GTAAGACCTA TGTTAGTCAA GTTAAGACCT CAATTAGTGA ATGTAAGACC 5900 TATGTTAGTA AAAGAAGGAC CTCACTTAGT GAAAGTAAGA CCTAAGTTAG 5850 TCCAAGTCTG ACCTTAGTTA GTTAACCTAA GACCTATGTT AGTCAAGTTA 5800 GGACCTATGT TAGTCATGTT AAGACCTTAG TTAGTTGAAA TTAAGACCTA 5750 AGTTAGTACC TTAATGACTT AGGTTAGTAA TTTTATGACC TATATTAGTT 5700 AAGTTAGGAC CTAAGTTAGC AAACATAAGA CCTATATGAG TGAATGTAAG 5650 ATCTTAGTTA GTCAAGTTAA GACCTATGTT AGTCAAGTTA AGACCTATGT 5600 TAGTCAATTT AAGACCTATG TTAGTAACAG AAGGACCTCA CTTAGTGAAC 5550 GTAAGACCTA TATCAGTGAA GGTAAGACGT TAGTTAGTTA CCATAAGACC 5500 TATATGAATG AAAGTAAGAC CTACATTACT AATGTTAGGA CCTATGTTAG 5450 TCAAGTTAGG ACCTAAGTTA GTAAAAGTAA GACCTTAGTT ATTGAAGTTC 5400 ATACCTAGAT TAGTTAAGTT AAGACCTTAG TTAGTAGAAG TATGACCTTA 5350 GTTAGTGAAG TTAAGACCTA AGTTAGTTAT GTTAAGACCT AAGTTAGTTA 5300 AGTTAAGACC TTAGTTAGTC AAGTTAAGAC CTAAGTTACT GAAGTTAAGA 5250 CCTATATTAG TGAAAGTAAG ACCTAAGTTA CTGAAGTTAA GACCTTAGTT 5200 ACTCAATTTA AGACCTAAGT TAGTGAAAGT AAGACTTAGG TTAGTGAAAG 5150 TAAGACCTTA GTTAGTTGAA ATTAAGACCT ATGTTAGTGA AGGTAAGACG 5100 TACATTAGTA ATGTTAGGAC CTATGTTAGT TAAATTAGGA CCTATATTAG 5050 TAAAAGTAAG GTCTGAGTTA GTTACGTTAA GACCTAAGTT AGTTGAAATT 5000 AAGACCTAAG TTAGATGACT TAAGACCTAT ATTAGTGAAT GTAAGGTCTC 4950 AGTTTAGTTA AATGAAGACC TATGTTAGCT AAGTTAAGAC CTAAGTTAGT 4900 TAACCTAAGA CCTATGTTAG TCAAGTTAAG ACCTATGTTA GTCGAAGTAT 4850 GACCTTACTT AGTTATGTTA AGACCTGAGT TAGTTAAGGT AAGACCTTAC 4800 TTAGTTAAGT TAAGACCTCT GTTAGTAAAT GTAAGACATA AGTTAGTAAA 4750 AGTAAGACCT AGGTTAGTAA ACTTGTGACC TATATTAGTT AAGTTAGGAC 4700 CTTAGTTAGT AATCATAAGA CCTATATCAG TGAATGTAAG ACCTATTTTA 4650 GTTAAAGTAA GACCTATATT AGTTGAAGTA TGACCTTAGT TAATTTAAGA 4600 TCTAAGTTAG TAAAAGTATG ACCTGAGTTA GTGAATTTAA GACCTATTCT 4550 ACTGAAAGTA AGACCTATAT CAGTGAATGT AAGACCAAAC TTAGTACCTT 4500 AATGACTTAT GTTAGTGACC TTAAGACCTA AGTTAGTAAC CCTAAGACGA 4450 AAGCTAGTAA TGTTAGGACC TACATTACTC CAGTCAAGAC CTAAGTATGT 4400 AATGTTAGGA CCTATATTAC TTACCTATAG GCCTATGTTG CTGTAGTTAG 4350 GACTTATATT AGTTACCTTA AGACCTACGT TTCTGTAGTT AAGACCTATA 4300 TATTAGTTAC CTTACGACAT AAGTTAGTAC CTTAATGACT TATGTTAGTA 4250 CCTTAATGAC CTAAGTTAGT AACCTTATGA CCTATATTAG TTAAGTTAGG 4200 ACCTATATTA CTTAAAGTAA GACCTGTGTT AGTGAAAGTA AGACCTCAGT 4150 TAGTAAAAGT AAGACCTAGG TTAGTCGAAG TATGACCTTA GTTTCTCAAT 4100 TTAAGACCTA AGTTAGTTGA AATTAAGACC TACGTTAGAT GACTTAAGAC 4050 CTATATTAGT GAAAGTAAGG TCTCAGTTAG TTAAGTTAAG ACCTAAGTTA 4000 GTAAATGTAA GACCTAAGTT AGTCAACTTA GGACCTATGT TAGTGAAAGT 3950 AAGACCTACA TTAGTCGAAG TATGACCTCA GTTAGTTGAG TTAAAACCTA 3900 AGTTAGTCAA GATAGGACCT ATGTTAGTTA AGATAAGACA TAAGTTAGTC 3850 AAGTTCAGAC TTCATTTAAT GAATGTCAGA CCTAAGTTAG TACCTTAATG 3800 ACTTAGTTTT GTAAACTTAA GACCTATATT AGTTACATTA CGACCTAAGT 3750 TAGTACCTTA ATGACTTAGC TTAGTAATCT TATGACCTAT ATTTGTTAAG 3700 TTAGGACCTT AGCTAGTAAT GATAAGACTT ATATCAGTGA AGGAAAGACC 3650 TTAGTTAGTT ACCATAAGAC CCATATGAGT GAAATTAAGA CCTACATTAC 3600 CAATGTTAGG ACCTATGTTA GTGAAGTTAA GACCTATGTT AGCTAAGTTA 3550 AGACATAAGT TAGTTAAGTT AAGACATAAG TTAGTTAAGT TAAGACCTAT 3500 ATCAGTGAAT GTAAGACCTA AGTTAGTAGA AGTAAGACCT ATGTTAGTCC 3450 AAGTATGACC TTAGTTAGTC AAGTTCAGAC CTTAGTTAGT CAAGTTAAGA 3400 CCTACGTTAG TAAAAGTAAG ACCTTAGTTC GTTAAAGTAA GAACTTAGTT 3350 AGTCAAGTTA AGACCTATGT TAGTCCAAGT ATGACCTTAG TTAGTTGAGT 3300 TAAGACCTAA GTTACTGAAG TTAAGACCTA TATTAGTGAA ATTAAGGTCT 3250 AAGTTAGATG ACTTAAGACC TATATTAGTG AAATTAAGGT CTAAGTTAGA 3200 TGACTTAAGA CCTATATTAG TGAATGTAAG GTCTCAGTTT AGTTAAATGA 3150 AGACCTATGT TAGCTAAGTT AAGACCTAAG TTAGTAATCA TAAGACCTTA 3100 TGTTAGTCAA GTTTAGACCT AAGTTAGATG AATTAAGACC AATAACAGTG 3050 AAAGTAAGAC CTATATTAGT TACTTTAAGA CCTCAGTTAG TTAAGTTAAG 3000 ACCTTAGTTA GTCATGTTAA GACCTTAGTT AGTCATGTTA AGACCTTAGT 2950 TAGTCGAAGT ATGACCTATG TTAGTGAAAG TAAGACTTAG GTTAGTGAAA 2900 GTAAGATCTG AGTTAGTTAA GTTAGGACCT TAGTTAGTAA TCATAAGACC 2850 TATATCTGTG AAATTAAGAC CTAAGTTAGT AAACGTATGA CCTGAGTTAG 2800 TGAAAGTAGG ACCTATGTTA GTGAAGGTAA GACCTACATC AGTAATGTTA 2750 GGACCTATAT TACTTACCTT AAGACTTACA TTACTTACCT AAGACCTACA 2700 TTACTTACCT TAAGACGTAC GTTACTGTCG TTAGGACCTA AGTTAGTTAC 2650 ATTAAGACCT ATGTTACTGT AGCTAGGACC TATATTTGTT AAGTTAAGAC 2600 CAAACTTAGT ACCTTAATGA CTTAGGTCAG TAACCTTATG ACCTATATTA 2550 GTAATAGTAA GACCTAGTTT TTACTTATAC TAAGTCTTAT ATTAATCATT 2500 TCAAGGCCTA CTTTTGTGAA AGTAAGAGCT ACATAAGTAC AATTAAGACC 2450 TATGTTAGTA CCTACATGAC CTAAATTAGT AAGCTTAAGA CCAATATCAG 2400 TGAAGGTAAG ACCTTAGTTA GTCGAAGTAT GACCTATGTT AGTAAACGTA 2350 AGACCTGTAT TAGTTAAGTT AAGACCTATG TTAGTAAACG TAAGACCTGT 2300 ATTAGTTAAG TTAAGACCGA AGTTAGTGAA AGTAAGACCT ACATTACTAA 2250 TGTTAGGACA TATGTTAGTT AATGTAAGAC CTATGTTAGT CGAAGTATGA 2200 CCTTAGTTAG TCAACGTAAG ACCTATATTA GTTAACCTAA GAC 2157 CTAGGTT 2150 AGTTTATTAA GACCTATATT AGTTATGTTA GGACCTACAT TAGGTATCTC 2100 TGGATCTACT TTCATGATCT TAGGACCTAG ATTAGTAAGC TTAAGACCTA 2050 TATTACCTAC ATTAGGACGT ACATTAGGTA TCTCTGGACC TACTTTCATG 2000 ATCTTAGGAC CTACATTAGG TATCTCTGGA CGTACTTTCA T 1960 TACCTTAGG 1950 ACCTATATTA GTTAACTTAA GACCTAGGTT AGTTTATCGA GACCTATATT 1900 AGCACCTCTA TAACCTAAAT TAGTAAGCTT AAGACCTATA TTAGTTAACT 1850 TAAGACCTAC TTTAGTTTAT TAAGACCTAT ATTAGTACCT GTATAACATA 1800 AATTAGTAAG CTTAAGACCT ATATTAGTAC CTCTATAACC TAAATTAGTA 1750 AGCTTAGGAC CTATATTAGG TATATTAGGG CCTACGTTAG TTACCTTAAG 1700 ACATATGTTA GTTTGTTGAG ACCTATATTA GTTATCTTAG GACCTATATT 1650 AGTTAACCTA AGACCTAGGT TAGTTTCTTA AGACCTATAT TAGGTATCTT 1600 TGGATCTATA TTAGCTATAT TAGGACCTTT GTTAGTTAAC GTAGGACCTA 1550 TGTTAGTAAC AGAAGGACCT CACTTAGTGA AAGTAAGACC TATATTAGTC 1500 CACGTAAGAC CTAAGTTAGT AAAGGTAAGA CTTATATCAG TGAAGGTAAG 1450 ACCTTAGTTA GTAATCATAA GACCTATATC AGTGAACGTA AGACCTTAGT 1400 TCGTTAAAGT AAGAACTTAG TTAGTCAAGT TAAGACCTAT GTTAGTCAAG 1350 TTAAGACCTA AGTTAGTAAA AGTAAGAGCT AAGTTAGTCA ACCTAAGACC 1300 TAAGTTAGTA AAAGTATGAC CTTAGTTAGT GAAAGTAAGA CCTATGTTAG 1250 TGAAAGTAGG ACCTATGTTA GTGAAGTTAG GACCTATGTT AGTGAAGTTA 1200 GGACCTATGT TAGCTAAGTT AAGACCTCAA TTAGTGAATG TAAGACCTAT 1150 GTTAGTAAAA GTAAGACTTA GGTTAGTGAA AGTAAGACTT AAGTTAGTAA 1100 TAGTATGACC AGAGTTAGTG AAGTTAAGAC TCATATTAGT CGAAATATGA 1050 CCTTAGTTAC TCAATTTAAG ACCTAAGTTA GTAAAAGTAA CACCTAAGTT 1000 AGTAAAAGTA AGATCTAACT TACTGAAGTT AAGACGTATG TTAGTAACCT 950 TAAGACCTAT ATTAGTGAAT GTAAGGTCTC AGTTTAGTTA AATGAAGACC 900 TATGTTAGCT AAGTTAAGAC CTAAGTTAGT TAAGTTAAGA CCTTAGTTAG 850 TTAAGTTAAG ACCTATGTTA GTTAAGATAG GACCTATGTT AGTTAAGATA 800 GGACCTATAT TAGTAAAAGT AAGGTCAAAG TTTAGTTAAG TTAAGACGAA 750 AGTTAGAAAA CCTAAGACCT ATATTAGTTA AATTATGACC TCACTTAGGC 700 AAAGTAAGAC TTAAGTTAGT GAAAGTAAGA CCAGAGTTAG TTAAGATAAG 650 TCCTATGTTA GTTATGATAG GACCTATATT AGTGAAAGTA ATGTCTCAGT 600 TAGTTGAGTT AAGATCTAAG TTAGTAAAGG TAAGACCTAC ATTACTAATG 550 TTAGCACCTA TGTTAGTAAA GGTAAGACCT AAGTTAGTGT AGTTAGGACC 500 TATATTGGTT ATGTTAGCAT CTACGTTAGG ACCTAAGTTA GTATTTTAAT 450 GACTTAAGTG AGTAATATTA AGACCTATAT GAGTGAAAAT AAAACCTGAG 400 TTAGTGAAAG TAAGACCTAC ATTACTAATG TTAGCACCTA TGTTAGTCAA 350 GTTAAGACCT ATATCAGTGA AGGTAAGACC TTAGTTAGTT ACGTTAAGAC 300 CTATGTTAGT GAAGTTAAGA CCTATGTTAG TGAAGTTAAG ACCTAAGTTA 250 GTGTAGTTAG GACCTATATT GGTTACCTTA AGACATACGT TACTGTATTG 200 AGGACCTATA TTACTTACCT TAAGACCTAA GTTAGTGAAG TTAGGACCTA 150 TGTTAGTTAC GTTAAGACGA AACTTAGTAA CTTAATGAAT TATGCTAGTG 100 ACATTAAGAC CTATATAACT TATGTTAGGA CCTATGTTGG TTAAGTTAAA 50 ACCTATAGTA CTTATATTAA GACCTATACT ATGTATGTTA GGACCTATAT end of file 4130 5 4131 7 4132 4 4134 1 + 2 telomere 4135 5 4136 12 + 13 telomere 4137 4 4139 5 msp8 4140 5 4141 5 4142 5 4143 1 + ? telomere 4144 4 4145 4 4146 5 4147 5 4149 4 4153 7 4154 10 telomere 4155 5 4156 6 + 11 4158 12 + 2 telomere Date: Tuesday, 3/26/2002 Time: 09:46 c4159.txt chrblob_4159|2001.10.15|GENOMIC|Sanger FEATURES Location CDS complement(1192..1983) /gene="chrblob_4159.glm_1|24oct01" /note="(protein coding) 48% identity to rifin PFB1035w - malaria parasite (Plasmodium falciparum)" /codon_start=1 ORIGIN watson strand 1 GAGGCTATTA AAAATGAGTT CTTAATTCGG CTTTCGGCGA TAGTTACTAT 51 CGAAAAATTA TATATATATA TGTATGTTTT TAAAGAAGAA GGGCCCTAAA 101 ATTCGCACAA TTTATAATAT AAGTGCTATT AAATCATAAA TATAGTTTAC 151 ATAAATATAT ACTTTTTAAT ATTTTAGTAC ACAGTAATTC TTCCTATTAT 201 ATAATTTAAA ATATAAAACA ATAAAGCATT AATATATAGA TAGAACAAAA 251 AAAACTATAT ATTATTATTT TTTTATTAAT TTATATGATA TTAGTATTTA 301 TAAATTATTT TATATTTCTA ATAATGTTAA TTATATATAT TATAATAGGA 351 TAAAAGAAAT CATATATAAA TATTGCTACG ACAATGCAGT TGTAACTTGT 401 ATATAATATA TTTATATGTA TATATATTTT GTGTTTTATC ATTTTAGAAT 451 AAAAATTTTT TGATTCTGAT ATACACATAT TATTGTATAA TATATGTATT 501 GATATAACAA AATATCTATG TTCAAATATA TTTTTTGCTG GTTAGAATAA 551 ATTAATTATT ATATAGAGTT ATTTATATTA TATATGTGTT AACAATCGTG 601 TTCTATAAAT AAATATAACA TTTTTTTTTT TTTTAGTAAA ATTAAGAATG 651 AAATAATAAT TAATATATAT AATACTGCAT ACTATACATT ATATTTAAAT 701 GGAACATATT TATAAATATA TTATAAATAT AATATGATAT AAATAATAAG 751 TATTAATGTG AACAATTTAA ATTATATTTA TGTTAATTTG AATTATATAA 801 TTAAAATTGC AATTTACACA ATTAATCCAT ACAAGAATAA GATAATAATA 851 TGTTTATTCT ATTAAATATT CAATTGTATA ACATTTCGTA CGAAGAATAT 901 TATAAATATA TATTACATTG TTCTTAAAAA TTATCTTATA TATATATAAG 951 AGATATATTT TAATAAAAGA AATTATAACT TATTTTCTTT TATTAAAAAA 1001 TAAAGTAATA AATAAAGAAA CAAAATAAAT AAATTTATAA TTAAATAAAT 1051 AACAAAATAA AAACAAACAA TGAACATATA TAAAACATAA TAATAATAAA 1101 AATATTTATT AATTATATTA TTCGTCCTAT AATAAGCGCA AAATAATTCA 1151 TTCATTAAAC TACCTATCAT CATGAACCTA GGAAAACATA T "chrblob_4159.glm_1|24oct01" 1192 CTATTCTTT 1201 TAATAGTTTT ATGTATTGTA ATTTTTTGTT CATTTTGATT TTCCTTCGAT 1251 AACGTAATAT CAAATAAATA ATTAAAAGTA TAACAACTAT AGAAATGACT 1301 ACTATAGCTG AAATTACAAT AGGATCAGTT AAGAATGTTG TTATTGTTGT 1351 AGAATCAGAA AACGTTCTAA TATATACATC TGCACCGTCC CTTCCAGCGT 1401 CTACCGCTTT TTGTATTATT CTAGAATCGT TTTGAGCTTC ATAACCGTTA 1451 CATAAAAGTT GATTTTTAGC AGCAGGCCCT ACACATTGTG TATTTATCAC 1501 ATTTTGAACT GCACCAACTA GAGCATTTGG ACATTGGAAA TTTCTTGTAG 1551 TGACCAATTC TGTAAATTTG TCCTGAAGTA ACAACTTAAG ACCACCAATA 1601 CTTTTTAAAC CCTCAAGAGC CTCTTTCATA CCAGCTTTCG TAGCAGCCTT 1651 TACTGCTGCA GCGTATACAG CAGTTCCACC TATCAAACCC ATTCCCGGAA 1701 CAAGCCCTCC CAAATTTTGT GCACATCTCA AACAACCTTT TTCCACTTTA 1751 TCTGCTAACG ACTTTTCGCA AATACATGTT GGAATGGCAT CACTTTGTAT 1801 ATCCGTGTGT AACGAAGAAA ACGTTTCGGC TAATTCTTTT TCAATTTTAT 1851 CTTTTAAAAT AATTTTTTGA ATGTCTTTGT CACATCGATC TTTACATTTT 1901 TGGCGTGTAG TTTTCATCCT TTCGTCATAT TCATGAAATC TTTGTTGTGT 1951 CTGTTTATTG AAATTATCCA TCACTTCTTT CAT 1983 "chrblob_4159.glm_1|24oct01" TTGTGGG TCACTATAAT 2001 AGTTGACAGG TGCATACAAT TCACATTCGC ATAATGATCT ATGTGTTCTT 2051 GTTGATTTAG TTTTGGGTGT ATGAAGTATA GTTTTCTTAT GGTTCCTTTG 2101 ATTATGCACC TATAAAAATG TTGACGTATA TATGTAATAT TTTGTTGTAA 2151 TTTATAATTA TATATATTTG TAATAAATAT GTATATTTTT ATGTTTATAA 2201 ACATGTATAT TTTGACTATA TATATATTAA TCATATATAT GGTATCATAA 2251 TAAATATATA TATTATAATT ATATCTATGA ATATATTACT CATTTATCAC 2301 ATAATGTTAC CAATATATTT AATGGAAGCG CAAACAATAA TATATTAATA 2351 TAATGGATTT TCATTTTTTT CTGTTGTTAT ATTTATAATA ATTATGATTA 2401 AAATTATAAA AAAAATAATT GATATATAGT ACCTTATTTT ATTTTGTAAA 2451 TAAATTAAAT ATGTTTAACC TAAAATATTA TTATAATTTA TTTAATATAA 2501 TTGATTGACT GCCATTATAA AAATATATAT TTTTTTTATA GTGGAACCAT 2551 ATACGCACTT TTATTTATTA CAAAAAAAAA AAAAAAAAAA AAAAAATGTA 2601 AAACAATTAA TATTAAAAAA AATTATCAAA ACATTTTACA TTTTTTATAA 2651 TTTTTTTTTT TAATTTTTAA TGAAATTTAA TTTTATGTAA CAATAAATTA 2701 TAATGGTAAT TTTTTTTTAT TTTTTTCATA TTTTTTAATA ATACGTTACT 2751 ATATAGTAAT AATACAGCGT ATTTTTGTGT TGTAAATTAT TTACAAATGT 2801 GTAAAACCAT AGTTTTGGAA ATTGTATATA ACATATATAT ATAATAACAT 2851 TTTAAAACAT ATATATGAAA TACATATGGT ATAGTTATTC TAATATATAT 2901 GTTCGTTATA TTGCATTTAT AAAAAAAAAT TAACAACAAA CATTGTTTGT 2951 CATAATAAAT GATATAAAAT CTTTTTAATA TAATGATATA TATATGTATA 3001 TTAATAAATC AATTTGGATA TATTATGTTA TTTGTTTTGT TCTAAAATTT 3051 GTTGTATGTT ATAAAATTCC CTCTAATTTA TCTGTATTAT TACTAAGTTT 3101 AATATTATTA TTTTTATAAA AATATTACAA ATAATTTAAA ACGTTCATTT 3151 ATCATTAAAG TATTAAATTA TATAATTATC GCAAAAAATA TTAATATTAA 3201 TTATTATAAA AAAAAAAAAA CAATTAACAA AATAAGAAAT TATACATACT 3251 ATTACATAAT ACATTTTATT GTTTTATGTT ATTCAGATAT ATTATATTCA 3301 TAACGTGTAT TATTATATAT ATTTCTTAAA ATAGTAGTTA TACTATTTCA 3351 CAACCTATCA TACATTAATT GTATTATTAC ATGTTGTAAC AAAATAATTA 3401 ATTACTATAT ATTTTAATAA ATATATTATT ATACATTAAA CAAATAACAC 3451 GATGTTATAT ATATTACGAA AAAACAAGGA ATCATTTATA TTTAATTTAT 3501 ACATAATTTA TAACTATGAA AAAAAAAAAA AAAAATTTCT TAATATTTCT 3551 TAAAATGAAG TTATTTCCTA TAATTATGAT GATAGTAAGT TTGAGTAGCA 3601 AAAAAGAAAA AAAAAAAAAA AATTTGTTTA TTAAATATTT TTTCTTCTGT 3651 AAAATGTTTT CCATTTTTGT TTATATTTAT ATTTATATAT TATTTTTTTT 3701 TTTTTTTTTT GGGAATTTTT TATATATATG AAATTTATAT GATATATTTC 3751 AAATTCTTTT TTTTTTTTTT TTTTTTAATT ATTGAATTGG GATACACATT 3801 TAGGAAAAAA AAATTTTAAA AAAAATTTTT ATATATAAAA AAATTTTTTT 3851 TTTTTTTTTT TTAATAAAAA AAAAGGTAAA ATTTTTAAAA TAAAAAATAA 3901 AAATTTTAAA TTTT // crick strand 3914 AAAA TTTAAAATTT 3900 TTATTTTTTA TTTTAAAAAT TTTACCTTTT TTTTTATTAA AAAAAAAAAA 3850 AAAAAAATTT TTTTATATAT AAAAATTTTT TTTAAAATTT TTTTTTCCTA 3800 AATGTGTATC CCAATTCAAT AATTAAAAAA AAAAAAAAAA AAAAGAATTT 3750 GAAATATATC ATATAAATTT CATATATATA AAAAATTCCC AAAAAAAAAA 3700 AAAAAAAATA ATATATAAAT ATAAATATAA ACAAAAATGG AAAACATTTT 3650 ACAGAAGAAA AAATATTTAA TAAACAAATT TTTTTTTTTT TTTTCTTTTT 3600 TGCTACTCAA ACTTACTATC ATCATAATTA TAGGAAATAA CTTCATTTTA 3550 AGAAATATTA AGAAATTTTT TTTTTTTTTT TTCATAGTTA TAAATTATGT 3500 ATAAATTAAA TATAAATGAT TCCTTGTTTT TTCGTAATAT ATATAACATC 3450 GTGTTATTTG TTTAATGTAT AATAATATAT TTATTAAAAT ATATAGTAAT 3400 TAATTATTTT GTTACAACAT GTAATAATAC AATTAATGTA TGATAGGTTG 3350 TGAAATAGTA TAACTACTAT TTTAAGAAAT ATATATAATA ATACACGTTA 3300 TGAATATAAT ATATCTGAAT AACATAAAAC AATAAAATGT ATTATGTAAT 3250 AGTATGTATA ATTTCTTATT TTGTTAATTG TTTTTTTTTT TTTATAATAA 3200 TTAATATTAA TATTTTTTGC GATAATTATA TAATTTAATA CTTTAATGAT 3150 AAATGAACGT TTTAAATTAT TTGTAATATT TTTATAAAAA TAATAATATT 3100 AAACTTAGTA ATAATACAGA TAAATTAGAG GGAATTTTAT AACATACAAC 3050 AAATTTTAGA ACAAAACAAA TAACATAATA TATCCAAATT GATTTATTAA 3000 TATACATATA TATATCATTA TATTAAAAAG ATTTTATATC ATTTATTATG 2950 ACAAACAATG TTTGTTGTTA ATTTTTTTTT ATAAATGCAA TATAACGAAC 2900 ATATATATTA GAATAACTAT ACCATATGTA TTTCATATAT ATGTTTTAAA 2850 ATGTTATTAT ATATATATGT TATATACAAT TTCCAAAACT ATGGTTTTAC 2800 ACATTTGTAA ATAATTTACA ACACAAAAAT ACGCTGTATT ATTACTATAT 2750 AGTAACGTAT TATTAAAAAA TATGAAAAAA ATAAAAAAAA ATTACCATTA 2700 TAATTTATTG TTACATAAAA TTAAATTTCA TTAAAAATTA AAAAAAAAAA 2650 TTATAAAAAA TGTAAAATGT TTTGATAATT TTTTTTAATA TTAATTGTTT 2600 TACATTTTTT TTTTTTTTTT TTTTTTTTTG TAATAAATAA AAGTGCGTAT 2550 ATGGTTCCAC TATAAAAAAA ATATATATTT TTATAATGGC AGTCAATCAA 2500 TTATATTAAA TAAATTATAA TAATATTTTA GGTTAAACAT ATTTAATTTA 2450 TTTACAAAAT AAAATAAGGT ACTATATATC AATTATTTTT TTTATAATTT 2400 TAATCATAAT TATTATAAAT ATAACAACAG AAAAAA start chrblob_4159.glm_1|24oct01 vbc rifin exon 1 2364 ATG AAA ATC CAT TA 2350 T ATT AAT ATA TTA TTG TTT GCG CTT CCA TTA AAT ATA TTG intron GTAACATTAT 2300 GTGATAAATG AGTAATATAT TCATAGATAT AATTATAATA TATATATTTA 2250 TTATGATACC ATATATATGA TTAATATATA TATAGTCAAA ATATACATGT 2200 TTATAAACAT AAAAATATAC ATATTTATTA CAAATATATA TAATTATAAA 2150 TTACAACAAA ATATTACATA TATACGTCAA CATTTTTATA G exon 2 GTG CAT AAT 2100 CAA AGG AAC CAT AAG AAA ACT ATA CTT CAT ACA CCC AAA ACT AAA TCA AC 2050 A AGA ACA CAT AGA TCA TTA TGC GAA TGT GAA TTG TAT GCA CCT GTC AAC T 2000 AT TAT AGT GAC CCA CAA ATG AAA GAA GTG ATG GAT AAT TTC AAT AAA CAG 1950 ACA CAA CAA AGA TTT CAT GAA TAT GAC GAA AGG ATG AAA ACT ACA CGC CA 1900 A AAA TGT AAA GAT CGA TGT GAC AAA GAC ATT CAA AAA ATT ATT TTA AAA G 1850 AT AAA ATT GAA AAA GAA TTA GCC GAA ACG TTT TCT TCG TTA CAC ACG GAT 1800 ATA CAA AGT GAT GCC ATT CCA ACA TGT ATT TGC GAA AAG TCG TTA GCA GA 1750 T AAA GTG GAA AAA GGT TGT TTG AGA TGT GCA CAA AAT TTG GGA GGG CTT G 1700 TT CCG GGA ATG GGT TTG ATA GGT GGA ACT GCT GTA TAC GCT GCA GCA GTA 1650 AAG GCT GCT ACG AAA GCT GGT ATG AAA GAG GCT CTT GAG GGT TTA AAA AG 1600 T ATT GGT GGT CTT AAG TTG TTA CTT CAG GAC AAA TTT ACA GAA TTG GTC A 1550 CT ACA AGA AAT TTC CAA TGT CCA AAT GCT CTA GTT GGT GCA GTT CAA AAT 1500 GTG ATA AAT ACA CAA TGT GTA GGG CCT GCT GCT AAA AAT CAA CTT TTA TG 1450 T AAC GGT TAT GAA GCT CAA AAC GAT TCT AGA ATA ATA CAA AAA GCG GTA G 1400 AC GCT GGA AGG GAC GGT GCA GAT GTA TAT ATT AGA ACG TTT TCT GAT TCT 1350 ACA ACA ATA ACA ACA TTC TTA ACT GAT CCT ATT GTA ATT TCA GCT ATA GT 1300 A GTC ATT TCT ATA GTT GTT ATA CTT TTA ATT ATT TAT TTG ATA TTA CGT T 1250 AT CGA AGG AAA ATC AAA ATG AAC AAA AAA TTA CAA TAC ATA AAA CTA TTA 1200 AAA GAA TAG* 1192 stop chrblob_4159.glm_1|24oct01 chr4:1156125 --> A TATGTTTTCC TAGGTTCATG ATGATAGGTA GTTTAATGAA 1150 TGAATTATTT TGCGCTTATT ATAGGACGAA TAATATAATT AATAAATATT 1100 TTTATTATTA TTATGTTTTA TATATGTTCA TTGTTTGTTT TTATTTTGTT 1050 ATTTATTTAA TTATAAATTT ATTTATTTTG TTTCTTTATT TATTACTTTA 1000 TTTTTTAATA AAAGAAAATA AGTTATAATT TCTTTTATTA AAATATATCT 950 CTTATATATA TATAAGATAA TTTTTAAGAA CAATGTAATA TATATTTATA 900 ATATTCTTCG TACGAAATGT TATACAATTG AATATTTAAT AGAATAAACA 850 TATTATTATC TTATTCTTGT ATGGATTAAT TGTGTAAATT GCAATTTTAA 800 TTATATAATT CAAATTAACA TAAATATAAT TTAAATTGTT CACATTAATA 750 CTTATTATTT ATATCATATT ATATTTATAA TATATTTATA AATATGTTCC 700 ATTTAAATAT AATGTATAGT ATGCAGTATT ATATATATTA ATTATTATTT 650 CATTCTTAAT TTTACTAAAA AAAAAAAAAA TGTTATATTT ATTTATAGAA 600 CACGATTGTT AACACATATA TAATATAAAT AACTCTATAT AATAATTAAT 550 TTATTCTAAC CAGCAAAAAA TATATTTGAA CATAGATATT TTGTTATATC 500 AATACATATA TTATACAATA ATATGTGTAT ATCAGAATCA AAAAATTTTT 450 ATTCTAAAAT GATAAAACAC AAAATATATA TACATATAAA TATATTATAT 400 ACAAGTTACA ACTGCATTGT CGTAGCAATA TTTATATATG ATTTCTTTTA 350 TCCTATTATA ATATATATAA TTAACATTAT TAGAAATATA AAATAATTTA 300 TAAATACTAA TATCATATAA ATTAATAAAA AAATAATAAT ATATAGTTTT 250 TTTTGTTCTA TCTATATATT AATGCTTTAT TGTTTTATAT TTTAAATTAT 200 ATAATAGGAA GAATTACTGT GTACTAAAAT ATTAAAAAGT ATATATTTAT 150 GTAAACTATA TTTATGATTT AATAGCACTT ATATTATAAA TTGTGCGAAT 100 TTTAGGGCCC TTCTTCTTTA AAAACATACA TATATATATA TAATTTTTCG 50 ATAGTAACTA TC <-- chr4:1154972 GCCGAAAG CCGAATTAAG AACTCATTTT TAATAGCCTC end of file 4160 5 4161 9 4162 5 4163 5 4165 5 4168 4 4169 5 Date: Monday, 3/25/2002 Time: 00:47 c4170.txt chrblob_4171|2001.10.15|GENOMIC|Sanger FEATURES Location CDS complement(1582..3573) /gene="chrblob_4171.glm_1|24oct01" /note="(protein coding) 32% identity to (AC012328) putative 26S proteosome regulatory subunit [Arabidopsis thaliana]" /codon_start=1 ORIGIN watson strand 1 TATATTATTA TGTTTTAAAA ATAATAAAAA TGAGCTAAAA ATTTAAAATG 51 TATACTCGAT ATTTTTTTTT TAAGAATATA TAAATATACC AAAATGTAAA 101 ATCTTATTTT TAAAAAAGAT AAAAACCAAA CAAAATATAT ATATTATATA 151 TTTTTTCTTC TTTATTTATA AAATTGTTCT TATATTATTG TTTTATATAG 201 AATAATATCA GTATCTATAT ATTTATATGT ATATATATTT TTTATAATAT 251 ATATATATCT ATTTTTTTTA GGTTGAACAA TTTTTGGTTG CATTTTTATA 301 TAATTATATA TATAACAAAA TATATATTTC GTAATTTTAT TATATATTAT 351 ATTATATATA TATATATATA TATATATATA TATAATTGTT TTTGATGGTT 401 ATGAATATAT TATTATATAT ATATAATATA TATATATATA TTTATATTTA 451 TTTATTTTAT GGGTATTTTA TTATAATTTA TTAAAAAAAA AAAAAAAAAA 501 ATTCTTCTAA TAAGATATAA GAATAAAGAA TAAAAAATAA AGAAAATATA 551 TAATATTTAT TTATATATTT ATTATATACA TGTGATGTTG TTGGGTTAGC 601 CTTTTTTAAA AAAAAGTATT ATTATTATGC CTTTTTTTTC AACATACATA 651 AATAAGTACT TTTTATTTTA ATATTATAAT ATATCACTCA AAATAAAAAA 701 TATATTATAT ATATATATAT ATATATATAT ATATATATAT ATATAATTTT 751 TTTTTTATTT ATTCTTTTAA TTCAATAATT ATTATATATA TATATAAATA 801 TATATATAAT ATTTTTTTTA CTACTTTGGT TTTTAATTCA AAATGTTATA 851 TAAAAATATA TTATAATATT CTTTTATTAT TTTTATTAAT TTTTTATTTA 901 TTATATTTAT ATTAAGGATG AATATAAAAT AAATATATTA AAATATATAT 951 TGTTACTAGT ATAATTTTAT AGGTTTTTAT AGATTAATAC GATTCATTAT 1001 ATATAATATT ATATATATAT ATATATATAT ATATATATAT ATGTATATCT 1051 TTATATTTTT TATTGTAAAA TATATATTGG TCCTTTTTTT TTACTTAAAC 1101 AAACAAAAAA AAAAAAAAAA CTATTAAAAT ATTTTTTATA ATATTAAATT 1151 TATCTTTTTA TTAAAATTGC ATGGTGAATT GAAATGTGAA AAAATGAAAA 1201 AATAAGTATG GCATTATGAC AAATAATTCA AAAAATGTAT ATATTTAAAA 1251 TGGCAATTAT ATATATATAT ATTTACATTT ATATTATTTT AATTTAGTAC 1301 TACTTATACA CATAAGTGTA TAAATATTTA ACATATTGAT TTTTTTAATT 1351 TATATATTTT TTTAATATTT AAAAATTTAA CAAAGTGAAT GAATTATATT 1401 AATAAAATAT AAAAAAATAA TGTATACAAA TAAAAATTGG TGTATAGGAT 1451 AAGATATAAA ATGTATACAT ATATAAAAAA TATAAAAAGT CACACATATA 1501 TATATTTATT TACATATGTA TAATATTTTT TATTATTTTT TTTTTTTTTT 1551 GTTGATAAGG TAAACATGCT TTGATATATT T "chrblob_4171.glm_1|24oct01" 1582 TCACAATTG TTCATTTATT 1601 AATACCTTTT TCTTTATAGC ATCATGGTTT GGAGTATTAT TCAAGTTAAT 1651 ATTTTTTGAA TTTTCGTCAT TTTCCTTTTT GTTATGTTCT TGCTCAATAT 1701 TAGTAATGTT ATGGTGTTGT TCGTTTTTTT TTTTATGAAC ATTCGGATTA 1751 TCTTTGAGTT TAAAATTTGA ATTATCATCG GAAGATGTAT AATTTGATGA 1801 GTGTTGCTTT TTTTTGTTTA CGTTTTGATT ATTTGTTTGT TCAAGTGAAT 1851 TACTTAAATG CCATGCAGTT ATTAAATTGA TTAATTCCTT TGTAACAACT 1901 TTGGTGTCAC TACCAAAAAC ACAACTTTGT ATATTAAGAC ATAGTTTAGA 1951 GATTTGTCTT CCTGATAATC CACATAGTTT ATTCGAAAGA TTATGTATAT 2001 ATTCATTATC AATAGACGAA TCAATAGTAA TATTATATTT TTTTAAAGGG 2051 TATACATATT TATTAAAATA CATAGTAAGC ATTTTTTGTA TCTCTTTAAT 2101 ATTGGGATTG TGGAAATTAT ACTGTTCATC TATACGATCG ATAACAGCTT 2151 GATCTAATAT ATCTTTACAA TTGGTAGCCA GTATTATGGA ATATTTTTTA 2201 GATTCAGAAC CTGTATGATA AAGAAATGTT GCTAAAGCAT TTCTTAAGCT 2251 TTCTGAAAAA TGAATAGATG ATTCATTTCT TCCTTTTCGT AAAAAGGCTT 2301 CTGCTTCATC AATAAAAATA ATACATTTTT TATTTTTTCT TCTTTTCAGA 2351 AAATCAAATA TTTTATTTAA TTCTACGGAA GCATGAATAC CTAATGCACT 2401 AACATCACCT CCGTTAATAA TTATATAATC GAAATTACTA TGATATGAAA 2451 GAGTTTTGGC AAATAATGTT TTTCCGGTAC CTGGTGGTCC GTGTAAAAGA 2501 ATATTTTTTA AATACAAATT ATATTTATTA GAATTTTTTA AACTATTTAT 2551 AGACCATTGT AACTTTTCTT GTAGTTCTTC ATTTAAGACA ATTTGATCAA 2601 AAATTTTATA ATTGTTATAT AAATTATTTT TATTTTTAAA AGGATAGATA 2651 AAATTTTTGA TAAGAGCAAA ATTTTTTTTA AAATTAAAAA TATCAAAGAA 2701 TTTATTAATA TGCCATAGAG AAGTTTCTCG AATTAATTTT GGTTTTCCTA 2751 ATTTTGTTTC TGCATATGTT CTAATAAATT TTGTAGTATG TTTCGTAGTA 2801 TATATACCTA TAGATGTTAA TGTAATGGTT AATGCAAATC TATATAGTTT 2851 TTGTTTATCA TTTAAAAATA GGAATAAAGA ATTATTAAAT TGTTCAAAAT 2901 ATTTATTAAT ACTTTCTATT TTTGTTTTTC TATCTTCATC AGCTTTAGTT 2951 CTTAATGTTG TTAAATGTAT ATCTAAATTT TTTCTTTCTC TTTCTATTAA 3001 GCCTTTATTT TCTTCAAAAA TCCTAGCTTT CATATTTTCT CTTTCTAAAC 3051 GTTTCTCTTC TTTAATTTGT TTCATTTTAA TATTCATTAA TTCTAGTTCA 3101 TTTCTTTTTC TAATATTTTC TTGTCTTAAA TATTGTTCAT GTTGATTACG 3151 TAACCATTCT TCGTTTTGTT TCTGTTGATC AAGAAGTTTC TTTTGGTATG 3201 ATTCAGCTTC TAATTTTGTT TTATATTCAG CAGTAATACG TTCTTGTTCC 3251 TGCTGGTAAT TTATCGTTTT CCTTTTTTCT TCATTTTCCA TTCTCATACG 3301 ATTGCTCATA TGCTGAGCAC GTTGTAAGGA TAATTCTTCC ATTTGTTTTT 3351 CATATTCTTT CTGTTTCGTT AATTCTTGTA ACTTTATAAC TTCAAAAGCT 3401 TTGCTAGAAT TTGATGACTG ATCTAATTCT TTTAATGCTT TAGCACCTCT 3451 TTCTAATGCT GTAGGATCAA AATTTCCAGT GATATGTTCA CCTCCCTTTT 3501 CATCTGACGA TGAATACGGT TTATTACTAC TAACCGTGGA ATTTATTTTC 3551 TTACTCAAAT TAGGAAAATT CAT 3573 "chrblob_4171.glm_1|24oct01" TTTTCCC TTTTTTTACA AAATTTAAAG 3601 ATATATATAA AAAAAAAATA TATATATATA TATATATAAT AATTTTGGGT 3651 TAGGCTCAAT ATTAATATAG TGCCTTATCA AATGTGAGGT GTTATATATT 3701 TTTTTTTGTT GATTGGGAAA AAGAAAAAAA AAAATTAACC TGTCATGGTA 3751 TAAATATATA TACATATAAA TTAATATATA TATATATATA TATAAACAAA 3801 TAGGTTTATC TCAAGATTTC CTTATTTTTT TTGGTCAATA TAAAAATGTT 3851 TTATCCACAA AAAAAAAAAA AAAAAAAAAA AACAATAAAA TGAAAAAATA 3901 ATAAAATGAA ACAATATTAA AATGAAAAAA TAAAAAAAAA GGAAATAAAG 3951 AAGAACCCCT ATATATTGCT TATTATTATA TACAAAAATT ATTCAAGAGG 4001 TACAATAAAT AATAAGAATC TACACAATAA ATATTATACG TATAATGAAA 4051 AATAAAAGAA ATATAAATAT AAATATAAAT ATAAATATAA ATATAAATAT 4101 ATATATATAT ATATATATAT ATATATATAT ATATATATAT ATATATATAT 4151 ATATATATAT ATAATATATA TATATATAAT AATTTTTCAT TATATACTTT 4201 TTTTTTTTTT TTTTTTTTTT TTTTGCACTA AAATATTACA TACATACATA 4251 CATATATATA TATTTATATA TATATATATA TATATATATA TATATATATA 4301 TATATTTTAT ATACATAATA TTATATGTAT AATATATTTT TCATAATCTT 4351 CTTTCAGGGG GGAGCGAAAA TTTACAAATT ACAATCCTAC ACAGGGATTA 4401 TGACTCTTTT TTTTTTTTTT TTTTTTTTTT TTCTTGAATA ATGGAAAATT 4451 ACAAATAACA TAAGAAGAAT AAACTTACAA AAATATAAAA TCAAATTTTA 4501 TACCTACAAC TCTATGACAT TTTGTAGGTA TTATTTATAT TTTAAATATA 4551 AAAAAAATGT ATAGCTATTT ATTATTTTAA TTACTTAACC ATATAATGTT 4601 AAATAAAAAT ATATATCATA AAATTTTCAT GTAATTTTTA GAAAATAGGG 4651 TACCTAAGGA AATGTATTAA CAACCTCAAT ATATTTTTTA GAAATAAGAT 4701 ATAAAAAGAG AAATAACATA ATAACA // crick strand 4726 TGTTAT TATGTTATTT CTCTTTTTAT 4700 ATCTTATTTC TAAAAAATAT ATTGAGGTTG TTAATACATT TCCTTAGGTA 4650 CCCTATTTTC TAAAAATTAC ATGAAAATTT TATGATATAT ATTTTTATTT 4600 AACATTATAT GGTTAAGTAA TTAAAATAAT AAATAGCTAT ACATTTTTTT 4550 TATATTTAAA ATATAAATAA TACCTACAAA ATGTCATAGA GTTGTAGGTA 4500 TAAAATTTGA TTTTATATTT TTGTAAGTTT ATTCTTCTTA TGTTATTTGT 4450 AATTTTCCAT TATTCAAGAA AAAAAAAAAA AAAAAAAAAA AAAAGAGTCA 4400 TAATCCCTGT GTAGGATTGT AATTTGTAAA TTTTCGCTCC CCCCTGAAAG 4350 AAGATTATGA AAAATATATT ATACATATAA TATTATGTAT ATAAAATATA 4300 TATATATATA TATATATATA TATATATATA TATATAAATA TATATATATG 4250 TATGTATGTA TGTAATATTT TAGTGCAAAA AAAAAAAAAA AAAAAAAAAA 4200 AAAGTATATA ATGAAAAATT ATTATATATA TATATATTAT ATATATATAT 4150 ATATATATAT ATATATATAT ATATATATAT ATATATATAT ATATATATAT 4100 ATATTTATAT TTATATTTAT ATTTATATTT ATATTTATAT TTCTTTTATT 4050 TTTCATTATA CGTATAATAT TTATTGTGTA GATTCTTATT ATTTATTGTA 4000 CCTCTTGAAT AATTTTTGTA TATAATAATA AGCAATATAT AGGGGTTCTT 3950 CTTTATTTCC TTTTTTTTTA TTTTTTCATT TTAATATTGT TTCATTTTAT 3900 TATTTTTTCA TTTTATTGTT TTTTTTTTTT TTTTTTTTTT TTGTGGATAA 3850 AACATTTTTA TATTGACCAA AAAAAATAAG GAAATCTTGA GATAAACCTA 3800 TTTGTTTATA TATATATATA TATATATTAA TTTATATGTA TATATATTTA 3750 TACCATGACA GGTTAATTTT TTTTTTTCTT TTTCCCAATC AACAAAAAAA 3700 AATATATAAC ACCTCACATT TGATAAGGCA CTATATTAAT ATTGAGCCTA 3650 ACCCAAAATT ATTATATATA TATATATATA TATTTTTTTT TTATATATAT 3600 CTTTAAATTT TGTAAAAAAA GGGAAAA start chrblob_4171.glm_1|24oct01 glm exon 1 3573 ATG AAT TTT CCT AAT TTG AGT AA 3550 G AAA ATA AAT TCC ACG GTT AGT AGT AAT AAA CCG TAT TCA TCG TCA GAT G 3500 AA AAG GGA GGT GAA CAT ATC ACT GGA AAT TTT GAT CCT ACA GCA TTA GAA 3450 AGA GGT GCT AAA GCA TTA AAA GAA TTA GAT CAG TCA TCA AAT TCT AGC AA 3400 A GCT TTT GAA GTT ATA AAG TTA CAA GAA TTA ACG AAA CAG AAA GAA TAT G 3350 AA AAA CAA ATG GAA GAA TTA TCC TTA CAA CGT GCT CAG CAT ATG AGC AAT 3300 CGT ATG AGA ATG GAA AAT GAA GAA AAA AGG AAA ACG ATA AAT TAC CAG CA 3250 G GAA CAA GAA CGT ATT ACT GCT GAA TAT AAA ACA AAA TTA GAA GCT GAA T 3200 CA TAC CAA AAG AAA CTT CTT GAT CAA CAG AAA CAA AAC GAA GAA TGG TTA 3150 CGT AAT CAA CAT GAA CAA TAT TTA AGA CAA GAA AAT ATT AGA AAA AGA AA 3100 T GAA CTA GAA TTA ATG AAT ATT AAA ATG AAA CAA ATT AAA GAA GAG AAA C 3050 GT TTA GAA AGA GAA AAT ATG AAA GCT AGG ATT TTT GAA GAA AAT AAA GGC 3000 TTA ATA GAA AGA GAA AGA AAA AAT TTA GAT ATA CAT TTA ACA ACA TTA AG 2950 A ACT AAA GCT GAT GAA GAT AGA AAA ACA AAA ATA GAA AGT ATT AAT AAA T 2900 AT TTT GAA CAA TTT AAT AAT TCT TTA TTC CTA TTT TTA AAT GAT AAA CAA 2850 AAA CTA TAT AGA TTT GCA TTA ACC ATT ACA TTA ACA TCT ATA GGT ATA TA 2800 T ACT ACG AAA CAT ACT ACA AAA TTT ATT AGA ACA TAT GCA GAA ACA AAA T 2750 TA GGA AAA CCA AAA TTA ATT CGA GAA ACT TCT CTA TGG CAT ATT AAT AAA 2700 TTC TTT GAT ATT TTT AAT TTT AAA AAA AAT TTT GCT CTT ATC AAA AAT TT 2650 T ATC TAT CCT TTT AAA AAT AAA AAT AAT TTA TAT AAC AAT TAT AAA ATT T 2600 TT GAT CAA ATT GTC TTA AAT GAA GAA CTA CAA GAA AAG TTA CAA TGG TCT 2550 ATA AAT AGT TTA AAA AAT TCT AAT AAA TAT AAT TTG TAT TTA AAA AAT AT 2500 T CTT TTA CAC GGA CCA CCA GGT ACC GGA AAA ACA TTA TTT GCC AAA ACT C 2450 TT TCA TAT CAT AGT AAT TTC GAT TAT ATA ATT ATT AAC GGA GGT GAT GTT 2400 AGT GCA TTA GGT ATT CAT GCT TCC GTA GAA TTA AAT AAA ATA TTT GAT TT 2350 T CTG AAA AGA AGA AAA AAT AAA AAA TGT ATT ATT TTT ATT GAT GAA GCA G 2300 AA GCC TTT TTA CGA AAA GGA AGA AAT GAA TCA TCT ATT CAT TTT TCA GAA 2250 AGC TTA AGA AAT GCT TTA GCA ACA TTT CTT TAT CAT ACA GGT TCT GAA TC 2200 T AAA AAA TAT TCC ATA ATA CTG GCT ACC AAT TGT AAA GAT ATA TTA GAT C 2150 AA GCT GTT ATC GAT CGT ATA GAT GAA CAG TAT AAT TTC CAC AAT CCC AAT 2100 ATT AAA GAG ATA CAA AAA ATG CTT ACT ATG TAT TTT AAT AAA TAT GTA TA 2050 C CCT TTA AAA AAA TAT AAT ATT ACT ATT GAT TCG TCT ATT GAT AAT GAA T 2000 AT ATA CAT AAT CTT TCG AAT AAA CTA TGT GGA TTA TCA GGA AGA CAA ATC 1950 TCT AAA CTA TGT CTT AAT ATA CAA AGT TGT GTT TTT GGT AGT GAC ACC AA 1900 A GTT GTT ACA AAG GAA TTA ATC AAT TTA ATA ACT GCA TGG CAT TTA AGT A 1850 AT TCA CTT GAA CAA ACA AAT AAT CAA AAC GTA AAC AAA AAA AAG CAA CAC 1800 TCA TCA AAT TAT ACA TCT TCC GAT GAT AAT TCA AAT TTT AAA CTC AAA GA 1750 T AAT CCG AAT GTT CAT AAA AAA AAA AAC GAA CAA CAC CAT AAC ATT ACT A 1700 AT ATT GAG CAA GAA CAT AAC AAA AAG GAA AAT GAC GAA AAT TCA AAA AAT 1650 ATT AAC TTG AAT AAT ACT CCA AAC CAT GAT GCT ATA AAG AAA AAG GTA TT 1600 A ATA AAT GAA CAA TTG TGA* 1582 stop chrblob_4171.glm_1|24oct01 A AATATATCAA AGCATGTTTA CCTTATCAAC 1550 AAAAAAAAAA AAAAATAATA AAAAATATTA TACATATGTA AATAAATATA 1500 TATATGTGTG ACTTTTTATA TTTTTTATAT ATGTATACAT TTTATATCTT 1450 ATCCTATACA CCAATTTTTA TTTGTATACA TTATTTTTTT ATATTTTATT 1400 AATATAATTC ATTCACTTTG TTAAATTTTT AAATATTAAA AAAATATATA 1350 AATTAAAAAA ATCAATATGT TAAATATTTA TACACTTATG TGTATAAGTA 1300 GTACTAAATT AAAATAATAT AAATGTAAAT ATATATATAT ATAATTGCCA 1250 TTTTAAATAT ATACATTTTT TGAATTATTT GTCATAATGC CATACTTATT 1200 TTTTCATTTT TTCACATTTC AATTCACCAT GCAATTTTAA TAAAAAGATA 1150 AATTTAATAT TATAAAAAAT ATTTTAATAG TTTTTTTTTT TTTTTTGTTT 1100 GTTTAAGTAA AAAAAAAGGA CCAATATATA TTTTACAATA AAAAATATAA 1050 AGATATACAT ATATATATAT ATATATATAT ATATATATAT AATATTATAT 1000 ATAATGAATC GTATTAATCT ATAAAAACCT ATAAAATTAT ACTAGTAACA 950 ATATATATTT TAATATATTT ATTTTATATT CATCCTTAAT ATAAATATAA 900 TAAATAAAAA ATTAATAAAA ATAATAAAAG AATATTATAA TATATTTTTA 850 TATAACATTT TGAATTAAAA ACCAAAGTAG TAAAAAAAAT ATTATATATA 800 TATTTATATA TATATATAAT AATTATTGAA TTAAAAGAAT AAATAAAAAA 750 AAAATTATAT ATATATATAT ATATATATAT ATATATATAT ATATAATATA 700 TTTTTTATTT TGAGTGATAT ATTATAATAT TAAAATAAAA AGTACTTATT 650 TATGTATGTT GAAAAAAAAG GCATAATAAT AATACTTTTT TTTAAAAAAG 600 GCTAACCCAA CAACATCACA TGTATATAAT AAATATATAA ATAAATATTA 550 TATATTTTCT TTATTTTTTA TTCTTTATTC TTATATCTTA TTAGAAGAAT 500 TTTTTTTTTT TTTTTTTTAA TAAATTATAA TAAAATACCC ATAAAATAAA 450 TAAATATAAA TATATATATA TATATTATAT ATATATAATA ATATATTCAT 400 AACCATCAAA AACAATTATA TATATATATA TATATATATA TATATATAAT 350 ATAATATATA ATAAAATTAC GAAATATATA TTTTGTTATA TATATAATTA 300 TATAAAAATG CAACCAAAAA TTGTTCAACC TAAAAAAAAT AGATATATAT 250 ATATTATAAA AAATATATAT ACATATAAAT ATATAGATAC TGATATTATT 200 CTATATAAAA CAATAATATA AGAACAATTT TATAAATAAA GAAGAAAAAA 150 TATATAATAT ATATATTTTG TTTGGTTTTT ATCTTTTTTA AAAATAAGAT 100 TTTACATTTT GGTATATTTA TATATTCTTA AAAAAAAAAT ATCGAGTATA 50 CATTTTAAAT TTTTAGCTCA TTTTTATTAT TTTTAAAACA TAATAATATA end of file Date: Monday, 3/25/2002 Time: 00:47 c4172.txt chrblob_4173|2001.10.15|GENOMIC|Sanger FEATURES Location CDS join(2451..2544,2656..4959,5138..5191,5561..5649) /gene="chrblob_4173.glm_1|24oct01" /note="(protein coding) 23% identity to probable secreted protein PFB0115w - malaria parasite (Plasmodium falciparum)" /codon_start=1 CDS 6224..6433 /gene="chrblob_4173.glm_2|24oct01" /note="(protein coding) No NR protein Similarities" /codon_start=1 ORIGIN watson strand 1 TTTAATTTTT TTTTTTTTTT TTTTTACCCC CCAAAGGGTT CCCCTCCTCT 51 TTTTTTTTAA AAAAACCCCG ATTTTCCAAA AAAAAAAAAC CGGGATTTCC 101 TTTTTTTTTC CCAAGGGTTA AAATTTTTTT TTTAAAGCCT GGGGAAAAAA 151 AAAAAAAAAA AAAAAAAACC AGGTTTTTTA AAAACATAAA GTTTTTTTTT 201 GGGGCAAAAT TGGGCGGGCC CCTTAATTTG GTTTAATTTA ATTTATTTTA 251 AAATTAAAAA AATTTTTTTT TTTTTGGGAA AACATTTTTT TTAAGGGGTT 301 TAAAAATTTG GGAAAAAAAA AAAAAAAACA AAGTTTGTTC CTTTTTTAAT 351 TTTTTTAAAA AAAATTTATT TATTTTTTTT TAAAAATGGG TTAAAAAAAA 401 AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AATATATATA TATATTAAAC 451 ATGTATATAA TATATATAAC ATATGTGAAC ATATCATATA TATATATATA 501 TATATATATG TATACATGTT TATATATATA TTTTTTTTTT TTTTTTTTTC 551 GCCTTTAACC TTCTAAGAAT TAGTAACCAC TATTGGTTGA ATAACTTATA 601 ATGAAGTCTT TTTTTTTTTT TTTTTTTTGA ACAAATAATA TATACGTATA 651 ATATTATATA TATGTATTCA TTTTAATTAT TTACACATTT TTTTATTGCT 701 TCATATATTT TATTATCTTA TATATTAATT AAAATATTTT TATTTTGTAA 751 CCTTTAATAG TGTATATCCT AAATAGGTTT AAAATACTTC CTAAAGAAAT 801 ATATTTTTTT CCTTTCCTTT ATTTTATTTT ACTTGATTTC ATTTTATTTT 851 ATTTCATTTT ATTTTGCTTT TTCCTTTTTT TTTTTAAATA AAGAAACATT 901 CTATTTCTTC TTAAATATAA CCTCAATAAT TAAAAGCAAA CATAATGCAT 951 ATGTATCTCA AAATAGTTTA TATAAACGTT TAATTTTTTA ATTTTAATTA 1001 TTTTAATATA TATATATATA TATATATATT TATATGTGTA ATTTTTTTTT 1051 TATTTATTTT ATTAATATGA TACGAAAATA TAAGAATATA TATATATACA 1101 TATATAATAT ATACACTGTA TTTTCGTATG TCTTTTTTTA TACCGATATA 1151 TTTTATATAT ATATATATAT ATTTATTTAT TTATTTATAA ATATATTGCA 1201 CATACCTATA TTTGGTTGTT CAAAAAAAAA AAAAAAAATG TATCCGTAGT 1251 AAAAGGAATA GAAAGAGTGA AGAAAAAAAA AAAAAAAAAA AAAAACAACA 1301 TGATAATAAT AAAAATAACA AAAAAATGAA AAAATAAAAA CAAATTAAAT 1351 ATAATATAAT AAAATAACAA TAACAATAAT AATAATAATA ATAATAATAA 1401 TAATAATTTA TGTTTAAATA TTTCTTATTC AATTTTCATC ATATCTTAAT 1451 AAAATAAATA TATATATATA TATATATATA TAATAATGTG GGGACTTGAA 1501 AAATAAAATA AATATATTAT AATATACATA ATGTAAAATA TATATGTGTA 1551 TTAACTTTAT TTATAGATTG TGCTTCAAAG TGCATTCAAG CATAATATAA 1601 AAAAAAAAAA AAATAAAAAA GATAAAATGA TAATATTTAA AAGGTGTAAT 1651 AAATTAGAAC ATATAAACAT ATATGTCATA TTACATACAC ATTATAATAA 1701 TTATAATATT AGACAATTAT TATATATATA TTATATTATA TATATATATA 1751 ACCATGGTGT TACTCTTAGT ATTAGCGTTA TTTTATTTAT AAAATAAAAG 1801 ACAATATTAT TAATAGGCAC TATACTTGCA TAATAGAATA AATGAATAAA 1851 ATAATTAAAT ATATAAAAAA AAAAAAAAAA AAAAAAAAAA AATGATATGA 1901 AATAAAAAGA AAATGAAAAT GAAAATAATA TTATAACAAA ATAAAAAAAC 1951 ATCTATTACA TTATAATACA ATGAAAAAAA GAAATAATAA GAAAAAATTC 2001 GTCAAATATA TTATCCTGAT TATGCATAAT ATATATATAA AAAAACAAAA 2051 CAATGAAAGA CACTATGTAA ATATGATGAA TAACAAAATA TAACATTTAT 2101 TTTATTTTAT TTATTTTCTT CCTTTTTGGT TATTAGGGAA AATAATTGTC 2151 ATATTTTTTT AAATAAATAA TTATATATTT ATTATATATT TATAATATAT 2201 TTATTATATA TTTATCTTGT TCATTTGTTA CATATATATA TATATATGTA 2251 TATGTTAATG TTGTATTTAT TTTTCCTTTA ATTTGATATA TTAATCTATA 2301 GACAATAAAT TTGTGTACAA AAAAAAAAAA AAAAAAAATT ATTGTCATAT 2351 ATTCATATAT ATATATATAT ACACATATAT ATTTATTTAT TTATTTATTT 2401 ATTTATTTAT TTTTGTAATT TTTGTTTTCC TAATAAATAT TTTTAAAAAA start chrblob_4173.glm_1|24oct01 vbc rama ag512 chr7 exon 1 2451 ATG AAT GTT CTA CTT CTG TCT TTG CTT GTT GTA CAA AAT ATA GTA ACA TA 2501 T TTA GAA CAA ATA AAA AAT GGT ATA AGC GGT CAT TAT ACA GAA G intron GTAGGA 2551 AATAAAATAA TAATTCATAT AAATAATATG ATATATATAT ATATATATAT 2601 ATATGTATGT ATATATTTAT GTATTTTTTT TTTTTTTTTC TTATTATATT 2651 TCCAG exon 2 2656 AT CAT AAT ATT AAG AAT AAT AAT TGT ATT AGC TTT TCT GAT TAT G 2701 AG AGA TCA ATA AAA AAC TTT TCT ATT TCT TCT CAT GCA GAA AAT AAT TAT 2751 GAT AAT ATA ATA AAT GAA TAT AAA AAA ATA AAA GAT ATT AAC AAC AAT AT 2801 A AAC ATA TTA TCA TCA GTA CAT AGA AAA GGA AGA ATA TTG TAC GAC AGC T 2851 TT TTA GAA ATA AAT AAG TTG GAA AAT GAC AAA AAA GAG AAA CAT GAA AAA 2901 GAA GAT GAA TAT GAA GAT AAT GAT GAA AGC TTT TTA GAA ACT GAA GAA TA 2951 T GAA GAT AAT GAA GAT GAA AAA TAT AAC AAA GAT GAA GAT GAT TAT GCA G 3001 AA AGT TTT ATT GAG ACT GAT GAA TAT GAA GAT AAT GAA GAT GAT AAA TAT 3051 AAT AAA GAT GAA GAT GAT TAT TCA GAA AGC TTT ATT GAG ACT GAT GAA TA 3101 T GAT GAT AAT GAA GAA GAA CAA TAT AAT AAA GAT GAA GAT GAT TAT ACA G 3151 AT AGT TTT ATT GAG ACA GAC CAT TAT GAA AAT AAC GAT GAT AAA AAT GAA 3201 GAA GAA GAA GAA TAT AAT GAT CAA GAT AAT GAT TAT GGA TAT AAC TTT TT 3251 A GAA ACT GAC GAA TAC GAT GAT AGC GAA GAA TAT GAT TAC GAC GAT AAG G 3301 AA TAC GGA GAG AGT TTC CTC GAA AAA GAA GAA GGT GAA GAA ATG AAA GAT 3351 GAA GAG ATG AAA GAT GAA GAA ATG AAA GAT GTA GAA ATG AAA GAT GAA GA 3401 G ATG AAA GAT GAA GAG ATG AAA TAT GAC GAG ATG AAA AAT GAA GAG ATG A 3451 AA TAT GAC GAG ATG AAA GAT GAA GTG ATG AAA GAT GAA GAG ATG AAA GAT 3501 GAA GTG ATG AAA GAT GAA GAG ATG AAA GAC GAA CAA ATG AAA TAT GAA GA 3551 A TTC AAA AAT GAA GAA TCC AAA AAT GAA GAA TCC AAA AAT GAA GAA TCC A 3601 AA AAT GAA GAA TCC AAA AAT GAA GAA TTC AAA AAT GAA GAA TCC AAA AAT 3651 GAA GAA TTT AAA AAT GAA GAA TTC AAA AAT GAA GAT ATG TCT TAT GAT GA 3701 A TAC ATG GGA TAT AAA AAG AAA GAA GAA GAT GAA TCA TAT AAT ACA TTC A 3751 AT GGT ACT AAG AAA AAT AAC ACA TCC AAC AGC TTC CTC GAA AAA GAT TTA 3801 CAA GGA GAT TCT GAC GAT GAA TTA CAT AGT ACC TTT TAT TCC AAA AAT GT 3851 A GAT AAA GAA AAT TAT GAT GAT AAA AAT ATT TTC TAT GGT TAT AGT GAT A 3901 AT GAT GAT GAA AGC TTT TTA GAA ACT GAT TCT TAT GAA GAA TAT GAA GAC 3951 GAA GAT AAA GAT GTT GAA GAT GAG TAT GAA GAA AGT TTC TTA CAA AAT GA 4001 T GAG AAA AAA ATG GTC TTT TAT GAT TTA TAC AAG CCA GAA GAA AAT GAA T 4051 CT TAT TAT GAA AAG AAA CAA AAG AAA GAA GAA AAA GAA GAG AAA GAA GAG 4101 AAA GAA CAA AGT TTG AAC AAA CAA AAC GAT ATG GAA GAC CAA GAA GAT AA 4151 T GAA GAA TAT AAA TTT GAA GAA GAA AAT AAA GAA GAC CTT CTA GAT GTC C 4201 AA CAA GAT GAA GAA TTA CCA AGT GAA GGA AAA CAA AAA GTA AAA GGA AAA 4251 TCA TTC GAT AAT GAA CAT TTG AAT GAA ATA CAA AAT GTT AGC GAC GTA CA 4301 T GCA TTT ATA CAA AAA GAT ATG AAA TAT TTA GAT GAT CTC ATA GAT GAA G 4351 AG CAA ACT ATT AAA GAT GCC GTC AAA AAA AGT GCT TAT AAA GGA AAT AAG 4401 AAA TTA GGA AAT AAT AAA AAA TCA CAA ATG ATA CTG GAA GAA GAA CCA GA 4451 A GAA AAT TTT GAA GAA GAT GCT GAT GAA GAA TTA AAT AAA CTA ATG GAA C 4501 AA GAA AAA AAT ATT GTA GAT AAA GAA ATC AAA AAT AGT AAA GCA AAT AAA 4551 AGC AAC AAA AAA TTA CAA TTC AAT AAC ACT AAT AAA CAA AAC AAA ATG TA 4601 T ATG AAA AAC GAA TAT AAT AAT AAG ACA AAA AAT AAT AAA AAC AAT AAA T 4651 TT GAA CAA CAA AAT TAT GAT GAA TCA TAT ATG GAT GAT GAT TAT GAA CAA 4701 AAT GAA GAA TTT AAT GAT AAT AAT CAA AGC GAA GAT ATG AAA GAA ACA AA 4751 T GAA CTC GAT AAA ATT AAT GAT GAA CTA TTA ACT GAT CAA GGA CCA AAC G 4801 AA GAT ACA TTA TTA GAA AAT AAT AAT AAA ATT TTC GAT AAT AAA TTT GTA 4851 GCA CAT AAA AAA AGA GAA AAA AGT ATA TCC CCA CAC AGT TAC CAA AAG GT 4901 A TCT ACC AAA GTA CAA AAT AAG GAA GAC ATG GAA AAT AAG GAA GAG AAA C 4951 AA TTG ATA A intron G TAAATAAAAA AAAAAAAAAA TAAAAAAAAA TAAATAAATA 5001 ATAAATAATA AATAATAAAT AATAAATGAT TATATATAAA ATATACACAA 5051 AATATATCAC ACATAAAAAA TATATATATA TATATATATA TATATATATA 5101 TTATTACATT TTTGTAATTA TTTAATTTTT TATTCAG exon 3 5138 AT GAT GAA GCC GC 5151 T ATG ACT GCT GAA GAA TTA GTC GAA TTA GAA AAC ACA GAA G intron GTAAAATTT 5201 TAAAAAATAA TATGACATAA ATGTTAACAT ATGTAATATT TTTATGTATT 5251 TCTATATATA TATATGTATA ATCTTTTATT TTATTTTATT TTATTTTTAG exon 4 5301 AT GTG AAT ACA CCT ACA ATG GTA GAA ACA GAA GAA ATT GAT TCT G intron GTAAG 5351 GATTAAGGTT CAAAATTAAT TTTTATTTAT ATAACTTTGT ATAAAATAAA 5401 AAAAAAAGGG AAATGTTCAT ATATCAACAT TTTCCATATA AACAACATGT 5451 AGATATTACA TATGTTTTAT TTTTATCATA TATACATATA TGTGTTCAAT 5501 CTTTTTATTT TATTTTCATT TTATTTTCAC TTTATTTTTA TTTTATTTTT 5551 ATTTTTTTAG exon 5 5561 AT GAA AAT GGA AAT AAG TCA AGC AGT TCA ATA TCA TAC AT 5601 T AGT TCT ATA GTA TTC CTT ATG GTC ACC CTT TTA TAT TTT ATG AAT TAA* 5649 stop chrblob_4173.glm_1|24oct01 vbc rama ag512 T 5651 ATTAGAAATA TGAATAGAAA GAATATATAA GTATATAAAC CTTTATGCAC 5701 ATATATGTAT ATGTCTATAT ATATATATAT ATATATATTT TTTTTTTTTA 5751 TTTTGTCTTT TACTATTTGT TTTTGTTACT GTTTTAATTT TTTTATTTAG 5801 TCATATATTT AAAAATTTAA TTTTTGTTTT TTTTGTTTTT TTTTTTTTTT 5851 TTTACCAATG AAATATATAA ATATGTGTAT ATGTAATAAA AAAAAAAAAT 5901 TATAATAATA AATAAATAGA TATGCACATT CTTCTATTAT TTTTCTTTTT 5951 CTTTTTCTTT TTCTTTTTTT TTTTTTTTTT TTTTGGTTTG GTGTTATTAT 6001 GGCATTTGTC AATTTAACTT AAATTTGTAT ACATATATAT ATATATATAT 6051 ATATATTTAT ATATATAAGA TATATATTTT AATTTTGATT TAAAAAAAAA 6101 AAAAAAAAAA AAAAAAAAAA GTTATAAAAC TGTATACCGA TATTATAATA 6151 TATATTTATA TAAGTATTTA ATACAGGAAT ATTCCTTGAA CAAAAAAAGA 6201 AATATAAATA TAAATATATA TAT ATG TAT ATA TAT ATA TAT ATA TAT ATA 6251 TAT ATA TAT ATA TAT ATA TAT ATA TAT ATA GAG GGA ATT TAT TTA TTT AT 6301 T TAT TTT TTT TTT TTT GGG GGG GGG GAA TTA TGG GAT TCC CCT TTT TAT A 6351 TC TTA TTT TTA AAA AAA TAT GGG GGG GGG GAA AAC ATT TCC TTA GGG GCC 6401 CTA TTT TCT AAA AAT TAC ATG AAA ATT TTA TGA TATATAT TTTTTTTTAA 6451 CATTTTATGG GGAAGGCATT AAAAAAAATA AAACCCTTAC CTTTTTTTTT 6501 TTTTTAAAA // crick strand 6509 TTTTAAAAA 6500 AAAAAAAAAG GTAAGGGTTT TATTTTTTTT AATGCCTTCC CCATAAAATG 6450 TTAAAAAAAA ATATATA "chrblob_4173.glm_2|24oct01" 6433 TCA TAAAATTTTC ATGTAATTTT TAGAAAATAG 6400 GGCCCCTAAG GAAATGTTTT CCCCCCCCCC ATATTTTTTT AAAAATAAGA 6350 TATAAAAAGG GGAATCCCAT AATTCCCCCC CCCCAAAAAA AAAAAAATAA 6300 ATAAATAAAT AAATTCCCTC TATATATATA TATATATATA TATATATATA 6250 TATATATATA TATATATATA TATACAT 6224 "chrblob_4173.glm_2|24oct01" ATA TATATATTTA TATTTATATT 6200 TCTTTTTTTG TTCAAGGAAT ATTCCTGTAT TAAATACTTA TATAAATATA 6150 TATTATAATA TCGGTATACA GTTTTATAAC TTTTTTTTTT TTTTTTTTTT 6100 TTTTTTTTTA AATCAAAATT AAAATATATA TCTTATATAT ATAAATATAT 6050 ATATATATAT ATATATATGT ATACAAATTT AAGTTAAATT GACAAATGCC 6000 ATAATAACAC CAAACCAAAA AAAAAAAAAA AAAAAAAGAA AAAGAAAAAG 5950 AAAAAGAAAA ATAATAGAAG AATGTGCATA TCTATTTATT TATTATTATA 5900 ATTTTTTTTT TTTATTACAT ATACACATAT TTATATATTT CATTGGTAAA 5850 AAAAAAAAAA AAAAACAAAA AAAACAAAAA TTAAATTTTT AAATATATGA 5800 CTAAATAAAA AAATTAAAAC AGTAACAAAA ACAAATAGTA AAAGACAAAA 5750 TAAAAAAAAA AAATATATAT ATATATATAT ATATAGACAT ATACATATAT 5700 GTGCATAAAG GTTTATATAC TTATATATTC TTTCTATTCA TATTTCTAAT 5650 A "chrblob_4173.glm_1|24oct01" 5649 TTAATTCAT AAAATATAAA AGGGTGACCA TAAGGAATAC TATAGAACTA 5600 ATGTATGATA TTGAACTGCT TGACTTATTT CCATTTTCAT CTAAAAAAAT 5550 AAAAATAAAA TAAAAATAAA GTGAAAATAA AATGAAAATA AAATAAAAAG 5500 ATTGAACACA TATATGTATA TATGATAAAA ATAAAACATA TGTAATATCT 5450 ACATGTTGTT TATATGGAAA ATGTTGATAT ATGAACATTT CCCTTTTTTT 5400 TTTATTTTAT ACAAAGTTAT ATAAATAAAA ATTAATTTTG AACCTTAATC 5350 CTTACCAGAA TCAATTTCTT CTGTTTCTAC CATTGTAGGT GTATTCACAT 5300 CTAAAAATAA AATAAAATAA AATAAAAGAT TATACATATA TATATATAGA 5250 AATACATAAA AATATTACAT ATGTTAACAT TTATGTCATA TTATTTTTTA 5200 AAATTTTACC TTCTGTGTTT TCTAATTCGA CTAATTCTTC AGCAGTCATA 5150 GCGGCTTCAT CATCTGAATA AAAAATTAAA TAATTACAAA AATGTAATAA 5100 TATATATATA TATATATATA TATATATATA TTTTTTATGT GTGATATATT 5050 TTGTGTATAT TTTATATATA ATCATTTATT ATTTATTATT TATTATTTAT 5000 TATTTATTTA TTTTTTTTTA TTTTTTTTTT TTTTTATTTA CTTATCAATT 4950 GTTTCTCTTC CTTATTTTCC ATGTCTTCCT TATTTTGTAC TTTGGTAGAT 4900 ACCTTTTGGT AACTGTGTGG GGATATACTT TTTTCTCTTT TTTTATGTGC 4850 TACAAATTTA TTATCGAAAA TTTTATTATT ATTTTCTAAT AATGTATCTT 4800 CGTTTGGTCC TTGATCAGTT AATAGTTCAT CATTAATTTT ATCGAGTTCA 4750 TTTGTTTCTT TCATATCTTC GCTTTGATTA TTATCATTAA ATTCTTCATT 4700 TTGTTCATAA TCATCATCCA TATATGATTC ATCATAATTT TGTTGTTCAA 4650 ATTTATTGTT TTTATTATTT TTTGTCTTAT TATTATATTC GTTTTTCATA 4600 TACATTTTGT TTTGTTTATT AGTGTTATTG AATTGTAATT TTTTGTTGCT 4550 TTTATTTGCT TTACTATTTT TGATTTCTTT ATCTACAATA TTTTTTTCTT 4500 GTTCCATTAG TTTATTTAAT TCTTCATCAG CATCTTCTTC AAAATTTTCT 4450 TCTGGTTCTT CTTCCAGTAT CATTTGTGAT TTTTTATTAT TTCCTAATTT 4400 CTTATTTCCT TTATAAGCAC TTTTTTTGAC GGCATCTTTA ATAGTTTGCT 4350 CTTCATCTAT GAGATCATCT AAATATTTCA TATCTTTTTG TATAAATGCA 4300 TGTACGTCGC TAACATTTTG TATTTCATTC AAATGTTCAT TATCGAATGA 4250 TTTTCCTTTT ACTTTTTGTT TTCCTTCACT TGGTAATTCT TCATCTTGTT 4200 GGACATCTAG AAGGTCTTCT TTATTTTCTT CTTCAAATTT ATATTCTTCA 4150 TTATCTTCTT GGTCTTCCAT ATCGTTTTGT TTGTTCAAAC TTTGTTCTTT 4100 CTCTTCTTTC TCTTCTTTTT CTTCTTTCTT TTGTTTCTTT TCATAATAAG 4050 ATTCATTTTC TTCTGGCTTG TATAAATCAT AAAAGACCAT TTTTTTCTCA 4000 TCATTTTGTA AGAAACTTTC TTCATACTCA TCTTCAACAT CTTTATCTTC 3950 GTCTTCATAT TCTTCATAAG AATCAGTTTC TAAAAAGCTT TCATCATCAT 3900 TATCACTATA ACCATAGAAA ATATTTTTAT CATCATAATT TTCTTTATCT 3850 ACATTTTTGG AATAAAAGGT ACTATGTAAT TCATCGTCAG AATCTCCTTG 3800 TAAATCTTTT TCGAGGAAGC TGTTGGATGT GTTATTTTTC TTAGTACCAT 3750 TGAATGTATT ATATGATTCA TCTTCTTCTT TCTTTTTATA TCCCATGTAT 3700 TCATCATAAG ACATATCTTC ATTTTTGAAT TCTTCATTTT TAAATTCTTC 3650 ATTTTTGGAT TCTTCATTTT TGAATTCTTC ATTTTTGGAT TCTTCATTTT 3600 TGGATTCTTC ATTTTTGGAT TCTTCATTTT TGGATTCTTC ATTTTTGAAT 3550 TCTTCATATT TCATTTGTTC GTCTTTCATC TCTTCATCTT TCATCACTTC 3500 ATCTTTCATC TCTTCATCTT TCATCACTTC ATCTTTCATC TCGTCATATT 3450 TCATCTCTTC ATTTTTCATC TCGTCATATT TCATCTCTTC ATCTTTCATC 3400 TCTTCATCTT TCATTTCTAC ATCTTTCATT TCTTCATCTT TCATCTCTTC 3350 ATCTTTCATT TCTTCACCTT CTTCTTTTTC GAGGAAACTC TCTCCGTATT 3300 CCTTATCGTC GTAATCATAT TCTTCGCTAT CATCGTATTC GTCAGTTTCT 3250 AAAAAGTTAT ATCCATAATC ATTATCTTGA TCATTATATT CTTCTTCTTC 3200 TTCATTTTTA TCATCGTTAT TTTCATAATG GTCTGTCTCA ATAAAACTAT 3150 CTGTATAATC ATCTTCATCT TTATTATATT GTTCTTCTTC ATTATCATCA 3100 TATTCATCAG TCTCAATAAA GCTTTCTGAA TAATCATCTT CATCTTTATT 3050 ATATTTATCA TCTTCATTAT CTTCATATTC ATCAGTCTCA ATAAAACTTT 3000 CTGCATAATC ATCTTCATCT TTGTTATATT TTTCATCTTC ATTATCTTCA 2950 TATTCTTCAG TTTCTAAAAA GCTTTCATCA TTATCTTCAT ATTCATCTTC 2900 TTTTTCATGT TTCTCTTTTT TGTCATTTTC CAACTTATTT ATTTCTAAAA 2850 AGCTGTCGTA CAATATTCTT CCTTTTCTAT GTACTGATGA TAATATGTTT 2800 ATATTGTTGT TAATATCTTT TATTTTTTTA TATTCATTTA TTATATTATC 2750 ATAATTATTT TCTGCATGAG AAGAAATAGA AAAGTTTTTT ATTGATCTCT 2700 CATAATCAGA AAAGCTAATA CAATTATTAT TCTTAATATT ATGATCTGGA 2650 AATATAATAA GAAAAAAAAA AAAAAAATAC ATAAATATAT ACATACATAT 2600 ATATATATAT ATATATATAT CATATTATTT ATATGAATTA TTATTTTATT 2550 TCCTACCTTC TGTATAATGA CCGCTTATAC CATTTTTTAT TTGTTCTAAA 2500 TATGTTACTA TATTTTGTAC AACAAGCAAA GACAGAAGTA GAACATTCAT 2451 "chrblob_4173.glm_1|24oct01" 2450 TTTTTTAAAA ATATTTATTA GGAAAACAAA AATTACAAAA ATAAATAAAT 2400 AAATAAATAA ATAAATAAAT ATATATGTGT ATATATATAT ATATATGAAT 2350 ATATGACAAT AATTTTTTTT TTTTTTTTTT TTGTACACAA ATTTATTGTC 2300 TATAGATTAA TATATCAAAT TAAAGGAAAA ATAAATACAA CATTAACATA 2250 TACATATATA TATATATATG TAACAAATGA ACAAGATAAA TATATAATAA 2200 ATATATTATA AATATATAAT AAATATATAA TTATTTATTT AAAAAAATAT 2150 GACAATTATT TTCCCTAATA ACCAAAAAGG AAGAAAATAA ATAAAATAAA 2100 ATAAATGTTA TATTTTGTTA TTCATCATAT TTACATAGTG TCTTTCATTG 2050 TTTTGTTTTT TTATATATAT ATTATGCATA ATCAGGATAA TATATTTGAC 2000 GAATTTTTTC TTATTATTTC TTTTTTTCAT TGTATTATAA TGTAATAGAT 1950 GTTTTTTTAT TTTGTTATAA TATTATTTTC ATTTTCATTT TCTTTTTATT 1900 TCATATCATT TTTTTTTTTT TTTTTTTTTT TTTTTTATAT ATTTAATTAT 1850 TTTATTCATT TATTCTATTA TGCAAGTATA GTGCCTATTA ATAATATTGT 1800 CTTTTATTTT ATAAATAAAA TAACGCTAAT ACTAAGAGTA ACACCATGGT 1750 TATATATATA TATAATATAA TATATATATA ATAATTGTCT AATATTATAA 1700 TTATTATAAT GTGTATGTAA TATGACATAT ATGTTTATAT GTTCTAATTT 1650 ATTACACCTT TTAAATATTA TCATTTTATC TTTTTTATTT TTTTTTTTTT 1600 TTATATTATG CTTGAATGCA CTTTGAAGCA CAATCTATAA ATAAAGTTAA 1550 TACACATATA TATTTTACAT TATGTATATT ATAATATATT TATTTTATTT 1500 TTCAAGTCCC CACATTATTA TATATATATA TATATATATA TATTTATTTT 1450 ATTAAGATAT GATGAAAATT GAATAAGAAA TATTTAAACA TAAATTATTA 1400 TTATTATTAT TATTATTATT ATTATTGTTA TTGTTATTTT ATTATATTAT 1350 ATTTAATTTG TTTTTATTTT TTCATTTTTT TGTTATTTTT ATTATTATCA 1300 TGTTGTTTTT TTTTTTTTTT TTTTTTTTCT TCACTCTTTC TATTCCTTTT 1250 ACTACGGATA CATTTTTTTT TTTTTTTTTG AACAACCAAA TATAGGTATG 1200 TGCAATATAT TTATAAATAA ATAAATAAAT ATATATATAT ATATATAAAA 1150 TATATCGGTA TAAAAAAAGA CATACGAAAA TACAGTGTAT ATATTATATA 1100 TGTATATATA TATATTCTTA TATTTTCGTA TCATATTAAT AAAATAAATA 1050 AAAAAAAAAT TACACATATA AATATATATA TATATATATA TATATTAAAA 1000 TAATTAAAAT TAAAAAATTA AACGTTTATA TAAACTATTT TGAGATACAT 950 ATGCATTATG TTTGCTTTTA ATTATTGAGG TTATATTTAA GAAGAAATAG 900 AATGTTTCTT TATTTAAAAA AAAAAAGGAA AAAGCAAAAT AAAATGAAAT 850 AAAATAAAAT GAAATCAAGT AAAATAAAAT AAAGGAAAGG AAAAAAATAT 800 ATTTCTTTAG GAAGTATTTT AAACCTATTT AGGATATACA CTATTAAAGG 750 TTACAAAATA AAAATATTTT AATTAATATA TAAGATAATA AAATATATGA 700 AGCAATAAAA AAATGTGTAA ATAATTAAAA TGAATACATA TATATAATAT 650 TATACGTATA TATTATTTGT TCAAAAAAAA AAAAAAAAAA AAGACTTCAT 600 TATAAGTTAT TCAACCAATA GTGGTTACTA ATTCTTAGAA GGTTAAAGGC 550 GAAAAAAAAA AAAAAAAAAA TATATATATA AACATGTATA CATATATATA 500 TATATATATA TATATGATAT GTTCACATAT GTTATATATA TTATATACAT 450 GTTTAATATA TATATATATT TTTTTTTTTT TTTTTTTTTT TTTTTTTTTT 400 TTTTTTTTAA CCCATTTTTA AAAAAAAATA AATAAATTTT TTTTAAAAAA 350 ATTAAAAAAG GAACAAACTT TGTTTTTTTT TTTTTTTTCC CAAATTTTTA 300 AACCCCTTAA AAAAAATGTT TTCCCAAAAA AAAAAAAATT TTTTTAATTT 250 TAAAATAAAT TAAATTAAAC CAAATTAAGG GGCCCGCCCA ATTTTGCCCC 200 AAAAAAAAAC TTTATGTTTT TAAAAAACCT GGTTTTTTTT TTTTTTTTTT 150 TTTTTTCCCC AGGCTTTAAA AAAAAAATTT TAACCCTTGG GAAAAAAAAA 100 GGAAATCCCG GTTTTTTTTT TTTGGAAAAT CGGGGTTTTT TTAAAAAAAA 50 AGAGGAGGGG AACCCTTTGG GGGGTAAAAA AAAAAAAAAA AAAAATTAAA end of file 4174 5 4176 8 4177 7 4178 5 4180 5 Date: Monday, 3/25/2002 Time: 00:48 c4181.txt chrblob_4181|2001.10.15|GENOMIC|Sanger FEATURES Location CDS complement(join(1770..4151,4334..4417)) /gene="chrblob_4181.glm_1|24oct01" /note="(protein coding) 23% identity to (AF056936) mature parasite-infected erythrocyte surface antigen [Plasmodium falciparum]" /codon_start=1 ORIGIN watson strand 1 TATATATATA TATATATATA TAATATGTGT ATTATTCATT AGTGTAGGAC 51 ATTTTGATAC ATTTAATATG AATTTAATGT TATTAATTAA AATACTTTTT 101 ATATTTTTTA ATTTTATCTA TATTTTTATT AGATATATTC CTTTTATAGC 151 ATTTTCGCAT TTGTTAATTT TATGAAAAAT ATTTTATGTA TAATTTTTTA 201 AACAAGTATT GAAATTTTAT CAAGTATATT TTTATATAAA AAATGAAATA 251 TTCTGTATAA TTACAAAATT TGCTTAGATA TTTTTATGTG CCTTCTGTCC 301 ACCTATATTT TTTTAATATA TATATTTATT TTTTTTTATA ATATAATTAA 351 GATTGTTAAA AATATAGAAA TAAAGTTGTC TATAAGATAA CCAGATGGTT 401 AATTGAACTT TGTATATTTA AATAATTTAG CAACATTTGA TATAAATATA 451 TTATATGTTC TAAATTTTCT TTTTTCTTAG TTTTTTTTTT TAAGATTCAA 501 ATGGAACAAA AAAAAAAAAA AAAATAAGAA AAGAATTATA TAAAGTAAGA 551 GTTATAGAAA TATATCAAAC TATATATTAT GTTGTATTTA ATTAATAAAA 601 AAATAAATAA ACAAAATAAA ATAAAATAAA ATAAAATAAA ATAAAATAAA 651 ATAAAATAAA ATAAAATAAA ATAAAATAAA ATAAAATAAA TTTTGATAAT 701 AAAAATATAT TTATAATTAA CTAAAAGTAT TTGATGTGTA AGTTATTTAT 751 TGGGAAGTAA ATAATTTTAT CAACATAATT TTATTTTTCT TCATTTTTAC 801 GGCATATATA TATATATATA TATATTAAAG AGCCTCATAT AAATATTATA 851 TATATAGTAT AATATCTTGT ACACCCTTTC TCAATATCAT AATAAATATA 901 AATAATTTAT TATAATTATA TTTCAGAAGA TATTGTAAAA TGTAACATTT 951 ATCTTCTCAT TTAATTTATA CTTCAATTTA ATTATAAATC AATAACCTCC 1001 ACATATTTAC TCAAAGGATT TATATCTATA TTAATTATGT AGAACAAATT 1051 ATTTTATATA ACATGAGAAA TATATATGTT TCTTATTTTT GAGTTTTTTT 1101 TAAATTTCAA TAAATTTTAA TAGTGGAATA AAAAAACATA TATATATATA 1151 TATATATATA TATTAAAATG ATAATTTCAA TATGGATATA TTCATTTTAA 1201 TTTGAAATAA TTAAGTATAT ATATTATCCT TCTTGTAGAG TGAATTTATA 1251 TGGTTTTATA TATTTTCCAT AAAAATAAAT AATTTTTCCT TTAAAAAAAT 1301 TATAATAAAT TAGATAATAT TATATATACT TCAATATAAA TACTAGAATT 1351 TTATATTTAT TCATGGATTT TACTTCTAAT ATGATATGGT TTTATATTAT 1401 TATATCATTT TTTCTGAATT CACATATATA TATATATATA TATATATATA 1451 TATATAGTGT AACTACTTTA TCATAATATC TAATATTTTC TTATACATTT 1501 TAAACACAAT ATCAAACGTA TAATTTAATA TTAAATATAA ATAAGGATAT 1551 TATGACATAT AAAAATAATA TAAACCCATC AAAATATGTT AATTAAAAAA 1601 AAAAAAAAAA AAAAAAAAAA TTAACAATCA AAAATAAGAA TGGGATCCAT 1651 TTATTATTAT ATTATTTATT TGGATTTATA CTACATTATA ATGTTAATCC 1701 CATTATGATT ATATATATAT ATATATATAT ATATATATAT ATATATATTT 1751 TTTATTTTTT TTTTTTTGT "chrblob_4181.glm_1|24oct01" 1770 C TAAATAAGTT TACCTTGGTA AAATTTTATA 1801 TTTAAAGCAT TATCTGGTAG ATTCTTAATT TTACTACGGA ACGTATGCTT 1851 ATATTTATAT AATAAGCGCT TTCTTAATTT TTCAAAATAC ATCATCCCAG 1901 AATAAATAAA ATTTGTAATA TCCTCAAGAT TGGCTGTTTT ATTAAGTAAA 1951 TGATAGAAAT TTCTAGAAAA TTCTTTTTGT TCAGAAGCTA CTTCCATTCC 2001 AAGATTAAGT ATGCATCTTC CCCAAGTTGA TTGAATATAA CTCCATATAA 2051 AAGGATATTC ATATGTTGAT CTATGATTAT ATTCATATTT ATCTAAATAA 2101 GTTTTCATAT AACTCTTAAA ATCTCTTGTT ATTATTTCAA AACCTAATTT 2151 AATTATACTA AGTGCTTCCC ACCATAAACC AAGGATATCT TTCTTTAGTG 2201 GATAACTTCC AAAACCATGA AAAACATTGT CAACCTTATC TTCTTTTAAA 2251 TCTTTTATAA ATTTATTATA ATCTATATTT TCATTATTCT CTGTAGTATT 2301 ATTATTATTA TTAATATCCT CTTTTTTATC TGTTTTTTTT TTAATAATAT 2351 TTTCAGATGA TTCATTAATA CAATCATTTT CTCCTTTAAG TTCCTTTGAT 2401 TTTCCTTCTT TTTCATAATT TCCGTTAAGA ATTTGTTCAT CATTTTCTAT 2451 GGTAATGTCT TCATCATTTT CTTTATTCCT TTTGTTATCT CTCTTATTTA 2501 TCAATTCTTC CTTATCACCT TCGTTTTTCA GTTCTTCTTG GTACAAATAA 2551 AACATTCCTA TGTCTTTTTT ACTATATTTA TTCATATCTA TATCATCATT 2601 TTTATTATAT TCCTCCTCTT GTTTCATAAC ATTTACTTTT TCTGGTTCAC 2651 TTGATATCAA ATCCTCGTTT TCATATTTTC TATCTACATA ATTATAAACA 2701 TTATCAAAAT ATAATTCAAT TAAATTAATT CTATTTTCAT CTTTCTCTGA 2751 AAAATTCATT CTTTCTTTTT GATTTTCCAA AATACCCCAT CCATTTTCTT 2801 TATTCCTTAT AAAATCCCAT TTACCAGAAT TACTGTTTTC ATCATCTTTT 2851 TCTTCTTCGA TTTTTTTTTG GTGTTCGACA TCATTTCTCT CTTCTACAGA 2901 ATCAGATTTG TCTTCTTCAT CTTCTGAGAA ATCCCATTTC TGTTCATCAT 2951 CTGATTCAAT ATTTTTTAAT TCATCGTCAT TTTCTTCTTC TATAACTGAA 3001 TTAGTATAGT CATATCCCTC TACAAATACC CATTTATCTT TTTCTTTTTC 3051 ATGTCCTAAA TCCCATTCAT CAACTTCGTC GTCCTGTTTA ATATTTTCCC 3101 ACATTGAATC ATCGTAATTT TTTTTTTTTC TATATTCATC ATGAATTTTT 3151 TCACAATCTA TCCATTTCCC ATTTGTACAA TTTTTAATCA AACTCCACTT 3201 ATCCATTAAT TCATGGTTTT CATCTATCCA TTTATTCTCA TCATTTTCTA 3251 CACCCACATT CCATTTACTA TAATATAAAT TATTAATAAT TGTTTTATCA 3301 TATTTCTCTC TCTTAAAATT TTCCTCTTCT CCATTATTAT TATATTCTTC 3351 ATTATAACTA TTCTCCTTAT CACTAAAATC TTCCCTATCA TTAATATCTT 3401 CCTTATCACT AAAATCATCC TTATCATTAC TATATTCCAT ATCACTAAAA 3451 TCATCCTTAT CATTACTATA TTCCATATCA CTTAAATCCT CCTTATCACT 3501 TAAATTTTCC TTATCACATA AATCTTCCCT ATCACTTAAA TCTTCCTTAT 3551 CACTTAAATC TTCCTTATCA CTTAAATCTT CCTTATCACT TAAATCTTCC 3601 TTATCACTTA AATCTTCCCT ATCACTTAAA TCTTCCTTAT CACTTAAATC 3651 TTCCTTATCA CTTAAATCTT CCTTATCACT TAAATCTTCC TTATCATTAT 3701 TATTTTCCAT ATCACTTAAA TCATCCTTAT CATTATTATT TTCCATATCA 3751 CTTAAATCAT CCTTATCATT ATTATTTTCC ATATCACTTA AATCATCCTT 3801 ATCATTATTA TTTTCCATAT CACTTAAATC TTCCCTATCA CTAATATCCT 3851 CTTTATTTTC ATAATTTTCA TTTTTCTCAT CAATATATTC TTCTTCTTCT 3901 TCATATGTTT CTTCCTCATC GTTTTCATAT TCATCCATTT TAACTTCTTC 3951 ATTTTCATCC TTAATATCAA ACTCTTTAAA ATCCTCACGA TTAATACAAC 4001 TTTCTTCATT TATTTCATCT TTCGATTTAT ACTTTAATTC ATGACATCTT 4051 AATGATGGGA TGTGATCTTT TTCTGTTTCA GATAATTTTC TTGAACAAAT 4101 ATTTAAATAT TTTACTCCTG ATTGTTCAGT TTCATCATAC ACAGATAAAT 4151 CCTGTTAAAA AAAATATAAA ATAATAATTA AGATAATTTA TTTTAATATA 4201 CATTTAGAAA AAAAAAAAAA AAAATTACAA ATATAAACAT AAATATATAT 4251 ATAAATAAAT ATACATGCAC ATGCATATAT ACATACATAT ATATATATAC 4301 ATCTCTATAT AGTAAAATCT TTTTTTAACA TACTACTGGA ATTTCATATA 4351 TAATTCCTAA AAGAACCACA GAAAAATAGC TGAAAAGAAG TTTTCTTAAA 4401 ATATGTATGT ATTCCAT 4417 "chrblob_4181.glm_1|24oct01" TAG TTCTTTATTC CTATAAAAAA AAAAAACAAA 4451 AAAAAAAAAA AAAAAACATA TATATATATA TATATATATA CATATATATA 4501 TGGATAAACT TTCTAAATTA ATATAATTGT CTTATAAATA ATAATGAATG 4551 CCGTTACCTT AAGACTGTAT TATTCAATTT TATTTCTTCG AAAGGTTAAC 4601 CAAAATTTTT TATCATATAA TAATTTATGA ATATTACTTT AAATATCAGC 4651 TAATACGATA ATATTTTTTT CAAATCAAAA AATAATAAGA TGTGTTTAAT 4701 CCTTTAATAT ATTAGGATAA AAACAGATAA TGTTAATAAA ATATAATGGA 4751 AATGTAGAAG CGTTCAAGAC TTATAATAAA TACATAACAT TTATAAGATA 4801 TATATATATA TATATATATA TATATGTATA TATCTATTAT ACTTTCTTAA 4851 AAAATATATT TACTTCTTGT GGGACTATAT ATTATCTTCA TCCTTATATA 4901 TATATTTCAC TTCGGACCTT TTGTTTACAA TAATGAAATT ATAAGTCACG 4951 ATTTTTATAG AAGAAATAAT ATAAATCTGA ATATATAAAA AATAATATTC 5001 AGGTATACAA AATAAAATTA TATATATAAT ATAATTATAC TTTCTTTAAT 5051 TGTAATGCTA TTGGTATTTT TATAAAAAGG TATGAACATA TAAATATAAA 5101 TAAATAAATA AATAAATATA TATATATATA TATATATATA TATATTTATA 5151 TTAATAAAGT CTAAAAATAT ATATTCTTAA TGTTTCCTGT ATCTTGAATT 5201 TGTTTTTACT TTTTTATTAT AAAATAAAAA AATATAATAT GTCTTCTTCA 5251 GAAAATTTCC TTATTTTTAT ATAATTCTTT ATTATAGTAC ACAAACTTTC 5301 AAAACATCGA AATATTCTTC TAAATATAAA CAGAATATTC ATATCACTTT 5351 TTCTTATCCT TTAATGATCA AACATACTCC CTCCTATACT ATATTTTTTC 5401 TTCGGTAGAT CAAAGAAATA AAATAAAAAG TAAAAATAAA AGTATATAAA 5451 TTATGTAATA AAAATGTTCA AATTAAATCA ACAAATATAT TATATATATA 5501 TATATATATA TATTAATTTA TATCAACACA CAAAATCAAT ATACTTTTAT 5551 TAATCTTTCC AAAAAACAAT TATAATTTCC CTTTGTTTTT GCTTATTAAA 5601 TAAAAATATT TATATTAAGA TTTAAATAGA GAATAATATA TAGAATATTA 5651 CTTTTGAAAA TTTTCAAAAA GTATATTTTC TTATTTAACA ATCAACGTAA 5701 AAGAAAGACT ATATAATATA AAATAATTTG AACTAACATT TCAAGTATAT 5751 AATATAAACA AAAAATAAAA ATTTATTAAA ATTCATATAT CATTTTTAAA 5801 ATATGTTCTC ATATTCTTAT TACAAAAGAC CATAAAAGTA TCTTATATAT 5851 ATATATATAT ATATTTTTTT TTTTTCTTTC TTCATTAATA ATACTACTTA 5901 TACTTAAATA TTTTTACTTT ATTTATTATT TATTTTATTT TTTTGGATTT 5951 TTTTGTGTAC ACCAAAAATT TTCCTTTTAC CACGTACACA TAAAAACGTT 6001 ATATTTATAC ATATACCTAT TTATTAAAAT AAATATATAT ATTTTTTTTT 6051 TTTTTATTTC AGATTTCATT TACAAATATT TATTTATATT ATATTTTTTT 6101 TTTTTTTTTT TTTTGACATA AAAAATTTTA TTTCTTTTTC TTATTTCATG 6151 TGGGCTTATA TTTTATTCTA TATCAATATT CGTTAATTTT ATTTATGTAA 6201 GCTTTATCAA AATATTATGA TGCCCTATAT AATGAAATTA CTTTTTTTTT 6251 TATATCAAAT TTACATATAA CTCATGGTAA GTATTTAACA CAATAATAAT 6301 AAATGGATTA GGGAAAATAT ATACATGTAC TTTTAATTCA GGTATAATGC 6351 AATATATATA TATATATATA TATATATTTT TAATTGAGCA TTTTTACTAA 6401 AAATACACAC GATGATACAA CGAAGATTTT TTGCGGACAT TATTATTTAA 6451 CAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAATTCT ACATATATAT 6501 ATATATATTT ATTTATTTAT TTATTTATAT TTACAAAATA CAATACCTTT 6551 ATTACTTACT AATTTTTCGC AAAAATAAAT ATTCATCTTA ATATAGATTA 6601 CTAAAAAATA TGTTCCTTAT ATTTCATTAG TTAAAAAAAT TCATATACAC 6651 TCATATCTAA TATAAATTAT TCAAATTCAT TTTTTTAAAT TTTATCAA // crick strand 6698 TTGATAAA ATTTAAAAAA ATGAATTTGA ATAATTTATA TTAGATATGA 6650 GTGTATATGA ATTTTTTTAA CTAATGAAAT ATAAGGAACA TATTTTTTAG 6600 TAATCTATAT TAAGATGAAT ATTTATTTTT GCGAAAAATT AGTAAGTAAT 6550 AAAGGTATTG TATTTTGTAA ATATAAATAA ATAAATAAAT AAATATATAT 6500 ATATATATGT AGAATTTTTT TTTTTTTTTT TTTTTTTTTT TTTTTTTTTG 6450 TTAAATAATA ATGTCCGCAA AAAATCTTCG TTGTATCATC GTGTGTATTT 6400 TTAGTAAAAA TGCTCAATTA AAAATATATA TATATATATA TATATATATT 6350 GCATTATACC TGAATTAAAA GTACATGTAT ATATTTTCCC TAATCCATTT 6300 ATTATTATTG TGTTAAATAC TTACCATGAG TTATATGTAA ATTTGATATA 6250 AAAAAAAAAG TAATTTCATT ATATAGGGCA TCATAATATT TTGATAAAGC 6200 TTACATAAAT AAAATTAACG AATATTGATA TAGAATAAAA TATAAGCCCA 6150 CATGAAATAA GAAAAAGAAA TAAAATTTTT TATGTCAAAA AAAAAAAAAA 6100 AAAAAAATAT AATATAAATA AATATTTGTA AATGAAATCT GAAATAAAAA 6050 AAAAAAAAAT ATATATATTT ATTTTAATAA ATAGGTATAT GTATAAATAT 6000 AACGTTTTTA TGTGTACGTG GTAAAAGGAA AATTTTTGGT GTACACAAAA 5950 AAATCCAAAA AAATAAAATA AATAATAAAT AAAGTAAAAA TATTTAAGTA 5900 TAAGTAGTAT TATTAATGAA GAAAGAAAAA AAAAAAATAT ATATATATAT 5850 ATATATAAGA TACTTTTATG GTCTTTTGTA ATAAGAATAT GAGAACATAT 5800 TTTAAAAATG ATATATGAAT TTTAATAAAT TTTTATTTTT TGTTTATATT 5750 ATATACTTGA AATGTTAGTT CAAATTATTT TATATTATAT AGTCTTTCTT 5700 TTACGTTGAT TGTTAAATAA GAAAATATAC TTTTTGAAAA TTTTCAAAAG 5650 TAATATTCTA TATATTATTC TCTATTTAAA TCTTAATATA AATATTTTTA 5600 TTTAATAAGC AAAAACAAAG GGAAATTATA ATTGTTTTTT GGAAAGATTA 5550 ATAAAAGTAT ATTGATTTTG TGTGTTGATA TAAATTAATA TATATATATA 5500 TATATATATA ATATATTTGT TGATTTAATT TGAACATTTT TATTACATAA 5450 TTTATATACT TTTATTTTTA CTTTTTATTT TATTTCTTTG ATCTACCGAA 5400 G AAA AAA TAT AGT ATA GGA GGG AGT ATG TTT GAT CAT TAA AGGATAAGAA 5350 AAAGTGATAT GAATATTCTG TTTATATTTA GAAGAATATT TCGATGTTTT 5300 GAAAGTTTGT GTACTATAAT AAAGAATTAT ATAAAAATAA GGAAATTTTC 5250 TGAAGAAGAC ATATTATATT TTTTTATTTT ATAATAAAAA AGTAAAAACA 5200 AATTCAAGAT ACAGGAAACA TTAAGAATAT ATATTTTTAG ACTTTATTAA 5150 TATAAATATA TATATATATA TATATATATA TATATTTATT TATTTATTTA 5100 TTTATATTTA TATGTTCATA CCTTTTTATA AAAATACCAA TAGCATTACA 5050 ATTAAAGAAA GTATAATTAT ATTATATATA TAATTTTATT TTGTATACCT 5000 GAATATTATT TTTTATATAT TCAGATTTAT ATTATTTCTT CTATAAAAAT 4950 CGTGACTTAT AATTTCATTA TTGTAAACAA AAGGTCCGAA GTGAAATATA 4900 TATATAAGGA TGAAGATAAT ATATAGTCCC ACAAGAAGTA AATATATTTT 4850 TTAAGAAAGT ATAATAGATA TATACATATA TATATATATA TATATATATA 4800 TATCTTATAA ATGTTATGTA TTTATTATAA GTCTTGAACG CTTCTACATT 4750 TCCATTATAT TTTATTAACA TTATCTGTTT TTATCCTAAT ATATTAAAGG 4700 ATTAAACACA TCTTATTATT TTTTGATTTG AAAAAAATAT TATCGTATTA 4650 GCTGATATTT AAAGTAATAT TCATAAATTA TTATATGATA AAAAATTTTG 4600 GTTAACCTTT CGAAGAAATA AAATTGAATA ATACAGTCTT AAG i n t r o n GTAACGG 4550 CATTCATTAT TATTTATAAG ACAATTATAT TAATTTAGAA AGTTTATCCA 4500 TATATATATG TATATATATA TATATATATA TATGTTTTTT TTTTTTTTTT 4450 TTTGTTTTTT TTTTTTATAG GAATAAAGAA CTA start chrblob_4181.glm_1|24oct01 vbc exon 1 ATG GAA TAC ATA CAT AT 4400 T TTA AGA AAA CTT CTT TTC AGC TAT TTT TCT GTG GTT CTT TTA GGA ATT A 4350 TA TAT GAA ATT CCA GTA intron GTA TGTTAAAAAA AGATTTTACT ATATAGAGAT 4300 GTATATATAT ATATGTATGT ATATATGCAT GTGCATGTAT ATTTATTTAT 4250 ATATATATTT ATGTTTATAT TTGTAATTTT TTTTTTTTTT TTTCTAAATG 4200 TATATTAAAA TAAATTATCT TAATTATTAT TTTATATTTT TTTTAACAG exon 2 4151 G 4150 AT TTA TCT GTG TAT GAT GAA ACT GAA CAA TCA GGA GTA AAA TAT TTA AAT 4100 ATT TGT TCA AGA AAA TTA TCT GAA ACA GAA AAA GAT CAC ATC CCA TCA TT 4050 A AGA TGT CAT GAA TTA AAG TAT AAA TCG AAA GAT GAA ATA AAT GAA GAA A 4000 GT TGT ATT AAT CGT GAG GAT TTT AAA GAG TTT GAT ATT AAG GAT GAA AAT 3950 GAA GAA GTT AAA ATG GAT GAA TAT GAA AAC GAT GAG GAA GAA ACA TAT GA 3900 A GAA GAA GAA GAA TAT ATT GAT GAG AAA AAT GAA AAT TAT GAA AAT AAA G 3850 AG GAT ATT AGT GAT AGG GAA GAT TTA AGT GAT ATG GAA AAT AAT AAT GAT 3800 AAG GAT GAT TTA AGT GAT ATG GAA AAT AAT AAT GAT AAG GAT GAT TTA AG 3750 T GAT ATG GAA AAT AAT AAT GAT AAG GAT GAT TTA AGT GAT ATG GAA AAT A 3700 AT AAT GAT AAG GAA GAT TTA AGT GAT AAG GAA GAT TTA AGT GAT AAG GAA 3650 GAT TTA AGT GAT AAG GAA GAT TTA AGT GAT AGG GAA GAT TTA AGT GAT AA 3600 G GAA GAT TTA AGT GAT AAG GAA GAT TTA AGT GAT AAG GAA GAT TTA AGT G 3550 AT AAG GAA GAT TTA AGT GAT AGG GAA GAT TTA TGT GAT AAG GAA AAT TTA 3500 AGT GAT AAG GAG GAT TTA AGT GAT ATG GAA TAT AGT AAT GAT AAG GAT GA 3450 T TTT AGT GAT ATG GAA TAT AGT AAT GAT AAG GAT GAT TTT AGT GAT AAG G 3400 AA GAT ATT AAT GAT AGG GAA GAT TTT AGT GAT AAG GAG AAT AGT TAT AAT 3350 GAA GAA TAT AAT AAT AAT GGA GAA GAG GAA AAT TTT AAG AGA GAG AAA TA 3300 T GAT AAA ACA ATT ATT AAT AAT TTA TAT TAT AGT AAA TGG AAT GTG GGT G 3250 TA GAA AAT GAT GAG AAT AAA TGG ATA GAT GAA AAC CAT GAA TTA ATG GAT 3200 AAG TGG AGT TTG ATT AAA AAT TGT ACA AAT GGG AAA TGG ATA GAT TGT GA 3150 A AAA ATT CAT GAT GAA TAT AGA AAA AAA AAA AAT TAC GAT GAT TCA ATG T 3100 GG GAA AAT ATT AAA CAG GAC GAC GAA GTT GAT GAA TGG GAT TTA GGA CAT 3050 GAA AAA GAA AAA GAT AAA TGG GTA TTT GTA GAG GGA TAT GAC TAT ACT AA 3000 T TCA GTT ATA GAA GAA GAA AAT GAC GAT GAA TTA AAA AAT ATT GAA TCA G 2950 AT GAT GAA CAG AAA TGG GAT TTC TCA GAA GAT GAA GAA GAC AAA TCT GAT 2900 TCT GTA GAA GAG AGA AAT GAT GTC GAA CAC CAA AAA AAA ATC GAA GAA GA 2850 A AAA GAT GAT GAA AAC AGT AAT TCT GGT AAA TGG GAT TTT ATA AGG AAT A 2800 AA GAA AAT GGA TGG GGT ATT TTG GAA AAT CAA AAA GAA AGA ATG AAT TTT 2750 TCA GAG AAA GAT GAA AAT AGA ATT AAT TTA ATT GAA TTA TAT TTT GAT AA 2700 T GTT TAT AAT TAT GTA GAT AGA AAA TAT GAA AAC GAG GAT TTG ATA TCA A 2650 GT GAA CCA GAA AAA GTA AAT GTT ATG AAA CAA GAG GAG GAA TAT AAT AAA 2600 AAT GAT GAT ATA GAT ATG AAT AAA TAT AGT AAA AAA GAC ATA GGA ATG TT 2550 T TAT TTG TAC CAA GAA GAA CTG AAA AAC GAA GGT GAT AAG GAA GAA TTG A 2500 TA AAT AAG AGA GAT AAC AAA AGG AAT AAA GAA AAT GAT GAA GAC ATT ACC 2450 ATA GAA AAT GAT GAA CAA ATT CTT AAC GGA AAT TAT GAA AAA GAA GGA AA 2400 A TCA AAG GAA CTT AAA GGA GAA AAT GAT TGT ATT AAT GAA TCA TCT GAA A 2350 AT ATT ATT AAA AAA AAA ACA GAT AAA AAA GAG GAT ATT AAT AAT AAT AAT 2300 AAT ACT ACA GAG AAT AAT GAA AAT ATA GAT TAT AAT AAA TTT ATA AAA GA 2250 T TTA AAA GAA GAT AAG GTT GAC AAT GTT TTT CAT GGT TTT GGA AGT TAT C 2200 CA CTA AAG AAA GAT ATC CTT GGT TTA TGG TGG GAA GCA CTT AGT ATA ATT 2150 AAA TTA GGT TTT GAA ATA ATA ACA AGA GAT TTT AAG AGT TAT ATG AAA AC 2100 T TAT TTA GAT AAA TAT GAA TAT AAT CAT AGA TCA ACA TAT GAA TAT CCT T 2050 TT ATA TGG AGT TAT ATT CAA TCA ACT TGG GGA AGA TGC ATA CTT AAT CTT 2000 GGA ATG GAA GTA GCT TCT GAA CAA AAA GAA TTT TCT AGA AAT TTC TAT CA 1950 T TTA CTT AAT AAA ACA GCC AAT CTT GAG GAT ATT ACA AAT TTT ATT TAT T 1900 CT GGG ATG ATG TAT TTT GAA AAA TTA AGA AAG CGC TTA TTA TAT AAA TAT 1850 AAG CAT ACG TTC CGT AGT AAA ATT AAG AAT CTA CCA GAT AAT GCT TTA AA 1800 T ATA AAA TTT TAC CAA GGT AAA CTT ATT TAG* 1770 stop chrblob_4181.glm_1|24oct01 ACAAAAAAA AAAAAATAAA 1750 AAATATATAT ATATATATAT ATATATATAT ATATATATAT AATCATAATG 1700 GGATTAACAT TATAATGTAG TATAAATCCA AATAAATAAT ATAATAATAA 1650 ATGGATCCCA TTCTTATTTT TGATTGTTAA TTTTTTTTTT TTTTTTTTTT 1600 TTTTTTAATT AACATATTTT GATGGGTTTA TATTATTTTT ATATGTCATA 1550 ATATCCTTAT TTATATTTAA TATTAAATTA TACGTTTGAT ATTGTGTTTA 1500 AAATGTATAA GAAAATATTA GATATTATGA TAAAGTAGTT ACACTATATA 1450 TATATATATA TATATATATA TATATATGTG AATTCAGAAA AAATGATATA 1400 ATAATATAAA ACCATATCAT ATTAGAAGTA AAATCCATGA ATAAATATAA 1350 AATTCTAGTA TTTATATTGA AGTATATATA ATATTATCTA ATTTATTATA 1300 ATTTTTTTAA AGGAAAAATT ATTTATTTTT ATGGAAAATA TATAAAACCA 1250 TATAAATTCA CTCTACAAGA AGGATAATAT ATATACTTAA TTATTTCAAA 1200 TTAAAATGAA TATATCCATA TTGAAATTAT CATTTTAATA TATATATATA 1150 TATATATATA TATGTTTTTT TATTCCACTA TTAAAATTTA TTGAAATTTA 1100 AAAAAAACTC AAAAATAAGA AACATATATA TTTCTCATGT TATATAAAAT 1050 AATTTGTTCT ACATAATTAA TATAGATATA AATCCTTTGA GTAAATATGT 1000 GGAGGTTATT GATTTATAAT TAAATTGAAG TATAAATTAA ATGAGAAGAT 950 AAATGTTACA TTTTACAATA TCTTCTGAAA TATAATTATA ATAAATTATT 900 TATATTTATT ATGATATTGA GAAAGGGTGT ACAAGATATT ATACTATATA 850 TATAATATTT ATATGAGGCT CTTTAATATA TATATATATA TATATATGCC 800 GTAAAAATGA AGAAAAATAA AATTATGTTG ATAAAATTAT TTACTTCCCA 750 ATAAATAACT TACACATCAA ATACTTTTAG TTAATTATAA ATATATTTTT 700 ATTATCAAAA TTTATTTTAT TTTATTTTAT TTTATTTTAT TTTATTTTAT 650 TTTATTTTAT TTTATTTTAT TTTATTTTAT TTTATTTTGT TTATTTATTT 600 TTTTATTAAT TAAATACAAC ATAATATATA GTTTGATATA TTTCTATAAC 550 TCTTACTTTA TATAATTCTT TTCTTATTTT TTTTTTTTTT TTTGTTCCAT 500 TTGAATCTTA AAAAAAAAAA CTAAGAAAAA AGAAAATTTA GAACATATAA 450 TATATTTATA TCAAATGTTG CTAAATTATT TAAATATACA AAGTTCAATT 400 AACCATCTGG TTATCTTATA GACAACTTTA TTTCTATATT TTTAACAATC 350 TTAATTATAT TATAAAAAAA AATAAATATA TATATTAAAA AAATATAGGT 300 GGACAGAAGG CACATAAAAA TATCTAAGCA AATTTTGTAA TTATACAGAA 250 TATTTCATTT TTTATATAAA AATATACTTG ATAAAATTTC AATACTTGTT 200 TAAAAAATTA TACATAAAAT ATTTTTCATA AAATTAACAA ATGCGAAAAT 150 GCTATAAAAG GAATATATCT AATAAAAATA TAGATAAAAT TAAAAAATAT 100 AAAAAGTATT TTAATTAATA ACATTAAATT CATATTAAAT GTATCAAAAT 50 GTCCTACACT AATGAATAAT ACACATATTA TATATATATA TATATATATA end of file 4182 10 + 1 telomere 4183 5 4184 5 4185 7 4186 5 4189 5 4191 9 9493..18049 telomere 4193 5 4194 5 Date: Saturday, 3/23/2002 Time: 23:50 c4195.txt chrblob_4195|2001.10.15|GENOMIC|Sanger FEATURES Location CDS join(2080..3022,3081..3151) /gene="chrblob_4195.glm_1|24oct01" /note="(protein coding) 25% identity to hypothetical protein C0425w - Plasmodium falciparum" /codon_start=1 ORIGIN watson strand 1 TTTTAAAATT TTTAAAAAAA AGGGCCCAAA AAAAAAAAAA TTACGCGAAA 51 AAAAAATATT AAACCCCTTT TTTATAAAAA AAAATTAAAT TTTTTTGGGC 101 CCAAGTTTTT TTTTTTTTTT TTTTTTTTTT TTCCTAAAAG TTTATTAAAA 151 AGGAAGAAAT CATGTTGATA ATCAGACATT TTAATAAACT CCCCCAAGAA 201 AAATCATAAA AGGTAAAAAA AAAAAAAAAA AAAAAAAAAA AAATTAAACA 251 CTATTTTCTT TTCATATTTA TATAAAATTA AATTTTTTTA TTTTCTATTA 301 TTTTGTGTAT CATGATGGAA AAGTACAATA TTAATTTTAC ATATTTATAT 351 ATATATATAT ATATATATAT TATATATATA TATTTAAATA TATTTATATT 401 TATGTAATTA TTTCTATGTA CACTTCTGGA AAGAGTAAAG AGAACATACA 451 TAATTAATAT TTTTTATGAG GACCCACATA TAATATTATT AATATATATA 501 TATATATATA TATCAAAGGA TTAATTAATA AAAAAAAATA TATTTATATA 551 TATAATGAAC ATAATAAATA AATAGTACTA TAATTGAAAT AATAAAGGGT 601 TTAATTTATT TTAATAATTG TACATGTTAT TTTATATATA TATAATAATA 651 ATATCTATAG AAAAACAAAA CATTTATATA TATATATTAT ATATATATAT 701 AATTATAAAT ATAATATTAT ATTTTAATAA TATATATAAA ATATTATATA 751 ATTATAATTA ATTATATAAA TTTATTTATA TGAAAAAAGT ACTATTACAA 801 CATTATATAT TTTATTTTAC ATTTTATAAG TATAATAAAA AAAATAATAA 851 TAATAAAATT TATATTCATA TTTATTATAT ATTATATATT GATTTTATTA 901 CATATATATT TTTTTTATAT ATAATTATTA CATTATAAAA TAAAGTAAAA 951 AAAAAAAATA TATATTTAAA AATTTTTTTT TTATCCTCAC ATAATATATA 1001 TATAATATAT TAAAAATTGT TCTCTAATTT ATATATAAAA ATAATAATAT 1051 ACATATTTTT ATATTTAACA TTACATAAAT AAGATATATA TATATATATA 1101 TATATATATA ATAATATTAA AATATATGAT AAATTAAATA ATATATTTTT 1151 TATACATATG AAAAAAATTT TATTATATAT ATATATATAT ATATATATAT 1201 ACAATATATA TATATAATAT ATATATTATA TTATAATATC ATTCTTACAA 1251 AAAGGATATA TATAATAATT TTTATTATAT ATAAATAATA TAATATTTAA 1301 AAATGTATAA ACATTTTTTT ATTTTATGAA ATATTTTCAT ATATAAATAT 1351 TTTTATTTCA TGTTAATCAG TATTATGATT ATATATATAA AGTAAAATAA 1401 ATTTATATAT TTACATATTT ATAAAAAAAT ATATATGAAA AAAAAAAAAA 1451 AATATATATA TATATATATA ATATATATAA TAATAATAAT TTAATCTATG 1501 TAAAAAAATA ATTGAAATAT TTTTAATATC TTATGTATTA AAAAAAAAAA 1551 AAAAAAAAAA AAAAACCAGA TATACTATTA TATATATATA TAGTAAAAAG 1601 GAAACACAGA GAAAAAAAAA AAAAAAATTA AGCATCATAC ATAAATATAT 1651 ATATATATAT ATATATATAT ATATTTACGA AATTAAAAGA ATATATTTGC 1701 TTCTCCCACA TTCTGTAATC CTTTAATGGA AATATGTTTT ACATATAATG 1751 TTTTTTATTT GAGATAGAAT ACAACAGAAA AAAAAAAAAA AAAAAAAAAA 1801 AAAAAAAAGG AGAACGAAAA AGAAAAAAAA AATAAATAAA TAAACCAAAC 1851 TACATACATA AAAATATATA CATATATATA TATATATATA TATAAGATAC 1901 CTTATATTGT ATATATGTTT AATATAGAAT TAAAAATCCC TCAAGCGTAA 1951 AGGTGACATA TATTTATATA TATATATGCA CCTATATATA TAATACCAAC 2001 ATTTTGTTAT ATATCCTATA TCGTAGTGTT TTTTTTTTTT TTAATTTTTT 2051 TTTTTAATTT TGAATATAAT TAAAAAATA start chrblob_4195.glm_1|24oct01 glm note partial gene exon 1 2080 ATG AGT AAC AAT AAA GAT AGC 2101 AGC AGT AAT AAA AAT ATG AAT AAA AAA AAG ATA GGA AAA GAT TCT ACA AT 2151 A AAT AAT AAT AAT AAT AAT AAT AAT AAT ACT GGT AAT AAT GAG GCC ATA A 2201 AT GAA GAT GTA AAT AAT GAG AAT AGG GCG GAC GAT AAT GTA AAA ACA GTA 2251 GAA GGA GAA AAT CAT GAA AAG AAA GAA GGA GGA AAT AAA AAC GAG AAA AA 2301 G GAC GAG GAG AAA AGG AAT GAT GAA GGA AAT CAT AGT AAT CTA TTG AAT A 2351 AG AAG AAA AAA AAT GAA ACA CAA TTA AAT GTA GAA TCA CAA CTA GAA GAA 2401 GAA GAG AAA AAT AAG AAA AAG AAA AAA TTC AAT AAA GGA ATG AAG CAT AA 2451 C GAT GAA AAA TCG GAA TTA ACA AAA GAG GAT GAA ATA TTA TTA GGA AAT T 2501 CA AAT GAT GAT AAT ATG AAG AAG AAG AAG AAA AAA AAA GAT CAA GAT GAG 2551 GAA GAA ATG GTA GGA CAA AAT GGT AAT ATT AAT CTA AAC AAT AAT GAT GT 2601 T AAT CAA AAA ATT GGT AAT ATA CAT GAA AAT GAT GGA GTA GAA GGG AGA G 2651 AA AAA CAA AAA ATA TCC TCG CAA GAA TAC AGA GGT GAT AAA AGT AAT GTT 2701 TTA GTA CCA TCT ACC TTT CAT CAG AAA AAT TTT AAG GAT AAA AAA CAT AT 2751 G ACA AGA ACG GAA AAA GGA GAT AAT TAT TAT AAT AAT GTT AGT CAC ATG C 2801 AT GAT TGG AGG AAT ACT TCA TCT CAT CAT TAT TAT ACA CAT CAT CAT AAT 2851 GAT AAT ATG AAG GGT GGT TTT ATG TAT CAC CAC ATG AAA AAT AAT AAT AG 2901 T AAT AAG AAT AAG AAC AAT AAT AAT AAT AAT ATT AAT AGT AAT AAT AAC A 2951 AT AAT AAT AAT AAT AAT AAT AAT AAT AAC AGT AAC AAT AAT AAT GAC AAT 3001 AAT AAT AAC AAT GAT GTA CAA AGT AAT GAA AAG ACG ATA CAA GAT TTT CA 3051 A CCT TCT ATG AAA GAT ATG AAT AAA AAA AGA AGC TTT AAT AAG AAT GAT A 3101 AT AAA AAT GTC GAT GGA GTT AAC AAT AAT AAT TAT AAT AAT AGC CCA GTG 3151 AAT AAT CAT ATG TAC AAA AAT AAC TTT AAG TAT GAC TAT AAG AAT AAT AA 3201 G GGTTACAAT TTAAAGATGG GAAAGGGTTA TAAAGTGCAG ACCATAACAA 3251 AT AATAACAA CAGCAATAAT AATAATAATA ATAATAGTAA TAATAGTCAC 3301 AAT AATAATA ATAATAATAA TAGTAATAAT AATCACAATA ATAATAATCA 3351 C AATAATAAT AATAATAATA ATAGTAACAG TACAAATTGT GAATTTAAAC 3401 CT GGCGAAGG GGTAATGGAT TCAATGAATA ATTTGTTTAT GTACAATAAT 3451 AAT GGTAATT ATAATTATTT AGGTAGCTAT GGATGTAATT ATCCATATAA 3501 T AATAACTAC TATGTAGATG AAAATGAGAA ATGTTATGAT ATAGGTAATT 3551 AT TATTCGGG AAAATTATAT CCAGAAGGTT ATAACGAGAA CAATTTTGAT 3601 GTG CGTTATA ATTATAATAT GATGAATGAT TTTTATAATT ATTTCCCTTT 3651 C AATTATTAT TATTACAATA TGAACAATTT ATATTTTAAT AATTCTAATT 3701 AT AATAATGG ACCTAATTTA TATAATGATT ATATGAAAAA TCGAAAGAAT 3751 AAA AAATTCT TATATGAGAA GGGGAAAAAG AAAAATTTTA AAAATATGAA 3801 T ACAAATAAT ATATATAATG AAATGAAAAC GAGAGTTATG GAAATATTCA 3851 AA AGAGAAAA TATTATGTCA GATGATTATT TGTTGTATTA TATGTACAAT 3901 AAT ATAAAGT TAAATATAGA TATAATATCA AAGCATCCAT ATATATCTCC 3951 T CTCATTAAT AATAATACGA ATATATTGGT AAATGTGTTG AACGATCTTA 4001 AG TGTATCAA TTTACCTAAA AAAGAATCAG CATCTGATAT AGATACGATA 4051 AAA ATTAATA ATGAGGAAGC TGATAATAAT AAGAATAATA ATAATATTGA 4101 T AGTAATCAT CAGTATGGTG ATAATAATAT TAATAATAAT AATAATAATA 4151 AT ATTACTGG TGAAGATGTT GTGCTTAAAG ATGAAAACAA AAAATCAAGT 4201 AAT GATTATG AGAAACAAAA TATTGATATG CATGAACCTA AGGCTGATGA 4251 T AAGGTGTTG TCTAATGAAG AAGTAGAAAA AAATATTGAT CGCGATAAAA 4301 AT GTAGACAT AAATGAAAAA ATGAAATTAT CAGAACAAAA TCATAAGAGT 4351 AAT GATAATA ATTATGATAA TGTGCCCAAC ATATGTAGTA ATGAAAAGAG 4401 T GATAATATT AATGTTAATA ATGATGTAAC TAATAATAAA AAAGAAACAT 4451 CG AATGAAAT AAATAAAGAT AGTAACAATA TATGTAAGAA TAATGATCAA 4501 GAA AATGACA CAAATAATAA TAATAATAAT AATAATAATA ATAATAGTAA 4551 T AGTGCTATT GATTTGATTA AGAACGATAT TGAAAATAAT GATATGTGTC 4601 AA AGTAATAA TAAAAAAGAA GAAAATGTTG AAATTATAAA TAATAATAAT 4651 AAT GAAAATA ATAATGTTGC TAAGATTAGT AAAAAAAGTT ATAATGAAAA 4701 A ATAAATAAT CAAGAAAATA ATAATAATAA TAATAATAAG AACAACAATA 4751 TT ATAACTAC TGATCAAATA GGTTCCATGA AAATATTGTT TGATGAAGAT 4801 AAT AAAAACT TTTTATTAAA TTTGAATAAC AGAAGAAATG TTATAATTAT 4851 A AGAGATATT AATTCTCATT ATATTAATAC TATAAAAAGT TTTGTTTTAA 4901 GT AGTCCGGG TATACAATCA AATGATGTCT TAAATATTAG AAGTGATATA 4951 AAC AATACTA TATTTATTAC TTTAAAAAAT GAAAAAAAAA CTGAATCTTT 5001 A GCACAGTAT TTAAAAACCA AAACAATAAA TGATAAAAAA TTAAATGTGA 5051 GA ATAAAGAC AACTCAAAAA ATTCAAAACA TTATTGAGAA TAATATATTT 5101 AAG GCATCAA CAAGTAATCA TGTTATAAAT ACTACAACTA ATAATATGAT 5151 T AATATTGTA AATAATGGTA ACAATAGTGC AATAGGAAAC ACAAATATGA 5201 AT AATTCTTC TAACAGAAAT AATAATAATA ATAATAACAA TCACAATAAT 5251 AAT AATATAA AAAGTAACAC TGTTAATAAT AATAATAATA ATAATGTTGG 5301 T ATTGTAAGT AACAGTAATA ATATGAACAG TCATATGAAT ATTTTGAATG 5351 GT GTAGGTAA TACTATACCA GTGAATGGAA AACAATTTTT TAATTTTAAT 5401 AAT TTATATT TTTTACCAAA TGCATTAAAT ACTTTTGATA ATAATATATA 5451 T TCAAATAAT GTTATGACTG GTGGAACTTC TACGACAGGT TCTGCAACAA 5501 AT GCG GCG TCT ACC ATT CCG TTT GAT GCT TAT ATG AGT TAT TAT AAT TAT 5551 AAT ATG AAC AGT AGT ACT TGT AAT TTA TTT AAT CCT ATG GCA TCT TGT GA 5601 T ACA TAT AAT AAT GCT TAT AAT ATG TAT GCC CCT CAT CAT CAT CAA GGA C 5651 AT AAC CAA AAT TAC AAT CAC ACT CAT AAC AAT CAT AAC TAT AAT CAT AAT 5701 AAT AAT AAT AGT AAT AAT AAC AAT AGT AAT AAT AAT AAT AAT AAT AAT AA 5751 T AAT AAT ACT TAT TTT CAA GGA AAC GAA TTA AAA GGG AAA GGT GGA ATG T 5801 AT CCT AAT AAA GGA ATG AAA TAT GGT AGA GGA GGA GCA AAC AAT GAA CAT 5851 TTT AAT AAT TTG AAA TAT TAT TCA AAT AAT TAT GGT AAT TAT AAC AAT GC 5901 A TAT AAT AAC TTC CAT GAA GGA GTT TCA AAT AGA AAT GAG CAT ATA ATA G 5951 AT GAA GCT AAT AGA AAA TAT CAT GGT GAA CAA AAT GTA AAT GAT AAT AAG 6001 GTA GTT CAT AAC AAT AGA ATG AAC AGA CCT ATA AAG GTG GAC ACA GAT AA 6051 T AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAA ... stop chrblob_4195.glm_1|24oct01 glm // crick strand 6090 TTTATTATTA TTATTATTAT TATTATTATT ATTATTATTA 6050 TTATCTGTGT CCACCTTTAT AGGTCTGTTC ATTCTATTGT TATGAACTAC 6000 CTTATTATCA TTTACATTTT GTTCACCATG ATATTTTCTA TTAGCTTCAT 5950 CTATTATATG CTCATTTCTA TTTGAAACTC CTTCATGGAA GTTATTATAT 5900 GCATTGTTAT AATTACCATA ATTATTTGAA TAATATTTCA AATTATTAAA 5850 ATGTTCATTG TTTGCTCCTC CTCTACCATA TTTCATTCCT TTATTAGGAT 5800 ACATTCCACC TTTCCCTTTT AATTCGTTTC CTTGAAAATA AGTATTATTA 5750 TTATTATTAT TATTATTATT ATTACTATTG TTATTATTAC TATTATTATT 5700 ATTATGATTA TAGTTATGAT TGTTATGAGT GTGATTGTAA TTTTGGTTAT 5650 GTCCTTGATG ATGATGAGGG GCATACATAT TATAAGCATT ATTATATGTA 5600 TCACAAGATG CCATAGGATT AAATAAATTA CAAGTACTAC TGTTCATATT 5550 ATAATTATAA TAACTCATAT AAGCATCAAA CGGAATGGTA GACGCCGCAT 5500 TTGTTGCAGA ACCTGTCGTA GAAGTTCCAC CAGTCATAAC ATTATTTGAA 5450 TATATATTAT TATCAAAAGT ATTTAATGCA TTTGGTAAAA AATATAAATT 5400 ATTAAAATTA AAAAATTGTT TTCCATTCAC TGGTATAGTA TTACCTACAC 5350 CATTCAAAAT ATTCATATGA CTGTTCATAT TATTACTGTT ACTTACAATA 5300 CCAACATTAT TATTATTATT ATTATTAACA GTGTTACTTT TTATATTATT 5250 ATTATTGTGA TTGTTATTAT TATTATTATT ATTTCTGTTA GAAGAATTAT 5200 TCATATTTGT GTTTCCTATT GCACTATTGT TACCATTATT TACAATATTA 5150 ATCATATTAT TAGTTGTAGT ATTTATAACA TGATTACTTG TTGATGCCTT 5100 AAATATATTA TTCTCAATAA TGTTTTGAAT TTTTTGAGTT GTCTTTATTC 5050 TCACATTTAA TTTTTTATCA TTTATTGTTT TGGTTTTTAA ATACTGTGCT 5000 AAAGATTCAG TTTTTTTTTC ATTTTTTAAA GTAATAAATA TAGTATTGTT 4950 TATATCACTT CTAATATTTA AGACATCATT TGATTGTATA CCCGGACTAC 4900 TTAAAACAAA ACTTTTTATA GTATTAATAT AATGAGAATT AATATCTCTT 4850 ATAATTATAA CATTTCTTCT GTTATTCAAA TTTAATAAAA AGTTTTTATT 4800 ATCTTCATCA AACAATATTT TCATGGAACC TATTTGATCA GTAGTTATAA 4750 TATTGTTGTT CTTATTATTA TTATTATTAT TATTTTCTTG ATTATTTATT 4700 TTTTCATTAT AACTTTTTTT ACTAATCTTA GCAACATTAT TATTTTCATT 4650 ATTATTATTA TTTATAATTT CAACATTTTC TTCTTTTTTA TTATTACTTT 4600 GACACATATC ATTATTTTCA ATATCGTTCT TAATCAAATC AATAGCACTA 4550 TTACTATTAT TATTATTATT ATTATTATTA TTATTATTTG TGTCATTTTC 4500 TTGATCATTA TTCTTACATA TATTGTTACT ATCTTTATTT ATTTCATTCG 4450 ATGTTTCTTT TTTATTATTA GTTACATCAT TATTAACATT AATATTATCA 4400 CTCTTTTCAT TACTACATAT GTTGGGCACA TTATCATAAT TATTATCATT 4350 ACTCTTATGA TTTTGTTCTG ATAATTTCAT TTTTTCATTT ATGTCTACAT 4300 TTTTATCGCG ATCAATATTT TTTTCTACTT CTTCATTAGA CAACACCTTA 4250 TCATCAGCCT TAGGTTCATG CATATCAATA TTTTGTTTCT CATAATCATT 4200 ACTTGATTTT TTGTTTTCAT CTTTAAGCAC AACATCTTCA CCAGTAATAT 4150 TATTATTATT ATTATTATTA ATATTATTAT CACCATACTG ATGATTACTA 4100 TCAATATTAT TATTATTCTT ATTATTATCA GCTTCCTCAT TATTAATTTT 4050 TATCGTATCT ATATCAGATG CTGATTCTTT TTTAGGTAAA TTGATACACT 4000 TAAGATCGTT CAACACATTT ACCAATATAT TCGTATTATT ATTAATGAGA 3950 GGAGATATAT ATGGATGCTT TGATATTATA TCTATATTTA ACTTTATATT 3900 ATTGTACATA TAATACAACA AATAATCATC TGACATAATA TTTTCTCTTT 3850 TGAATATTTC CATAACTCTC GTTTTCATTT CATTATATAT ATTATTTGTA 3800 TTCATATTTT TAAAATTTTT CTTTTTCCCC TTCTCATATA AGAATTTTTT 3750 ATTCTTTCGA TTTTTCATAT AATCATTATA TAAATTAGGT CCATTATTAT 3700 AATTAGAATT ATTAAAATAT AAATTGTTCA TATTGTAATA ATAATAATTG 3650 AAAGGGAAAT AATTATAAAA ATCATTCATC ATATTATAAT TATAACGCAC 3600 ATCAAAATTG TTCTCGTTAT AACCTTCTGG ATATAATTTT CCCGAATAAT 3550 AATTACCTAT ATCATAACAT TTCTCATTTT CATCTACATA GTAGTTATTA 3500 TTATATGGAT AATTACATCC ATAGCTACCT AAATAATTAT AATTACCATT 3450 ATTATTGTAC ATAAACAAAT TATTCATTGA ATCCATTACC CCTTCGCCAG 3400 GTTTAAATTC ACAATTTGTA CTGTTACTAT TATTATTATT ATTATTATTG 3350 TGATTATTAT TATTGTGATT ATTATTACTA TTATTATTAT TATTATTATT 3300 GTGACTATTA TTACTATTAT TATTATTATT ATTATTGCTG TTGTTATTAT 3250 TTGTTATGGT CTGCACTTTA TAACCCTTTC CCATCTTTAA ATTGTAACCC 3200 TTATTATTCT TATAGTCATA CTTAAAGTTA TTTTTGTACA TATGATTATT 3150 CACTGGGCTA TTATTATAAT TATTATTGTT AACTCCATCG ACATTTTTAT 3100 TATCATTCTT ATTAAAGCTT CTTTTTTTAT TCATATCTTT CATAGAAGGT 3050 TGAAAATCTT GTATCGTCTT TTCATTACTT TGTACATCAT TGTTATTATT 3000 ATTGTCATTA TTATTGTTAC TGTTATTATT ATTATTATTA TTATTATTAT 2950 TGTTATTATT ACTATTAATA TTATTATTAT TATTGTTCTT ATTCTTATTA 2900 CTATTATTAT TTTTCATGTG GTGATACATA AAACCACCCT TCATATTATC 2850 ATTATGATGA TGTGTATAAT AATGATGAGA TGAAGTATTC CTCCAATCAT 2800 GCATGTGACT AACATTATTA TAATAATTAT CTCCTTTTTC CGTTCTTGTC 2750 ATATGTTTTT TATCCTTAAA ATTTTTCTGA TGAAAGGTAG ATGGTACTAA 2700 AACATTACTT TTATCACCTC TGTATTCTTG CGAGGATATT TTTTGTTTTT 2650 CTCTCCCTTC TACTCCATCA TTTTCATGTA TATTACCAAT TTTTTGATTA 2600 ACATCATTAT TGTTTAGATT AATATTACCA TTTTGTCCTA CCATTTCTTC 2550 CTCATCTTGA TCTTTTTTTT TCTTCTTCTT CTTCATATTA TCATCATTTG 2500 AATTTCCTAA TAATATTTCA TCCTCTTTTG TTAATTCCGA TTTTTCATCG 2450 TTATGCTTCA TTCCTTTATT GAATTTTTTC TTTTTCTTAT TTTTCTCTTC 2400 TTCTTCTAGT TGTGATTCTA CATTTAATTG TGTTTCATTT TTTTTCTTCT 2350 TATTCAATAG ATTACTATGA TTTCCTTCAT CATTCCTTTT CTCCTCGTCC 2300 TTTTTCTCGT TTTTATTTCC TCCTTCTTTC TTTTCATGAT TTTCTCCTTC 2250 TACTGTTTTT ACATTATCGT CCGCCCTATT CTCATTATTT ACATCTTCAT 2200 TTATGGCCTC ATTATTACCA GTATTATTAT TATTATTATT ATTATTATTT 2150 ATTGTAGAAT CTTTTCCTAT CTTTTTTTTA TTCATATTTT TATTACTGCT 2100 GCTATCTTTA TTGTTACTCA T 2080 "chrblob_4195.glm_1|24oct01" TATTTTTTA ATTATATTCA AAATTAAAAA 2050 AAAAAATTAA AAAAAAAAAA AACACTACGA TATAGGATAT ATAACAAAAT 2000 GTTGGTATTA TATATATAGG TGCATATATA TATATAAATA TATGTCACCT 1950 TTACGCTTGA GGGATTTTTA ATTCTATATT AAACATATAT ACAATATAAG 1900 GTATCTTATA TATATATATA TATATATATG TATATATTTT TATGTATGTA 1850 GTTTGGTTTA TTTATTTATT TTTTTTTTCT TTTTCGTTCT CCTTTTTTTT 1800 TTTTTTTTTT TTTTTTTTTT TTTCTGTTGT ATTCTATCTC AAATAAAAAA 1750 CATTATATGT AAAACATATT TCCATTAAAG GATTACAGAA TGTGGGAGAA 1700 GCAAATATAT TCTTTTAATT TCGTAAATAT ATATATATAT ATATATATAT 1650 ATATATTTAT GTATGATGCT TAATTTTTTT TTTTTTTTTC TCTGTGTTTC 1600 CTTTTTACTA TATATATATA TAATAGTATA TCTGGTTTTT TTTTTTTTTT 1550 TTTTTTTTTT TAATACATAA GATATTAAAA ATATTTCAAT TATTTTTTTA 1500 CATAGATTAA ATTATTATTA TTATATATAT TATATATATA TATATATATT 1450 TTTTTTTTTT TTTCATATAT ATTTTTTTAT AAATATGTAA ATATATAAAT 1400 TTATTTTACT TTATATATAT AATCATAATA CTGATTAACA TGAAATAAAA 1350 ATATTTATAT ATGAAAATAT TTCATAAAAT AAAAAAATGT TTATACATTT 1300 TTAAATATTA TATTATTTAT ATATAATAAA AATTATTATA TATATCCTTT 1250 TTGTAAGAAT GATATTATAA TATAATATAT ATATTATATA TATATATTGT 1200 ATATATATAT ATATATATAT ATATATAATA AAATTTTTTT CATATGTATA 1150 AAAAATATAT TATTTAATTT ATCATATATT TTAATATTAT TATATATATA 1100 TATATATATA TATATATCTT ATTTATGTAA TGTTAAATAT AAAAATATGT 1050 ATATTATTAT TTTTATATAT AAATTAGAGA ACAATTTTTA ATATATTATA 1000 TATATATTAT GTGAGGATAA AAAAAAAATT TTTAAATATA TATTTTTTTT 950 TTTTACTTTA TTTTATAATG TAATAATTAT ATATAAAAAA AATATATATG 900 TAATAAAATC AATATATAAT ATATAATAAA TATGAATATA AATTTTATTA 850 TTATTATTTT TTTTATTATA CTTATAAAAT GTAAAATAAA ATATATAATG 800 TTGTAATAGT ACTTTTTTCA TATAAATAAA TTTATATAAT TAATTATAAT 750 TATATAATAT TTTATATATA TTATTAAAAT ATAATATTAT ATTTATAATT 700 ATATATATAT ATAATATATA TATATAAATG TTTTGTTTTT CTATAGATAT 650 TATTATTATA TATATATAAA ATAACATGTA CAATTATTAA AATAAATTAA 600 ACCCTTTATT ATTTCAATTA TAGTACTATT TATTTATTAT GTTCATTATA 550 TATATAAATA TATTTTTTTT TATTAATTAA TCCTTTGATA TATATATATA 500 TATATATATT AATAATATTA TATGTGGGTC CTCATAAAAA ATATTAATTA 450 TGTATGTTCT CTTTACTCTT TCCAGAAGTG TACATAGAAA TAATTACATA 400 AATATAAATA TATTTAAATA TATATATATA ATATATATAT ATATATATAT 350 ATATAAATAT GTAAAATTAA TATTGTACTT TTCCATCATG ATACACAAAA 300 TAATAGAAAA TAAAAAAATT TAATTTTATA TAAATATGAA AAGAAAATAG 250 TGTTTAATTT TTTTTTTTTT TTTTTTTTTT TTTTTTACCT TTTATGATTT 200 TTCTTGGGGG AGTTTATTAA AATGTCTGAT TATCAACATG ATTTCTTCCT 150 TTTTAATAAA CTTTTAGGAA AAAAAAAAAA AAAAAAAAAA AAAAACTTGG 100 GCCCAAAAAA ATTTAATTTT TTTTTATAAA AAAGGGGTTT AATATTTTTT 50 TTTCGCGTAA TTTTTTTTTT TTTGGGCCCT TTTTTTTAAA AATTTTAAAA end of file 4196 5 4197 5 4198 5 4199 5 4200 4 4201 4 pfemp1 var 4203 9 telomere 4205 6 4206 3 telomere 4207 5 4208 4 4209 5 4210 4 + 10 chimera 4212 5 4213 5 head varies 4214 5 4215 5 4216 4 4217 6 centromere chr7 variant copy 4218 5 4219 5 4220 5 4222 5 4223 4 pfemp1 var 4224 5 Date: Wednesday, 3/20/2002 Time: 11:42 c4225.txt chrblob_4225|2001.10.15|GENOMIC|Sanger FEATURES Location CDS 696..1622 /gene="chrblob_4225.glm_1|24oct01" /note="(protein coding) 28% identity to CAX4p contains 3 short stretches of amino acids that are characteristic for a wide variety of phosphatases, including lipid phosphatases and a protein phosphatase.; Cax4p" /codon_start=1 CDS complement(join(2790..2914,3164..7388)) /gene="chrblob_4225.glm_2|24oct01" /note="(protein coding) 55% identity to (AL034560) PFC0060c (MAL3P8.10), Serine/threonine protein kinase, len: 587 aa; Similarity to protein kinases; predicted using hexExon; alternatives exist for 5' donor [Plasmodium falciparum]" /codon_start=1 CDS join(7535..7619,8157..8254) /gene="chrblob_4225.glm_3|24oct01" /note="(protein coding) 36% identity to (BC012382) Unknown (protein for MGC:21495) [Homo sapiens]" /codon_start=1 ORIGIN watson strand 1 GCCTTGGGGG CTGCACCCAG TTTTCGTGTA AGATCCACTC CTATTATATA 51 TATATATATT TATTTATATA TTACATATAT ATTTATATAT CCCATATATA 101 TGCAATATAC ATAAAATATA AAAGTATAAT AATTAGATTC TGTAATTTTT 151 TTCTTTTGAA AATTAAGAAT GCTTTCTTTT TCTTAATTAT ATATATTTAT 201 ATATATTTTT TATGAAATGA AAGAGAAAAA AAATTGTATT TAAATTTTGT 251 AATTTATTTT TTAAAAAAGT ATAATATATA TGAATTTAAT TTTTTTTTTT 301 TTTTTTTTTT TTAATAATTA TAAATATTAT ATTATATATA TGTAATATAT 351 ATATATATAT ATATAATTAT ATATATATAT ATATTTCTTA TTTTATTCAT 401 TTGTCATTTT TTTTAAAAAT AAAAAAAAGA AAAAGTCCAA TTACGTATAA 451 AGTGAATAAT AAGAAGATTA TAAATAATAT AGTAATAAAA AATATATAAA 501 TTTTTTTTTT ATACGAAGCT ATAAAAAGTG AACAAAATAA TATATATATA 551 TATATATATA TATTTATATA TTTATGTAAT ATTTTTATAT GTTTAAGAAT 601 TTATGATGAT ATGCACTTGT AATGATATAA AAATAAAATA ATTAAAACAT 651 TTCATGTGAT TTTATAAAAT CCTTATATAT AAAAAT TAG TTT AGT start chrblob_4225.glm_1|24oct01 glm exon 1 696 ATG TT 701 A ACA AAA GTT TAT TTA CCT ACG TTA TTA CAT GTC GGT TAT TTG TTT AAT A 751 CA ATA CAA TGC ATA AAT ATA ATA AAT TAT CTT ATA TTT GGG GGG TCT GAT 801 AAA GAT TCT CCT AAT AAA AAT TCA AGT GAT AAT AAA GAG GAA AAA AAT AA 851 A AAG ATG GAA GAA TAT ATT GAT GAA AAG ATG AAA ATA AAT TTG CGT AGT A 901 AA AAG ATA AAT AGT TTG AAA CCA ATA TAT ACA AAT ACT GAA TTA GAA ACG 951 AAT TAT TAT ATA GAT AAT AAT GAG ACA TTT AAG AAA TTA TAT GCT AAC TA 1001 T CCA ATA TGT GAG GCA AAA TAT AAA TTA GTT GAT AAA TTA AAA TCA TTT A 1051 AA ATT TTT AAA AAA TTA ATG ACA GAT AAA CCT AAA AAA ATT ATT TTA TTT 1101 AAA ACA TGT ATA ATA GAA TTA TAT GGA ATG TTA TCC GTA ACA ATA AGA AA 1151 T GTA AAT AAT TTC TCA TCA GTA ATA GCA ACA GTA TAT GGA TAT GTT CCA T 1201 TT TTA ATA ATG ATT TTA ACA GTA TTT GGT TTC ATA ATT ACT TTT AAT AAA 1251 AAC TTA CTT TAT ATT ATT TTT ATA ATG CCG ACA CAA ACC TTA ATT AGT GA 1301 T TTA TTT TTA AAA AGA ATA TTT AAA AAA CCA AGA CCA ATT AAT AGT GCA T 1351 TG CCA ACT TAT GGT ATG CCA TCA AGT CAT AGT TCC TTT GCA ATA GCT TTA 1401 TTA ACT TTT CTT TTA CTT CAT ATT ACA GAA CAG AAA AAA GAC AAA TGG AG 1451 T ATT ATC ACA TAT GTA ATA GCT ACT CTT ACC TTA CTC CCC ATA CCT TGG A 1501 GT CGT GTT GAA GTT GAA GAT CAC ACC GTT TTG CAA GTT ATA GTT GGT TCT 1551 CTT GTA GGT ATA GGT TTT GGA TTT ATT TTC TAT TTT ATG AAA AAG TAT TT 1601 T TTT AAA CAT AAG GAT TCA TAA* 1622 stop chrblob_4225.glm_1|24oct01 CTATAACG AAAATAATAA AAAATTTGTA 1651 AAATAACCAT GATTATATTG TTATATTATA TATACTTAGC AGAAATATAA 1701 TCCACAGAAT TATCTACATA GGGGAAAACT AGGAATGTAA TGATCGTTTA 1751 ATTGATGAAT AATATATATA TATATATATT ATATTTATAT CTATGTATAT 1801 TTATATATAT AAGGAAAAGT ACCCTTTTTT ATATTATTTT ACAAGTATAT 1851 ATATTTTACA AATTATGTAA GGCGCGCTAC CCATAATAAT TCGTTTTTTT 1901 TTTTTTTTTT TTTTTTATAA TTCTCTTTAT TTTTGTAATT TCTTTTAAAG 1951 ATAAAAAAAA AAAAAAAAAA CACAAATGGG TATGCAATGA TTTTAACGTG 2001 AACATATATA AGTGTATGTT CTAATATATT TTTTATTTTA ATTTATTACC 2051 TTCTTTTATT AATTATTAAT GATTTATTTT ATTTTATTTT TTTTTTTTTT 2101 TGTGATACAT AATAAAAATA TCCAGTTTTT TTTTTTTTTT CTCCCAATTT 2151 TTGTTTTAAT ATATTTATCA AATATATTAA TACATATTTG TGTTTTATTT 2201 TAATTTTTTT TTTTTCTTTT TAATTTTGGA TTTTATTTTA AATGATATAT 2251 AAAAAAATAA CTCTTTAAAT TTTAATAAAC TTTTAATATA TATATATATA 2301 TATATATATA TATATATATA TATATATTAT ATGTCAAGAA AAGAAAAAAA 2351 AATATATTAT ATTATTTTTT TTTTTTTTTT TTTTGAACTG ATCTATTTTA 2401 AAATATTATA AATTTTATTA AATGTAATAC AGAAAAAAGT ACTAAAAAGA 2451 AAAGGATTTT TTAAAAATGA ATGAAAACAA AAAAAGGGAA AAATGAAAAA 2501 ATAAAAAAAT AAAAAAATAA AAAAATCAAT AAACATTCTT TTTTATTTTT 2551 AAAAAAATAA AGATAAAAAA AATATATATA TATATATATA TATATATTAA 2601 CTTCATTATA TATTATATGT AAAATGGGAA AAAATATATA TCTACTTATT 2651 TTATATACAT ATATTTGTGT AAAAGGATAT ATTTTTATAT TATAAAGATG 2701 GTTATATAAT TTTTTGTAAG AAATCCAAAA ATGTTGAGAT TCCCACATGT 2751 CTATTTTGAT ATTATTTCAT TATATATGAA AATAAAATA "chrblob_4225.glm_2|24oct01" 2790 T TATATATATA 2801 TATATATATA TATGTAATAA TAATGCTGAC AAATTATAAC TTGAAAGACC 2851 ACCATGGATG TGCGCTTAGA TCTTTCAAGT TCAACTTCTT TCTCTGTTCT 2901 ACATGTAATA ATTGCTGTAA AAAAAGAAGA AATATACAAA TAAATAAATA 2951 TAAATATATA TATATATATA TATTATATAT ATATATATCG GGTTGTTTAA 3001 GATTTTTTTT TTTTTTTTTT TAAATTATCA TATATCAACA ATATGAAACA 3051 TTTATACAAC ATATAATACT ATATAATAAT ACACTACTAT CCTACCTTGA 3101 TGATATCTTT TAACTCATTT GGCCAATTTT TTGTTAACTC AAAATTATCA 3151 AAATTCATAT CACATTTTAC GAAATAGAAA AAATCCTCAT CTTGTAATGG 3201 ATCTGAACAT TTCCATAAAT TTCCGTTTGT CCAAATCCAA AAGAAGAACA 3251 CACCAAGCAT AAACTTATCA GCATTAGAAA CATCGAAATA AAATTGTTTT 3301 CGTTTTTCTT GATCTGTAAT ATGCTTTAAA TCTTTTAGAG GATTTTTTAT 3351 TTTCATTGTA TCATATTTCC AATATATTTT CCAACATTCT GGTGGCATAT 3401 ATGCCCCTTT TGCAATAGTA GGTTCACATG ATTCAAATAA ATAGAGACGG 3451 TTCATATCTT TAATGTGTCT TAAATTGTAT GTATAGATGG GTGTACTTTT 3501 AGATAAGTCA CAGAAACGTA ATTCATAATT ATCAGAGATT AAAATATTTT 3551 CTGGTGTTAA ATCTAAATGT GATAGGCCTG CATCATGTAA TCGTATTAAT 3601 AATTTTAAAC ATTGGTATAA TATAAAACTT TTTTCATTAT TACTGATTTT 3651 CATATTATAT TTTTTTTGTC TACGATCTAT AAAATCAAGT ATATCTTCAT 3701 TAAAAAATTC AGAGACGATA ACAATATTAC CACCAACATT ACATTTCAAT 3751 CTTTCACTTA GCATATCATT AAAAACATTT AAATTATTAT ACATAGATTT 3801 CTGTGAAAGT CCTTCATTAA AATATTTGTT ATCTGGTTCA TATAATATTT 3851 TATATAACTT TGGTGTGATT CCTGGATGAT ACTCATTTAA AAAAGCTAAA 3901 GCCGTAGCTT CCATTACAAA ATTTTCTCCA TCTGTTACAT ATTCTCCATC 3951 ATATTCATTC ATCAAATTAA ATTGTTTAAC CCATATATAT ATAGGAATTT 4001 TTTTAATAAA TAATTTAACT TCCTTTTTTA CATTACTATC TTTTGGAACA 4051 ACAAAAGCTC TATACATTTG TTGAACTCTA TTACTAGATT TAGAAAATCC 4101 AAGAGTTGGT ATGCACGTAA ATTTCCAATC TGAATATTTA ACACCGTTGA 4151 AATAAAAATT ATGTGCACTA TGTAACATTT TCATTAATGA CTTTTTAGCT 4201 ATTTTCCAAT TAAAGATACA TTTAGGTCTC ATTTGTTTAT CCATATTATT 4251 ATTATTGATA TGATTCATAT ATATTATTGG TTTATTAATA CACTCTTTAT 4301 TATTAATAAT ATTATTACTA TTGCTATTAT TATTAATATT ATTATTATTA 4351 TTATTAATAT TATTATTATT GTTGTTATTG TCGTATGGAT AATTATAATA 4401 CTCATTACCT AATCCTTTCT TTGGAATATT CATTATTTCC ATTTTGTGCA 4451 CATAATTATT ATTCTTACTT TCAGATATTC TATTCACATT ATGTTCTTTA 4501 CAAGTATTAT TTTTAAATTT GCTCCAAATA TTTTTTATCT TTTGTTTTGA 4551 AATAGATAAC ATAGGATTCC TATCATCCTT TAATAAATCA TTTCTTTGAC 4601 ATGTAGGAAG TATATAAGAA TTTCCTTGAC CATAATGCAT TTCAGGATTA 4651 TCACATTTAG ATATAATTGT TGTATCTCTA TTCATGCTAT TATAATTATT 4701 ATCTTCATTA TTATTTTTAT AAATATGTGT ATGCTCATCT AAATCCAATT 4751 TCTCATTTGA AACATATTTA GGTTGTTTCA TATCTTTATT CTTCATTCGT 4801 TTCTTTTCTT TTTCTGAAGA ATAATACACA GGGTTTTCTT TTATCTTTGA 4851 AATTAAATCA TAGTCTCTGT TATTTAATAA ATCATTATAT GTATTGGATG 4901 GATTTTCATA TTTGATGTTT TTAATAATAT CTTCTGGGAG GTTATTTCGG 4951 AAATATTCAT CTAAAGATTT ATCATAAGAA TTATCATTAT TATAATTATT 5001 ATCATTATTA TAACTCTTAT CATTATTATA ACTCTTATCA TTATTATCAT 5051 TATTATTACT GTTCATATTT CCTGGAACAA CAAAACTATT GTAATTATTT 5101 CTGTTACTAT TATTGCTATT TCGATTGCTG TGAGTATTAT TACTATTTCG 5151 ATTGCTGTGA GTATTATTAC TATTTCGATT ACTATGAATA TTATTACTAT 5201 TTCGATTACC ATGTATATTA TTACTATTTC GATTTCCATG TATATTATTA 5251 CTATTTCGAT TACCATGAAT ATTATTGTTA TTCTTATTTA TATTACCATT 5301 ATAATTATTA TTATTCCTAT TAATATTATT CTTATGAACA GCGCTTTTTG 5351 TCCCTTCACT ATCTCTCTTG GACGTTGAGT CAATATAACT TGGTTCTATC 5401 CTTTCACACA AGTTATTCAT AATATTTTGT TCATCTTTTA TATATCCATT 5451 ATATTGACTA TTTTGAAATG CTATATTATT TTGGTTTCTT AACATATCAT 5501 TAATTCCTTC TTGATTTAAA TGGAAACCTT TTTGTGATAT ATTATGCATA 5551 TTATTGGGCA TATCATTTTG ACCTGCTCCT CTTAATATGT CATTATTTTC 5601 ATTATAATTA TTTTTCATGT TCTTATCATT TATATTACAT TTCTTTTTAA 5651 AAAGATCATT TGAAATGTCA ACATTATATT TACTACCATT TTTATCTATA 5701 TAAATTTGTT GAGAAAGGCT CTTATAAAAT GAATCTTTAT TATTAACAGC 5751 ATCATCTCTT GAATTTATTA TATAACCATT ATCATCTATT TCATGATGAA 5801 CTTTATTATG GTCACGGTAT TTTTCTTCTT CCATCGTAAT ATGTATATTT 5851 TTATTTTCTA CAGTATTAAA AGGAAAATTG ACATATGATT TATTCTTATT 5901 TTCACAACCA ATAGGTGTAT GTAATAAAGA ATTATTATCC TTAACATCCA 5951 CTTGTTCATA ACTTCTGAAA TTTGCATTCA CATCTTTAGG TAAATATGTA 6001 TTATCTAATA AATTACCCTG TATATGATTA TTTGTAATAC ATTTGGGCAC 6051 ATCTTTAACT ATTGTACATT CGGTGGTACT ATCATTAATA TTTTCCGTTT 6101 CGTTATAAAT ATCTTGATTA CTTAACATAT TCTTATAATC TCCATTTTTT 6151 TTATAAAAAG TATCATTTTT TTTTCTTTCT TCTTCAGTGT TATTATTATG 6201 ATCATTCAAA TTATAATTAT TATTTGAATT CTTATCTTCC TCATCATTAT 6251 CACCTTCATC TTCATCCTGT TCCTTTTTAT TTCTATACAT AATGTTTTCA 6301 GTATAATTTT CATTTCCCAT ATTTTCATAA CTTTCTAAAT TTGAATTATT 6351 ACCAATGACA ACATTATTAT CTTCTTCTAC ATTCATTTCA TTAAAATTTA 6401 TTCCTGAACA ATCTTTAGGA TCCATAGAAA TATTTCTATA AACATTTTTA 6451 ATATCATCCT TATTTGTATC TTCCTTCATC ATAATAGTAC TATTAAAATT 6501 TTGATTATTC GTTTGTTTAT ATTCATCTGT ATATTCTATA CAATTCATAT 6551 TATCAAATAT TTCTGTTGTG GATCTGTTCA TTTCGGAATA TTTATCTTTT 6601 GACATGGTAC ACACAAATTC TTTATCATTA ACAAAATTTT TCGAGCTATC 6651 ATTATTTTTG GTATCCTCTA TATATTTCAT AAAAATATCT TCTTCATTCA 6701 TAATTGTATT ATTATTATTA TTATTATTAT TGTTATTGTT ACTATTATTA 6751 TTATTATCTA ACATATTTTT ATTCATAAAC TTTTCAGATA AGTCTTTAGA 6801 TTCTTTTGGA TAATTATCAA ACGACTCATT ATCATCTTTA GAAATCATAT 6851 GCTGCACATT TTCATAATAT GTTGTATTCA CCATATTTCT ATCATACATA 6901 CTATTCATAT TATTATTATT ATTACTATTA TCTTCATCAT CTCTTTCTTC 6951 TAAACCATTA TATTTTGATG AGTTTCTTTT TGTATTATTA CTTTTTCTAT 7001 CAGTACTTTT AATATTATTT CCCTCACACA TATCAACATT ACTTTTATCA 7051 ACATTACTTT TATCAACATT ACTTTTATCA ACATTACCTT TATCAATATT 7101 ATTTTTATCA ACATTACTTT TATCAACATT ACCTTTATCA ATATTATTTT 7151 TATCAACATT ATTTTTATCA ACATTTTTTT TTGGATTGTA TTTCTTATTT 7201 TTATATAATG ACACATCTTC AGCATCATTC ATATTTTGTA CATCTCTTCT 7251 TTCATTCCCT AACTTTTCAT ATTCTTCTTC TCCGTTATCT ATATTTAGGG 7301 TCTTCGAAGA TTTCAATGAT AAATAATCAT CATCACAAGT CATGGTTTTG 7351 GATTTGCAAT ACTCCACCTT TTCGCTAGTT CTTATCAT 7388 "chrblob_4225.glm_2|24oct01" TT TATAATAAGT 7401 ATGTAAAAAT TATATATATA TATATATATG TTAATCTATA TTCGCAAAAA 7451 ATATTACCTA TATGTAAAAA TATATATGAT TTGTTTTTAT CACATATACA 7501 TTATATATAT ATATATATAT ATATATATAT ATAT no gene chrblob_4225.glm_3|24oct01 7535 ATG TAT GTA TGT ATG T 7551 AT GTA TGT ATG TAT GTA TGT ATG TAT GTA TGT ATG TAT GTA TGT ATG TAT 7601 GTA TGT GCT ATA TAT GCA T 7619 G TATATTATAT ACGTATTATA TGCATAAGTT 7651 TGTAAAATAG AGATTGTCAT TATAAAACAT ATACACTATA AAAAATGTAC 7701 CATTAAGAAT GGGACAACTA AGAAATAAAT AATATTTTTG GTCATGTAGG 7751 AAAAATCGAA ATATACAATG TATATGAATA TATATATATA TATATATATA 7801 TATATATATA TGTATATATT TTTTATTTTT TTTTTGTGCC TATATTTGTA 7851 TGTAAATTTT GCATTTAATC ATAAATATAA ATATATATTC TTCTTATTTA 7901 AAAAAAAAAA AAAAAATGCT ATACTTGACA AAATTTAAGG ACAACATGTA 7951 AATATAAATA TATATATATA TATATATATA TATAATAAAT AAAAAAAAAA 8001 TACATATACA TATATATATA TATATATTAA CACGATTAAA AAATACACAA 8051 AGGAAAAAGC ATATTTTATA AAACTTTATA ATTAAAGTAT AGTGTTGCAA 8101 TATAATACAA ACATTATATA ATAATATATA TATATATATA TATATATACC 8151 ATATAG no gene chrblob_4225.glm_3|24oct01 8157 AC ATT AGT TTT GTG GTA TGT GTT AAT ATG GAA AAA TAT AAA ATA 8201 AGT AAA AAC AAT ATG TGT ATT TAT GTA CAT TAC TTT GTA TCA TCC ACT GA 8251 T TAG* 8254 AAAAAT AAAAGATAAA ATCTTTATAT ATATTAATGT ATACATAATT 8301 GCAGACAACA TATATTTCAT ACAAAAATCA ATTCACTTTT AAGAATTATA 8351 ATAATTACTC ACATAAAAGA ATTTATAATA AAAAAAAAAA AAATAATAGT 8401 AATAAATAAA ATAAACTTTA ACGGTTTTAA TATAAAAGTA ACATACACAA 8451 ATTACACAAA AAAAAAAAAA AAAAAAAAAA GGAAAAACCT TAAAAAAAAA 8501 TGTTTATTTC ATACTTTGAT AGTTTATTCA AAAAAAAAGG CAATTATGTA 8551 AAGATACACA TAAATGTTTT ATATCATTTT GTTTATATAT ATATTAGAAT 8601 ATTAAAAAAA // crick strand 8610 TTTTTTTAAT 8600 ATTCTAATAT ATATATAAAC AAAATGATAT AAAACATTTA TGTGTATCTT 8550 TACATAATTG CCTTTTTTTT TGAATAAACT ATCAAAGTAT GAAATAAACA 8500 TTTTTTTTTA AGGTTTTTCC TTTTTTTTTT TTTTTTTTTT TTTGTGTAAT 8450 TTGTGTATGT TACTTTTATA TTAAAACCGT TAAAGTTTAT TTTATTTATT 8400 ACTATTATTT TTTTTTTTTT TATTATAAAT TCTTTTATGT GAGTAATTAT 8350 TATAATTCTT AAAAGTGAAT TGATTTTTGT ATGAAATATA TGTTGTCTGC 8300 AATTATGTAT ACATTAATAT ATATAAAGAT TTTATCTTTT ATTTTT "chrblob_4225.glm_3|24oct01" 8254 CTAA 8250 TCAGTGGATG ATACAAAGTA ATGTACATAA ATACACATAT TGTTTTTACT 8200 TATTTTATAT TTTTCCATAT TAACACATAC CACAAAACTA ATGTCTATAT 8150 GGTATATATA TATATATATA TATATATTAT TATATAATGT TTGTATTATA 8100 TTGCAACACT ATACTTTAAT TATAAAGTTT TATAAAATAT GCTTTTTCCT 8050 TTGTGTATTT TTTAATCGTG TTAATATATA TATATATATA TGTATATGTA 8000 TTTTTTTTTT ATTTATTATA TATATATATA TATATATATA TATTTATATT 7950 TACATGTTGT CCTTAAATTT TGTCAAGTAT AGCATTTTTT TTTTTTTTTT 7900 TAAATAAGAA GAATATATAT TTATATTTAT GATTAAATGC AAAATTTACA 7850 TACAAATATA GGCACAAAAA AAAAATAAAA AATATATACA TATATATATA 7800 TATATATATA TATATATATA TATTCATATA CATTGTATAT TTCGATTTTT 7750 CCTACATGAC CAAAAATATT ATTTATTTCT TAGTTGTCCC ATTCTTAATG 7700 GTACATTTTT TATAGTGTAT ATGTTTTATA ATGACAATCT CTATTTTACA 7650 AACTTATGCA TATAATACGT ATATAATATA CATGCATATA TAGCACATAC 7600 ATACATACAT ACATACATAC ATACATACAT ACATACATAC ATACATACAT 7550 ACATACATAC ATACAT 7535 "chrblob_4225.glm_3|24oct01" ATAT ATATATATAT ATATATATAT ATATATATAA 7500 TGTATATGTG ATAAAAACAA ATCATATATA TTTTTACATA TAGGTAATAT 7450 TTTTTGCGAA TATAGATTAA CATATATATA TATATATATA ATTTTTACAT 7400 ACTTATTATA AA start chrblob_4225.glm_2|24oct01 glm exon 1 7388 ATG ATA AGA ACT AGC GAA AAG GTG GAG TAT TGC AAA TC 7350 C AAA ACC ATG ACT TGT GAT GAT GAT TAT TTA TCA TTG AAA TCT TCG AAG A 7300 CC CTA AAT ATA GAT AAC GGA GAA GAA GAA TAT GAA AAG TTA GGG AAT GAA 7250 AGA AGA GAT GTA CAA AAT ATG AAT GAT GCT GAA GAT GTG TCA TTA TAT AA 7200 A AAT AAG AAA TAC AAT CCA AAA AAA AAT GTT GAT AAA AAT AAT GTT GAT A 7150 AA AAT AAT ATT GAT AAA GGT AAT GTT GAT AAA AGT AAT GTT GAT AAA AAT 7100 AAT ATT GAT AAA GGT AAT GTT GAT AAA AGT AAT GTT GAT AAA AGT AAT GT 7050 T GAT AAA AGT AAT GTT GAT ATG TGT GAG GGA AAT AAT ATT AAA AGT ACT G 7000 AT AGA AAA AGT AAT AAT ACA AAA AGA AAC TCA TCA AAA TAT AAT GGT TTA 6950 GAA GAA AGA GAT GAT GAA GAT AAT AGT AAT AAT AAT AAT AAT ATG AAT AG 6900 T ATG TAT GAT AGA AAT ATG GTG AAT ACA ACA TAT TAT GAA AAT GTG CAG C 6850 AT ATG ATT TCT AAA GAT GAT AAT GAG TCG TTT GAT AAT TAT CCA AAA GAA 6800 TCT AAA GAC TTA TCT GAA AAG TTT ATG AAT AAA AAT ATG TTA GAT AAT AA 6750 T AAT AAT AGT AAC AAT AAC AAT AAT AAT AAT AAT AAT AAT AAT ACA ATT A 6700 TG AAT GAA GAA GAT ATT TTT ATG AAA TAT ATA GAG GAT ACC AAA AAT AAT 6650 GAT AGC TCG AAA AAT TTT GTT AAT GAT AAA GAA TTT GTG TGT ACC ATG TC 6600 A AAA GAT AAA TAT TCC GAA ATG AAC AGA TCC ACA ACA GAA ATA TTT GAT A 6550 AT ATG AAT TGT ATA GAA TAT ACA GAT GAA TAT AAA CAA ACG AAT AAT CAA 6500 AAT TTT AAT AGT ACT ATT ATG ATG AAG GAA GAT ACA AAT AAG GAT GAT AT 6450 T AAA AAT GTT TAT AGA AAT ATT TCT ATG GAT CCT AAA GAT TGT TCA GGA A 6400 TA AAT TTT AAT GAA ATG AAT GTA GAA GAA GAT AAT AAT GTT GTC ATT GGT 6350 AAT AAT TCA AAT TTA GAA AGT TAT GAA AAT ATG GGA AAT GAA AAT TAT AC 6300 T GAA AAC ATT ATG TAT AGA AAT AAA AAG GAA CAG GAT GAA GAT GAA GGT G 6250 AT AAT GAT GAG GAA GAT AAG AAT TCA AAT AAT AAT TAT AAT TTG AAT GAT 6200 CAT AAT AAT AAC ACT GAA GAA GAA AGA AAA AAA AAT GAT ACT TTT TAT AA 6150 A AAA AAT GGA GAT TAT AAG AAT ATG TTA AGT AAT CAA GAT ATT TAT AAC G 6100 AA ACG GAA AAT ATT AAT GAT AGT ACC ACC GAA TGT ACA ATA GTT AAA GAT 6050 GTG CCC AAA TGT ATT ACA AAT AAT CAT ATA CAG GGT AAT TTA TTA GAT AA 6000 T ACA TAT TTA CCT AAA GAT GTG AAT GCA AAT TTC AGA AGT TAT GAA CAA G 5950 TG GAT GTT AAG GAT AAT AAT TCT TTA TTA CAT ACA CCT ATT GGT TGT GAA 5900 AAT AAG AAT AAA TCA TAT GTC AAT TTT CCT TTT AAT ACT GTA GAA AAT AA 5850 A AAT ATA CAT ATT ACG ATG GAA GAA GAA AAA TAC CGT GAC CAT AAT AAA G 5800 TT CAT CAT GAA ATA GAT GAT AAT GGT TAT ATA ATA AAT TCA AGA GAT GAT 5750 GCT GTT AAT AAT AAA GAT TCA TTT TAT AAG AGC CTT TCT CAA CAA ATT TA 5700 T ATA GAT AAA AAT GGT AGT AAA TAT AAT GTT GAC ATT TCA AAT GAT CTT T 5650 TT AAA AAG AAA TGT AAT ATA AAT GAT AAG AAC ATG AAA AAT AAT TAT AAT 5600 GAA AAT AAT GAC ATA TTA AGA GGA GCA GGT CAA AAT GAT ATG CCC AAT AA 5550 T ATG CAT AAT ATA TCA CAA AAA GGT TTC CAT TTA AAT CAA GAA GGA ATT A 5500 AT GAT ATG TTA AGA AAC CAA AAT AAT ATA GCA TTT CAA AAT AGT CAA TAT 5450 AAT GGA TAT ATA AAA GAT GAA CAA AAT ATT ATG AAT AAC TTG TGT GAA AG 5400 G ATA GAA CCA AGT TAT ATT GAC TCA ACG TCC AAG AGA GAT AGT GAA GGG A 5350 CA AAA AGC GCT GTT CAT AAG AAT AAT ATT AAT AGG AAT AAT AAT AAT TAT 5300 AAT GGT AAT ATA AAT AAG AAT AAC AAT AAT ATT CAT GGT AAT CGA AAT AG 5250 T AAT AAT ATA CAT GGA AAT CGA AAT AGT AAT AAT ATA CAT GGT AAT CGA A 5200 AT AGT AAT AAT ATT CAT AGT AAT CGA AAT AGT AAT AAT ACT CAC AGC AAT 5150 CGA AAT AGT AAT AAT ACT CAC AGC AAT CGA AAT AGC AAT AAT AGT AAC AG 5100 A AAT AAT TAC AAT AGT TTT GTT GTT CCA GGA AAT ATG AAC AGT AAT AAT A 5050 AT GAT AAT AAT GAT AAG AGT TAT AAT AAT GAT AAG AGT TAT AAT AAT GAT 5000 AAT AAT TAT AAT AAT GAT AAT TCT TAT GAT AAA TCT TTA GAT GAA TAT TT 4950 C CGA AAT AAC CTC CCA GAA GAT ATT ATT AAA AAC ATC AAA TAT GAA AAT C 4900 CA TCC AAT ACA TAT AAT GAT TTA TTA AAT AAC AGA GAC TAT GAT TTA ATT 4850 TCA AAG ATA AAA GAA AAC CCT GTG TAT TAT TCT TCA GAA AAA GAA AAG AA 4800 A CGA ATG AAG AAT AAA GAT ATG AAA CAA CCT AAA TAT GTT TCA AAT GAG A 4750 AA TTG GAT TTA GAT GAG CAT ACA CAT ATT TAT AAA AAT AAT AAT GAA GAT 4700 AAT AAT TAT AAT AGC ATG AAT AGA GAT ACA ACA ATT ATA TCT AAA TGT GA 4650 T AAT CCT GAA ATG CAT TAT GGT CAA GGA AAT TCT TAT ATA CTT CCT ACA T 4600 GT CAA AGA AAT GAT TTA TTA AAG GAT GAT AGG AAT CCT ATG TTA TCT ATT 4550 TCA AAA CAA AAG ATA AAA AAT ATT TGG AGC AAA TTT AAA AAT AAT ACT TG 4500 T AAA GAA CAT AAT GTG AAT AGA ATA TCT GAA AGT AAG AAT AAT AAT TAT G 4450 TG CAC AAA ATG GAA ATA ATG AAT ATT CCA AAG AAA GGA TTA GGT AAT GAG 4400 TAT TAT AAT TAT CCA TAC GAC AAT AAC AAC AAT AAT AAT AAT ATT AAT AA 4350 T AAT AAT AAT AAT ATT AAT AAT AAT AGC AAT AGT AAT AAT ATT ATT AAT A 4300 AT AAA GAG TGT ATT AAT AAA CCA ATA ATA TAT ATG AAT CAT ATC AAT AAT 4250 AAT AAT ATG GAT AAA CAA ATG AGA CCT AAA TGT ATC TTT AAT TGG AAA AT 4200 A GCT AAA AAG TCA TTA ATG AAA ATG TTA CAT AGT GCA CAT AAT TTT TAT T 4150 TC AAC GGT GTT AAA TAT TCA GAT TGG AAA TTT ACG TGC ATA CCA ACT CTT 4100 GGA TTT TCT AAA TCT AGT AAT AGA GTT CAA CAA ATG TAT AGA GCT TTT GT 4050 T GTT CCA AAA GAT AGT AAT GTA AAA AAG GAA GTT AAA TTA TTT ATT AAA A 4000 AA ATT CCT ATA TAT ATA TGG GTT AAA CAA TTT AAT TTG ATG AAT GAA TAT 3950 GAT GGA GAA TAT GTA ACA GAT GGA GAA AAT TTT GTA ATG GAA GCT ACG GC 3900 T TTA GCT TTT TTA AAT GAG TAT CAT CCA GGA ATC ACA CCA AAG TTA TAT A 3850 AA ATA TTA TAT GAA CCA GAT AAC AAA TAT TTT AAT GAA GGA CTT TCA CAG 3800 AAA TCT ATG TAT AAT AAT TTA AAT GTT TTT AAT GAT ATG CTA AGT GAA AG 3750 A TTG AAA TGT AAT GTT GGT GGT AAT ATT GTT ATC GTC TCT GAA TTT TTT A 3700 AT GAA GAT ATA CTT GAT TTT ATA GAT CGT AGA CAA AAA AAA TAT AAT ATG 3650 AAA ATC AGT AAT AAT GAA AAA AGT TTT ATA TTA TAC CAA TGT TTA AAA TT 3600 A TTA ATA CGA TTA CAT GAT GCA GGC CTA TCA CAT TTA GAT TTA ACA CCA G 3550 AA AAT ATT TTA ATC TCT GAT AAT TAT GAA TTA CGT TTC TGT GAC TTA TCT 3500 AAA AGT ACA CCC ATC TAT ACA TAC AAT TTA AGA CAC ATT AAA GAT ATG AA 3450 C CGT CTC TAT TTA TTT GAA TCA TGT GAA CCT ACT ATT GCA AAA GGG GCA T 3400 AT ATG CCA CCA GAA TGT TGG AAA ATA TAT TGG AAA TAT GAT ACA ATG AAA 3350 ATA AAA AAT CCT CTA AAA GAT TTA AAG CAT ATT ACA GAT CAA GAA AAA CG 3300 A AAA CAA TTT TAT TTC GAT GTT TCT AAT GCT GAT AAG TTT ATG CTT GGT G 3250 TG TTC TTC TTT TGG ATT TGG ACA AAC GGA AAT TTA TGG AAA TGT TCA GAT 3200 CCA TTA CAA GAT GAG GAT TTT TTC TAT TTC GTA AAA TGT GAT ATG AAT TT 3150 T GAT AAT TTT GAG TTA ACA AAA AAT TGG CCA AAT GAG TTA AAA GAT ATC A 3100 TC AAG intron GTAGG ATAGTAGTGT ATTATTATAT AGTATTATAT GTTGTATAAA 3050 TGTTTCATAT TGTTGATATA TGATAATTTA AAAAAAAAAA AAAAAAAATC 3000 TTAAACAACC CGATATATAT ATATATAATA TATATATATA TATATATTTA 2950 TATTTATTTA TTTGTATATT TCTTCTTTTT TTACAG exon 2 2914 CAA TTA TTA CAT GT 2900 A GAA CAG AGA AAG AAG TTG AAC TTG AAA GAT CTA AGC GCA CAT CCA TGG T 2850 GG TCT TTC AAG TTA TAA 2834 stop chrblob_4225.glm_2|24oct01 TTT GTCAGCATTA TTATTACATA TATATATATA 2800 TATATATATA ATATTTTATT TTCATATATA ATGAAATAAT ATCAAAATAG 2750 ACATGTGGGA ATCTCAACAT TTTTGGATTT CTTACAAAAA ATTATATAAC 2700 CATCTTTATA ATATAAAAAT ATATCCTTTT ACACAAATAT ATGTATATAA 2650 AATAAGTAGA TATATATTTT TTCCCATTTT ACATATAATA TATAATGAAG 2600 TTAATATATA TATATATATA TATATATATT TTTTTTATCT TTATTTTTTT 2550 AAAAATAAAA AAGAATGTTT ATTGATTTTT TTATTTTTTT ATTTTTTTAT 2500 TTTTTCATTT TTCCCTTTTT TTGTTTTCAT TCATTTTTAA AAAATCCTTT 2450 TCTTTTTAGT ACTTTTTTCT GTATTACATT TAATAAAATT TATAATATTT 2400 TAAAATAGAT CAGTTCAAAA AAAAAAAAAA AAAAAATAAT ATAATATATT 2350 TTTTTTTCTT TTCTTGACAT ATAATATATA TATATATATA TATATATATA 2300 TATATATATA TATATTAAAA GTTTATTAAA ATTTAAAGAG TTATTTTTTT 2250 ATATATCATT TAAAATAAAA TCCAAAATTA AAAAGAAAAA AAAAAAATTA 2200 AAATAAAACA CAAATATGTA TTAATATATT TGATAAATAT ATTAAAACAA 2150 AAATTGGGAG AAAAAAAAAA AAAAACTGGA TATTTTTATT ATGTATCACA 2100 AAAAAAAAAA AAAATAAAAT AAAATAAATC ATTAATAATT AATAAAAGAA 2050 GGTAATAAAT TAAAATAAAA AATATATTAG AACATACACT TATATATGTT 2000 CACGTTAAAA TCATTGCATA CCCATTTGTG TTTTTTTTTT TTTTTTTTAT 1950 CTTTAAAAGA AATTACAAAA ATAAAGAGAA TTATAAAAAA AAAAAAAAAA 1900 AAAAAAACGA ATTATTATGG GTAGCGCGCC TTACATAATT TGTAAAATAT 1850 ATATACTTGT AAAATAATAT AAAAAAGGGT ACTTTTCCTT ATATATATAA 1800 ATATACATAG ATATAAATAT AATATATATA TATATATATT ATTCATCAAT 1750 TAAACGATCA TTACATTCCT AGTTTTCCCC TATGTAGATA ATTCTGTGGA 1700 TTATATTTCT GCTAAGTATA TATAATATAA CAATATAATC ATGGTTATTT 1650 TACAAATTTT TTATTATTTT CGTTATAG "chrblob_4225.glm_1|24oct01" 1622 TT ATGAATCCTT ATGTTTAAAA 1600 AAATACTTTT TCATAAAATA GAAAATAAAT CCAAAACCTA TACCTACAAG 1550 AGAACCAACT ATAACTTGCA AAACGGTGTG ATCTTCAACT TCAACACGAC 1500 TCCAAGGTAT GGGGAGTAAG GTAAGAGTAG CTATTACATA TGTGATAATA 1450 CTCCATTTGT CTTTTTTCTG TTCTGTAATA TGAAGTAAAA GAAAAGTTAA 1400 TAAAGCTATT GCAAAGGAAC TATGACTTGA TGGCATACCA TAAGTTGGCA 1350 ATGCACTATT AATTGGTCTT GGTTTTTTAA ATATTCTTTT TAAAAATAAA 1300 TCACTAATTA AGGTTTGTGT CGGCATTATA AAAATAATAT AAAGTAAGTT 1250 TTTATTAAAA GTAATTATGA AACCAAATAC TGTTAAAATC ATTATTAAAA 1200 ATGGAACATA TCCATATACT GTTGCTATTA CTGATGAGAA ATTATTTACA 1150 TTTCTTATTG TTACGGATAA CATTCCATAT AATTCTATTA TACATGTTTT 1100 AAATAAAATA ATTTTTTTAG GTTTATCTGT CATTAATTTT TTAAAAATTT 1050 TAAATGATTT TAATTTATCA ACTAATTTAT ATTTTGCCTC ACATATTGGA 1000 TAGTTAGCAT ATAATTTCTT AAATGTCTCA TTATTATCTA TATAATAATT 950 CGTTTCTAAT TCAGTATTTG TATATATTGG TTTCAAACTA TTTATCTTTT 900 TACTACGCAA ATTTATTTTC ATCTTTTCAT CAATATATTC TTCCATCTTT 850 TTATTTTTTT CCTCTTTATT ATCACTTGAA TTTTTATTAG GAGAATCTTT 800 ATCAGACCCC CCAAATATAA GATAATTTAT TATATTTATG CATTGTATTG 750 TATTAAACAA ATAACCGACA TGTAATAACG TAGGTAAATA AACTTTTGTT 700 AACAT 696 "chrblob_4225.glm_1|24oct01" ACTAA ACTAATTTTT ATATATAAGG ATTTTATAAA ATCACATGAA 650 ATGTTTTAAT TATTTTATTT TTATATCATT ACAAGTGCAT ATCATCATAA 600 ATTCTTAAAC ATATAAAAAT ATTACATAAA TATATAAATA TATATATATA 550 TATATATATA TTATTTTGTT CACTTTTTAT AGCTTCGTAT AAAAAAAAAA 500 TTTATATATT TTTTATTACT ATATTATTTA TAATCTTCTT ATTATTCACT 450 TTATACGTAA TTGGACTTTT TCTTTTTTTT ATTTTTAAAA AAAATGACAA 400 ATGAATAAAA TAAGAAATAT ATATATATAT ATAATTATAT ATATATATAT 350 ATATATTACA TATATATAAT ATAATATTTA TAATTATTAA AAAAAAAAAA 300 AAAAAAAAAA ATTAAATTCA TATATATTAT ACTTTTTTAA AAAATAAATT 250 ACAAAATTTA AATACAATTT TTTTTCTCTT TCATTTCATA AAAAATATAT 200 ATAAATATAT ATAATTAAGA AAAAGAAAGC ATTCTTAATT TTCAAAAGAA 150 AAAAATTACA GAATCTAATT ATTATACTTT TATATTTTAT GTATATTGCA 100 TATATATGGG ATATATAAAT ATATATGTAA TATATAAATA AATATATATA 50 TATATAATAG GAGTGGATCT TACACGAAAA CTGGGTGCAG CCCCCAAGGC end of file 4226 5 Date: Wednesday, 3/20/2002 Time: 11:42 c4227.txt chrblob_4228|2001.10.15|GENOMIC|Sanger FEATURES Location CDS complement(454..837) /gene="chrblob_4228.gen_1|24oct01" /note="(protein coding) 75% identity to (AJ403982) alfa-peptide [Cloning vector pBPSCat2]" /codon_start=1 ORIGIN watson strand 1 GATAAAGTTG CAGGACCACT TCTGCGCTCG GCCCTTCCGG CTGGCTGGTT 51 TATTGCTGAT AAATCTGGAG CCGGTGAGCG TGGGTCTCGC GGTATCATTG 101 CAGCACTGGG GCCAGATGGT AAGCCCTCCC GTATCGTAGT TATCTACACG 151 ACGGGGAGTC AGGCAACTAT GGATGAACGA AATAAACAGA TCGCTGAGAT 201 AGGTGCCTCA CTGATTAAGC ATTGGTAACT GTCAGACCAA GTTTACTCAT 251 ATATACTTTA GATTGATTTA AAACTTCATT TTTAATTTAA AAGGATCTAG 301 GTGAAGATCC TTTTTGATAA TCTCATGACC AAAATCCCTT AACGTGAGTT 351 TTCGTTCCAC TGAGCGTCAG ACCCCGTAGA AAAGATCAAA GGATCTTCTT 401 GAGATCCTTT TTTTCTGCGC GTAATCTGCT GCTTGCAAAC AAAAAAACCA 451 CCG "chrblob_4228.gen_1|24oct01" 454 CTACCAG CGGTGGTGTG GGGATCCTCT AGAGTCGACC TGCAGGCATG 501 CAAGCTTGGC ACTGGCCGTC GTTTTACAAC GTCGTGACTG GGAAAACCCT 551 GGCGTTACCC AACTTAATCG CCTTGCAGCA CATCCCCCTT TCGCCAGCTG 601 GGCGTAATAG CGAAAAAGGC CCCGCACCGA TCGCCCTTCC CAACAGTTTG 651 CGCAGCCCTG AATGGGCGAA TGGCGCCCTG ATGCGGGTAT TTTCTCCCTT 701 ACGCATCTGT GCGGTATTTC ACACCGCATA TGGTGCACTC TCAGTACAAT 751 CTGCTCTGAT GCCGCATAGT TAAGCCAGCC CCGACACCCG CCAACACCCG 801 CTGACGCGCC CCTGACGGGC TTGTCTGCTC CCGGCAT 837 "chrblob_4228.gen_1|24oct01" CCG CTTACAGACA 851 AGCTGTGACC GTCTCCGGGA GCTGCATGTG TCAGAGGTTT TCACCGTCAT 901 CACCGAAACG CGCGAGACGA AAGGGCCTCG TGATACGCCT ATTTTTATAG 951 GTTAATGTCA TGATAATAAT GGTTTCTTAG ACGTCAGGTG GCACTGGGAT 1001 CCTCTAGAGT CGACCTGCAG GCATGCAAGC TTGGCACTGG CCGTCGTTTT 1051 ACAACGTCGT GACTGGGAAA ACCCTGGCGT TACCCAACTT AATCGCCTTG 1101 CAGCACATCC CCCTTTCGCC AGCTGGCGTA ATAGCGAAGA GGCCCGCACC 1151 GATCGCCCTT CCCAACAGTT GCGCAGCCTG AATGGCGAAT GGCGCCTGAT 1201 GCGGTATTTT CTCCTTACGC ATCTGTGCGG TATTTCACAC CGCATATGGT 1251 GCACTCTCAG TACAATCTGC TCTGATGCCG CATAGTTAAG CCAGCCCCGA 1301 CACCCGCCAA CACCCGCTGA CGCGCCCTGA CGGGCTTGTC TGCTCCCGGC 1351 ATCCGCTTAC AGACAAGCTG TGACCGTCTC CGGGAGCTGC ATGTGTCAGA 1401 GGTTTTCACC GTCATCACCG AAACGCGCGA GACGAAAGGG CCTCGTGATA 1451 CGCCTATTTT TATAGGTTAA TGTCATGATA ATAATGGTTT CTTAGACGTC 1501 AGGTGGGGGA TCCTCTANAG TCGACCTGCA GGCATGCAAG CTTGGCACTG 1551 GCCGTCGTTT TACAACGTCG TGACTGGGAA AACCCTGGCG TTACCCAACT 1601 TAATCGCCTT GCAGCACATC CCCCTTNCGC CAGCTGGGNT NNTACCAAAA 1651 AGGCCCGCAC CGATCGCCCT TCCCAACANT TGCNCACCCT GAATGGCGAA 1701 TGGCGCCTGA TGCGGTTTTT NCTCCTTACG CATCNNTNCG GTATTTCACA 1751 CCGCATATGG TGCACTCTCA GTACAATCTG CTCTGATGCC GCATAGTTAA 1801 GCCAGCCCCN ACACCCGCAA AACCCGCTGA CGCCCCCTGA CGGGCTTGTC 1851 TGCTCCCGGC ATCCGCTTAC AGACAAGCTG TGACCGTCTC TCGGGAGCTG 1901 CATGTGTCAG AGGTTTTCAC CGCCATCACC GAAACGCGCG AAAAGAAAGG 1951 GCCTCGTGAT ACGCCTATTT TTATAGGTGA ATGTCATGAT AATAATGGTT 2001 TCTTAGACGT CTCGTGGCAC TTTTCCGGGA AATGTGCGCG GAACCCCTAT 2051 TTGTTTATTT TTCTAAATAC ATTCAAATAT GTATCCGCTC ATGAGACAAT 2101 AACCCTGATA AATGCTTCAA TAATATTGAA AAAGGAAGAG TATGAGTATT 2151 CAACATTTCC GTGTCGCCCT TATTCCCTTT TTTGCGGCAT TTTGCCTTCC 2201 TGTTTTTGCT CACCCAGAAA CGCTGGTGAA AGTGATAGAT GCTGAATATC 2251 AGTTGGGTGC ACGAGTGGGG TACATCGAAA TAGTACTCAA CAGGCGGGAG 2301 ATCCTTGAAA GTGTTAACCC CAACTACGAC TTCCAATGAG AA // crick strand 2342 TT CTCATTGGAA GTCGTAGTTG GGGTTAACAC TTTCAAGGAT 2300 CTCCCGCCTG TTGAGTACTA TTTCGATGTA CCCCACTCGT GCACCCAACT 2250 GATATTCAGC ATCTATCACT TTCACCAGCG TTTCTGGGTG AGCAAAAACA 2200 GGAAGGCAAA ATGCCGCAAA AAAGGGAATA AGGGCGACAC GGAAATGTTG 2150 AATACTCATA CTCTTCCTTT TTCAATATTA TTGAAGCATT TATCAGGGTT 2100 ATTGTCTCAT GAGCGGATAC ATATTTGAAT GTATTTAGAA AAATAAACAA 2050 ATAGGGGTTC CGCGCACATT TCCCGGAAAA GTGCCACGAG ACGTCTAAGA 2000 AACCATTATT ATCATGACAT TCACCTATAA AAATAGGCGT ATCACGAGGC 1950 CCTTTCTTTT CGCGCGTTTC GGTGATGGCG GTGAAAACCT CTGACACATG 1900 CAGCTCCCGA GAGACGGTCA CAGCTTGTCT GTAAGCGGAT GCCGGGAGCA 1850 GACAAGCCCG TCAGGGGGCG TCAGCGGGTT TTGCGGGTGT NGGGGCTGGC 1800 TTAACTATGC GGCATCAGAG CAGATTGTAC TGAGAGTGCA CCATATGCGG 1750 TGTGAAATAC CGNANNGATG CGTAAGGAGN AAAAACCGCA TCAGGCGCCA 1700 TTCGCCATTC AGGGTGNGCA ANTGTTGGGA AGGGCGATCG GTGCGGGCCT 1650 TTTTGGTANN ANCCCAGCTG GCGNAAGGGG GATGTGCTGC AAGGCGATTA 1600 AGTTGGGTAA CGCCAGGGTT TTCCCAGTCA CGACGTTGTA AAACGACGGC 1550 CAGTGCCAAG CTTGCATGCC TGCAGGTCGA CTNTAGAGGA TCCCCCACCT 1500 GACGTCTAAG AAACCATTAT TATCATGACA TTAACCTATA AAAATAGGCG 1450 TATCACGAGG CCCTTTCGTC TCGCGCGTTT CGGTGATGAC GGTGAAAACC 1400 TCTGACACAT GCAGCTCCCG GAGACGGTCA CAGCTTGTCT GTAAGCGGAT 1350 GCCGGGAGCA GACAAGCCCG TCAGGGCGCG TCAGCGGGTG TTGGCGGGTG 1300 TCGGGGCTGG CTTAACTATG CGGCATCAGA GCAGATTGTA CTGAGAGTGC 1250 ACCATATGCG GTGTGAAATA CCGCACAGAT GCGTAAGGAG AAAATACCGC 1200 ATCAGGCGCC ATTCGCCATT CAGGCTGCGC AACTGTTGGG AAGGGCGATC 1150 GGTGCGGGCC TCTTCGCTAT TACGCCAGCT GGCGAAAGGG GGATGTGCTG 1100 CAAGGCGATT AAGTTGGGTA ACGCCAGGGT TTTCCCAGTC ACGACGTTGT 1050 AAAACGACGG CCAGTGCCAA GCTTGCATGC CTGCAGGTCG ACTCTAGAGG 1000 ATCCCAGTGC CACCTGACGT CTAAGAAACC ATTATTATCA TGACATTAAC 950 CTATAAAAAT AGGCGTATCA CGAGGCCCTT TCGTCTCGCG CGTTTCGGTG 900 ATGACGGTGA AAACCTCTGA CACATGCAGC TCCCGGAGAC GGTCACAGCT 850 TGTCTGTAAG CGG no gene chrblob_4228.gen_1|24oct01 837 ATG CCG GGA GCA GAC AAG CCC GTC AGG GGC GCG TCA G 800 CG GGT GTT GGC GGG TGT CGG GGC TGG CTT AAC TAT GCG GCA TCA GAG CAG 750 ATT GTA CTG AGA GTG CAC CAT ATG CGG TGT GAA ATA CCG CAC AGA TGC GT 700 A AGG GAG AAA ATA CCC GCA TCA GGG CGC CAT TCG CCC ATT CAG GGC TGC G 650 CA AAC TGT TGG GAA GGG CGA TCG GTG CGG GGC CTT TTT CGC TAT TAC GCC 600 CAG CTG GCG AAA GGG GGA TGT GCT GCA AGG CGA TTA AGT TGG GTA ACG CC 550 A GGG TTT TCC CAG TCA CGA CGT TGT AAA ACG ACG GCC AGT GCC AAG CTT G 500 CA TGC CTG CAG GTC GAC TCT AGA GGA TCC CCA CAC CAC CGC TGG TAG* 454 CGG 450 TGGTTTTTTT GTTTGCAAGC AGCAGATTAC GCGCAGAAAA AAAGGATCTC 400 AAGAAGATCC TTTGATCTTT TCTACGGGGT CTGACGCTCA GTGGAACGAA 350 AACTCACGTT AAGGGATTTT GGTCATGAGA TTATCAAAAA GGATCTTCAC 300 CTAGATCCTT TTAAATTAAA AATGAAGTTT TAAATCAATC TAAAGTATAT 250 ATGAGTAAAC TTGGTCTGAC AGTTACCAAT GCTTAATCAG TGAGGCACCT 200 ATCTCAGCGA TCTGTTTATT TCGTTCATCC ATAGTTGCCT GACTCCCCGT 150 CGTGTAGATA ACTACGATAC GGGAGGGCTT ACCATCTGGC CCCAGTGCTG 100 CAATGATACC GCGAGACCCA CGCTCACCGG CTCCAGATTT ATCAGCAATA 50 AACCAGCCAG CCGGAAGGGC CGAGCGCAGA AGTGGTCCTG CAACTTTATC end of file 4229 5 4231 5 4232 9 telomere right 4233 5 4234 5 4236 5 4237 5 4239 5 4240 4 + partial chr4 copy |: :| 4241 4 telomere 4242 5 4243 4 + 3 + 12 telomere 4246 5 4247 5 4249 5 4250 5 4255 5 4256 5 4257 5 4258 5 4260 5 4261 5 4262 5 4263 5 4265 5 4266 12 + 13 + 3 telomere + pfemp1 var 4269 5 4270 4 pfemp1 var + telomere 4272 5 4273 5 4274 4 telomere 24510..10892 Date: Sunday, 3/17/2002 Time: 00:43 c4275.txt chrblob_4275|2001.10.15|GENOMIC|Sanger FEATURES Location CDS complement(67..267) /gene="chrblob_4275.gen_3|24oct01" /note="(protein coding) 86% identity to MINOR SPIKE PROTEIN (H PROTEIN) (PILOT PROTEIN)" /codon_start=1 CDS complement(join(327..902,1031..1399)) /gene="chrblob_4275.gen_2|24oct01" /note="(protein coding) 99% identity to MAJOR SPIKE PROTEIN (G PROTEIN) (GPG)" /codon_start=1 CDS join(1082..1647,1751..1862) /gene="chrblob_4275.gen_1|24oct01" /note="(protein coding) 98% identity to protein gene D [Bacteriophage phi-X174]" /codon_start=1 ORIGIN watson strand 1 CCACGTATTT TGCAAGCTAT TTAACTGGCG GCGATTGCCT ACCCGACGAC 51 CAAATTAGGG TCAACGCTAC CTGTAGGAAG TGTCCGCATA AAGTGCACCT 101 GCATGGCAAA TGAAGACGGC CTCATCAGGG TTAGGAACAT TAGAGCCTTG 151 AATGGCAGAT TTAATACCAG CATCACCCAT GCCTACAGNA TTGTTATCGG 201 TAGCAAGCAC ATCACCTTGA ATGCCACCGG AGGCGGCTTT TTGACCGCCT 251 CCAAACAATT TAGACATGGC GCCACCAGCA AGAGCAGAAG CAATACCGNC 301 AGCAATAGCA CCAAACATAA ATCACCTCAC TTAAGTGGCT GGAGACAAAT 351 AATCTCTTTA ATAACCTGAT TCAGCGAAAC CAATCCGCGG CATTTAGTAG 401 CGGTAAAGTT AGACCAAACC ATGAAACCAA CATAAACATT ATTGCCCGGC 451 GTACGAGGAA GGACGTCAAT AGTCACACAG TCCTTGACGG TATAATAACC 501 ACCATCATGG CGACCATCCA AAGGATAAAC ATCATAGGCA GTCGGGAGGG 551 TAGTCGGAAC CGAAGAAGAC TCAAAGCGAA CCAAACAGGC AAAAAATTTA 601 GGGTCGGCAT CAAAAGCAAT ATCAGCACCA ACAGAAACAA CCTGATTAGC 651 GGCGTTGACA GATGTATCCA TCTGAATGCA ATGAAGAAAA CCACCATTAC 701 CAGCATTAAC CGTCAAACTA TCAAAATATA ACGTTGACGA TGTAGCTTTA 751 GGTGTCTGTA AAACAGGTGC CGAAGAAGCT GGAGTAACAG AAGTGAGAAC 801 CAGCTTATCA GAAAAAAAGT TTGAATTATG GCGAGAAATA AAAGTCTGAA 851 ACATGATTAA ACTCCTAAGC AGAAAACCTA CCGCGCTTCG CTTGGTCAAC 901 CCCTCAGCGG CAAAAATTAA AATTTTTACC GCTTCGGCGT TATAACCTCA 951 CACTCAATCT TTTATCACGA AGTCATGATT GAATCGCGAG TGGTCGGCAG 1001 ATTGCGATAA ACGGTCACAT TAAATTTAAC CTGACTATTC CACTGCAACA 1051 ACTGAACGGA CTGGAAACAC TGGTCATAAT C ATG GTG GCG AAT AAG TAC G 1101 CG TTC TTG CAA ATC ACC AGA AGG CGG TTC CTG AAT GAA TGG GAA GCC TTC 1151 AAG AAG GTG ATA AGC AGG AGA AAC ATA CGA AGG CGC ATA ACG ATA CCA CT 1201 G ACC CTC AGC AAT CTT AAA CTT CTT AGA CGA ATC ACC AGA ACG GAA AAC A 1251 TC CTT CAT AGA AAT TTC ACG CGG CGG CAA GTT GCC ATA CAA AAC AGG GTC 1301 GCC AGC AAT ATC GGT ATA AGT CAA AGC ACC TTT AGC GTT AAG GTA CTG AA 1351 T CTC TTT AGT CGC AGT AGG CGG AAA ACG AAC AAG CGC AAG AGT AAA CAT A 1401 GT GCC ATG CTC AGG AAC AAA GAA ACG CGG CAC AGA ATG TTT ATA GGT CTG 1451 TTG AAC ACG ACC AGA AAA CTG GCC TGT CTC ATC ATG GAA GGC GCT GAA TT 1501 T ACG GAA AAC ATT ATT AAT GGC GTC GAG CGT CCG GTT AAA GCC GCT GAA T 1551 TG TTC GNG TTT ACC TTG CGT GTA CGC GCA GGA AAC ACT GAC GTT CTT ACT 1601 GAC GCA GAA GAA AAC GTG CGT CAA AAA TTA CGT GCA GAA GGA GTG AT GTA 1651 ATGTCTAAAG GTAAAAAACG TTCTGGCGCT CGCCCTGGTC GTCCGCAGCC 1701 GTTGCGAGGT ACTAAAGGCA AGCGTAAAGG CGCTCGTCTT TGGTATGTAG 1751 G TGG TCA ACA ATT TTA ATT GCA GGG GCT TCG GCC ACG ACG CAA TGG AGA A 1801 AG ACG GAG AGC GCC AAC GGC GTC CAT CTC GAA GGA GTC GCC AGC GAT AAC 1851 CGG AGT AGT TGA AATGGTAA TAAGACGACC AATCTGACCA GCAAGGAAGC 1901 CAAGATGGGA AAGGTCATGC GGCATACGCT CGGAGCCAGT TTGAATATTA 1951 CACATAATTT ATCCTTAAGT TAGGGGGGGG ATCTCTATAG AGTTCGACAT 2001 ATGCAGGCTA TGACAAGACT TAGAGGTCCT CAATCTCCCT TTTGGGGAGA 2051 TTTCCCAACC CAGGGGTTAG TGCCGTGTTT TTTTATTTTT TTTTTTTTTT 2101 TAAAAAATCC CCCCTTCAAA AATAAAAAAA ACCCCGCGGG GTTTATATTT 2151 TTCCCCCCTC TTGCGGTTTT TTGGGGGGTA TAAAAACACC CTCTTTTTTT 2201 TTGTGGGGGG GGGGGGCAGC GCCCAC // crick strand 2226 GTGGGC GCTGCCCCCC CCCCCCACAA 2200 AAAAAAAGAG GGTGTTTTTA TACCCCCCAA AAAACCGCAA GAGGGGGGAA 2150 AAATATAAAC CCCGCGGGGT TTTTTTTATT TTTGAAGGGG GGATTTTTTA 2100 AAAAAAAAAA AAAAATAAAA AAACACGGCA CTAACCCCTG GGTTGGGAAA 2050 TCTCCCCAAA AGGGAGATTG AGGACCTCTA AGTCTTGTCA TAGCCTGCAT 2000 ATGTCGAACT CTATAGAGAT CCCCCCCCTA ACTTAAGGAT AAATTATGTG 1950 TAATATTCAA ACTGGCTCCG AGCGTATGCC GCATGACCTT TCCCATCTTG 1900 GCTTCCTTGC TGGTCAGATT GGTCGTCTTA TTACCATTTC AACTACTCCG 1850 GTTATCGCTG GCGACTCCTT CGAGATGGAC GCCGTTGGCG CTCTCCGTCT 1800 TTCTCCATTG CGTCGTGGCC GAAGCCCCTG CAATTAAAAT TGTTGACCAC 1750 CTACATACCA AAGACGAGCG CCTTTACGCT TGCCTTTAGT ACCTCGCAAC 1700 GGCTGCGGAC GACCAGGGCG AGCGCCAGAA CGTTTTTTAC CTTTAGACAT 1650 TACATCACTC CTTCTGCACG TAATTTTTGA CGCACGTTTT CTTCTGCGTC 1600 AGTAAGAACG TCAGTGTTTC CTGCGCGTAC ACGCAAGGTA AACNCGAACA 1550 ATTCAGCGGC TTTAACCGGA CGCTCGACGC CATTAATAAT GTTTTCCGTA 1500 AATTCAGCGC CTTCCATGAT GAGACAGGCC AGTTTTCTGG TCGTGTTCAA 1450 CAGACCTATA AACATTCTGT GCCGCGTTTC TTTGTTCCTG AGCATGGCAC 1400 T ATG TTT ACT CTT GCG CTT GTT CGT TTT CCG CCT ACT GCG ACT AAA GAG A 1350 TT CAG TAC CTT AAC GCT AAA GGT GCT TTG ACT TAT ACC GAT ATT GCT GGC 1300 GAC CCT GTT TTG TAT GGC AAC TTG CCG CCG CGT GAA ATT TCT ATG AAG GA 1250 T GTT TTC CGT TCT GGT GAT TCG TCT AAG AAG TTT AAG ATT GCT GAG GGT C 1200 AG TGG TAT CGT TAT GCG CCT TCG TAT GTT TCT CCT GCT TAT CAC CTT CTT 1150 GAA GGC TTC CCA TTC ATT CAG GAA CCG CCT TCT GGT GAT TTG CAA GAA CG 1100 C GTA CTT ATT CGC CAC CAT GAT TAT GAC CAG TGT TTC CAG TCC GTT CAG T 1050 TGTTGCAGTG GAATAGTCAG GTTAAATTTA ATGTGACCGT TTATCGCAAT 1000 CTGCCGACCA CTCGCGATTC AATCATGACT TCGTGATAAA AGATTGAGTG 950 TGAGGTTATA ACGCCGAAGC GGTAAAAATT TTAATTTTTG CCGCTGAGGG 900 G TTG ACC AAG CGA AGC GCG GTA GGT TTT CTG CTT AGG AGT TTA ATC ATG T 850 TT CAG ACT TTT ATT TCT CGC CAT AAT TCA AAC TTT TTT TCT GAT AAG CTG 800 GTT CTC ACT TCT GTT ACT CCA GCT TCT TCG GCA CCT GTT TTA CAG ACA CC 750 T AAA GCT ACA TCG TCA ACG TTA TAT TTT GAT AGT TTG ACG GTT AAT GCT G 700 GT AAT GGT GGT TTT CTT CAT TGC ATT CAG ATG GAT ACA TCT GTC AAC GCC 650 GCT AAT CAG GTT GTT TCT GTT GGT GCT GAT ATT GCT TTT GAT GCC GAC CC 600 T AAA TTT TTT GCC TGT TTG GTT CGC TTT GAG TCT TCT TCG GTT CCG ACT A 550 CC CTC CCG ACT GCC TAT GAT GTT TAT CCT TTG GAT GGT CGC CAT GAT GGT 500 GGT TAT TAT ACC GTC AAG GAC TGT GTG ACT ATT GAC GTC CTT CCT CGT AC 450 G CCG GGC AAT AAT GTT TAT GTT GGT TTC ATG GTT TGG TCT AAC TTT ACC G 400 CT ACT AAA TGC CGC GGA TTG GTT TCG CTG AAT CAG GTT ATT AAA GAG ATT 350 ATTTGTCTCC AGCCACTTAA GTGAGGTGAT TTATGTTTGG TGCTATTGCT 300 GNCGGTATTG CTTCTGCTCT TGCTGGTGGC GCCATGTCTA AATTGTTTGG 250 A GGC GGT CAA AAA GCC GCC TCC GGT GGC ATT CAA GGT GAT GTG CTT GCT A 200 CC GAT AAC AAT NCT GTA GGC ATG GGT GAT GCT GGT ATT AAA TCT GCC ATT 150 CAA GGC TCT AAT GTT CCT AAC CCT GAT GAG GCC GTC TTC ATT TGC CAT GC 100 AGGTGCACTT TATGCGGACA CTTCCTACAG GTAGCGTTGA CCCTAATTTG 50 GTCGTCGGGT AGGCAATCGC CGCCAGTTAA ATAGCTTGCA AAATACGTGG end of file 4277 5 4279 3 + 8 chimera, defective assembly 4281 4 genomic unmapped 4 cf end of chr4 list and c4 data 4282 5 4286 5 4287 5 4290 5 4292 5 4294 5 4296 5 4297 mitochondrial aj276847 d:\genome\mb4297.txt Date: Friday, 3/15/2002 Time: 10:16 c4298.txt chrblob_4298|2001.10.15|GENOMIC|Sanger FEATURES Location CDS complement(1101..4499) /gene="chrblob_4298.glm_1|24oct01" /note="(protein coding) 23% identity to hypothetical protein C0385c - Plasmodium falciparum" /codon_start=1 CDS complement(join(5467..5541,5696..5795,6177..6232)) /gene="chrblob_4298.glm_2|24oct01" /note="(protein coding) 72% identity to (AE003684) CG8495 gene product [Drosophila melanogaster]" /codon_start=1 CDS complement(join(8384..8542,8637..8660)) /gene="chrblob_4298.glm_3|24oct01" /note="(protein coding) No NR protein Similarities" /codon_start=1 CDS complement(join(10289..10420,11050..11286)) /gene="chrblob_4298.glm_4|24oct01" /note="(protein coding) 52% identity to (AF114954) ATP synthase subunit 9 [Saccharomyces exiguus]" /codon_start=1 CDS complement(12979..13260) /gene="chrblob_4298.glm_5|24oct01" /note="(protein coding) 29% identity to hypothetical protein Y50E8A.i - Caenorhabditis elegans" /codon_start=1 CDS 13466..17155 /gene="chrblob_4298.glm_6|24oct01" /note="(protein coding) 24% identity to (AY056143) unknown protein [Arabidopsis thaliana]" /codon_start=1 CDS complement(join(18439..18676,18995..21258)) /gene="chrblob_4298.glm_7|24oct01" /note="(protein coding) 24% identity to (AL034559) hypothetical protein, PFC0960c [Plasmodium falciparum]" /codon_start=1 CDS complement(join(21392..21443,22066..22201,22399..23125)) /gene="chrblob_4298.glm_8|24oct01" /note="(protein coding) 28% identity to (AF305417) Aardvark [Dictyostelium discoideum]" /codon_start=1 CDS 25629..25964 /gene="chrblob_4298.glm_9|24oct01" /note="(protein coding) 33% identity to hypothetical protein PFB0800c - malaria parasite (Plasmodium falciparum)" /codon_start=1 ORIGIN watson strand 1 ATAAATAATA TATTCAAAAA TATACATATA ATTTTTTTTT TTTTTATTTT 51 TATCAAAATT TAAAAATAAT TATATATATT GATGTATACA AATAAATATA 101 TTCATTAAAA AAAAAAAAAA AATTAAATAA TAAAACTTAA AGAATTAACC 151 CTCAATCTAT TTATTATCTA AATGTATTTT ATTTATATGT TTTTTTATTT 201 AATATATATT TTTTAAAATG TTGCATAAAA TATAAATATA AATTGTATAT 251 AAAATTTAAA TTAGCATATC ATAATTCATA ATAAAAATTA TAAGTACAAA 301 AAAATAAATA AATAAATAAA TAAATAAATA AATAAAAATA ATATAATATA 351 AATAAAATAA ATTAAAATAA AAAGAGAATA AAAAGGAGGA ATTATTAACT 401 ACTAAAATAA ATATTTTTTT TATATTCACA TTAATATTTA TTTATATTTA 451 TTTCATTTAT AAAAAAAAAA AAAGAAAAAA AAAAAAAAAA AAAAAGTGAT 501 TAAAATTTTA AACAATTTAT AAAAATTTTA ATATTTATTT TTATATATAA 551 TGTTTTAATT TTTACCTAAA AATACATTGA AAAAAAAAGA AAAAAAAAAA 601 AAAAAAAAAA AAAAAAAGGC TGCATTGATT TTTATATTAT TTTTATATGA 651 TTAATTATAT ATATATATAT ATATAATATG TAGAGGAACA CAAAGTATTC 701 TTTTAACTTT ATTATTTTTT AAGAATAACA TAAAAAAATA AATTAATTAA 751 AATAAAAATA TATATAATAT GTATAAATAT CTTTTTCTTT TTTTTTTTCT 801 TTTTTTCATC TATTTAATAA CAAAAATATA ACAACAAAAA AAAAAAAAAA 851 ATAAATAAAT ATATATGTAT ATTATATATA TATATTATAT ATATATATAT 901 ATATATAGAA AAAATAAAAA AGTATAATTT GTAGATTTTT TTTTTAATAT 951 AGAGAAAAAA ATTGAAATTT TTTATTTGTA TATGTATAAA ATAATTAAAT 1001 CATTTAAAAC ATTTTAAACT TTTGCTCTTA AATTTCAACT ACAATATATA 1051 CATACATAAT ATATATATAT ATATAATATG TATATTTTTT ATTTATTCTT "chrblob_4298.glm_1|24oct01" 1101 TTAAAAGTAA GTTTTCTTCT GATATTTTTT TTCCTTAATA CTTGCTTCTT 1151 CTTCATATGT AGGCATATTA TCCAATACAA TAGTATCTTG ATCATATTGT 1201 ATTTCATTAT TTTTATTTAT ATTTCTCTTT GTTTTTCTTT TTTTGGCTAG 1251 TATTTGTAAT GATCCGTCGT TTAATTTATT CATGGAATTA TATTCATTAC 1301 TATCATATTC TTGTGCTTGT CTATTAGGAT ATCTTGGTAT TTTTTCATGA 1351 CCCTTAAGTA TGCCTTTTTT TATTAATCTT TTCCTTTCGA TTTCCATCTT 1401 ATGATAAAAA TATAATTTCT TAGATAAAAT TTTATTTCTT TTACTTAAAC 1451 AATTTCTTTT AGGAGCAATA TGTAATGCTT TTCTTCCACC TCGTTTTTGA 1501 TATTTTTTCT TTTTTTTGAC TATATCATAA TATTTACTTT GTAATTTTAA 1551 CATTTTGCTT ACTTTTTTAT TTAGATTTTG AAAAATAATT TGTTTCTTAT 1601 CAACAGTTCG TTCAATTATA TCATTAACAA TATTTGTAGT TTTTTTATTA 1651 AAAAAGGATG TTAAGGAATT ATTATTTTTA TCGAAATTAG AAGATCCACA 1701 AATATTCTTT GTTTTATATA TATAATCATT TATATTATTA CTTAAATCAT 1751 AATTTATTAT TTCACAATTA TCAAATTTAA CACCTCTACT TAATATATTA 1801 GTACATATTA GTATATTCGT TTTCCCTTTT TTAAAATCTC GATAATTTCT 1851 ACTCCTATCT TTATAGTTCA TTTCATTATG TATATAACTT ACTTTATATT 1901 CTAATTCTTC TAATATTTCT CGAATATTCA TTACACTCTT TCTAGTATTA 1951 CAAAATATTA CATATCGACA AACAAAAGCA TAATTTCTCC CACCATATAT 2001 ATTTCCATAT AAATTATTCT TATAATTATT TGATATTTTA CCCTTATTTA 2051 TCTCTTTACT ATTAAGTATT TCTAATAATA AAGATACTTT CTCCTTATTT 2101 TTACTATTAA TAAATATATG CTTCATATCC TTGTCAATGT GGTGGCTACT 2151 TATATTTATT ATTTGTTGAA TATATTTACT CCTTATATTG TTATTTAAAA 2201 ATTCTGAAAT AGCACAGGTT TTAGTTGATG ATACAAAAAT GCTAATAGGG 2251 ATATTTGAAT ATAATGTGTT TTTTATATTC TTAATATTTA TATTATCAAT 2301 ATATATATCC TTTTTTTTTT CATTATTTAT ATTGTTTTCC TTATTATTTC 2351 CTTTTTCTAA AATGGGACCT AATTCACCTT GTCTTTTTTC TATTTCATCA 2401 TCAACCACTT GTCGTGTATT TGTATAATTA TTATTTGTAT TATGAAAACC 2451 ATATATTTTA TTGAAATCAC CTCCCAACCT ATCTTTACTA TTAATACGAT 2501 ATATATCTTC CTTATTAACA ACATCATACA TATTATCCTT ACTTTTATCA 2551 TCCGTCATTT TATTGTCGTT TATTTCATGT TTATACATAT TATCATTACT 2601 TTTATCATCC ATCATTTTAT TGGCGTTCAT CTCATGTTCA TACATATTAT 2651 CCTTACTTTT ATCATCCGTC ATTTTATTGT CGTTTATTTC ATGTTCATAC 2701 ATATTATCCT TACTTTTACC ATCCGCCATT TTATTATCGT TCATCTCATG 2751 TTCATACATA TCATCATTAA CCCCAATTTC CTTGATAGTA AACCTATTCC 2801 CAGACACTCT CTTTCGAATT TTTTTCCGCC CCTCTTCATC TCTCTGTTCA 2851 ATGCTCTTAT CCAACAATTT ATTCGAATAT TTACTATTTT CCCTGTTATT 2901 ATGATATTCC ATATCATCTT CATCGCATTT TTGTAAACCC CTAAAATAAT 2951 ACATATTTGT ATATTTTTTA ATATGGTTAA ATAATAATTG TAACTTTCTC 3001 TCATTAAAAA CGTTACATAA AGATTCTGAC TCTTCAATAA TAAAATATTT 3051 TAAAAATTTG AAATTATATA AATGTTTATT CTTGATATTT TCCATCTTTT 3101 CAAATATTTT ATCTGGAGTC CCTATCAAAA GGTCAATATT GTAATTTATT 3151 CGCTCATTCC CTCCAGAGGG TTTTATTTTG TCATTTCTTT TTTCTTTTAT 3201 ATTTCTGACA TATTCATACC TACCTCTATA AGAAGTATCT ATCCATATAT 3251 TTTCTTGTTT ATCATTATAA TTTCGATTTA TATCAGAAAA ATATTCTACG 3301 TGGTATTTTT TTATAGATTT TTTCTTATTT AAATATCCTC CACTCAATAA 3351 TTCAATATTT ATATCGAATT TTTTTAATAA ACTAAAAAGT TCACAAGCTG 3401 CTTCTCTTGT ATTTGTTAAA ATGATAGCAT ATGGGAAAAA TACATTTTTC 3451 TTATGTCTTA AACTATTCAA TTGATTATTC CTCTTATTTT TTATATAACT 3501 ATTATTTATA CTATAATTTT TATATGTACG CATATGTATA ATTCTATTAT 3551 TCACTTTATA TTTCTCATAT GATATATTAA AAAAAAGATT TTCATCCTTC 3601 CTACGATGAA CATATCTTAA CCTTTCTTTT TTTCTATATA GTTTATTTTT 3651 ACATTTCTTA TAATTATATT TATTTAAAAA ATGATAAAAA TTTAATAAAT 3701 ATTTCATTAT ACGTTCGTTA GATTTATAAA AATTATCTAA TATAGGAAGA 3751 AAATAACTTA ATGTTTTCCC ACTATTATTA GGGCTAACGA TTAAGTATAC 3801 ATCATTAAAG CATTTTTCAT TATTCTTATT CATAGATATA ATTTTTTCTC 3851 TATCATCATT CAAATGATAC ATCAGATTAG GTGCTCTGTG TGTATTATGG 3901 TTATTATTAT AATTATATTC TATGTTATTT TCATTTTTAT ATTTCTCAAC 3951 ATTATACATA TTATTTTTTT CTGGTATAAA TATATTATTT TTTTTTAGGT 4001 AGTTATTTAT TTCTATTCTA TTCTTTAATA TTTGATTGTA AATGTTATTT 4051 CTGCTTATGG ATATAATACC ATCTCGATGA AGCGTATGAC TACTACTATT 4101 ATTATTATTA TTACTACTAC TATAAATATT ATTATTATTA TTATTATTAT 4151 TATTACTTGG ATAATTTTTT TTTTTTTCAT CTAGTAATAA AGGTATCACA 4201 TTCATTTGTA TACTTGAAGG ATTCATAATA CCTAATTCAT TTAATTTTAA 4251 ATATATATCA GTTTTTAAAT TATATTCTAA AAAACTATTT TTATATAATT 4301 CACTTTTTAT AAATTTCTCA TTGTCTCTTT CTTTCTTTTT TAAATTCCTC 4351 TTTACATAAC GTTTTCTTCC AATAACAAAA TTCTTGTTTT TATCTTTGCT 4401 CATTTTATGA ATACTATGGT ATGTGCACCT AAACATATTG AACATGTTTT 4451 CTCCTTCTTC CTTCAAAAAG GAGGTAACAT AAAACAAACG ATTCCTCAT 4499 "chrblob_4298.glm_1|24oct01" A 4501 TTTTAACATG TTTTCAAAAA TAAAACATAT AAATAAATAA ATATATATAT 4551 ATATATATAT ATATATATAT AAATATATTT ATTTATTTAT TATATAATTC 4601 TTGTGTGGTG ACCATTACAC TATATTCCTT TTTCTTTATA AAAAATAAAA 4651 TAAATGCATA TAGAAAATAA TAATTATATA CAGGAACAAT TATATATATT 4701 ATTTTTTTAT TTATTTATTA ATTCAGAATA GAGCATATAT ATTGAATTCT 4751 ACATAAATAT ATATATATAT ATATATATAT ATATATATAT AATATATTAA 4801 ATTCTTTGAA TTCTTATTTA TCTTATATTT TCCCTTGAAT AAGAAATAAA 4851 AAAACATAAT TAAATAAATA ATATAAAATA AAAATAAAAT ATATTACACA 4901 ATATATATAT ATATATATAT ATATATATTT TTGTTAAGAA CCAAATAACA 4951 GTATACACCC CCCAAATAAA AGAAAAAAAT TATTTCATTT TTCTAATATA 5001 TCAAAAAAAA AAAAAAAAAA AGTGACACAT ATATTATTAT TTGTTGCTCT 5051 TTTAAAAATA TTCATATATT ATTAGGCATA GCCATATACC ATTTTTTATA 5101 CATGAAATAA ATATATTTCA TTTTCCTATT ATTTTTATTT ATTTATTTTT 5151 TTTAAGTAGA ATTACAAAAG TTTTTAAGAT ATAGTTTCTT ATAAAAATAA 5201 AAATATATGT AAATATTTTA TTTTAATAAA TAATAAATAA AAATTATATT 5251 ATTTGTTCAT TTTATACAAT ATATATATAT ATATATATAT GTAGTTAAAA 5301 AAATGTAGTT TTTCTTTTTA CATTTAGATG GTGTCATATA TTAACTGCTA 5351 AGATAAACCT AATAAAAATT ATAGTTTCAT TATTCCTTTA ACAATTCCTC 5401 AAAAATGATA TAAAACACAA TATTATAAAG CAAAAAATAA TAATAATAAA 5451 ATTTCTCTCT ATCTTA "chrblob_4298.glm_2|24oct01" 5467 TTAT TCCTTTTTTC GTAGGACAAG AAAGTTCATA 5501 AGAAAATATT CCTCATAATT ATACATAAAC TTTGAATTTA TCTATACTGT 5551 AAATTGAAAA AAAAAAAAAA AAAAATATAT ATATATATAT ATATATATGT 5601 ATGAATACGA ATAGGATATT ATATATTACA TATGAAAAAT ATATAATGTA 5651 AATATATACA TATAAATAGA AATCCATTCT TTATTTCATT TTTACCTTCT 5701 TAAAACCAAT TATGTCAGCT CTTTCTCTAA AGCATTGTCT GCATATGTTT 5751 ATGTTATATT TTCTGATTAT GGCATGCTTA TTCGAACATA CACGGCTACA 5801 GGAAAATAAA AAAAATTATA TCAAATAATA AATCAGTAAT AAGTATATGA 5851 TAATATATTA AGATGTACAT ATATAAAATA ATAAAACATT CATAAAAAAG 5901 GTACCAAACA TATATATTTC ATTATGTTAT TAACATAAAA GTTTCAAATG 5951 TTATTTTACT TAAGGAATAA AAAGAAGAGG TAAAACAACA ATGCACATAT 6001 ATACATATAT ATATATATAT ATATATATAT ATATACTTAT AACTTTAAAA 6051 TATACATATA TTTACATAAA AATCTCACAT TTTAACAAAA AAAGCTGATT 6101 CATTAGTTAT ATTATACATA TATATATATA TATATATATA TATATTTATA 6151 ATTTTTTTTT TTTTTTTTAA ATTTACCATT GCCTAGATCC TTGACCATAT 6201 TTCTTTGGAT GAACGTTTAA AATACAACCC AT 6232 "chrblob_4298.glm_2|24oct01" TGTTTCTT AAATTATTTA 6251 TTTTATATTA AAAAAAAAAA GAAGGATTTA TTTTCCAAAA TTTTTTATAA 6301 AAATGAGTGT TATAAAATTT TTTTCTTGAT GAAAAAATAT AACTTTAGCT 6351 TTTTGTAAAA TATATATTAT TGTTTATTAT ATATATACTT TGTTTTTTAT 6401 AAATTATAAA TTTACTTTTA AATACATAAT TATTTTATTA ATTGTATAAT 6451 AAAAAAAAAA AAAAAAAATT TTTTTTTTAT ACTTATATTT TTTACAAAAT 6501 ATATTTTTAT TTTATATATA TTCCTTTTAC ATATAATAAT AATAATAATA 6551 CTCGTTTTTA TTTAAAATTA ATTTTTTTTT TTTTTTTCCT CCATATTATT 6601 ATTTTATGGG CACTACATAA TTTATATACT AGTATAATAA TGTTATAATC 6651 ATAATATATT AAATTATAAA TATAAATAAT AATATAATAG ATACATATAT 6701 TTTTAATTAT ACTTAAAGAA ATATTATATA TACTATATAT TATATATATA 6751 TATATAAATA ATTTTTTTTA TACCTTTATT TATTATATTA CTTGTTTTTT 6801 TTTCTTCGCT AAAGTATCAT ATATATAATA AAATATATAT ATGTATAAAT 6851 TAAAATATAT ATATTAATTA ATATATTATA TATGAATAAT AATATATATT 6901 CGAGATAGAT AAAAAAAAAA TAAAAAAATA CCATAAGAAA AAAATTATCA 6951 TATATAATTA TATATACATA CCTATAATAT ATATATATAT ATATATATAT 7001 ATAATATATT ATATATTTCT ATTTATTAAT AAAATTAAAT AATTTTTTAT 7051 AAAGTTCCAT TTATTATTTT TTTTTATATA TAATAAAAAG ATGTAGAAAT 7101 ATTATTAATA TAAAATAAAA AATTTTTAAT TCTTTTTAAA TTATTTAATT 7151 AATAAATATA TTTACAAATA AAATGCATAT AATTCAAGAG GTTTTAAAAT 7201 CGGAGGGAAA TATTATATAC AAAATATATT TAGGATGTAA TATAAACATA 7251 CATTTTGGAA TATACATTCT TGTTTATAAA AAAAGTTGAA AAAGCAAATA 7301 AAAAAAGAAT TTTCTTTATT TATAAATTCA CATATTACGA AACAATTATA 7351 TTTTTATAAA TTTCCTGTTT CTTTATTATA TATATATGTT CTGTTTATAT 7401 TTTTAAATAT TAAAAAAAAA AAAAAAAGGT AAAAAAAAAA AGAGAGTCAA 7451 GGGGTTTTTT TATTAGTACC CCCACATATA TATTTTATAT ATTCTATTAT 7501 AAACTATATA TGAATTATTT TTTTTTTTTT TTATCCGGTA TATTTTAAAA 7551 ATATATAATA TGAAAAATAA AAAATAATTA TATTTATTTT TTTTTTTTTT 7601 TTTTTATATA TTATAATATA TTAAGTTTAT AAAATTATTT AACATAAGCT 7651 TTATAAATCT CCTTATGACT GTGTTCTCTT ATCTGAATGA TCATTTTTCA 7701 TTATATGTAT TCCATTATTT AAATTATCCA AAACATACAT TGTCTAAAAA 7751 AAAAAAAAAA AAAAGAAAGA AAAAAATATA CAATTATAAA TTTATTTAAT 7801 ATTACATATA TATATTGAAC TGTTATGTAT ATATTACATC AATAGTCCCA 7851 ACATTGTCAG CAAAATAACC TGAAAAAGAA AATATTAAGT GGGTACATAT 7901 TAAAAAAAAA ATAATAATAA TATTTAAAAA ATTAAATGTT ATATATATAT 7951 ATATATATAT ATATATATAT ATTTATACCT GGCTTATTTG TATTATTATC 8001 ATATTTGCAA ATTAAAATTC CTTTTGTTTT ACAACATGCT GTAGCACATC 8051 CAAGGTTCTA AAAAATGATA TATCATATAA ATGTTATTAT AATTTTTCTT 8101 TTTTGTTTTT TCTTTAATTT TTTTTTATAT ATCTACAGTA TGTATCTACC 8151 TCTGAACTTT TCCATATAAT CCTTGTAAAT TCAAATATAT TATCATTCCT 8201 TTTAATACAC CCTGTTATTA ACAACAAAAG AAAAAAAAAA AAAAAAAGAT 8251 AAAAAAAAAA ATATGAATGG TTCAGGTGAA TCATATTATC CAAACATAAA 8301 AATATATATA TTTTTTTTTT TCGCTATAAA ATGAAATTTT TTCTTTCTTA 8351 TTTAATATTA TTATATAAAA CATTTTATAT ATT "chrblob_4298.glm_3|24oct01" 8384 TTATTCT TCCATATTAT 8401 ATATACCTAA CTCAAAGTCA TAATCATTAA TCCCCTCATA CCATGTATCA 8451 ACAGATGCTT CAATATTTTC ATTTTTAAAA AACGAAAAAT AGTTTGTATC 8501 AACTTGCTTT GAACTAACAA TACAATCAGA ATTATCCCTT ATCTATAAAT 8551 ATAAATATAT ATATATATAT ATATATATAT ATATATATAT ATATATATAT 8601 ATATTTATAT ATGTACATTA TTTTTTACAT ATTTACTTTT AACAAAACAA 8651 ATTCATTCAT 8660 "chrblob_4298.glm_3|24oct01" ACATTGAACA ACATTATATA ACAGTATTTA TATGTATAAT 8701 AATATTTAAA AAAAAAAAAC ATTTTAATAT ATTAACCAAA TTTGCTTCGT 8751 ATGTTGCTAT CTCTTCAAGT TTCTTACTCC TTTAAAAAAA AAAAAAAAAA 8801 AAAATATTAT AAAAAATTAA ATAGAACATA ATCAAATAAT GTATTTTTTT 8851 TTATTCTCTA TATATGTATA TATTTCCAAA TTTTGACTAA TATAACCATT 8901 GAAGTGGTTT GGCTTTATGC TTTAATCTAA AATCATTATG TCTTTCTTTT 8951 ATAAATTCTT TCTATACAAA AGTAAAATAT ATATTTTTTT ATCTCATATC 9001 TTTTATTGTT ATAAAATTAG TTCTCTATTT TTTTTCTTTT ATTATTATTA 9051 TTATTTATTT AATTATATAC ATTAAATTTA CAAAATTGGC CATTCACATA 9101 TATATAAGAA ATAAAAACAA AAAATAGTAA AAAAATATTC ATGATTCCTA 9151 TCATAGTATA AATATAATAA TTATCTCTTT ATAAATATAT TGAAATAAAG 9201 GTGTTAATGA AGTGTTATGG CGTTCTCCAT TTATATGTAA TATAAACTTT 9251 TATATTTACA ATTTTTTCTT TACAAATATA TACATAATTA GTATATTCAA 9301 TTATATATAT ATATATATAT ATATATATAT ATATATATAT ATATATGTGT 9351 GTGTATATAT ATATATAATA TAAAAGTTGG AATAAATATA TATAAGTATA 9401 TATAAAATAC ACTTTTATAA TGTCATAATC TAATAAATTA ATAAACAACG 9451 TAATAAAGAA ATAACTATCC TGTCAAAAGT CATTCTTTTA TGATGTGTTG 9501 CCTTAAGAAA GAGAACAACA TATAAATAAA TAACATAACA TTAAATACAT 9551 ACAAAAATTT GTACATATTT CCAATAATGT ACATACAAAA TAAGAATGAT 9601 AAGAAATTCA CGAACATTTT TTCTTTTTAT ATTTCTATTC TTATATAGAA 9651 CCAAGCAAAA ATTATTATGA GCTATTGTAA TATTTAAAAA TATAATAATA 9701 TAGACATAAA TAATATTTTA AATATATACA TATATATAGT TATATTTAAT 9751 TTCATACAAT GTTAGTATGT TTTTTTTTTT TAATGTACTG TTACACGCTA 9801 TCATATATGA TAACCTTTTG TTCTTTTTTT TTTTTTTATT TAAAAAAAAA 9851 AAAAAATGTA TTTAAATTAA ATAAATAAAT AAATATATAT ATATATATAT 9901 ACCGTGAACA ATAAAAAAAA ACCTACTACT ATGAATTCAT TATGTAAATG 9951 TATTAAATGG ATCTATAATT TTTCATATAG TGGAATTTTC GCATATATAT 10001 ATATATATAT ATATATATAT ATATATATAT AATATATATG AATATATATT 10051 TATCTGTGCA CTAATAAACT TATATTATTT TTTATTTTCT TATATGTATT 10101 AAGAATATCT TAAACATGTG TGGGCAATGA AAAAAGGAAA AATAAAGGAT 10151 AACATAATAT ATCCCTTAAG AATATAACAA AACAGCGCTC ATCAAAACAC 10201 AAATGATACC TAAAGGGAAA AATATATAAA TATATATATA TATATATATA 10251 TATATATATA ATTATGTTTA CGTAAAATTT TTATATTC "chrblob_4298.glm_4|24oct01" 10289 TT ATGTATTACC 10301 AAGAAATTCT AAGAAACCCA TACCGATTAA GGTATATGTA AATAACTCAT 10351 CCTTAATTGA TGGATTTCTA CTAGTTCCTA AAACCAAAGC CGAAAAAAGG 10401 TTACCTATAC CTTGAGCAAC CTAAATAAAA AAGAAAAAAA AAGAAAAAAA 10451 GAAAAAAAAA AAAGAAAAAA AAAAAAGAAA AATGAATGCG TACACACAAG 10501 GTCTAAACAT GTATATAATA AGAATGTTAT AATTATAAGA AATATAAATA 10551 TTTAATTATA ATTTATTTTG TTATTTTGTT ACCCCTCCAA CTGACATTAA 10601 GGCAATGGCT GCTGATAAAC TTGCAATGCC ACTATCGTGT CTGACACCAA 10651 ATTGTTTGTT AACATTATAT TTTTCATCCT TCTAAAAAAA ATACATGGAA 10701 TTTTTTTTTT TTTTTTATCC ATAAATATAA AAGTTCACAA ATAGACAAAC 10751 AATATATATA TATATATATA TATATATATA TATATATATA ATAATAATAA 10801 CATGTAAGAA TATTATGTGT TTTATTATTG ATAAGATATA TTTTTTGTCT 10851 AAATGGATTT TATAAGAAAA TATATACACA AAAAGGAAAA ACTAATATAT 10901 AAAATATAAA TGGAAAAAAA AAAAAAAAAA AAAAAAAAAG TGACCATACA 10951 TTATATATGC ACTTTTGTAT ATATAATTAT ATAAATAAAA ACACATATAT 11001 ATATATATAT ATATATTATG CTTTATATAT ATGTCTAATA TTTTCATACT 11051 TGAAGGAGGG TGTTACAATT TGAATTACTA ACTGATCTAC ATATAAATGG 11101 TGAGGTGTGA TAAGATCTAA AAAAATTATT TTCCTTAAAT AAGTAATTAG 11151 AAATAAAGGA TTTGTTCACA TTGGTTGTTA TACTTCTATT AGAGAAAAAA 11201 TATCCACTGC TCAAATATGA GCTCTTTAAT TTAAAATTTT GAAAAAGAGA 11251 TGAATTTAAA GTATTATAAA AAAACTTATT CATCAT 11286 "chrblob_4298.glm_4|24oct01" TTTT AAATTATTTG 11301 AAAAAAAGAA AATTATAAAC AGTGTGTAAC ATATAAATAT TTTCAAATAT 11351 TTATCGCATA TATATATATA TTAATTTTTT TTTTTTTTTT TTTCTTGGTA 11401 ATTTGAGATA TATTTTTAAA TTAAAAGATT ATACTCTTTT CTTTGAAATT 11451 TGTTCAATAA TATACATATA TATATATATA TATATACATA TATTTTTTTA 11501 TATTATTATT TTTTTTTTCT TCGTATTCTA TATGAGGGTG TAAATTTATA 11551 ATAATTATTA TAAATTTATT TATTTTTAAT GTTACAAGAA TAATATATTT 11601 TATAAAAAAA AAAAAAAAAA AAAAAAAAAA ATATGAGTTA ATATAATTAT 11651 ATATCTTTTG GAAAATACAT TTTTTATTTT TTATGAGGTA TTTAAAACTA 11701 TTTAATTTTT TTTTTTTAAA TATAAAATGA AAATAATAAA ATATAAGGTT 11751 TTACATTATA ATATATTATA TGGATACCAT AATATATATA TTTAATAAAG 11801 ATATATTCTT CTTCTTAAGC ACACCATATC AAAAAAAAAT GTACACGTAT 11851 ATACAATACA TACATATGTA TGCATATTAT ATATAATATA TATGTATATT 11901 TTTTTATTCT TAAATATTGC CATATATATA TATATATAAT ATATATATTA 11951 TTTATATATA ATTTTTTTAA TTTTGTTAAT TATATACTTT TAAGTATTTT 12001 ATATAATACA TATTATATAT TTTTTAATAA TATTAATGAA AAAAAATATA 12051 TTATATAAAA ATATTATATA TATAATTATC CATCCTTACA TACATGTATT 12101 ATATATAATA TATTATTATT TATATTATAA TTATTATATA TATTATATAT 12151 ATATATATAT ATATATATGT ATATATATTT TTAAATGCCT CATGTATTTT 12201 TTTTTTTTTT TTTTTTTTTA ATACAGTTCA TTTAAAATAT TTAAAAAAAA 12251 AAAAAAAAAA TTATATTATA AATAAAAACT AAATATTATA TAACAAAAAT 12301 TATATATTTT TTTCCTTTTT CATTTAAAAA AAAAAAAAAA TTAAAAGAAT 12351 TTTATTTTTA TTATTTTTCA TTAATATATT TTATATTTTT AACTATAATC 12401 TTACCATTTT CTTTCTGTTA ATAAAAAAAA AAAAAAGAAC ATATTTTTAT 12451 GATATATATA AATATAATAA TATTATATGC TAAGAATAAA AATAATAAAA 12501 ATATAAAAAA TATTAAATTT TCATTATTTT TATACATTAT ATATTTTTAT 12551 AAATATTTTT CTTATTATAA TAATATATAG TAAAATATTT ATAAAATATA 12601 TAATATAATA TATATACCTA AATAAAATAT ATTTCATTTT AAAATATGAT 12651 TTTTTTTTAT CGTTATCTTT AAAGATATAT ATATATATAT AGTTTATGTT 12701 AAAAATAAAA TTGCTTATTT TTTTCACCTA AAATAAAATA TATAATATAT 12751 TATTGCATTT GATATAATTT TAAATTTGAA AAGGAAAAAA AATAATAGTA 12801 AAACTAAAAT CAAATTAATA AATAAAAAAA GAAAACAACA AAAAAGAAGA 12851 TATACATACA TAATACATTA TATATATATA TTATATATAT ATGAAACTAC 12901 TTTTTATCCT TATTACAAAG TTTATAATTT TTTTCTATAT AAAAAAAAAA 12951 TTGATTATTT TCTCATCACC TATATGTATT AGTAAAATGT GGACTGTTGA 13001 TTAACATTTT TTATATATTT AAATAAGTAT ACATATTTTA TATAAACACC 13051 CCCACCAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAT ACACATATAT 13101 AAACACATAC ATATATAAAT ATATATATAT ATATATATAT ATATATATAT 13151 ATATATATAT ATTTTATTAT CGTATTAGTT TCCTTCCTTG AAACAAAATA 13201 GAAAAAGGAT TCATAACTAC TACACAAGTG CTTATATCTA TTAAAATATT 13251 GAACCTGCAT ATATATATAT AGAGAGAACA ATACATATAT AAATATATAT 13301 TTATATATAT ATAGAACAAT ACAGATATAA ATATATATTT ATATATATAT 13351 AGAACAATAC AGATATAAAT ATATATTTAT ATTTATATAT ATATATTTTC 13401 TTTTTTTTTT TTTTTTTTTT TTGCTTTTAT TTTAATTTTT TTGAGAAAGG 13451 AAAAAAAAAG AAAAA start chrblob_4298.glm_6|24oct01 glm exon 1 13466 ATG CAG AAC CTT TTA AAT ACC AGC AAA TTA TGT GA 13501 A GTG CTC GAG GGT TCC ATC AGC GCT TCA AAG GAG AAA AGA ATT GAA TGT G 13551 AA GAA TAC TTA AAA CAA ATA ACT AAG GTT GAT GGT TAT ATG AAT GTT ATA 13601 TTA AAC ATA GTG AAG AGT ATT AAT GTT GTT GAT GAC AAT ATT AGG ATA TC 13651 A GCT TCC ATA TTT TTA AAG AAT AGT ATT AGA AAC AAT TAT GAT GTA TTG A 13701 AA AAA GAA GAA GTA TGT ACT TTA ACA AAA GAT ATA TAT GAA AGC TTA TTA 13751 TAT TTA GAA ATG AAA GAT AAA CAA TTA TAT ATT CAA TTA TTT GAA ATA AT 13801 G AAA ATT TTA ATA CAT AAT AAT TTC CCA GAT AAT TTT TCG CTA TTA GAA A 13851 AT ATT TTA GAA GAT ATG AAT CAA AGA AAA GAT TTC CGT AGA CTA TAT GTA 13901 AGT TTA TAT TGT TTA AAA TTA ATA TTT AAG AAA TTA AAA ATA AAA AAG AA 13951 A GAG AAT AAT GAA TTA TAT ATA GAT ATA TTG AAT AAA TAT TTT TAT CCA T 14001 TG ATT AAT TGT TTA TAT GAT TTA AGT ATG TTA GAT TTA AAT AAT AAT GAT 14051 GTT AGT GAA ATT TTA AGT TTA ATT TGT AAA ATA TAC TAT TAT GTG AAT GA 14101 T AGT TAT TTA ATA AAA GAA GTT ATC ATA TTA GAA TAT ATG GAT AAT TAT T 14151 TC AGC TTA TTT GAT TTT ATA TTA AAG AAT GAA ATT ATA GTT ACA AAT TAT 14201 ATT GAA GAT GAG AAT TAT TTA AAA AAA TTA CCA CAA TTT AAA TGT AAA AG 14251 A ATA GTA TTA GAT ATT ATA ACT CGT TTA TTT TCC AGA TAT GTA AAT ACG A 14301 AT TAT AAT AAA TTT AAT AAT GAT ATT ACA AAA AAA TTT TGT GAT GTA TTC 14351 TTG AAC AAA TGG TTA TGT CCA TTC TTT GAA GAC TTC ATA ATT AAT TTA CA 14401 A AAT TAT GAC AAA AAT AAA AAA ACT TTA ACA GAC GAA TGT TTA ATA TAT A 14451 TA TTA CAA GGA TTA TCA TAT GGT GTT GAA AAT GCA TTA ATA TAT AAA AAT 14501 TAT ATA AAA AAT AAT TTT GAT TTT CTA GTT CGA AGT ATA ATT TTT CCA TT 14551 A TTA TGT TAT AAT AAT GAA GAT ATT GAA AAA TTA TTA TAT GAT GAA TAT G 14601 AT TAT ACT ATG AAT ATA TTT AAT ACT TAT GTA GTC GAA GAT AAA AAG GTA 14651 AGT GCC AGC TCT TTT ATA AAA GAT TTA ACA AGA TAT AGA GGT GTT AAA CA 14701 T ATA TCA GAA TTA TTT GCT TTA TGC GAA AAT ATT ATA AGT ACA TAT AAT G 14751 AA AAT TAT ACC AAA ATT TAT AGT ACT AGT CAT AAT GTT ACT AAT GAA AAT 14801 GAT CAA TTC ACC CAA TTA GAA GAA TTA TTA AAT AAT GAA TAT TGT AAG TA 14851 T AAA TAT GGT GCT TTA AAA ATA TTA GAA TGT TTA TAT AAT CGT CTA TGT G 14901 AT AAG AAA AGA AAT ATG AAC ATT GAA CAA TTT TTA AAA ACT TAT GTA GAA 14951 AAT GAT TTA AAT AGT CCG AAT TAT TTA TTA TGC TAT CAA TCA ATT GTA AC 15001 T TAT TCT TGT TTT ATT AAA AAA GTA CAA TCC TTC TCA GAT ATA AAT GGT T 15051 TA TTA AGA AAC TAT GAA ATC ATT CTT AAT CAT ATG GGT AGT TCA AGT TTA 15101 TTA ATT AGA GTA GCT AGT GCA TCA TAT ATT AAG AAA TTC TTT AAG ATC AA 15151 A AAT GAA TAT TTA AAA AAT GCA ATC ATA AAA ACC ATT CCT TTA CTT ATT G 15201 AA CGT TTA TTA AAT GTA ATA AAA GAA ATT AAA TGT GAA TAT ATT GTT ATG 15251 ACC TTA GAT AAT TTA GCA TAT ACA TAT AAA GAT TAT ATA ACA CCA TAT GT 15301 A AAT GAT GTT GTA GTT GCA TTA TGT ACA AGT TTT GTA TTC CTT ATA AAT A 15351 AA AAA GAT GTT GAA GCA AAT ATT AAG AAT TCA TTA GAA TAT AAT TTA AGA 15401 AAT AAT AGC CAT ACT AAT AAT AAT AGT AAT TAT AAT AGT AAT AGT AAT AA 15451 T AAT AGT CAT CAT ATG CAT CAT CAT CAT CAT CAC CAT TTT CAT AAT AAT A 15501 AT GAT ATA ACA ATG AAT AGT ATG AGT GAT AAT TCT TTT ATT AAA CAA AAA 15551 TAT AGT ACC CTT ATG AAT GAA AAA AAA GAA AAA AAA AAT GAA AAT GAA GA 15601 A TTA GAT TTA AAT TCT GTT ATT TTA TCT ATA TTA ACA GCA ATC TTA AGT T 15651 TA TTA GAT TCA GTA GAT GAA GAA AAT AAA GTA CAA ATT TAT AAA AAT ACC 15701 ATA TCT TAT TTA TAT GTA GTT GTT GAT GAA ACC TTT AAA TCA CCT TCT AT 15751 T GAT TAT TTA GAA GAA GCA TTA TCC TTA TTA ACA AAT ATA ACA TAT TAT T 15801 TA GAT ATA GAT GAA CAA GTA TAT AAA CGT TTT GAA AAG TTA TAT GAT ATA 15851 TTT TAT TTT AAT ACA GAT GAT AAT TTG AAA ATG CAA GAA TTG AAT ATG AT 15901 A CGA ACA AAT CCA CAA ATT ATT TTA AAC AAT GAA ATC TTG ATT AGT GAT A 15951 AA AAC AGT GAT GCA TAT TTT TAT GAT TTC ATT TTT GAT TTA TCA TTT TCT 16001 ATA GGT GTA TTT GAT AAT ATA ATA TCT AAA GCA ACA GAA AGT TTT GTT CA 16051 A ATG TAT AGT CAT GAA TAT GGA ATG AAA TAT ATT CAT ATG GTG TAT AGG T 16101 TA GGT ATG TTT GCT TTA CAT TCC AAA ATT GTT AAA AGT GCA TGC AAA CTA 16151 TTC TTT ATA CTA TTT GAA GCT ACT GTA AAA ATA AGA GGA GTA GAT GAA TT 16201 G ATA ATA CCT GTG CTA AAT GCT TTT TCT ATG AAA TTA TTT AAA CAT GAT G 16251 AA GCA CAA GCT CTT ATG AAT CAG AAA AAA AAA GAA TCT TTA GAA AAT AAT 16301 GAT GGT GCA GAT AGT ATA TGT AGT GAA TAT GAT GAA GAT ATT TTG AGT AA 16351 A ACA AGT CTA GAA TAT ATT AGG AAA TTA TTT TAT TCA ATT ATT ATT TAT A 16401 AT GTT GAT CAA TTC TTT TTA TTC TTT AAT AAT ATA AAT AAG ACA AAT GTT 16451 ATA TTA ATG TTC TTG TCT AAT CTA AAT GAT ATC AAA ATT AAT AAT ACA AG 16501 G AAA TTG TAT ATA CTA GCC ATG AGT AAT ATA TTA GAA AAT ATG CAC AAT G 16551 CT AAT ATT AGT ATT CAT ATT AAT GAA ATT AAT ACA TTT ATG CTC AAC CTA 16601 GTT AAT ATA GCT AAT TTA TAT TAT GAA AAT AAA AAT GTC AAA GAA ATG TC 16651 T GAA AAA TCA TTC GAT TCA GAT ACA TCA TCT ATT GAT GAT AAT AGT GAA G 16701 TC GAT ATA GAT GAA AAT GAG GAT GCC ACA AAT GAA AAG GCA TAT AAA TTA 16751 ATT AAA ACT ATT GAA GCC TTA GAA AAA AAA AAT GAT CTA AAA ATA AAA TT 16801 A AAA GAT AAT GTT ACA TTA GAT AAT ATT GTT ACT GCT CAA ACA CAA AAT T 16851 TT AAT AAA GAA ATC AAA AAA CAT AAT AAT AAT CAT GAT GAT GCA GAT TAT 16901 GAT GAC GAT GAA GAT GAC GAT GAT GAT GAT GAT GAC GCA TAT TAT GAT TA 16951 T GAT GAT TGT TCC GAT TAT AGT AAT GAT GAA TAT AGA AAA GGA TTC TTT G 17001 AT GAT ATT AAT GCA TTC AAA ATT TTA TAT GAT ACT ACA ACA AAC TTT TAT 17051 AAT AAG TAT CAA AAT ACT TAT AAT AAT GAA ATA TTG GGA AAA ATG AAA TA 17101 T CTA GTT GAT GCA GAT CAT AAT AAT GAG TTA CAA CAA AAA ACA CAA GAT A 17151 AA TAA* 17155 stop chrblob_4298.glm_6|24oct01 ACACT CAAAAAAATT TAAATAAAAA AAAAAAAAAA AAGAAATTAA 17201 TATATATATA TATATATATA TAAGTAATTA TTCATATTAT GTGTACAAAA 17251 AAAAAAAAAA AAAAAAAAAA AAAATCATTT TTATATTATT TTATAATTTT 17301 TTTACCCATA AAATTGAATA TATAAAATTA CATATACTTT TTTATGCATA 17351 CTTACATATT TATGTATATA CATAAAACAA TATTTTTCAT AATATTTAAA 17401 AAATAAAAAA AATTTAAAAT TAATTAAAAT AAAACAAAAC AAAGCAAAAC 17451 AAAACAAAAC AAAATAAATA AATATTACCA TAAAATGAAT TCCTTCCATA 17501 ACCATTAAAA GATAATTTTA CTACTGCCAT TTCTTATAGT GTGAATTATT 17551 TATCACATAT GAATTGTTTA ATCATAATAA TATTCTACAA AATAAAAAAT 17601 ATAATACAAT ATAATATAAT AAATATATAT TTAAAATATT ATTTTCTAAT 17651 GTCAACTTTA TTTACTTTTT TAAAGTGTCC ATATAAAGAA ATTTCTTCTC 17701 ATCACTAATA TTTTGATAAG AAAATATATT CACCTAAGGG AAAAAAAAAT 17751 AAGTTAAAAT AAAATAATAA ATGAACAATT AACATATATA TATATATATA 17801 TATATATATA TTTATTTATT TATTTATTTA TTTATTTATA TATCCCTTGT 17851 GAATTATTTT TAAAAAAAGT TCTTTCTTTC ATGTATTTAC TAATTTTTTC 17901 CTCTTGGCAA TATCAATATC TGAAAAGTTA ATATTTTCAT CTATCATTTG 17951 CAGTTTTATT AAATTATAAA CTTCTTCAAT GCACATCTAA AAATTAAATG 18001 TAACACACAA ATAAATATAT TTGAATATGT ATAAAAGTAC GAATGTGTCA 18051 TTTATTATAT GAAATATATA TTATTTCTTA CGTCATATTC AAACTTGTCC 18101 AGTAAATTTA TCGCCCTCTT TATAATATCA TTTTTTCTAA CAAAGAAAAT 18151 ATATATATAT ATATATATAT TAATGTTAAA ATATATAACC TGAATTATAT 18201 ACATACATTT ATCACATTTT TATAAATTTT TTATTCATTC TCGTACAAAA 18251 TATTTAGCAC GTGGGAAAGA TGATACTGTT CTTCTGGGCC CCTAATTAAC 18301 GCTTTGATTT TGCTCAGAAA ATTGTTAAAG TGGTTAATAT AATCAGCTAT 18351 ACAAAATGAA CGAATAAATA AATAAATAAA ATAATAAACA TATATATATA 18401 TATATATATA ATATACATAT AAACATATAT TTTATGAA "chrblob_4298.glm_7|24oct01" 18439 TC AAGTTATTTT 18451 TCTTATACCT TGCGATTTTA TAAAGGCATC CGTTTTTTTC GTATGAATAT 18501 AATTGTCAAC ACAAGATAAT AAAAATTCAT ACAACAATTT AGAACTTAAG 18551 GATGATAAAT CAAATATGTT TTTTTTATAT TGTAAATTAT CATTTATAAA 18601 AATTAACAAG TCATATAATT TATGTAACTT TTCATCATAA TTTTCATCTG 18651 ATTTTAAGTA GGTATCAATT TTAGTCCTTA AAAAATCTAT AACGATATTT 18701 TTCTGTTCTT CTTTGCTCAT ATTAAATAGA AAGTTGAAAA AGGAATCCAT 18751 GTTATTAAGG GAATGTAATT CTTGGTTCTC AATATATTTC TACAAAACAA 18801 ATAAAATAAA ACACAATGAA ATATATATAT ATATATATAT ATATATATAT 18851 TTATTTATTT ATAATTGTAA CAGCAATATG TCACACAATA TCCATTTTAT 18901 AAACGTTACC CTATATATCT TAGTAGATAT ATCATTCACA GTCGTCTCAT 18951 GGACATTCAA TATGGTTCTG AGCTTAAAGA TGTTATCCTT ATACATGTTT 19001 CTATTCTCAT TCGTTATAAC ATCAATGACA TATAAAACAT ATCGCTCAAA 19051 TATTTTGTGA ACAATATTAT AATTCGATTC CACAAGAGAA AACTTAACAA 19101 AATACATTTC TTGGTTATTT CTTATGACCT TTTTTATAAG ATCAAAATTT 19151 TTATATATAG TTAATATTTC ATTAATATCA TCAATAAAAT CAGAATCATT 19201 TCTATATATA TAGAAATTTT CTTTTATAGT TTTAAATATA TTATTGGTTT 19251 GATGGAAAAT ACAATTTAGT TCTACAATAG AAGCTTTTTC TTCAGATATA 19301 TTTAAAAAGT TAATAATTCT TTTTAAATAT AAATTTTTAA TATTTGTATA 19351 ATTTTTATTC AATATATTGG TTTTTATTGT ATCATTAATC ATTTTTTCAT 19401 ATTGATCTAT TAAATAGATA TCATGTATTT CATTTATATT TTTTTCTATA 19451 TTCAATATAA CTTGATAAAA ATATAATTCC TTTCTGTTAT TATATATATT 19501 TTCTTTTAAA TGAAATAATT TATTTATATA CATTTTCTGA CATATCTCTA 19551 AAAAGGATTC ATCATCAATA TCATCAAAAA TGTCTTCTTT TTTTATAATA 19601 TATTCATTTA AAGACATTTT TTTATTTTCT TCATCTTTCA AGCTTTTTTT 19651 AAAATTATGC TTAATTAATA ACCCTTCATT AAAATTCAGA TGTTTATAAT 19701 CAAATAAATT ATCATTACCT ATAATTTTTA ATTGCATATC TAAATTTTTT 19751 AAATTTGTTA ATTTATTTTT TGTACTATCT TCTAAAAAAC GTTTTATTAT 19801 ATTATCCTCA ATTTCTTTAT CTATATCATT ATTATCATAA TCTAAATTAA 19851 AAATAATTTT TAAAATATTC CTTTCAGATT TATTTTTCAT ATATTTTAAA 19901 ACAAATTCTT CATATAATTT CTTTCTATCA TTTTTATTAA GAATAATTTT 19951 CCCTTCATTT TCATCACATA ATTTCTCTTT ATAAATGTTA TGTTTTATGA 20001 ACTCTTCTTC TTCTTTTAAA AAAGGTTGAT TTAAATTAAC TTCCTCATCA 20051 CTACTAAAAT TTTCGTTTTC TTCCTTATTC TTACCATGGT CATTTACCAT 20101 ATGATCCTCT TGTGATATAT TATCATTATT ATTTATTATA TTACTACTCT 20151 GATCATTTTG TATTATATCA GTGTGCTCAT TTTCCTTGTA ACAGTTGTAA 20201 GAAAAAAAAT GATCAAGATT AAATATATTC GAATTAAATT TAATAAATTT 20251 TTTTTTCTTT TTTATTTTCT TATATATATT TATCAAGTTA ACTATCAATC 20301 TTAAACATTT ATCTATATTT TCAAGTTTAT AAAAGATAGC GATATTTTCT 20351 TTTGTCTTAA TAACAAAATT AAGGATAATA TTTTTTACAA TATTTTGTGT 20401 TGTCTTACTT GGTAAATTTA TACCACGTTT AAGAAAAAAT AAGTTGTCAT 20451 TTTTATTTTT TAATTTCTTA AAAATTAAAT TATTAATAAA TATTTTATAT 20501 TCTTTATATA TATATTTAAA TAAATATTTT TCTAAAAAAT TATCTGTAAA 20551 TTCTTTATCA ATATTTAAAT ATTTTCTTAA AAAATATATA TCATTTAATT 20601 TTTTCATTAA CTGTTCTTTT TCTTTTAATT CCTCTTTCTC ACTTAATATT 20651 ACATCATTTT TTTTTATCTT CTCCGTTGAT ATATCCCCAG TGTTTTTTGT 20701 TGCATTTTTT AAAGAATTAT TGTCATGAAT AATGTAGTCT ACACTTTCTT 20751 CCATGTTGGA ATAAAATCCT TTTTCTAAAT TGTTTTCGTT AAATTCGTTT 20801 GATTCTAAAT TTGAATTATC ATCATTACTA TGATCATTAC TATGATCATT 20851 GCTATGATCA TTGCTATGAT CATTGCTATT ATCATCATTA TTATCATCAT 20901 TATTATCATC ATTATTATCA TCATCATTAT TATCATCATT ATTATCATCC 20951 TCATTATTAT CATCGTCATT ATTATTAGAA GAAATATTTT CTTTTTCCTT 21001 CAGAACATCA TTTCCATCCA TTTCAAATTC ACTTACAATT TTATCCTTCC 21051 TATTACTTCT CGAGGTATAT TTACATTCAT AATCAACATT ACTAATTATA 21101 TCTTTAACAA GGTTCATAAA AATGGAGACG TTTACATCAT CAATAACACT 21151 GCTGTGTAGT GTTATGAATA GCATATTCTT TATATCGTCA TACACACTAT 21201 TTGAATAAGT TTTTGTTCTT AATAAGGAAA GAACATAGTT TTCATAATCA 21251 TTCTTCAT 21258 "chrblob_4298.glm_7|24oct01" TT TTTCTAGGAG GTAATTATTG ATTATTTTTT CTTTTACCTA 21301 AAAATAAAAT ATACATATAT ATATATATAT ATATATATAT ATTATATATA 21351 TGTTTGCATA ATATACACAG GGATATAATT TCAACTTACA T "chrblob_4298.glm_8|24oct01" 21392 TTAAATGAT 21401 CCGAAATGTG GGAGAGTAAG AAATAATTGG ATATATTATT ATTCTTGAAA 21451 AAAAAAGGTA TCATGTATTT ATTTTCTCCT CTAAGTAAAT TCAACTTATG 21501 AGCTTGTATT ACATCATATT TAAACTTAAT ATTAATTATA TAGAAGATAT 21551 AAAAAATCCG AGATAACAAA TCTTTATTTT TATTTTCATT CTTTACATTA 21601 GAAATATGAT ATTTATTCAA TATCATAGTT AATATATTTT TTATGTTTTC 21651 CTTATTGGTC TTAAATAATT TTTGATATAA GCTTATAAAG CTATCAATAT 21701 ATATTACAAT ATCTGGATCA AATATTTCAT CAACATATAT TTTCTTATTT 21751 AAGAAATAAA TAAACATATC ATTCAGTGAA TATAATATAT CATTTAACGT 21801 ATAATTATAT TTATTCATAA ACTGATAAAT CTTTTTTTTA TTCAAATGTT 21851 CTATTCCTTC ATAAAAAAAA TAATTACTAA ACAACACAGC AAAGCCATCA 21901 TCTGTTATAG AAAAATATTG ATTATATTTA TTTATAAATA ACACATTTAT 21951 AAATAAACAA AAAAGAACTA TTTTATAGAT CTTCATATTT CTTAAGCCGT 22001 AAATTAAATT AAAATGGTTC TTCAAAAGAA AAATGTTATC GATCCTAATA 22051 TTTCTAAGTA TATACTTTAA CATAAATGTT AGACCTGCAC TTACACAACC 22101 GAAAGAAATA TATTTTAGGG CATTTACATT TTTCAAATAA AATGATATAA 22151 AACTACACAA CCATTTATTT GAAAATATGT TGTTCTTCTT GCTTAAATTT 22201 CCTACAAAAA AAAAAAAAAA AATAAATAAA TAAAAAATGA AAAAAATGAA 22251 AAAAATGAAA ATAATAATAA CAATATATTA AATATAACAA AATAAAGACA 22301 CTTAAATAAT TTATATACAC ATATAATGTT TATTTTATAT ATTTATATAT 22351 TTATATTTTT TTTTTTTTTT TTTTTTTTTT TTTTTTTTTT TTTTTTACCA 22401 TTTCTCCACT CAAGAGAGGT ATCCTTATGA TTTATCAAGT TATTTATATA 22451 ATAACAATAC GATTGTATAC TATCATAATT TTTATTTGAA TGAACATCAT 22501 TAAAAATTTT TTTTTTTAAA TAATAAGATA ATATAAAATT TAAAATATTA 22551 TAATTTTTTT TTTGTTTACG TTCTTTTTCA TTTTTCATTT GATTAAAATA 22601 ATATTCCATA GATTTCTTTT CTCTATTTAT ATAACCAAAT CTAGAAAAAA 22651 ATTCTTCTTC ATTTGATAAG GTAGGTATAT AATTTATTAA TTTTAAAATT 22701 TCACTTTTCC CTTCATCTTC TTCATAATCT TCTACTTTAT TCTTTTTCAA 22751 ATATTCTTCA ATCTCTTCAT ATGTTATATC ATCTTCATTA TCATTATCAT 22801 CATTATCATT ATTATTATTA TTATTATCAT CATTATTATT ATCATCATCA 22851 TCATTATAAT CATTATTATT ATTATTATTT T