Protein

Genbank accession
ADP00156.1 [GenBank]
Protein name
predicted protein
RBP type
TF
Evidence RBPdetect
Probability 0,74
TF
Evidence RBPdetect2
Probability 0,96
TF
Evidence Phold
Probability 1,00
Protein sequence
MAVTTKKTFSAANGSTKSFGPIGIELNNQDDLDVYVTLSGGTRRLSLRQSSDTTATSSHPQVNDTTGLYFPAVSVGDQLYNYSISTDNNNIVFNNNLPSGAIVSCERRTRDSSSNYTSFAGGSTIRSTDLNKAFDESNFTAQEARNKAFEIENKIFGTEATSTAFVDTNEIKDDAITAAKIAVGAVNHEQLATDAVRTVKIQDGNVTTAKIADNAITTTKLLNGNVTETKLANNAVTNAKITAGAVQNDSLGADAVTGSKIADDTIDSEHYVAGSIDTEHIADSNVTTAKIANNAVTTVKLLNGNVTELKLANNAVTNAKMADNAITTAKINNTAITTAKIDADAVTGSKIADDQIDSEHYIDGSIDTAHLADNAVTTVKITDSNVTTAKIADSNVTTAKIANANITTAKIADSNVTTDKIADNAVTTGKLLNGNVTELKLANNAVTNAKMADNAIGTAEITNGAVTTAKIADSQVTTAKIAADAITSAKLADDVVNSEHIVADSIDTEHYAAGSVDTTALASNSVTTVKITDSNVTTAKIANDAVTTGKIADGELKTLAGMTSGTASKLAEAQTLTADINDLNQIDGLAKQTTITDDDAKFPTSGAVVDYVAAQINPIGGLEVIATDAAFPNTQPQSGVVISIADAGGLVVASGSSTTGRTVGGSTVTINNINSQFNNTTVDNGVGMLVSSTGSGQVYNYHKATLKEGDLLALSGDINDFAERYRVGGTNPTSNNDAGDLFFNTGSGKMLVWDTTGTPAWEEVQSIGNFYISSLSSVGSNSDTPPGGSATFNGNAQKFTVANAPTSAQQLLVSVNGVIQKPNAGTGAPSEGFTLDGSTITFSSAPASGVPFFIVVIGSAVNVGTPSNNTITSAILQSGCVTTAKIADDAITAAKIADGAIDAARIATNAVTATELADNAVDTAAIAANAVTTAKITNGNVTTAKIAADAITAAKIADDALGSEHYGAGSVDTTALADDSVTAAKLANTSVSAGSYGSATAIPAITVDAQGRVTAASTNTVNTTTNLATTTATDTVTVTSSTGNNATISEATGSAAGVMSTAHHNKLDGIETGATADQTNAEIRAAVEAAGDSNVFTDADHSKLNAIEASATADQTAAEIRTLVESASDSNVFTDADHSKLNGIEASATADQSAAEILAAIKTVDGSGSGLDADTLDGISSASFLRSDASDTMSGDLTLSSNASYPLDISGSSDAKIVLQGSSNPYIRWREGSTDKGYLQWNQDGYLRIANSEANASIRIKDDLDFTTDNGSTWHSIHHGGNSSPHGVHPTQYVNIITSTGTWTKPSGVNMIKVTVTGGGGGGQAHNADDAGGGGGAGGTAIEWIDVSGVSSVSVTVGGGGSGGSGNNNNNAGDGGASSFGSYCSASGGKGPNDWGAGGDGGVGSNGNMNLWGGAGATGNIDGQGNEEGGGTGGASYWGGGCGGGTNWQSRGTVGAYGSGGGGTHASSNNSGSNGIAGVVMVEAFG
Physico‐chemical
properties
protein length:1486 AA
molecular weight: 149485,55470 Da
isoelectric point:4,46143
aromaticity:0,04240
hydropathy:-0,17503

Domains

Domains [InterPro]
ADP00156.1
1 1486
Legend: Pfam SMART CDD TIGRFAM HAMAP SUPFAM PRINTS Gene3D PANTHER Other

Taxonomy

  Name Taxonomy ID Lineage
Phage Cyanophage NATL2A-133
[NCBI]
445692 Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host Prochlorococcus marinus str. NATL2A
[NCBI]
59920 Bacteria > Cyanobacteria > Prochlorales > Prochlorococcaceae > Prochlorococcus >

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
ADP00156.1 [NCBI]
Genbank nucleotide accession
GU071104 [NCBI]
CDS location
range 6419 -> 10879
strand -
CDS
ATGGCAGTTACAACTAAAAAAACATTCTCAGCGGCCAATGGATCGACAAAATCCTTTGGTCCGATTGGGATCGAACTGAATAACCAAGATGATCTTGATGTATATGTAACCTTATCGGGTGGTACTAGGAGGCTTAGTCTCAGACAAAGTTCTGATACTACGGCTACTAGCTCTCACCCACAGGTTAACGATACAACTGGATTATATTTTCCAGCCGTTTCGGTTGGAGATCAACTTTATAATTACTCAATATCTACTGATAACAATAATATTGTTTTTAATAACAATTTACCTTCAGGTGCTATAGTTTCGTGTGAACGCCGAACTAGGGATAGCTCAAGTAATTACACCAGCTTCGCAGGTGGTAGTACAATTAGATCAACAGACTTGAATAAAGCTTTTGACGAGTCTAATTTTACAGCACAGGAAGCAAGAAACAAAGCGTTTGAAATAGAGAATAAAATATTTGGAACAGAAGCTACAAGTACAGCTTTTGTTGATACTAATGAAATTAAAGATGATGCTATAACAGCTGCTAAAATAGCAGTTGGTGCTGTTAATCATGAACAGTTAGCAACAGATGCAGTCCGTACTGTTAAAATACAAGATGGTAATGTAACAACTGCAAAGATAGCAGATAATGCAATTACTACAACTAAGTTATTAAACGGAAATGTAACTGAAACTAAACTAGCAAATAATGCGGTTACTAATGCTAAGATAACAGCAGGTGCAGTTCAAAATGATTCACTTGGTGCTGATGCAGTTACAGGTTCTAAAATAGCTGACGATACTATAGACTCTGAGCATTATGTTGCAGGATCTATTGATACTGAGCATATAGCTGACAGTAATGTAACGACTGCTAAGATAGCAAATAATGCAGTTACTACAGTTAAGTTATTAAACGGGAATGTAACTGAACTAAAACTAGCAAATAATGCGGTTACTAATGCTAAGATGGCAGATAATGCTATTACTACAGCTAAAATAAATAATACTGCTATTACTACAGCTAAAATAGATGCTGATGCAGTTACAGGTTCTAAGATAGCTGACGATCAGATTGATTCAGAGCATTATATAGATGGTAGTATTGATACTGCACACCTAGCAGACAATGCAGTAACTACAGTTAAAATAACAGATAGTAATGTAACTACAGCTAAGATTGCTGACAGTAACGTAACTACAGCTAAGATTGCTAACGCTAATATAACGACTGCTAAGATAGCTGACAGTAATGTAACTACAGATAAGATAGCAGATAATGCAGTTACTACAGGTAAGTTATTAAACGGGAATGTAACTGAACTAAAACTAGCAAATAATGCGGTTACTAATGCTAAGATGGCAGACAATGCTATTGGTACTGCTGAGATAACAAACGGTGCAGTGACTACAGCTAAGATAGCAGATAGTCAAGTAACTACCGCTAAAATAGCTGCTGATGCTATTACAAGTGCTAAACTAGCAGATGATGTTGTAAATTCAGAACACATTGTAGCTGATTCTATAGATACAGAGCATTATGCTGCTGGATCAGTAGATACCACAGCTTTAGCAAGTAACTCTGTAACTACAGTTAAGATAACAGACTCTAATGTTACTACAGCAAAAATAGCTAATGACGCTGTTACCACAGGTAAGATAGCAGATGGAGAGTTAAAAACTCTAGCTGGTATGACTTCTGGTACAGCATCTAAACTAGCTGAAGCGCAGACTTTAACAGCAGATATTAATGATCTTAACCAGATAGATGGTTTAGCAAAGCAGACAACAATTACAGATGATGACGCTAAGTTCCCGACAAGTGGAGCTGTTGTTGATTATGTAGCTGCTCAGATAAATCCTATTGGTGGTCTTGAAGTTATAGCTACAGATGCTGCTTTTCCTAATACACAACCTCAATCTGGTGTTGTAATTAGTATTGCGGATGCTGGAGGTTTAGTTGTAGCTAGTGGTTCTAGCACTACAGGTAGAACTGTAGGTGGATCTACAGTTACAATTAACAATATCAACTCACAATTCAACAACACAACTGTTGATAATGGTGTTGGTATGTTAGTCAGCTCTACAGGATCAGGTCAGGTATATAATTATCATAAAGCAACTCTTAAAGAAGGTGATTTATTAGCGTTAAGTGGAGATATAAACGACTTTGCAGAACGATATCGTGTAGGTGGTACCAATCCTACTTCTAATAATGACGCAGGTGACTTGTTCTTTAACACAGGATCAGGTAAAATGCTTGTCTGGGATACTACAGGTACTCCAGCATGGGAAGAAGTACAGTCTATTGGTAATTTTTATATAAGTTCATTATCTAGTGTAGGCTCTAATAGTGATACTCCTCCTGGAGGTAGTGCAACATTCAACGGTAATGCTCAAAAATTCACTGTTGCTAATGCTCCTACTTCAGCACAACAGTTACTTGTTTCAGTAAACGGTGTAATTCAAAAACCTAATGCAGGAACTGGTGCTCCTAGTGAGGGATTTACTCTAGATGGCTCTACTATTACATTTAGTAGTGCTCCTGCTAGTGGAGTTCCGTTCTTTATTGTTGTTATTGGTTCTGCTGTTAATGTAGGTACGCCAAGTAATAACACAATAACCAGTGCTATTCTACAAAGTGGGTGTGTAACTACAGCTAAAATTGCAGATGATGCTATTACAGCAGCTAAGATAGCCGATGGAGCTATTGATGCAGCTCGTATAGCAACAAATGCAGTTACAGCAACAGAATTAGCAGATAATGCAGTAGATACAGCAGCTATAGCGGCTAATGCTGTCACTACAGCTAAAATAACTAATGGAAATGTAACAACAGCTAAGATAGCAGCCGATGCTATTACAGCAGCTAAGATAGCAGATGATGCTTTAGGGTCAGAACATTACGGAGCTGGATCAGTTGATACTACAGCTTTAGCAGATGACTCTGTAACCGCAGCTAAACTTGCAAATACGTCAGTTTCAGCAGGTAGTTACGGTTCAGCTACTGCTATTCCAGCAATTACCGTTGATGCTCAAGGTAGAGTAACCGCAGCATCAACAAATACAGTTAACACAACCACAAACTTAGCGACTACAACTGCTACAGATACGGTTACTGTTACAAGTAGTACAGGAAATAACGCAACTATTAGTGAAGCAACTGGTTCAGCTGCTGGTGTGATGTCTACAGCACATCACAATAAGCTTGATGGTATTGAAACAGGTGCTACAGCAGACCAAACTAATGCAGAAATTAGAGCAGCAGTTGAAGCAGCTGGTGATTCTAATGTATTTACAGACGCAGATCATTCTAAGCTAAATGCAATAGAAGCTTCTGCAACAGCAGACCAAACCGCAGCAGAAATAAGAACACTTGTTGAGAGTGCAAGTGACAGTAACGTGTTTACTGACGCAGATCACTCAAAACTAAATGGAATTGAGGCATCAGCAACCGCTGACCAGAGTGCTGCTGAGATTCTTGCAGCAATTAAGACTGTAGATGGTTCGGGTTCTGGGTTAGATGCAGATACTTTAGATGGTATTAGTTCTGCTTCGTTCTTAAGATCGGACGCTAGTGATACAATGTCAGGTGATCTGACTCTTTCAAGTAATGCAAGTTATCCATTAGACATTAGTGGTTCAAGTGATGCAAAAATCGTTCTTCAAGGTTCAAGTAATCCTTATATAAGATGGAGAGAAGGTTCAACTGATAAAGGTTATCTCCAATGGAACCAAGATGGGTATTTACGAATTGCTAATAGTGAGGCTAACGCTAGTATAAGAATCAAAGATGATCTAGATTTCACAACTGATAATGGATCTACCTGGCACTCAATACACCACGGAGGAAATTCTTCACCACATGGAGTTCATCCAACTCAATATGTTAATATAATTACAAGCACAGGTACATGGACTAAACCATCTGGAGTTAACATGATTAAAGTAACTGTCACTGGTGGCGGCGGCGGTGGTCAAGCACATAACGCTGATGACGCTGGCGGCGGCGGCGGTGCAGGCGGAACTGCTATTGAATGGATTGATGTTTCTGGTGTTTCTAGTGTTTCTGTAACAGTTGGAGGCGGTGGAAGCGGTGGAAGCGGTAATAATAATAATAATGCTGGTGACGGCGGTGCTTCTTCCTTTGGTAGTTACTGTTCTGCTAGTGGTGGTAAAGGACCAAACGACTGGGGAGCAGGTGGTGACGGCGGTGTTGGAAGTAATGGAAATATGAATTTATGGGGAGGAGCAGGAGCAACAGGTAATATTGATGGTCAGGGTAATGAAGAAGGCGGTGGTACTGGTGGAGCTTCCTATTGGGGTGGAGGCTGCGGCGGTGGTACTAACTGGCAATCTAGGGGCACAGTAGGTGCTTATGGTTCTGGCGGTGGAGGTACTCACGCTAGTAGTAATAACAGTGGTTCCAATGGTATCGCAGGTGTTGTAATGGTAGAGGCATTTGGCTAA

Gene Ontology

No Gene Ontology terms available.

Enzymatic activity

No enzymatic activity data available.

Tertiary structure

PDB ID
0fbf56b7ae445769167a8fb7f7f13295c09174d3366adc614089be5d4ff5ef38
ESMFold
Source ESMFold
Method ESMFold
Resolution 0,5283
Evidence 0,5283

Literature

Title Authors Date PMID Source
The Genome Sequence of Cyanophage NATL2A-133 Henn,M.R., Sullivan,M.S., Osburne,M.S., Levin,J., Malboeuf,C., Casali,M., Russ,C., Lennon,N., Erlich,R., Young,S.K., Koehrsen,M., Yandava,C., Zeng,Q., Alvarado,L., Anderson,S., Berlin,A., Borenstein,D., Chen,Z., Engels,R., Freedman,E., Gellesch,M., Goldberg,J., Green,L., Griggs,A., Gujja,S., Heiman,D., Hepburn,T., Howarth,C., Jen,D., Larson,L., Lewis,B., Mehta,T., Park,D., Pearson,M., Roberts,A., Ryan,E., Saif,S., Shea,T., Shenoy,N., Sisk,P., Stolte,C., Sykes,S., Walk,T., White,J., Yu,Q., Coleman,M.L., Huang,K.H., Weigele,P.R., DeFrancesco,A.S., Kern,S.E., Thompson,L.R., Fu,R., Hombeck,B., Chisholm,S.W., Haas,B., Nusbaum,C., Galagan,J. and Birren,B. 2011-09-23 GenBank