Genbank accession
YP_005087528.1 [GenBank]
Protein name
hypothetical protein
RBP type
TF
Evidence Phold
Probability 1,00
TF
Evidence RBPdetect
Probability 0,74
TF
Evidence RBPdetect2
Probability 0,96
Protein sequence
MAVTTKKTFSAANGSTKSFGPIGIELNNQDDLDVYVTLSGGTRRLSLRQSSDTTATSSHPQVNDTTGLYFPAVSVGDQLYNYSISTDNNNIVFNNNLPSGAIVSCERRTRDSSSNYTSFAGGSTIRSTDLNKAFDESNFTAQEARNKAFEIENKIFGTEATSTAFVDTNEIKDDAITAAKIAVGAVNHEQLATDAVRTVKIQDGNVTTAKIADNAITTTKLLNGNVTETKLANNAVTNAKITAGAVQNDSLGADAVTGSKIADDTIDSEHYVAGSIDTEHIADSNVTTAKIANNAVTTVKLLNGNVTELKLANNAVTNAKMADNAITTAKINNTAITTAKIDADAVTGSKIADDQIDSEHYIDGSIDTAHLADNAVTTVKITDSNVTTAKIADSNVTTAKIANANITTAKIADSNVTTDKIADNAVTTGKLLNGNVTELKLANNAVTNAKMADNAIGTAEITNGAVTTAKIADSQVTTAKIAADAITSAKLADDVVNSEHIVADSIDTEHYAAGSVDTTALASNSVTTVKITDSNVTTAKIANDAVTTGKIADGELKTLAGMTSGTASKLAEAQTLTADINDLNQIDGLAKQTTITDDDAKFPTSGAVVDYVAAQINPIGGLEVIATDAAFPNTQPQSGVVISIADAGGLVVASGSSTTGRTVGGSTVTINNINSQFNNTTVDNGVGMLVSSTGSGQVYNYHKATLKEGDLLALSGDINDFAERYRVGGTNPTSNNDAGDLFFNTGSGKMLVWDTTGTPAWEEVQSIGNFYISSLSSVGSNSDTPPGGSATFNGNAQKFTVANAPTSAQQLLVSVNGVIQKPNAGTGAPSEGFTLDGSTITFSSAPASGVPFFIVVIGSAVNVGTPSNNTITSAILQSGCVTTAKIADDAITAAKIADGAIDAARIATNAVTATELADNAVDTAAIAANAVTTAKITNGNVTTAKIAADAITAAKIADDALGSEHYGAGSVDTTALADDSVTAAKLANTSVSAGSYGSATAIPAITVDAQGRVTAASTNTVNTTTNLATTTATDTVTVTSSTGNNATISEATGSAAGVMSTAHHNKLDGIETGATADQTNAEIRAAVEAAGDSNVFTDADHSKLNAIEASATADQTAAEIRTLVESASDSNVFTDADHSKLNGIEASATADQSAAEILAAIKTVDGSGSGLDADTLDGISSASFLRSDASDTMSGDLTLSSNASYPLDISGSSDAKIVLQGSSNPYIRWREGSTDKGYLQWNQDGYLRIANSEANASIRIKDDLDFTTDNGSTWHSIHHGGNSSPHGVHPTQYVNIITSTGTWTKPSGVNMIKVTVTGGGGGGQAHNADDAGGGGGAGGTAIEWIDVSGVSSVSVTVGGGGSGGSGNNNNNAGDGGASSFGSYCSASGGKGPNDWGAGGDGGVGSNGNMNLWGGAGATGNIDGQGNEEGGGTGGASYWGGGCGGGTNWQSRGTVGAYGSGGGGTHASSNNSGSNGIAGVVMVEAFG
Physico‐chemical
properties
protein length:1486 AA
molecular weight: 149485,55470 Da
isoelectric point:4,46143
aromaticity:0,04240
hydropathy:-0,17503

Domains

Domains [InterPro]
IPR052671
Unmapped
278–455
DC_0591
STR
422–508
YP_005087528.1
1 1486
Architecture
STR
ATT
STR
ATT
STR
STR 1-318 | ATT 335-423 | STR 424-917 | ATT 918-1076 | STR 1077-1486
Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Taxonomy

  Name Taxonomy ID Lineage
Phage Cyanophage NATL2A-133
[NCBI]
445692 Uroviricota > Caudoviricetes > Autographivirales > Tangaroavirus > Tangaroavirus NATL2A133
Host Prochlorococcus marinus str. NATL2A
[NCBI]
59920 Bacteria > Cyanobacteria > Prochlorales > Prochlorococcaceae > Prochlorococcus >

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
YP_005087528.1 [NCBI]
Genbank nucleotide accession
NC_016659 [NCBI]
CDS location
range 6419 -> 10879
strand -
CDS
ATGGCAGTTACAACTAAAAAAACATTCTCAGCGGCCAATGGATCGACAAAATCCTTTGGTCCGATTGGGATCGAACTGAATAACCAAGATGATCTTGATGTATATGTAACCTTATCGGGTGGTACTAGGAGGCTTAGTCTCAGACAAAGTTCTGATACTACGGCTACTAGCTCTCACCCACAGGTTAACGATACAACTGGATTATATTTTCCAGCCGTTTCGGTTGGAGATCAACTTTATAATTACTCAATATCTACTGATAACAATAATATTGTTTTTAATAACAATTTACCTTCAGGTGCTATAGTTTCGTGTGAACGCCGAACTAGGGATAGCTCAAGTAATTACACCAGCTTCGCAGGTGGTAGTACAATTAGATCAACAGACTTGAATAAAGCTTTTGACGAGTCTAATTTTACAGCACAGGAAGCAAGAAACAAAGCGTTTGAAATAGAGAATAAAATATTTGGAACAGAAGCTACAAGTACAGCTTTTGTTGATACTAATGAAATTAAAGATGATGCTATAACAGCTGCTAAAATAGCAGTTGGTGCTGTTAATCATGAACAGTTAGCAACAGATGCAGTCCGTACTGTTAAAATACAAGATGGTAATGTAACAACTGCAAAGATAGCAGATAATGCAATTACTACAACTAAGTTATTAAACGGAAATGTAACTGAAACTAAACTAGCAAATAATGCGGTTACTAATGCTAAGATAACAGCAGGTGCAGTTCAAAATGATTCACTTGGTGCTGATGCAGTTACAGGTTCTAAAATAGCTGACGATACTATAGACTCTGAGCATTATGTTGCAGGATCTATTGATACTGAGCATATAGCTGACAGTAATGTAACGACTGCTAAGATAGCAAATAATGCAGTTACTACAGTTAAGTTATTAAACGGGAATGTAACTGAACTAAAACTAGCAAATAATGCGGTTACTAATGCTAAGATGGCAGATAATGCTATTACTACAGCTAAAATAAATAATACTGCTATTACTACAGCTAAAATAGATGCTGATGCAGTTACAGGTTCTAAGATAGCTGACGATCAGATTGATTCAGAGCATTATATAGATGGTAGTATTGATACTGCACACCTAGCAGACAATGCAGTAACTACAGTTAAAATAACAGATAGTAATGTAACTACAGCTAAGATTGCTGACAGTAACGTAACTACAGCTAAGATTGCTAACGCTAATATAACGACTGCTAAGATAGCTGACAGTAATGTAACTACAGATAAGATAGCAGATAATGCAGTTACTACAGGTAAGTTATTAAACGGGAATGTAACTGAACTAAAACTAGCAAATAATGCGGTTACTAATGCTAAGATGGCAGACAATGCTATTGGTACTGCTGAGATAACAAACGGTGCAGTGACTACAGCTAAGATAGCAGATAGTCAAGTAACTACCGCTAAAATAGCTGCTGATGCTATTACAAGTGCTAAACTAGCAGATGATGTTGTAAATTCAGAACACATTGTAGCTGATTCTATAGATACAGAGCATTATGCTGCTGGATCAGTAGATACCACAGCTTTAGCAAGTAACTCTGTAACTACAGTTAAGATAACAGACTCTAATGTTACTACAGCAAAAATAGCTAATGACGCTGTTACCACAGGTAAGATAGCAGATGGAGAGTTAAAAACTCTAGCTGGTATGACTTCTGGTACAGCATCTAAACTAGCTGAAGCGCAGACTTTAACAGCAGATATTAATGATCTTAACCAGATAGATGGTTTAGCAAAGCAGACAACAATTACAGATGATGACGCTAAGTTCCCGACAAGTGGAGCTGTTGTTGATTATGTAGCTGCTCAGATAAATCCTATTGGTGGTCTTGAAGTTATAGCTACAGATGCTGCTTTTCCTAATACACAACCTCAATCTGGTGTTGTAATTAGTATTGCGGATGCTGGAGGTTTAGTTGTAGCTAGTGGTTCTAGCACTACAGGTAGAACTGTAGGTGGATCTACAGTTACAATTAACAATATCAACTCACAATTCAACAACACAACTGTTGATAATGGTGTTGGTATGTTAGTCAGCTCTACAGGATCAGGTCAGGTATATAATTATCATAAAGCAACTCTTAAAGAAGGTGATTTATTAGCGTTAAGTGGAGATATAAACGACTTTGCAGAACGATATCGTGTAGGTGGTACCAATCCTACTTCTAATAATGACGCAGGTGACTTGTTCTTTAACACAGGATCAGGTAAAATGCTTGTCTGGGATACTACAGGTACTCCAGCATGGGAAGAAGTACAGTCTATTGGTAATTTTTATATAAGTTCATTATCTAGTGTAGGCTCTAATAGTGATACTCCTCCTGGAGGTAGTGCAACATTCAACGGTAATGCTCAAAAATTCACTGTTGCTAATGCTCCTACTTCAGCACAACAGTTACTTGTTTCAGTAAACGGTGTAATTCAAAAACCTAATGCAGGAACTGGTGCTCCTAGTGAGGGATTTACTCTAGATGGCTCTACTATTACATTTAGTAGTGCTCCTGCTAGTGGAGTTCCGTTCTTTATTGTTGTTATTGGTTCTGCTGTTAATGTAGGTACGCCAAGTAATAACACAATAACCAGTGCTATTCTACAAAGTGGGTGTGTAACTACAGCTAAAATTGCAGATGATGCTATTACAGCAGCTAAGATAGCCGATGGAGCTATTGATGCAGCTCGTATAGCAACAAATGCAGTTACAGCAACAGAATTAGCAGATAATGCAGTAGATACAGCAGCTATAGCGGCTAATGCTGTCACTACAGCTAAAATAACTAATGGAAATGTAACAACAGCTAAGATAGCAGCCGATGCTATTACAGCAGCTAAGATAGCAGATGATGCTTTAGGGTCAGAACATTACGGAGCTGGATCAGTTGATACTACAGCTTTAGCAGATGACTCTGTAACCGCAGCTAAACTTGCAAATACGTCAGTTTCAGCAGGTAGTTACGGTTCAGCTACTGCTATTCCAGCAATTACCGTTGATGCTCAAGGTAGAGTAACCGCAGCATCAACAAATACAGTTAACACAACCACAAACTTAGCGACTACAACTGCTACAGATACGGTTACTGTTACAAGTAGTACAGGAAATAACGCAACTATTAGTGAAGCAACTGGTTCAGCTGCTGGTGTGATGTCTACAGCACATCACAATAAGCTTGATGGTATTGAAACAGGTGCTACAGCAGACCAAACTAATGCAGAAATTAGAGCAGCAGTTGAAGCAGCTGGTGATTCTAATGTATTTACAGACGCAGATCATTCTAAGCTAAATGCAATAGAAGCTTCTGCAACAGCAGACCAAACCGCAGCAGAAATAAGAACACTTGTTGAGAGTGCAAGTGACAGTAACGTGTTTACTGACGCAGATCACTCAAAACTAAATGGAATTGAGGCATCAGCAACCGCTGACCAGAGTGCTGCTGAGATTCTTGCAGCAATTAAGACTGTAGATGGTTCGGGTTCTGGGTTAGATGCAGATACTTTAGATGGTATTAGTTCTGCTTCGTTCTTAAGATCGGACGCTAGTGATACAATGTCAGGTGATCTGACTCTTTCAAGTAATGCAAGTTATCCATTAGACATTAGTGGTTCAAGTGATGCAAAAATCGTTCTTCAAGGTTCAAGTAATCCTTATATAAGATGGAGAGAAGGTTCAACTGATAAAGGTTATCTCCAATGGAACCAAGATGGGTATTTACGAATTGCTAATAGTGAGGCTAACGCTAGTATAAGAATCAAAGATGATCTAGATTTCACAACTGATAATGGATCTACCTGGCACTCAATACACCACGGAGGAAATTCTTCACCACATGGAGTTCATCCAACTCAATATGTTAATATAATTACAAGCACAGGTACATGGACTAAACCATCTGGAGTTAACATGATTAAAGTAACTGTCACTGGTGGCGGCGGCGGTGGTCAAGCACATAACGCTGATGACGCTGGCGGCGGCGGCGGTGCAGGCGGAACTGCTATTGAATGGATTGATGTTTCTGGTGTTTCTAGTGTTTCTGTAACAGTTGGAGGCGGTGGAAGCGGTGGAAGCGGTAATAATAATAATAATGCTGGTGACGGCGGTGCTTCTTCCTTTGGTAGTTACTGTTCTGCTAGTGGTGGTAAAGGACCAAACGACTGGGGAGCAGGTGGTGACGGCGGTGTTGGAAGTAATGGAAATATGAATTTATGGGGAGGAGCAGGAGCAACAGGTAATATTGATGGTCAGGGTAATGAAGAAGGCGGTGGTACTGGTGGAGCTTCCTATTGGGGTGGAGGCTGCGGCGGTGGTACTAACTGGCAATCTAGGGGCACAGTAGGTGCTTATGGTTCTGGCGGTGGAGGTACTCACGCTAGTAGTAATAACAGTGGTTCCAATGGTATCGCAGGTGTTGTAATGGTAGAGGCATTTGGCTAA

Genome Context

Genome Context

Tertiary structure

PDB ID
0fbf56b7ae445769167a8fb7f7f13295c09174d3366adc614089be5d4ff5ef38
ESMFold
Source ESMFold
Method ESMFold
Resolution 0,5283
Oligomeric State monomer
Model Confidence
Very high
pLDDT > 90
High
90 > pLDDT > 70
Low
70 > pLDDT > 50
Very low
pLDDT < 50

Literature

Title Authors Date PMID Source
The Genome Sequence of Cyanophage NATL2A-133 Henn,M.R., Sullivan,M.S., Osburne,M.S., Levin,J., Malboeuf,C., Casali,M., Russ,C., Lennon,N., Erlich,R., Young,S.K., Koehrsen,M., Yandava,C., Zeng,Q., Alvarado,L., Anderson,S., Berlin,A., Borenstein,D., Chen,Z., Engels,R., Freedman,E., Gellesch,M., Goldberg,J., Green,L., Griggs,A., Gujja,S., Heiman,D., Hepburn,T., Howarth,C., Jen,D., Larson,L., Lewis,B., Mehta,T., Park,D., Pearson,M., Roberts,A., Ryan,E., Saif,S., Shea,T., Shenoy,N., Sisk,P., Stolte,C., Sykes,S., Walk,T., White,J., Yu,Q., Coleman,M.L., Huang,K.H., Weigele,P.R., DeFrancesco,A.S., Kern,S.E., Thompson,L.R., Fu,R., Hombeck,B., Chisholm,S.W., Haas,B., Nusbaum,C., Galagan,J. and Birren,B. 2011-09-23 GenBank