Genbank accession
YP_007877757.1 [GenBank]
Protein name
structural protein
RBP type
TF
Evidence RBPdetect2
Probability 0,93
Protein sequence
MANRIQLRRGGAQEWANANPTLAQGELGIELDTGRFKIGDGVTAWNTLRYERPVESTSNTANTLVQRDADGNFAAGTVTATLIGNSSTAARLASTRQIQLSGDVQASGVFDGSQNLNLTSSISLISTLPHYDGTDTASGTYTKVTVDSKGRVTNATNPTTLAEYNLNGTVEGQSAQPYDLDLVAIAGLTTTGLISRTSGGNMQTRTIAGTAGRISVNDGGGINGNPTIDIISTTVQPGDYNTESLTSVSGVGSNSEPFGTETVNATKFTVDDRGRLTSATNVPIATATEGSKYANYGAGTTYVRYDIIQNASKVYQAITGIAAGQGAPTHTSGDSGGWRYLAAEATEQKGLASFAQEDFDVDSNGHVTISAQGVDNNQLQNNRIGFADGNTLENFELDQELTATTGYRGFNYLNYVKVNNTSGGLLFGANNTGDSGNGEVDINVKTLFSDPDFVLDGAVDQVINKDGSGHFTISHTQNVATPRNLNILATNSGSGTSNIVIRAEDTVTINATEATGKIHVEDARFQDNYIATSNATMHLDPGDDRAITGLVRVHGDLQVDGTTTTVNSTVTTVDDPIITLGGDTAPSSDDNKDRGVEFRYYDSQARIGFFGYDDSYTDLGGHVGGFTFLHDATNTSEVFSGTASGIIGGNLKLTTNTNSTSNTTGDLVVAGGAGIGQDVNIGGTLDVDTNFRTHGTSRFDDNVVLQGASKTLQLNNGSGTTKVEFQSTTGNGSLAGILDVTGNLNVNTNKFNVVAASGNTTIAGTLGVTNIATFSNNIDANGDVAIAGNIHSESTNDITTAKNSGTGEWEIQSNDYGSLRVDGGAYVAGSALIDGTLHVNGPLEIKDSATETESRLNWLRVRYRGRFGDTYQASPSYASHNFSTLKAHGGAGIMKSLYVGATGSNERFAVGKLNSGDTEKFTVIGATGNTTIQGTLLVEDNVNFNGTLDVDADFAVRNGTTDKFFVDNVTGNTNIEGTLTADGHTELNSTLNVDSNTTLGGTLTVANNTEINGTLDVDANFAVRSGTTDKMTVASSTGNIATDGTLVVQGQTTINDSIILNAANEEFAVQNGSGVDKFTVDSDNGNTVIAGETTIGGATQINNTVGITNVTTITRNTQQTLTGTYSADGAFRLSGGAGIGKNLAIGEGLRVYGGTELSSALDLNSSADISGALVTHDNVTVTADNKFFKVQNGSGVDKFTVDTDNGNLVSQGQLTVAGDAALQSDLVVTGNLTVNGTTTTVNSTVTTIDDPVITIGGDTAPASNDGKDRGVEFRYYDGSAKLGFFGFDRSSSEFALLTSASNSSEVFTGTDGALRIGSIHVTGAGTSVDIDNNLNVDGTATVDGQIISQVSSGPALVIPTTDKINNLNADLLDGMTTATAATVSTVVNRDSSGDFAANQITAASGTGSGAGFLGNASTADAWKTARTFTIDGVVSGSVSVDGSSAPTITTTFVDADSTGLAAMSGTGYVVRTGTGTYAQRTLQVTASSGITLTNADGVSGNTTINVASASTNSSNNLVIRDGSGNFAAGTITAALTGNVTGQVSDISNHDTGDLTEGSNLYYTDERVDDRVNALITAGTGITKAYNDSANTYTLTVTQSDIDTDNVTEGSSNLFTTAARTRTHFTYGNGIALAGSGELSVTQSQINTDNVTEGSTNLFTTAARTRTHFTYGTGIELSGSGELSVTQADINTSNITEGSKLFYTDARFDTRLAAKTTANLTEGSNLYFTDARADARVAAATGANLDLSSKSTSDLSEGTNQYYTEARVQTKLDNAFEQLSAMLNNLATSTTLTLNLSGDPTPGAVVTTGVSVGGGGGFTAATGVATSGAASGASGLTVDTTVDADGNITAAAVNAGGSDYLITDTVTITNANAGKVLSFNLATLAGGSNYVTGTALATTGGSGSASLVVNITASAGAITNVTINDGGTGYAVGETITIVQPTGLDGSNPGSGGTVNVATVATNATLTLTDITTMEVGATVTGATSGTTGVITALGTNQVTVDNVDGFFKKGEVVSANDVTALTISSFA
Physico‐chemical
properties
protein length:2027 AA
molecular weight: 207404,28940 Da
isoelectric point:4,33741
aromaticity:0,05723
hydropathy:-0,19003

Domains

Domains [InterPro]
IPR041352
ATT
5–43
YP_007877757.1
1 2027
Architecture
ATT
STR
STR
STR
RBD
ATT 4-43 | STR 44-242 | STR 336-943 | STR 1109-1575 | RBD 1654-2027
Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Taxonomy

  Name Taxonomy ID Lineage
Phage Cyanophage P-RSM1
[NCBI]
536444 Uroviricota > Caudoviricetes > Pantevenvirales > Emcearvirus > Emcearvirus gerard
Host Prochlorococcus marinus str. MIT 9303
[NCBI]
59922 Bacteria > Cyanobacteria > Prochlorales > Prochlorococcaceae > Prochlorococcus >

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
YP_007877757.1 [NCBI]
Genbank nucleotide accession
NC_021071 [NCBI]
CDS location
range 140257 -> 146340
strand -
CDS
ATGGCAAATAGAATTCAATTAAGAAGGGGTGGTGCTCAGGAATGGGCAAACGCAAACCCTACTCTTGCTCAAGGTGAATTGGGTATTGAGTTAGATACTGGTCGATTTAAGATTGGTGATGGTGTTACCGCGTGGAATACTCTGCGATATGAGAGACCTGTCGAATCTACTTCAAACACTGCTAACACTCTTGTACAAAGAGATGCTGATGGTAACTTTGCTGCAGGTACGGTAACTGCAACTCTTATTGGTAACTCTTCTACTGCTGCACGTCTTGCTTCAACTAGACAAATTCAACTCTCTGGTGACGTACAAGCATCTGGTGTATTTGATGGTTCACAAAATCTTAACTTAACTTCTTCTATTAGTCTGATTTCTACTTTACCACATTACGATGGTACTGATACTGCAAGTGGAACTTATACTAAAGTAACTGTTGATTCTAAAGGTAGAGTTACAAATGCTACAAACCCAACAACTCTTGCTGAATATAACTTAAACGGAACTGTAGAAGGTCAGTCTGCACAACCATATGACTTAGACCTTGTTGCTATTGCAGGTCTTACTACCACTGGTTTGATTTCCAGAACTTCTGGTGGTAACATGCAGACCAGAACTATTGCAGGTACTGCAGGTAGAATCTCCGTAAATGATGGTGGTGGTATCAATGGAAACCCCACGATCGACATTATTTCAACGACTGTACAACCAGGAGATTATAATACAGAATCTTTAACATCTGTCTCAGGTGTGGGATCCAACTCAGAACCATTCGGTACTGAAACTGTAAACGCTACGAAATTTACAGTGGACGACAGGGGTCGTCTAACCAGTGCTACTAATGTACCAATCGCTACTGCAACAGAGGGAAGTAAGTACGCTAACTATGGTGCAGGTACTACTTACGTTAGGTATGACATCATTCAAAATGCCTCTAAGGTTTACCAAGCAATCACTGGGATTGCTGCAGGTCAAGGTGCTCCTACTCATACTAGTGGCGACTCTGGCGGGTGGAGATACCTCGCTGCCGAGGCAACGGAGCAGAAGGGTCTCGCGTCCTTTGCACAAGAAGACTTTGACGTTGACAGCAACGGGCACGTCACGATCTCCGCCCAAGGTGTAGATAACAATCAATTACAGAACAATAGAATCGGTTTTGCTGATGGCAACACCTTAGAAAACTTTGAACTCGATCAAGAGTTAACTGCTACCACTGGATATAGAGGTTTTAATTATCTTAACTATGTTAAGGTAAACAACACGTCTGGTGGTCTTTTATTTGGTGCTAATAATACTGGTGATAGTGGTAATGGTGAAGTAGATATTAATGTAAAGACTTTATTCAGTGATCCTGATTTCGTTCTTGATGGTGCTGTCGATCAGGTCATTAATAAGGATGGATCTGGTCATTTCACCATAAGTCATACTCAAAATGTTGCGACACCTAGAAATCTCAACATTCTTGCAACAAACAGTGGATCGGGAACTTCTAATATCGTAATTCGTGCAGAAGATACTGTTACAATTAACGCAACTGAAGCAACTGGTAAGATTCATGTTGAAGATGCAAGATTCCAAGACAACTATATTGCAACTTCAAATGCTACAATGCATCTTGATCCAGGTGATGATAGAGCAATCACTGGATTAGTACGAGTTCATGGAGATTTACAAGTAGATGGAACTACTACAACAGTTAACAGCACGGTTACGACCGTTGATGATCCCATTATTACTCTTGGTGGTGACACTGCTCCAAGTAGTGATGATAACAAAGATCGTGGAGTTGAATTCAGATACTACGATTCTCAAGCAAGAATTGGATTCTTTGGTTACGATGATTCTTACACCGACCTCGGAGGACACGTCGGAGGATTTACATTTTTACACGACGCCACAAATACTTCAGAGGTCTTTAGTGGAACAGCGTCTGGCATAATCGGTGGTAACTTAAAACTTACAACAAATACAAACTCAACATCTAATACTACTGGAGATTTGGTAGTTGCAGGTGGTGCAGGTATTGGTCAGGATGTTAATATTGGTGGTACGTTAGATGTAGATACTAACTTCCGTACTCACGGTACAAGTAGATTTGATGATAATGTTGTTTTACAAGGTGCTTCTAAGACATTACAACTAAACAATGGATCTGGAACTACTAAAGTTGAGTTCCAATCTACAACAGGTAACGGTTCTCTTGCAGGTATCTTAGATGTAACTGGTAACCTCAACGTTAATACTAACAAGTTCAATGTTGTTGCTGCTTCTGGTAACACAACTATTGCAGGTACATTGGGTGTTACAAACATTGCTACCTTCTCTAACAATATTGATGCTAACGGTGACGTTGCAATCGCAGGTAATATTCACTCCGAAAGCACAAACGATATCACCACTGCGAAGAACAGTGGCACTGGTGAATGGGAGATTCAATCTAATGACTATGGTTCATTAAGAGTTGATGGTGGTGCATACGTTGCAGGTTCTGCTCTGATCGATGGTACGTTACACGTTAACGGTCCTCTTGAGATTAAGGATAGTGCGACAGAGACTGAATCTAGATTGAACTGGTTGAGAGTCAGATACAGAGGTCGTTTCGGTGACACTTATCAGGCATCTCCTTCCTATGCATCTCATAACTTCTCCACCTTGAAAGCACATGGTGGTGCAGGTATTATGAAATCCTTGTACGTTGGTGCTACTGGATCTAACGAAAGATTTGCTGTTGGTAAACTCAATAGTGGTGATACTGAGAAGTTCACTGTTATTGGTGCAACTGGTAACACAACTATTCAAGGTACATTACTTGTTGAAGATAATGTAAACTTTAATGGCACTCTCGATGTTGATGCAGACTTTGCAGTCAGAAATGGAACGACTGATAAGTTCTTCGTTGACAACGTAACTGGTAATACTAATATTGAAGGCACGCTGACTGCCGATGGTCACACTGAGTTGAACTCTACACTTAACGTAGATAGCAATACAACTCTTGGTGGTACACTGACTGTTGCTAATAATACTGAGATTAACGGCACCTTAGACGTTGACGCTAACTTTGCTGTTAGATCTGGTACAACTGATAAGATGACTGTTGCATCTTCCACAGGTAACATTGCAACTGATGGTACTCTGGTTGTTCAAGGTCAGACAACTATTAATGATTCAATTATCCTCAACGCTGCTAACGAAGAGTTTGCAGTCCAGAATGGTTCTGGAGTAGATAAGTTTACTGTTGATAGTGACAATGGTAACACTGTCATTGCAGGTGAAACAACGATTGGTGGTGCTACACAAATTAATAATACTGTTGGTATTACTAATGTAACTACAATTACTAGAAATACCCAACAAACCCTTACTGGAACCTACTCTGCCGATGGTGCATTCCGTCTCAGTGGTGGTGCAGGTATCGGTAAGAACCTCGCTATTGGTGAGGGATTAAGAGTTTACGGTGGTACAGAACTTAGCAGTGCATTAGATCTTAATAGTAGTGCTGATATCTCTGGAGCACTGGTAACTCATGATAATGTTACTGTCACAGCAGACAACAAGTTCTTCAAAGTTCAGAACGGTTCTGGTGTAGATAAGTTTACTGTTGATACAGATAATGGTAATTTGGTCTCCCAAGGTCAATTAACTGTTGCAGGTGATGCAGCATTACAATCTGATCTTGTAGTTACTGGAAACTTAACCGTAAATGGAACAACAACTACTGTTAACAGCACTGTCACTACAATCGATGACCCTGTTATTACTATTGGAGGTGACACAGCACCCGCGTCTAACGATGGTAAGGATAGGGGTGTTGAATTTCGTTACTATGATGGTTCTGCTAAACTTGGTTTCTTCGGTTTTGACAGATCCTCCTCAGAATTCGCACTCTTAACTAGTGCAAGTAACTCCTCCGAAGTATTCACTGGTACTGATGGTGCATTAAGAATCGGTTCTATTCATGTTACTGGTGCAGGTACATCTGTTGACATTGATAACAACTTAAATGTTGATGGAACTGCAACCGTTGATGGACAGATCATCTCTCAAGTATCTTCTGGTCCTGCTCTTGTCATTCCAACAACTGATAAGATTAATAATCTAAACGCAGACTTACTAGATGGTATGACAACTGCGACTGCTGCAACAGTCTCTACAGTTGTAAATCGTGACTCATCTGGTGACTTTGCTGCTAACCAAATCACTGCTGCTAGTGGCACAGGATCTGGTGCAGGTTTCTTAGGAAACGCATCTACTGCTGACGCATGGAAGACTGCTAGAACATTCACTATTGACGGTGTTGTATCTGGTTCTGTATCTGTAGATGGTAGTTCTGCTCCAACAATCACAACAACATTTGTTGATGCTGATAGCACTGGTCTTGCTGCCATGTCTGGAACTGGATATGTTGTAAGAACAGGAACTGGAACTTATGCACAAAGAACTCTCCAAGTTACTGCATCTTCTGGTATTACTCTGACCAATGCTGATGGTGTTTCTGGAAACACTACAATCAACGTTGCTAGTGCAAGCACCAATTCTTCTAACAACCTCGTAATCAGAGACGGATCTGGTAACTTCGCTGCAGGAACTATTACTGCTGCATTGACTGGTAATGTTACTGGTCAGGTATCTGATATCTCAAACCATGATACTGGTGATCTTACTGAGGGATCTAACCTCTACTACACTGACGAGAGAGTCGATGATAGAGTCAATGCTCTTATCACTGCAGGAACTGGTATCACCAAAGCATATAATGACTCCGCAAACACATATACACTGACTGTAACACAGTCCGATATCGATACTGATAACGTAACTGAAGGATCTTCAAATCTCTTTACTACTGCTGCAAGAACCAGAACTCATTTCACATATGGTAATGGTATTGCACTCGCAGGATCTGGTGAACTGTCTGTAACTCAGTCTCAAATCAACACTGATAATGTAACTGAAGGATCAACTAACCTGTTCACCACTGCTGCACGAACAAGGACACACTTTACTTACGGAACAGGTATTGAGTTGTCTGGTAGTGGTGAACTTTCTGTCACACAAGCAGATATCAACACTAGCAACATCACTGAAGGTAGCAAACTATTCTACACTGATGCACGTTTTGATACTCGTCTTGCTGCTAAGACTACTGCAAATCTTACTGAAGGTTCAAATCTTTACTTCACCGATGCTCGTGCTGATGCAAGAGTCGCTGCTGCTACAGGTGCAAACCTTGATCTTTCTTCTAAGTCTACTTCCGATCTTTCTGAAGGAACTAATCAGTACTACACTGAAGCAAGAGTTCAAACAAAACTCGACAATGCATTTGAACAGTTAAGTGCAATGTTAAACAACCTTGCAACTAGCACTACTCTAACTCTGAACTTGTCTGGTGATCCTACTCCTGGTGCAGTTGTTACCACTGGTGTTAGCGTCGGTGGTGGTGGCGGATTCACTGCTGCTACTGGAGTTGCAACCTCTGGTGCTGCATCTGGTGCATCTGGATTGACTGTTGACACTACGGTCGATGCTGATGGAAACATCACTGCTGCTGCAGTTAATGCAGGTGGTAGTGACTATCTGATTACAGATACAGTTACAATCACTAACGCCAACGCAGGTAAAGTATTGTCATTCAACTTGGCAACCTTAGCAGGTGGATCAAATTATGTTACAGGAACTGCTCTAGCAACGACTGGAGGTTCTGGATCTGCAAGTTTAGTGGTAAATATTACTGCATCTGCAGGTGCTATTACCAACGTTACTATCAATGACGGTGGTACTGGTTATGCTGTCGGTGAAACAATCACTATCGTTCAACCAACTGGTCTTGATGGATCAAACCCAGGATCAGGTGGTACAGTGAACGTTGCTACAGTTGCAACTAATGCGACTCTGACTCTTACTGACATCACAACGATGGAAGTTGGAGCAACCGTTACTGGTGCTACCTCTGGTACTACTGGAGTTATCACTGCTCTTGGAACTAACCAAGTCACTGTTGATAATGTTGACGGATTCTTCAAAAAAGGAGAAGTCGTCAGTGCTAATGATGTTACCGCTTTGACCATATCCTCTTTCGCATAA

Genome Context

Genome Context

Tertiary structure

PDB ID
cd074f3cd33786e83e8576d7bbbc4b54a0143169f096b7d9a9f871bc5021e81b
ColabFold
Source ColabFold
Method ColabFold
Resolution 0,5275
Oligomeric State monomer
Model Confidence
Very high
pLDDT > 90
High
90 > pLDDT > 70
Low
70 > pLDDT > 50
Very low
pLDDT < 50

Literature

Title Authors Date PMID Source
The Genome Sequence of Cyanophage P-RSM1 Henn,M.R., Sullivan,M.S., Osburne,M.S., Levin,J., Malboeuf,C., Casali,M., Russ,C., Lennon,N., Chapman,S.B., Erlich,R., Young,S.K., Yandava,C., Zeng,Q., Alvarado,L., Anderson,S., Berlin,A., Chen,Z., Freedman,E., Gellesch,M., Goldberg,J., Green,L., Griggs,A., Gujja,S., Heilman,E.R., Heiman,D., Hollinger,A., Howarth,C., Larson,L., Mehta,T., Pearson,M., Roberts,A., Ryan,E., Saif,S., Shea,T., Shenoy,N., Sisk,P., Stolte,C., Sykes,S., White,J., Yu,Q., Coleman,M.L., Huang,K.H., Weigele,P.R., DeFrancesco,A.S., Kern,S.E., Thompson,L.R., Fu,R., Hombeck,B., Chisholm,S.W., Haas,B., Nusbaum,C. and Birren,B. 2011-09-23 GenBank