Protein

View in Explore

Genbank accession

YP_004323242.1 [GenBank]

Protein name

structural protein

RBP type

Evidence RBPdetect2

Probability 0,93

Protein sequence

MANRIQLRRGGAQEWANSNPTLAQGELGIELDTGRFKIGDGVSAWNTLRYERPVESTSNTANTLVQRDADGNFSAGTITSTVIGNSSTASRLASSRQIQLSNEVTASGVFDGSQNLNLSAELALVSTLPHYDGTSSPSATYNKVTVDAKGRVTNAQDFTASNNGTLADYGLDGTNEGTSAQPYDLDLVALAGLTTTGMISRTASNTVATRAITGTATRISVSEGAGISGNPTIDMITTAVTAGNYNTESLTSVSGAGGNGEPFGTATVNATKFTVDAYGRLTSATNVPIATAAEGSKYASYNAGTTYVRYDIIANASKVYQAITGIAAGAGAPTHSSGDSGGWRYLAAEATEQKGLASFAQEDFDVDANGHVTIATAGVDNTQLQNNKLIFTDGNAVENFELDNELTTSTANTGFNKLNFIKINNTSGGLLFGANNTGDSGAGEIDVNVRSYFSDPDITLDGSVAQTLNKTGDGNLTFTTTQNSSSARSLTVSASNSGSGTSTVTITAEDVVDIDASDSNGKVHVEDSRFQDNYIATSNATMHLDPGDDRATSGLVRVHGDLQVDGTTTTINSTVTTIDDPIITLGGDTAPGSDDNKDRGVEFRYYDNQARIGFFGYDDSYTDLGGHVGGFTFLHNATNTSEVFSGTASGITAGNLKLTTNTNSTSNTTGDLVVAGGVGIGDDVNIGGLLDVDGTFRANSTSRFDDNIVFQGASKTLSLNNGSGTTKIQLHTTTGNVEIGGILTNTGAIDANSTLNVASTVRFEDTDEPTVAQNGGTGIYEIQSNDYGAFRFDGGGYVEGDTVFNSDVFINGVLNQRDSATESFGNRNYLNIRYKLRSGSSAAYTPSYASDNTSNLRIFGGAGIQTDLHIGDDLYIGKLNSGDSVSFQVLGESGNTTTQGTLTVEGQTNINDSLIVNASNENFKIQNGSAADKFTVDTDNGNTLIEGTLNVNGVTDIDADFAVRNGTTDKFFVASASGNTQIKGNLTADGHTELNSTLNVDSNTTLGAQLTVTGNSEFNGTVDVDANFAVRSGTTDKMTVASSTGNIATDGTLVVAGQTTINDSLIVQSDNEVVNINNGSGTTKFSIDTDNGNTNIIGTLTVADATQINNTLGVSNVVTLTRNTQQTLTGSYSADGAFKLTGGAGIGKNLAVGEGLRVYGGTELTGALDLNNSADISGALVTHDDVTITADNKMFKVQNASAANKFTVDTDNGNTDIQGTLDVAGDVTASSDLTVTGNLTVNGTTTTVNSTVTTIDDPVITVGGDTAPASNDGKDRGIEFRYYDGSAKIGFFGFDRSSSQFQFLTSATNTSEVLSGTDGALRAGSLNLTGAGTSLDVDANANIDGTLTVDGQIISQVSSGPALVIPTTDKINNLNADLLDGATTATAATASTVVLRDSSGDFAANQITAASAAGSGAGFLGNASTADAWKTARTLTISGVVSGFVVIDGSENETLTTTYVDADITALAAMSGTGYVVRTAANTYAQRTLQVTASSGITLTNADGVSGNTTINVASASSNSANNLVLRDGSGNFAAGTITAALTGNVTGNVTGNVTGQVSDISNHDTGDLTEGSNLYYTNERVDDRVNALITAGTGITKVYDDAANTYTLTVTQSDINTDNVTEGSTNLFTTAARTRTHFTYGTGITHSSGTLSVTQSDINTDNVTEGSTNLFTTAARTRTHFTYGTGITHSSGTLSVTQSDINTDNITEGSTNLFITNERVDDRVNALTVAGTGVSKTYDDAAGTLTLAVDFSEFNTGNITEGSNLYFTNTRADARADLKVAAATGSNLDLSSKSTSDLSEGTNQYYTEARVQAKLDNAYEQLRAMLTNLATSTTLNLNLSGDPTPGAVVTTGVSVGGGGGFTAGTAVATSGSATGSGLTVDTTVDSDGNITAAAVNAGGSGYLITDTVTVTNPNAGKILTLNLATLSGGTGYSSATGVAVTGGDGSSATVDITASAGAITNVTVNNGGTGFAAGNTITIANANATGVKTLGSISAAGSGYSTGTAIATSASASGSGATLNITSVNASGGITGVAINDDGSGYAASEVLTITNANASGIATVGNIGAADASRTAGTYNLGTSDYGTEASGANATFTVVVDSNGAASITVTDDGSGFIANETITVADAQLGGGGGAALTFDVTAIHGSTATVPVSAIHGNGATVNVATVATNATLTLTDITTMEVGATVTGATSGTTGVITALGTNQITVNTVDGFFKKGEVVSANDVTTLTISSFS

Physico‐chemical properties

protein length:	2236 AA
molecular weight:	226908,34840 Da
isoelectric point:	4,21929
aromaticity:	0,05590
hydropathy:	-0,15309

Domains

Domains [InterPro]

SSF69349
STR
4–247

SSF69349 DC_1607 DC_1607 DC_0029 DC_0029

IPR041352
ATT
5–43

IPR041352 DC_1617 DC_0029

YP_004323242.1

1 2236

Architecture

ATT

STR

RBD

ATT 4-43 | STR 44-247 | STR 342-1065 | STR 1111-1539 | RBD 1721-1995 | RBD 2086-2236

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
SSF69349	STR	SSF69349	4	247	Merged direct domain	SSF69349	Central	Low	Positional only	153 proteins / 153 hits
IPR041352	ATT	DC_0533	5	43	InterPro cluster	Major tropism determinant, N-terminal domain	Central	Medium	Text match	295 proteins / 296 hits
DC_1607	STR	DC_1607	342	912	Novel HMM	DC_1607	Central	Low	Positional only	159 proteins / 159 hits
DC_1617	STR	DC_1617	879	1065	Novel HMM	DC_1617	Central	Low	Positional only	43 proteins / 43 hits
DC_1607	STR	DC_1607	1111	1539	Novel HMM	DC_1607	Central	Low	Positional only	159 proteins / 159 hits
DC_0029	RBD	DC_0029	1721	1922	Novel HMM	DC_0029	C-terminal	Low	Positional only	131 proteins / 131 hits
DC_0029	RBD	DC_0029	1909	1995	Novel HMM	DC_0029	C-terminal	Low	Positional only	131 proteins / 131 hits
DC_0029	RBD	DC_0029	2086	2236	Novel HMM	DC_0029	C-terminal	Low	Positional only	131 proteins / 131 hits

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Prochlorococcus phage P-RSM4 [NCBI]	444862	Uroviricota > Caudoviricetes > Pantevenvirales > Thaumasvirus > Thaumasvirus stim4
Host	Prochlorococcus marinus str. MIT 9303 [NCBI]	59922	Bacteria > Cyanobacteria > Prochlorales > Prochlorococcaceae > Prochlorococcus >

Coding sequence (CDS)

Genbank protein accession

YP_004323242.1 [NCBI]

Genbank nucleotide accession

NC_015283 [NCBI]

CDS location

range 95142 -> 101852
strand +

CDS

ATGGCAAATAGAATTCAATTAAGAAGAGGTGGCGCACAGGAATGGGCGAACTCTAACCCGACTCTTGCACAAGGTGAATTGGGTATCGAACTTGACACGGGTCGTTTTAAGATCGGTGATGGTGTATCTGCATGGAACACCTTAAGGTACGAACGTCCTGTAGAGTCTACATCTAATACTGCAAATACTTTAGTCCAAAGGGATGCTGATGGTAACTTCTCTGCAGGTACCATTACTTCTACTGTTATTGGTAACTCGTCTACTGCGTCTAGACTTGCTTCATCTAGACAAATCCAACTCTCTAATGAGGTTACTGCTTCTGGTGTATTTGATGGTTCTCAAAACTTAAATCTATCTGCTGAATTAGCACTTGTTTCTACTTTACCACATTACGATGGTACATCATCTCCCTCAGCAACTTACAATAAGGTAACTGTTGATGCTAAAGGTAGAGTAACAAACGCACAAGATTTTACTGCTTCTAACAACGGTACTCTTGCTGATTATGGTCTTGATGGAACCAATGAAGGAACATCTGCACAACCATATGATTTAGACTTAGTTGCTTTAGCAGGTTTGACCACTACTGGTATGATCTCTAGAACTGCTTCTAATACTGTAGCAACTAGAGCAATTACTGGAACTGCCACAAGAATCTCTGTAAGTGAGGGTGCAGGTATTTCTGGTAACCCAACTATTGATATGATTACCACTGCTGTTACAGCAGGTAACTATAATACGGAATCCCTGACATCTGTATCTGGTGCAGGTGGAAATGGCGAACCCTTTGGTACCGCTACAGTTAACGCTACTAAGTTTACTGTTGATGCCTATGGTAGATTGACAAGTGCAACAAATGTGCCTATCGCTACTGCTGCAGAAGGTAGTAAGTATGCTAGCTATAATGCAGGTACTACTTACGTTAGATATGACATCATTGCTAACGCATCAAAAGTTTACCAAGCCATCACTGGCATTGCTGCAGGTGCAGGTGCACCTACTCATAGTAGCGGTGACTCTGGCGGGTGGAGATATCTCGCTGCCGAAGCAACAGAGCAGAAGGGATTGGCTAGTTTTGCACAAGAAGATTTCGACGTTGACGCGAACGGGCACGTCACGATCGCCACCGCAGGAGTAGATAATACACAACTACAAAATAATAAACTTATTTTCACAGATGGAAATGCTGTTGAAAATTTTGAATTAGATAACGAACTTACAACTTCTACCGCCAACACTGGTTTTAATAAATTAAACTTTATTAAAATCAATAATACTTCTGGCGGTTTATTATTTGGTGCTAATAATACTGGTGATAGTGGTGCAGGTGAGATCGATGTAAACGTACGTTCTTACTTTAGCGATCCTGATATTACTTTAGATGGTTCAGTTGCACAAACTCTAAACAAAACTGGTGATGGTAATCTTACTTTCACAACTACTCAAAACTCATCATCTGCAAGATCTTTAACAGTTTCAGCATCAAACTCTGGTTCTGGAACTAGCACAGTTACAATTACTGCAGAAGATGTAGTTGATATTGATGCCTCAGATTCAAACGGAAAAGTTCATGTCGAAGATTCTAGATTCCAAGATAACTACATTGCTACGTCTAATGCCACTATGCACCTTGATCCTGGTGATGATCGTGCTACTAGTGGGTTAGTTCGTGTTCATGGAGATTTACAGGTAGATGGTACGACTACGACAATTAATTCAACAGTTACAACAATTGATGATCCCATTATTACTCTTGGTGGCGATACTGCTCCAGGTAGTGATGACAATAAAGATCGTGGAGTTGAATTCAGATACTACGACAATCAAGCAAGAATTGGATTCTTTGGTTACGATGATTCTTACACCGACCTCGGAGGACACGTCGGAGGATTTACATTTTTACACAACGCCACAAATACTTCAGAGGTCTTTAGTGGAACTGCGTCAGGTATAACTGCAGGTAATTTAAAACTTACAACAAATACTAACTCAACATCTAATACTACAGGAGACTTAGTAGTTGCAGGTGGTGTTGGTATTGGAGATGATGTTAATATTGGTGGATTGCTAGATGTCGATGGCACATTCCGTGCTAATAGCACATCTAGATTTGATGATAACATTGTATTCCAAGGTGCTTCTAAGACATTATCATTGAATAATGGTAGTGGCACAACTAAAATACAACTTCACACTACTACAGGTAATGTAGAAATTGGTGGTATCTTAACAAATACTGGTGCTATTGATGCAAACAGCACTTTAAATGTTGCATCCACAGTACGTTTTGAAGACACAGATGAACCAACTGTTGCACAGAATGGTGGAACTGGTATTTATGAAATTCAATCAAATGATTATGGTGCATTTAGATTTGATGGTGGTGGATATGTTGAAGGTGATACAGTATTCAATAGTGATGTTTTTATTAACGGTGTTCTAAACCAAAGAGACAGTGCTACAGAATCATTCGGTAATAGAAACTATCTAAACATCAGATATAAATTACGTTCTGGTTCAAGTGCAGCGTATACTCCTTCATATGCATCTGATAATACTTCTAACTTAAGAATCTTTGGTGGTGCAGGTATTCAAACTGACCTCCATATTGGTGATGATCTTTATATTGGTAAATTAAACTCTGGTGACAGTGTTTCATTCCAAGTATTAGGAGAGTCAGGTAATACAACTACTCAAGGAACATTAACAGTAGAAGGTCAAACAAATATTAATGACTCTCTAATTGTTAATGCTTCTAACGAAAACTTTAAGATTCAAAATGGATCTGCTGCAGATAAATTTACAGTTGATACTGATAATGGTAATACATTAATTGAAGGAACACTTAATGTAAACGGTGTAACTGATATTGACGCAGACTTCGCAGTTAGAAACGGAACGACTGATAAGTTCTTTGTCGCATCTGCCTCAGGTAATACTCAAATTAAAGGCAATCTGACTGCTGATGGTCATACTGAATTAAATTCAACACTTAATGTTGATAGTAATACAACACTTGGTGCACAACTTACAGTAACTGGTAACTCAGAGTTCAACGGAACTGTAGATGTTGATGCAAACTTTGCAGTCAGATCAGGAACTACTGATAAGATGACTGTTGCATCTTCTACAGGTAACATAGCAACTGATGGAACTCTAGTTGTTGCAGGTCAAACAACTATTAATGATTCTCTAATTGTTCAAAGTGATAACGAAGTAGTTAATATAAACAATGGTTCTGGCACAACTAAGTTCAGCATTGATACTGATAACGGTAATACAAATATTATCGGAACATTAACAGTTGCTGATGCTACTCAAATTAATAATACTCTTGGTGTTTCTAACGTTGTAACCTTAACAAGAAACACTCAGCAAACTCTGACTGGATCTTATTCTGCTGATGGTGCATTCAAACTAACTGGTGGTGCAGGTATCGGTAAAAACCTTGCTGTTGGTGAAGGTCTAAGAGTATATGGAGGCACTGAACTTACTGGTGCTCTTGATCTTAATAATAGTGCTGATATATCTGGTGCTTTAGTAACTCATGATGATGTTACTATCACTGCAGATAATAAGATGTTCAAGGTGCAGAATGCTTCTGCAGCGAACAAGTTTACAGTCGATACCGATAATGGTAACACTGATATTCAAGGAACATTGGATGTTGCAGGTGATGTAACTGCATCATCTGACCTTACAGTCACAGGAAATCTTACAGTCAATGGAACAACAACTACTGTCAATTCTACGGTCACAACAATCGATGACCCTGTTATTACTGTTGGTGGTGATACAGCACCCGCGTCTAATGATGGAAAGGATCGTGGTATTGAATTTCGTTATTATGATGGTTCTGCTAAAATCGGTTTCTTCGGTTTTGATAGATCATCCTCCCAATTCCAATTCTTAACAAGTGCAACAAATACTTCTGAAGTTCTCTCAGGAACAGATGGTGCTCTAAGAGCAGGTAGTTTAAATCTTACTGGTGCGGGCACATCTCTTGATGTTGATGCTAATGCAAACATTGATGGCACACTGACTGTAGATGGTCAGATTATTTCACAAGTATCTTCAGGTCCTGCTCTTGTTATCCCAACAACAGATAAGATTAATAATCTTAACGCAGACTTACTAGATGGTGCTACAACCGCAACTGCTGCAACTGCATCCACAGTTGTTCTTCGTGATTCATCTGGTGATTTTGCTGCCAATCAAATCACTGCTGCTAGTGCTGCAGGATCTGGTGCAGGTTTCTTAGGAAACGCATCCACTGCTGACGCATGGAAGACTGCTAGAACACTCACCATTAGCGGTGTTGTATCTGGTTTTGTAGTCATCGATGGAAGTGAAAATGAAACACTTACAACAACTTATGTTGATGCAGACATCACTGCTCTAGCAGCGATGAGTGGAACTGGTTATGTCGTACGAACTGCTGCTAACACTTATGCCCAAAGAACTCTCCAAGTCACCGCATCGTCTGGAATCACTCTTACTAACGCTGATGGCGTTTCTGGTAATACTACAATTAACGTTGCTAGTGCATCTTCTAATTCTGCAAACAACCTCGTCCTAAGAGACGGATCTGGTAACTTTGCTGCAGGAACTATTACTGCTGCCTTAACTGGTAATGTCACAGGTAATGTAACTGGTAATGTAACTGGTCAGGTATCTGATATCTCAAACCATGATACTGGTGATCTTACTGAGGGATCTAACCTCTACTACACTAATGAAAGAGTTGACGATAGAGTCAATGCTCTTATTACTGCAGGAACTGGTATTACTAAGGTTTACGATGACGCTGCAAATACATATACACTGACTGTAACTCAGTCAGATATCAATACTGATAATGTAACAGAGGGATCAACAAATCTATTCACAACTGCTGCTAGAACTAGAACTCATTTCACATATGGAACTGGTATCACACATAGTTCTGGAACTTTATCAGTTACTCAGTCTGATATTAATACTGACAACGTAACTGAAGGATCAACTAACCTCTTTACTACTGCTGCTAGAACAAGAACACACTTTACATACGGAACTGGTATTACACACAGTTCTGGAACTTTATCAGTTACACAATCAGATATCAACACTGATAATATTACTGAAGGTTCTACAAACCTATTCATTACTAATGAACGTGTTGATGATAGAGTCAACGCTTTAACTGTTGCAGGAACTGGTGTAAGTAAGACATATGATGACGCTGCAGGAACTCTAACTTTAGCAGTTGACTTTAGTGAGTTTAATACTGGCAATATTACAGAGGGTTCTAACCTTTACTTTACAAACACTCGTGCTGATGCAAGGGCAGACTTGAAAGTTGCTGCTGCAACTGGTTCAAACCTTGATCTTTCTTCTAAGTCTACTTCCGATCTTTCTGAAGGAACTAATCAATACTATACAGAAGCAAGAGTTCAAGCAAAACTTGACAATGCTTATGAGCAACTAAGAGCAATGTTAACTAACCTTGCAACTAGCACCACTCTAAATCTTAACTTGTCTGGTGATCCTACACCTGGCGCAGTTGTTACCACTGGTGTTAGTGTTGGTGGTGGCGGTGGATTTACTGCAGGAACTGCGGTTGCTACATCTGGTTCAGCAACTGGATCTGGATTGACTGTTGATACTACGGTTGATAGTGATGGAAACATCACTGCTGCTGCGGTAAATGCAGGTGGTTCTGGATATCTAATTACTGATACTGTCACAGTCACTAACCCCAACGCAGGTAAGATTCTTACATTGAACTTGGCAACATTATCAGGTGGAACAGGTTATTCATCTGCTACTGGAGTTGCAGTCACTGGGGGTGACGGTTCTTCTGCGACTGTTGACATTACTGCATCTGCAGGTGCTATCACTAACGTAACAGTTAATAACGGTGGAACAGGATTCGCTGCGGGTAATACTATAACTATTGCTAATGCTAATGCTACTGGAGTTAAGACTCTTGGATCTATTAGTGCTGCAGGATCTGGATATTCAACAGGAACTGCCATTGCAACATCAGCGTCCGCATCTGGATCTGGAGCAACATTAAATATCACTTCTGTCAATGCTAGTGGTGGTATCACTGGTGTTGCAATCAACGATGATGGATCTGGTTACGCTGCATCTGAAGTCTTGACAATTACTAATGCTAACGCATCTGGTATCGCAACAGTAGGAAACATTGGTGCTGCTGATGCATCAAGAACTGCAGGAACCTATAACTTAGGCACATCTGATTATGGAACTGAAGCATCTGGTGCCAACGCAACATTCACTGTTGTTGTTGATTCAAATGGTGCTGCTTCTATCACCGTAACAGATGATGGTAGCGGATTTATCGCCAATGAAACTATCACAGTTGCTGATGCTCAACTTGGTGGTGGCGGTGGTGCTGCTCTTACATTCGATGTAACAGCAATCCATGGTAGCACTGCTACAGTTCCAGTATCTGCGATTCATGGAAACGGTGCAACAGTTAATGTCGCTACCGTTGCAACAAATGCAACTCTAACTCTAACTGACATCACAACGATGGAAGTTGGAGCAACAGTTACAGGTGCTACTTCTGGCACCACAGGTGTTATCACTGCTCTGGGAACTAACCAGATCACTGTCAATACCGTTGACGGATTCTTCAAGAAAGGAGAAGTCGTCAGTGCTAATGATGTTACTACACTTACTATCTCCTCATTCAGTTAA

Genome Context

Tertiary structure

PDB ID

f5968b7e8b0d3d735100b970ae87af9c54d62c5eae12955118af188025a3b6be

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,4860

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Literature

Title	Authors	Date	PMID	Source
The Genome Sequence of Cyanophage 9303-10a	Henn,M.R., Sullivan,M.S., Osburne,M.S., Levin,J., Malboeuf,C., Casali,M., Russ,C., Lennon,N., Erlich,R., Young,S.K., Koehrsen,M., Yandava,C., Zeng,Q., Alvarado,L., Anderson,S., Berlin,A., Borenstein,D., Chen,Z., Engels,R., Freedman,E., Gellesch,M., Goldberg,J., Green,L., Griggs,A., Gujja,S., Heiman,D., Hepburn,T., Howarth,C., Jen,D., Larson,L., Lewis,B., Mehta,T., Park,D., Pearson,M., Roberts,A., Ryan,E., Saif,S., Shea,T., Shenoy,N., Sisk,P., Stolte,C., Sykes,S., Walk,T., White,J., Yu,Q., Coleman,M.L., Huang,K.H., Weigele,P.R., DeFrancesco,A.S., Kern,S.E., Thompson,L.R., Fu,R., Hombeck,B., Chisholm,S.W., Haas,B., Nusbaum,C., Galagan,J. and Birren,B.	2011-09-23	—	GenBank

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence

Literature