Protein

View in Explore

Genbank accession

YP_004322768.1 [GenBank]

Protein name

structural protein

RBP type

Evidence RBPdetect2

Probability 0,93

Protein sequence

MANRIQLRRGGSQEWRNANPTLAQGEVGIDLDSGRIKIGDGSTAWNSLAYERPVESVANTANSLVQRDADGNFQAGTITGTVIGNASTASRLANVRQIQLTQDIVASGTFDGSQNLNLAAELQEIPTLPHFGADPAQGTYTSVTVDAKGRIINAANPSTIQDYNLDGVVEGQSAQPYDNDLSAVSGLTGTGISIRIGDGNWTTRSILSTAGQVVVSNGSGTAGNPQIDLATTTVVDGDYNTESLTSVIANGPAGEPFGTETVNAVKFTVDDRGRLQSATNVPIATATEGSKYANYDAGTAYSRYAIIQNASKVYQAYESVSAGAGAPAHTSGDSGGWRYLAAEATEQKGLASFAQEDFDVDSNGHVTIAALGVDNLQLQNNRVSFADGNTKEDFELDQELTATTGYRGFNYLNYIKVNDTSGNLLFGANNTGDSGAGELDVNVRSYFSDPNIDLDGAVDQIVSKYGDGHWTVSHVQNVATPRNLNILATNSGSGSANIVITSDDTVQISASDAAGKVWVEDYRFQENYIATTNATLNIDPGDDRAVTGTVRVWGDLQVDGTTTTVNSTTLQVDDPIITLGGDTDPVADDNLDRGIEFRYYDSQARRGFFGYDDSYTDLGGHSGGYAFYYNATNTAEVFSGTDAGVLAGNLKLTTNTNSTTNTTGDLVVAGGAGIGQDVNIGGSVDIDTNLTVHGTTLHDDNIVIQGASKVLQLNNGTGTTRVELQSTTGNASFYGVVDITNNLNINTNKFNVVAATGNTAIAGTLNVEGITTITDAVDLNSTLNVASSVHFEATDEPTFALNGGTGLWEIQSADYGSFRFDGGGYIAGDFMFDSDVVINGTILQRESSTEVFNEQNFLRVRRKFESGSVQVLTPSYASHSSSNARIFGGAGIGTSLHIGGTSASEGLFIGKKVNSDTVKFSVLGASGNTDIQGTLNVEGASVIDDTLNVTGAVDLDSTLNVDADATFQSNVTINGDNLLFTIEAQNGTDAFTVDSDNGNTIIAGTLDVDDATQITNTLNVTNGVDFDQTLNVDGAVDFNSTLVVDGQTTIYNSIYLNASNEEFAIQNGSGVDKFTVDSDNGNTIISGTVDISGATGITNSLTTSGVNTFTNSTQQTLTGSYSADGAFRLTGGAGIGKNLAVSGDTRVYGATELTGALDLNNSADISGIVTITNTSDITSYGDASVSLVTAGGLRVNKNAYVGGDFYVYDNGNSRAAFSVDNSTGNGEFHNNLIVGGDLTVNGTTTTVNSTTVTIDDPVFTLGGDTAPGSDDNKDRGIEFRYHTGSTAALGFFGYDDSASEFVFLTASTNSSEVFTGTDGNLRANQLHLTGSGTTLDVDADAIINGDLTVDDQIISTVTGKPPLVVASNSKVNNLNADLLDGLTTSSTDTTGTSVVSRSNGDFSANQITVNNGIGALAGIQGNATTADELRTARTVTIDGVVNATVSFDGSQNVTLTTTFDDADMDGLAAMAGTGFVSRTAANTYAQRTLITSPASGSGITVTQGDGVAGNPTINILSATTNAANNLVLRDGSGSFASNQITMVTSTVSGNATIGGTLGVTGITSLTDLLNADGGIAVDGTNFTVDGTTGAVSTASTLNADAAVTFGSTLGVTSNATIGGTLGVTGTVTASANLDVTVDATVGGTLGVTGITTLSNNLTVTGTSAFTGAITATNGVVGNITGQVSDISNHDTDALTEGSTNIYFTDERVDDRVAALISGGTGITATYNDAGNLLTLSATQADISTDLITEGSTNLFTTAARTRTHFTYGTGIEHDGSGALSVTQVDIDTDNVTEGSVNLFTTAARTRTHFTYGTGIEHDGSGALSVTQADIDTDNVTEGSTNIFYTEARFDASLAGKNTANLTEGTNLYYTDARAEASFDTKIAAADTDALSEGSTNLYYTDARADARVANATGAALDLSSKSTADLAEDTNLYFTDARADARVDVGFAAKSTTDLAEGTNQYYTEARVQDKLDNAFAQLQAMLTNLATTTTLTLNLSGDPTPGAVVTTGSISASGLGGFTAGTAVATTSDGAGTGLTVDTTVDASGAITAVAANAGGTDYLIGETITLTNPNLGGAATFDFASLVGGSNYVTATGLTTTSSGSGNNLTVDITASAGVITNITVNVAGDGYSIGDTITIVQPVGSDPLGPGAGGTIDLSTVFTNATFALSDITTMEVGATVTGSTSGTTGVITALAASAITVDTVDGFFKVGEVVSANDVTTLTVQSFA

Physico‐chemical properties

protein length:	2228 AA
molecular weight:	228218,16390 Da
isoelectric point:	4,05003
aromaticity:	0,06373
hydropathy:	-0,10539

Domains

Domains [InterPro]

DC_1619
ATT
1–464

DC_1619 DC_1617 DC_1607 DC_0029 DC_0029

SSF69349
STR
4–241

SSF69349 DC_1607 DC_0029 DC_0029

IPR041352
ATT
5–43

IPR041352

YP_004322768.1

1 2228

Architecture

ATT

STR

RBD

ATT 1-464 | STR 465-1052 | STR 1097-1567 | RBD 1805-2228

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_1619	ATT	DC_1619	1	464	Novel HMM	DC_1619	N-terminal	Low	Positional only	123 proteins / 123 hits
SSF69349	STR	SSF69349	4	241	Merged direct domain	SSF69349	Central	Low	Positional only	153 proteins / 153 hits
IPR041352	ATT	DC_0533	5	43	InterPro cluster	Major tropism determinant, N-terminal domain	Central	Medium	Text match	295 proteins / 296 hits
DC_1607	STR	DC_1607	328	944	Novel HMM	DC_1607	Central	Low	Positional only	159 proteins / 159 hits
DC_1617	STR	DC_1617	943	1052	Novel HMM	DC_1617	Central	Low	Positional only	43 proteins / 43 hits
DC_1607	STR	DC_1607	1097	1567	Novel HMM	DC_1607	Central	Low	Positional only	159 proteins / 159 hits
DC_0029	RBD	DC_0029	1805	1881	Novel HMM	DC_0029	C-terminal	Low	Positional only	131 proteins / 131 hits
DC_0029	RBD	DC_0029	1874	1928	Novel HMM	DC_0029	C-terminal	Low	Positional only	131 proteins / 131 hits
DC_0029	RBD	DC_0029	1914	2079	Novel HMM	DC_0029	C-terminal	Low	Positional only	131 proteins / 131 hits
DC_0029	RBD	DC_0029	2070	2228	Novel HMM	DC_0029	C-terminal	Low	Positional only	131 proteins / 131 hits

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Synechococcus phage S-ShM2 [NCBI]	445683	Uroviricota > Caudoviricetes > Pantevenvirales > Ahtivirus > Ahtivirus sagseatwo
Host	Synechococcus sp. WH 8102 [NCBI]	84588	Bacteria > Cyanobacteria > Oscillatoriophycideae > Chroococcales > Synechococcus >

Coding sequence (CDS)

Genbank protein accession

YP_004322768.1 [NCBI]

Genbank nucleotide accession

NC_015281 [NCBI]

CDS location

range 96015 -> 102701
strand +

CDS

ATGGCAAATAGAATCCAACTTAGAAGAGGCGGTTCACAGGAATGGAGAAACGCTAACCCAACACTAGCGCAAGGTGAGGTAGGTATTGACCTAGACTCTGGTCGTATCAAAATTGGTGATGGTTCCACTGCATGGAACTCACTGGCGTATGAACGTCCTGTAGAATCTGTTGCTAACACTGCAAATTCCCTCGTACAAAGAGACGCTGATGGTAACTTCCAAGCGGGTACGATTACAGGAACTGTTATTGGTAATGCCTCTACTGCATCTCGTCTAGCAAATGTTAGACAGATTCAACTTACTCAAGATATTGTTGCCTCTGGTACTTTTGACGGTTCTCAAAACCTCAACCTTGCTGCAGAACTGCAAGAGATCCCCACGCTGCCTCACTTTGGTGCGGATCCTGCACAAGGTACATACACCAGCGTTACTGTGGACGCAAAGGGTAGAATTATCAATGCCGCAAACCCATCTACTATTCAAGACTATAACTTAGATGGTGTTGTAGAAGGTCAGTCTGCACAACCTTATGACAATGACCTCAGTGCAGTTTCAGGTCTGACTGGTACTGGTATCAGTATTCGTATTGGTGATGGTAACTGGACTACTAGGAGTATTCTATCTACTGCTGGTCAAGTTGTTGTCAGTAATGGTTCTGGTACTGCAGGTAACCCACAAATTGACTTAGCAACTACAACAGTTGTTGACGGTGATTACAACACAGAATCCCTAACGTCAGTAATTGCTAACGGTCCAGCAGGTGAACCTTTCGGTACAGAGACCGTAAACGCAGTCAAATTTACTGTTGACGACAGGGGTCGTCTTCAAAGCGCAACAAATGTGCCTATTGCTACTGCTACTGAGGGTAGTAAGTATGCTAACTATGATGCAGGCACTGCTTACTCTAGATATGCAATCATTCAGAATGCATCAAAGGTTTATCAAGCGTATGAATCAGTTAGTGCTGGTGCTGGTGCTCCTGCTCATACCAGTGGCGATTCTGGAGGATGGCGCTACCTCGCGGCTGAAGCGACAGAGCAGAAGGGACTGGCTAGTTTTGCACAAGAGGATTTCGATGTTGACAGTAACGGGCATGTAACTATTGCTGCCCTAGGCGTAGATAATTTACAATTACAAAATAATAGAGTTTCTTTTGCGGATGGAAATACAAAAGAAGATTTTGAACTGGATCAAGAACTCACTGCAACCACTGGATACCGAGGATTCAATTACCTCAACTATATCAAAGTCAATGATACAAGCGGCAATTTACTTTTTGGCGCTAATAATACAGGCGATAGTGGCGCTGGTGAACTTGATGTCAACGTCCGTTCCTATTTTTCTGATCCTAATATTGATCTTGATGGAGCAGTCGATCAGATCGTTAGTAAGTATGGCGATGGTCACTGGACCGTAAGTCATGTTCAAAATGTCGCGACTCCCAGAAACCTCAATATTCTTGCAACGAACTCTGGTTCAGGAAGTGCAAATATTGTAATTACATCTGATGACACTGTACAGATTAGTGCATCAGATGCAGCAGGTAAAGTTTGGGTAGAAGACTATAGATTCCAAGAAAATTATATTGCTACAACCAATGCCACTCTCAACATTGATCCTGGTGATGATAGGGCGGTTACTGGAACCGTCAGAGTTTGGGGTGATCTTCAGGTTGACGGCACCACGACGACAGTCAACTCTACTACCCTTCAAGTTGACGACCCAATCATTACTCTTGGTGGTGATACTGATCCAGTTGCTGACGATAATCTTGATCGTGGTATTGAGTTTAGATACTATGATTCTCAAGCGCGTCGAGGCTTCTTTGGTTACGATGATTCGTATACTGATCTCGGAGGACACTCTGGTGGATATGCATTCTACTACAATGCTACCAACACTGCAGAAGTCTTTAGCGGTACTGATGCAGGTGTCTTAGCAGGTAACCTAAAACTTACTACTAATACTAACTCCACTACTAATACAACGGGTGACCTTGTGGTTGCTGGTGGTGCTGGTATTGGACAAGATGTGAATATTGGTGGTAGCGTTGATATCGATACCAACCTGACTGTTCATGGCACGACTCTCCATGATGACAACATTGTCATCCAAGGTGCTTCTAAGGTTCTGCAACTGAACAATGGCACTGGTACAACTCGTGTTGAACTGCAGAGCACTACAGGTAATGCATCATTCTATGGTGTTGTTGATATTACTAACAACCTGAACATCAACACTAATAAGTTCAACGTTGTTGCTGCTACTGGTAATACTGCTATTGCAGGTACGCTGAATGTTGAAGGTATCACTACAATTACTGATGCTGTTGATCTCAATAGCACACTAAATGTTGCTAGTTCTGTGCATTTTGAAGCAACTGATGAACCCACATTTGCATTGAATGGTGGCACTGGTCTTTGGGAAATTCAATCCGCTGACTATGGTTCATTCCGATTTGATGGTGGTGGATATATTGCTGGCGACTTTATGTTCGACAGCGACGTTGTTATCAACGGTACTATTCTCCAGAGAGAATCATCTACTGAGGTCTTCAACGAGCAAAACTTCCTGAGAGTTCGTCGTAAGTTTGAATCTGGATCTGTTCAGGTTCTAACCCCTAGTTATGCTTCACATTCTAGCTCAAACGCTAGAATCTTTGGTGGTGCTGGTATCGGCACTAGTCTCCACATCGGGGGCACAAGTGCTAGCGAAGGTCTGTTTATTGGTAAGAAAGTCAATAGCGATACTGTCAAGTTCTCTGTCTTAGGTGCATCTGGTAATACTGATATTCAAGGCACACTGAATGTTGAGGGTGCATCTGTTATTGATGATACTCTGAATGTAACTGGTGCAGTTGATCTTGACAGCACTCTGAACGTTGATGCTGATGCAACATTCCAAAGCAATGTTACAATCAATGGTGACAATTTACTGTTTACCATTGAGGCACAGAATGGCACTGATGCATTTACAGTAGACTCTGACAATGGCAATACAATCATTGCTGGTACATTAGATGTAGATGATGCAACACAAATCACAAACACCCTCAACGTCACTAACGGCGTTGACTTTGATCAAACTCTCAATGTTGATGGTGCCGTTGACTTCAATAGCACTTTGGTTGTGGATGGTCAAACAACAATTTACAACTCCATTTACCTGAATGCTTCCAATGAGGAGTTTGCTATTCAGAACGGTTCTGGTGTAGACAAGTTCACTGTAGATAGTGACAATGGCAATACTATAATCTCTGGCACTGTTGATATTAGTGGTGCTACAGGTATTACAAATAGCCTGACTACATCAGGTGTCAATACATTTACAAATTCTACTCAACAAACCCTCACTGGTTCATACAGTGCAGATGGTGCATTCCGTTTGACAGGTGGTGCTGGTATTGGCAAGAATCTTGCAGTTAGTGGTGACACTAGAGTCTATGGTGCTACCGAACTTACAGGTGCTCTTGATCTCAATAACTCTGCAGATATTTCTGGTATTGTTACTATTACTAATACCAGTGACATTACCTCTTATGGTGATGCATCTGTCTCTCTAGTCACCGCTGGTGGTCTAAGAGTCAACAAGAATGCATACGTTGGTGGTGACTTCTACGTCTATGACAACGGAAATTCTCGTGCTGCATTTAGTGTAGACAACAGCACTGGTAATGGCGAGTTTCATAACAATCTAATTGTTGGTGGTGATCTAACGGTCAACGGTACAACTACTACCGTCAACAGCACTACCGTCACAATTGATGACCCCGTATTTACTCTTGGTGGTGACACTGCTCCTGGTTCCGATGACAACAAAGATCGTGGTATTGAGTTCCGTTATCACACGGGTTCTACCGCTGCTCTTGGTTTCTTCGGTTATGACGATTCTGCTTCGGAGTTTGTCTTCCTTACTGCATCTACAAATTCAAGTGAAGTATTCACTGGTACAGATGGAAACCTGAGAGCAAATCAGTTACATCTGACAGGTAGTGGAACAACTCTCGATGTTGATGCTGATGCAATTATCAATGGTGATCTGACTGTTGATGATCAAATTATTTCTACCGTAACTGGTAAACCACCTTTGGTTGTTGCATCAAACTCTAAGGTCAATAACCTGAATGCTGACTTGCTAGATGGTCTGACCACAAGCAGCACTGATACAACTGGTACTTCTGTTGTTAGTAGAAGTAATGGTGACTTCTCTGCTAATCAGATCACTGTAAACAATGGTATCGGTGCTCTTGCTGGTATCCAAGGTAACGCAACAACTGCGGATGAACTTCGCACTGCTCGTACCGTCACAATTGATGGTGTCGTCAATGCAACAGTCTCCTTTGATGGTTCTCAGAACGTAACTCTGACAACTACATTTGATGATGCAGACATGGATGGTCTGGCAGCGATGGCAGGAACAGGTTTCGTCAGCAGAACTGCTGCCAATACCTATGCTCAGCGTACGCTGATTACTTCTCCTGCATCTGGATCTGGTATTACTGTCACTCAAGGTGATGGTGTTGCTGGTAATCCAACGATCAATATTCTGTCTGCTACTACCAACGCTGCAAACAACTTGGTCCTGAGAGATGGAAGCGGTAGTTTTGCTTCTAATCAGATCACTATGGTGACCTCCACAGTGAGCGGAAACGCTACGATTGGTGGAACACTCGGTGTAACTGGTATAACGTCCCTCACAGACCTCCTGAACGCCGATGGTGGCATTGCAGTTGACGGTACTAACTTCACTGTAGATGGTACAACAGGTGCCGTTTCTACTGCTAGCACACTGAATGCTGATGCTGCAGTAACTTTCGGTAGCACACTGGGAGTTACTTCTAACGCAACTATCGGTGGCACACTGGGTGTTACTGGAACTGTAACTGCTAGCGCAAACCTAGATGTAACAGTCGATGCAACTGTCGGCGGTACTCTGGGTGTCACGGGTATTACAACTCTAAGTAACAACCTGACAGTAACTGGAACCTCTGCATTCACTGGTGCTATTACAGCAACTAATGGTGTTGTTGGTAACATCACTGGTCAAGTATCTGATATCAGCAATCATGATACGGATGCACTGACCGAAGGTTCTACTAATATCTACTTCACTGATGAGAGAGTAGATGATCGCGTTGCTGCATTGATCTCTGGTGGTACAGGTATTACTGCTACCTATAACGATGCTGGTAACCTCCTGACCTTGAGTGCTACTCAAGCAGACATCTCCACTGATCTTATTACTGAAGGTTCCACGAATCTCTTTACTACTGCTGCTAGAACTCGTACACACTTTACATACGGTACAGGCATTGAGCATGATGGATCTGGTGCTCTTTCTGTAACACAAGTAGACATCGATACTGACAATGTAACTGAAGGTTCTGTCAATCTGTTTACCACTGCTGCAAGAACCAGAACCCACTTCACATATGGTACTGGTATTGAGCATGATGGTTCAGGTGCTCTGAGTGTTACTCAGGCAGACATTGATACTGATAATGTAACTGAAGGTTCTACAAATATCTTCTACACAGAGGCACGCTTTGATGCAAGTCTCGCAGGTAAGAATACTGCTAATCTGACAGAGGGTACTAACCTCTACTACACAGACGCTCGTGCTGAGGCATCCTTCGATACTAAGATTGCTGCTGCTGACACTGATGCATTGAGTGAGGGTTCTACTAACCTTTACTACACCGATGCTCGTGCTGATGCAAGAGTTGCTAATGCAACTGGTGCTGCTCTTGACCTTAGCAGTAAGTCTACTGCTGACTTGGCAGAGGATACCAACCTTTACTTTACTGATGCTCGTGCTGATGCAAGAGTCGATGTAGGATTTGCTGCTAAGTCAACTACTGATCTTGCTGAAGGTACTAATCAATATTATACCGAGGCAAGAGTACAAGATAAACTGGATAATGCATTCGCTCAACTACAAGCAATGCTTACCAACCTTGCAACTACTACCACTCTTACATTGAACCTCTCTGGCGACCCTACACCTGGTGCAGTGGTTACTACTGGTTCTATCAGTGCTAGTGGTCTTGGTGGTTTCACTGCTGGAACTGCTGTTGCTACCACCTCTGATGGTGCTGGTACTGGATTGACTGTTGATACTACAGTTGATGCTTCTGGTGCTATCACTGCAGTCGCTGCTAACGCAGGTGGCACTGATTATCTGATCGGTGAAACAATTACCCTTACCAACCCTAATCTGGGCGGTGCTGCAACATTCGACTTTGCTTCGTTGGTTGGTGGATCTAACTACGTTACCGCAACTGGTTTGACAACTACTTCATCAGGTTCTGGAAATAATCTCACCGTAGACATCACCGCATCTGCTGGTGTTATTACCAACATTACTGTAAATGTAGCAGGAGATGGTTACTCAATTGGTGACACTATTACTATTGTTCAACCTGTTGGTTCCGATCCATTAGGTCCTGGTGCTGGTGGTACTATTGATCTTTCAACAGTATTCACCAATGCAACCTTTGCACTTTCTGATATCACAACGATGGAAGTTGGTGCAACTGTCACGGGTTCTACCAGTGGCACCACAGGTGTTATCACCGCTCTCGCTGCTAGTGCTATTACCGTCGATACCGTTGATGGATTCTTCAAAGTTGGAGAAGTCGTCAGTGCTAATGATGTTACTACTTTGACTGTCCAATCATTCGCTTGA

Genome Context

Tertiary structure

PDB ID

e73b250b1034c224f0916c8d7472ff4554a74988da873848c2c2b5e4e317bed4

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,4969

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Literature

Title	Authors	Date	PMID	Source
The Genome Sequence of Cyanophage 8102-4	Henn,M.R., Sullivan,M.S., Osburne,M.S., Levin,J., Malboeuf,C., Casali,M., Russ,C., Lennon,N., Erlich,R., Young,S.K., Koehrsen,M., Yandava,C., Zeng,Q., Alvarado,L., Anderson,S., Berlin,A., Borenstein,D., Chen,Z., Engels,R., Freedman,E., Gellesch,M., Goldberg,J., Green,L., Griggs,A., Gujja,S., Heiman,D., Hepburn,T., Howarth,C., Jen,D., Larson,L., Lewis,B., Mehta,T., Park,D., Pearson,M., Roberts,A., Ryan,E., Saif,S., Shea,T., Shenoy,N., Sisk,P., Stolte,C., Sykes,S., Walk,T., White,J., Yu,Q., Coleman,M.L., Huang,K.H., Weigele,P.R., DeFrancesco,A.S., Kern,S.E., Thompson,L.R., Fu,R., Hombeck,B., Chisholm,S.W., Haas,B., Nusbaum,C., Galagan,J. and Birren,B.	2011-09-23	—	GenBank

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence

Literature