Protein

View in Explore

Genbank accession

AOO08527.1 [GenBank]

Protein name

structural protein

RBP type

Evidence RBPdetect2

Probability 0,94

Protein sequence

MANRIQLRRGGAQEWANANPTLAQGELGIELDTGRIKIGDGVTAWNTLRYERPVESNTNTPNTLVQRDADGNFSAAIVTASLIGNASTATRLDQTRQIQLSGDVTASGNFDGSQNLNLSSALTLVSTLPHYLQDNDPSITRVFTEVTVDQKGRVVNARTPAQMNLADYGLDGSATSDTSLAQPWNPNLEAISDETGTGFYVRTGAGSIAVRQILAESADIVVSNGTGVSGNPNLSLAIQAGLVAGNYNTESLTSVTQAGGSGEPFGTETVNAVKFSCDNHGRLSSATNVPIATATEGSKYPSYNAGTTYARYDIIANESKVYQAYQAISAGAGAPTHSSGDNGGWRYLAAEATEQKGLASFAQEDFDVDSNGHVTIAALGVDNTQLQNNRISFADGNTKEDFELDQELTGTTGYRGFNYLNYIKVNDTSGNLLVGANNTGDSGAGELDINVRSYFSDPDITLDGIVDQTLDKTGDGNLTFQLTQNSASARNLSILSTNAGSGTSTVTITAEDVVDIDASDANGKVHIEDLRIQSNYLASTGQLNLDPGDDRTASGLVRIFGDLQIDGTTTTVNSTVTTVDDPVITLGGDTAPASDDNKDRGIEFRYYDTQARVGFYGWDTGYTDLGGHEGGYRFLHAATNTSEVFAGTDSGLIAGNVKLTTNTNSTSNTTGDLVVAGGAGIGQDVNIGGLLDVDGTFRVNSTSRFDDNIVLQGASKTLQLNNGSGTTKIEFQSTTGNGSLGGILDVTGNFNVNTNKFNVVAASGNTSIAGTLGVTNIATFSNDIDANANMTLAGDLHMESTNDITVAKNAGTGVWEIQSNDYGALRIDGGVYAAGDALIDGTLHVNGAIEVKDSATEAESRLNWLRVRYRGRFGDSYQATPDYASHNTTTIRAHGGAGIERTLHVGGTGASEGLFVGKRYSGDTVKFSVLGASGNTDIQGTLDVAGNTEINGTLDVDADFAVRNGTTDKFFVDNLTGNTNIEGTLDVNGATEITNTLDVSNAVTFDQTLLVQGNSEFNGTVDVDADFAVRTGTTDKFTVASASGNVATDGTLVVQGQTTINDSLIIDAANEVFSIRNGSAVEKFGVDADNGNTNIIGTLTVGDATQINDTLGVSDVVTFTRNTDQTLTGLYGADGAVRITGGVGVQRNLAVGGNMRVYGDFEITGSTTQTGNTGFSGLVSITNTSDATSFSDNSVALTTDGGLIVSKNAWVGGDFYVWDDANSRNAFYVDTSTGDATLHNTLTVGGNLIVNGTTTTVNSTVTTLDDPIITLGGDAAPASNDGKDRGVEFRYYDGSAKVGFFGYDRSANQFSFLVDATNNAEVHTGTDAPLRAGSLNLTGSGTALDVDNNANIDGTLTVDGQITSNVAQGVTPLIITSTTKVNNLNVDLLDSMTTASANTPTTVVNRDSFGNFAAGTITAALVGNASTATTLETARTITVDGVVDGNVSFNGSADVTITTVFNDSDITALAAQTGTGLVVRTGTGTYARRSVTATASSGVTITNGDAVAGNITINVASASSNSANNLVLRDGSGNFSAGTITAALIGSVTGNVTGNLTGNVTGNVTGDLTGNVTGNVTGNLDGIVGGNTPAAVTGTTITANTGFTGNLTGNVTGQVTGNVTGDLTGDVTGNLTGNVTGNVTGNVTGDLTGDVTGNVTGNVTGNVTGTVSSISNHTTSNLTEGTNLYYTDARADARIAAADTDNLSEGSTNLYFTNARADARIAAADTGDLSEGTNLYYTEARVQTQLDNAYEQLRAMLNNLATATTLTLALSGDPTPGDVTALNNGTLVGGSGYNTATGVATTSSGSGTGLTVDITASGGIITSVAINAGGAGYAVGETITISTGNADATINVSAVIEMAVGDTVTGGTSGTTAVITAVGTNQITVDNVDGFFKKTETVSAGDVSNLTISSFA

Physico‐chemical properties

protein length:	1912 AA
molecular weight:	195867,93000 Da
isoelectric point:	4,18945
aromaticity:	0,05753
hydropathy:	-0,16606

Domains

Domains [InterPro]

DC_1619
ATT
1–456

DC_1619 DC_1607 DC_0029

SSF69349
STR
4–200

SSF69349 DC_1607 DC_1607

IPR041352
ATT
5–43

IPR041352

AOO08527.1

1 1912

Architecture

ATT

STR

RBD

ATT 1-456 | STR 457-1550 | RBD 1668-1912

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_1619	ATT	DC_1619	1	456	Novel HMM	DC_1619	N-terminal	Low	Positional only	123 proteins / 123 hits
SSF69349	STR	SSF69349	4	200	Merged direct domain	SSF69349	Central	Low	Positional only	153 proteins / 153 hits
IPR041352	ATT	DC_0533	5	43	InterPro cluster	Major tropism determinant, N-terminal domain	Central	Medium	Text match	295 proteins / 296 hits
DC_1607	STR	DC_1607	345	947	Novel HMM	DC_1607	Central	Low	Positional only	159 proteins / 159 hits
DC_1607	STR	DC_1607	939	1120	Novel HMM	DC_1607	Central	Low	Positional only	159 proteins / 159 hits
DC_1607	STR	DC_1607	1108	1550	Novel HMM	DC_1607	Central	Low	Positional only	159 proteins / 159 hits
DC_0029	RBD	DC_0029	1668	1912	Novel HMM	DC_0029	C-terminal	Low	Positional only	131 proteins / 131 hits

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Synechococcus phage S-RIM2 [NCBI]	687800	Uroviricota > Caudoviricetes > Pantevenvirales > Nerrivikvirus > Nerrivikvirus srim2
Host	Synechococcus [NCBI]	1129	cellular organisms > Bacteria > Bacillati > Cyanobacteriota/Melainabacteria group > Cyanobacteriota > Cyanophyceae

Coding sequence (CDS)

Genbank protein accession

AOO08527.1 [NCBI]

Genbank nucleotide accession

KX349277 [NCBI]

CDS location

range 90094 -> 95832
strand +

CDS

ATGGCAAATAGAATTCAATTAAGACGTGGTGGTGCCCAGGAATGGGCAAACGCGAACCCAACTCTTGCACAAGGTGAACTCGGAATCGAACTCGATACGGGTCGTATTAAGATTGGTGATGGTGTTACTGCATGGAACACGCTGAGATATGAGCGTCCTGTTGAATCTAACACCAACACGCCAAACACTCTTGTTCAAAGAGATGCTGATGGTAACTTCTCTGCAGCAATTGTTACTGCTTCATTGATTGGTAATGCTTCTACTGCAACCCGTCTTGATCAAACTCGTCAGATTCAGTTATCTGGGGATGTTACTGCTTCTGGAAACTTTGACGGTTCTCAAAACCTGAACCTGTCTTCGGCATTGACGCTTGTTTCTACTCTGCCACACTATTTGCAAGACAACGATCCTAGTATTACTCGTGTCTTTACTGAAGTAACAGTTGACCAGAAAGGTAGAGTTGTAAATGCTAGAACTCCTGCTCAGATGAATCTGGCAGATTATGGTCTGGATGGTTCTGCAACTAGTGACACTTCTCTGGCACAACCTTGGAATCCAAACCTGGAAGCAATCTCAGATGAAACTGGTACAGGTTTCTATGTAAGAACTGGTGCTGGTTCGATTGCAGTCAGGCAGATTCTTGCTGAAAGTGCTGACATCGTTGTTTCTAATGGTACTGGTGTTTCTGGTAACCCCAACCTTTCTCTTGCTATTCAGGCAGGTCTTGTTGCTGGTAACTATAATACAGAGAGTCTTACATCTGTAACTCAAGCAGGTGGTAGTGGTGAACCTTTCGGTACAGAAACTGTAAACGCTGTTAAGTTCTCCTGCGACAATCATGGTCGCTTATCGAGTGCTACAAATGTACCTATTGCTACTGCTACTGAAGGTAGTAAGTATCCTAGCTATAATGCAGGCACTACTTATGCTCGCTATGATATCATCGCGAACGAATCAAAAGTTTACCAAGCATATCAGGCAATCAGTGCTGGTGCTGGTGCTCCTACTCATTCCAGTGGCGATAATGGAGGTTGGCGCTACCTCGCGGCTGAAGCAACAGAGCAGAAGGGACTGGCTTCATTTGCACAGGAAGATTTCGATGTTGACAGCAACGGGCACGTTACCATCGCTGCACTAGGTGTAGATAACACTCAACTACAGAATAATAGAATTTCTTTTGCTGATGGAAATACAAAAGAAGATTTTGAACTTGATCAAGAACTTACTGGAACCACTGGATACAGAGGATTCAACTATCTTAACTATATCAAAGTTAATGATACGAGCGGCAATCTACTTGTTGGCGCTAATAATACAGGGGACAGCGGAGCTGGCGAACTTGATATTAATGTACGCTCGTACTTCTCTGATCCTGACATTACTCTTGACGGCATTGTTGATCAGACACTGGATAAGACTGGGGATGGTAACCTTACCTTCCAGTTAACCCAAAACTCTGCATCTGCTAGAAACCTTAGTATCCTCTCTACAAATGCTGGGTCTGGCACAAGCACAGTTACAATCACTGCAGAAGATGTTGTTGACATTGATGCATCTGATGCAAATGGTAAGGTTCATATTGAGGACTTGAGGATTCAGTCCAACTATTTGGCATCTACTGGTCAACTAAATCTTGACCCTGGTGATGATCGTACTGCATCTGGTCTGGTTCGTATCTTTGGCGATCTCCAGATTGACGGTACTACAACTACAGTCAACTCAACAGTAACAACAGTTGATGATCCTGTAATAACTTTGGGTGGCGATACTGCTCCTGCATCTGATGATAACAAAGATCGTGGTATTGAGTTCCGTTATTATGACACTCAAGCACGAGTCGGTTTCTATGGTTGGGATACTGGGTACACTGATCTGGGTGGTCATGAAGGCGGTTATCGTTTCCTTCATGCTGCTACAAATACTTCCGAAGTCTTTGCTGGTACTGATTCTGGTCTTATTGCTGGTAATGTAAAACTTACAACTAACACTAACTCCACTTCAAATACAACGGGTGACCTCGTAGTTGCTGGTGGTGCTGGTATTGGTCAGGATGTAAACATTGGTGGTCTTCTGGATGTTGATGGCACATTCCGTGTTAATAGCACCTCTCGTTTTGATGACAACATTGTCCTTCAGGGTGCTTCTAAGACACTGCAACTAAACAATGGTAGCGGCACCACTAAGATTGAGTTCCAATCTACAACTGGTAATGGATCTCTTGGTGGCATCCTGGATGTAACTGGCAACTTCAATGTCAACACTAATAAGTTCAATGTTGTTGCTGCTTCTGGTAACACTTCTATTGCTGGCACCTTAGGTGTCACGAACATTGCGACATTCTCTAACGATATTGATGCTAACGCCAACATGACGTTGGCTGGTGACCTCCACATGGAGAGCACCAATGACATTACGGTTGCTAAGAATGCTGGCACTGGTGTTTGGGAGATTCAATCTAACGATTATGGTGCTCTTCGCATTGACGGTGGTGTGTATGCTGCTGGTGATGCACTGATTGATGGCACCCTACACGTTAACGGTGCTATTGAAGTTAAGGATAGTGCGACAGAGGCAGAATCGAGACTGAACTGGTTGCGTGTCAGATACAGAGGTCGTTTCGGTGACTCTTATCAGGCAACTCCTGATTATGCATCTCATAACACCACAACTATTAGAGCACATGGTGGTGCTGGTATTGAAAGAACTCTGCACGTTGGTGGCACAGGAGCTAGTGAAGGTCTGTTTGTTGGTAAGAGATACTCTGGCGATACCGTCAAGTTCTCTGTATTGGGTGCATCTGGTAACACCGATATTCAAGGCACACTCGACGTTGCTGGCAACACTGAAATCAATGGTACTTTAGATGTTGATGCAGACTTTGCTGTTAGAAACGGTACAACTGATAAGTTCTTTGTTGATAACTTAACTGGCAATACTAATATTGAAGGCACTTTAGATGTCAATGGTGCAACTGAAATCACCAATACTCTTGACGTTAGCAATGCAGTTACCTTCGATCAGACACTTTTAGTTCAAGGTAACTCAGAATTTAATGGCACTGTTGATGTTGATGCTGACTTTGCAGTTAGAACTGGCACTACAGACAAGTTCACTGTTGCTTCTGCATCTGGTAATGTTGCAACTGATGGTACTCTGGTTGTTCAGGGTCAGACAACTATTAACGATTCTCTGATTATTGATGCTGCTAACGAAGTCTTCTCGATTAGAAATGGTTCTGCTGTTGAGAAGTTTGGTGTTGATGCAGATAACGGAAATACAAATATCATTGGCACTCTTACTGTTGGTGATGCAACTCAGATCAACGATACCCTGGGCGTCTCTGATGTTGTTACCTTCACAAGAAATACTGATCAAACTCTGACAGGTCTCTACGGTGCTGATGGTGCAGTTCGTATTACTGGTGGTGTTGGTGTTCAAAGAAACCTCGCTGTTGGCGGCAACATGCGTGTCTATGGTGACTTTGAGATTACTGGTAGCACAACTCAGACTGGTAACACTGGTTTCAGTGGTCTTGTTTCGATTACCAATACTTCAGATGCTACATCATTCTCTGATAACTCTGTCGCTCTTACAACCGATGGCGGTTTAATAGTAAGCAAGAATGCATGGGTTGGTGGCGATTTCTATGTTTGGGATGATGCAAACTCTAGAAATGCATTCTATGTTGATACAAGCACTGGTGATGCAACTTTACATAATACACTTACTGTCGGTGGGAACCTGATTGTTAATGGAACAACAACTACTGTTAACTCTACGGTCACAACTCTCGATGACCCTATTATTACTTTGGGTGGTGACGCAGCACCAGCGTCTAACGACGGTAAGGACCGTGGTGTTGAGTTCCGTTATTACGACGGCTCTGCGAAAGTGGGCTTCTTCGGATATGACAGATCCGCCAACCAGTTCTCATTCTTAGTCGATGCAACTAACAACGCCGAAGTTCATACTGGCACAGATGCTCCTCTTCGTGCTGGTTCTCTTAATCTTACTGGGTCTGGCACAGCACTTGATGTTGATAACAATGCCAACATTGATGGCACCCTGACTGTTGATGGTCAAATCACATCAAACGTTGCTCAAGGTGTAACACCTCTGATCATCACATCTACCACTAAGGTCAACAACCTGAACGTTGACCTCCTGGATAGCATGACGACTGCTTCGGCAAACACACCTACCACGGTTGTTAATCGCGATTCTTTTGGTAACTTTGCTGCAGGAACTATCACTGCTGCTCTGGTTGGTAACGCTTCTACAGCAACCACCCTGGAGACTGCAAGAACAATCACTGTTGATGGTGTTGTTGATGGTAATGTCTCCTTTAATGGATCTGCTGATGTAACTATCACAACGGTCTTCAACGACTCTGATATTACTGCTCTTGCTGCCCAGACTGGCACAGGTCTGGTAGTAAGGACTGGCACAGGCACTTATGCAAGACGCTCTGTGACCGCTACAGCGTCCTCTGGCGTCACTATTACTAACGGTGATGCAGTTGCTGGTAATATCACCATTAACGTCGCTTCTGCGTCCTCTAACTCGGCAAATAACCTGGTCCTGCGTGACGGTTCTGGTAACTTCTCTGCTGGTACAATCACTGCAGCACTGATTGGTAGTGTTACAGGTAACGTTACAGGTAATCTGACTGGTAATGTAACGGGTAATGTCACTGGTGATTTGACTGGAAATGTTACAGGTAACGTTACTGGTAATCTCGATGGCATCGTTGGTGGTAATACACCTGCTGCGGTCACGGGTACTACGATTACAGCGAACACTGGATTTACTGGTAATCTCACAGGCAACGTTACTGGCCAGGTCACTGGTAATGTCACTGGTGATTTGACTGGTGATGTAACTGGCAACCTGACTGGTAATGTCACGGGTAATGTAACTGGTAATGTTACTGGTGATTTGACTGGCGATGTTACAGGTAACGTCACTGGTAATGTAACTGGCAATGTAACTGGAACAGTTTCTAGTATCAGCAACCATACCACTAGTAACCTGACAGAAGGCACGAACCTGTACTATACAGATGCACGTGCAGATGCTCGTATTGCTGCAGCAGACACTGATAATCTGAGTGAAGGTTCTACCAATTTGTACTTCACCAATGCTCGTGCTGATGCACGTATTGCCGCTGCTGATACTGGTGACCTTTCTGAAGGCACAAACCTGTACTATACAGAAGCAAGAGTTCAGACACAACTTGACAATGCATATGAGCAACTGAGAGCAATGCTCAACAACCTTGCAACTGCAACAACTCTGACCTTGGCACTGTCTGGCGATCCTACTCCTGGTGATGTAACTGCTCTCAATAACGGAACGCTGGTCGGCGGTTCTGGATACAACACCGCTACTGGAGTTGCTACTACTTCTAGTGGCAGTGGCACAGGTTTGACAGTAGATATCACTGCATCTGGTGGTATCATCACCTCTGTTGCAATCAATGCTGGTGGTGCTGGATATGCTGTTGGTGAAACAATCACCATCTCTACTGGTAATGCAGATGCAACTATTAATGTCTCTGCTGTTATTGAAATGGCAGTTGGTGATACCGTCACTGGCGGTACATCAGGCACCACCGCTGTTATCACTGCTGTGGGCACCAATCAGATTACTGTCGATAACGTCGATGGATTCTTTAAGAAGACTGAGACCGTATCTGCAGGTGATGTTTCTAACCTTACAATCTCCTCATTCGCTTGA

Genome Context

Tertiary structure

PDB ID

d4ca40ea30657c8f59e8261b3772d1411632e4369ebb0552941411c83c035a13

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,5252

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence