Protein

View in Explore

Genbank accession

WLW37400.1 [GenBank]

Protein name

structural protein

RBP type

Evidence RBPdetect2

Probability 0,94

Protein sequence

MANRIQLRRGGAQEWANANPTLAQGELGIELDTGRIKIGDGVSAWNTLRYERPVESTTNTANTLVQRDADGNFSAGTITATLTGNAATATRLSQSRQISIDTDITASANFDGSQNITLNAQLGLISTLPHYDGTNVPTGTYTKVQVDSKGRVINATALSAMTLAEYGLDGTVEGASAQPYDNDLAAIAGLLTTGYITRTGNGNIFTREVIGQAGQIVITDGKGLTGNTNVDLATTTVVAGDYNTESLTSVSALGANNEPFGTETVNATKFTVDDRGRLQSATNVPIATATEGSKYASYDAGTTYSRYDIIEEGGNVYQALATIAAGGGAPSHTSGDTGQWRYLAAAATEQKGLASFAQEDFDVDNNGHVTIAALGVDNTQLQNNRISFADGNTKEDFELDQELTSTTGYRGFNYLNYVKVNDTSGNLLFGANNTGDSGAGEIDVNVRSYFSDPDITLDGAVAQTLDKSGDGNLTFSLTQNSASARNLSIISTNAGSGTSTVTISAEDVIDIDTTDANGKVHVEDLRIQANYLASTGQLNLDPGDDRAATGLVRIFGNLQIDGTTTTVNSTELTVDDVTLLLGGDTAPTSDDNLDRGLQFRYYDTQARLGFYGWDTNYTDLGGHEGGYRFLHAATNTSEVFTGTDSGIIAGNVKLTTNTNSTSNTTGDLVVAGGAGIGQDVNIGGLLDVDGTFRANSTSRFDDNIVLQGASKTLQLNNGSGTTKIEFQSTTGNASIGGVTDVTGNFNVNTNKFNVVAASGNTTVAGTLGVTGATTLTGALDLNNTLNVSGDIHLESTNDITVAKNATTGVWEIQSNDYGALRLDGGAYVAGDALVDGTLHVNGAIEVKDSATEAESRLNWLRVRYRGRFGDSYGATPSYASHNTTTIRAHGGAGVEKTLHVGATGSGEGLFVGKRYSGDTVKFSVLGASGNTDIQGTLDVAGNSEFNGTVDVDADFAVRSGTTDKFFVDNVTGNTDIQGTLDVNGATEITNTLDVSNAVTFDSTLTVDGETNITDTLNVSANGEYFRVRNGNNANKFTVDTDNGNTEVYGTLDVSGNSEFNGTVDVDADFAVRNGTTDKFFVDNVTGNTNIIGTLTVGDATQINDTFGASGIVTLTNNTDQTLTGNYGADGALRLTGGAAIQRNLAVGGNMRVYGDFEITGSTTQSGNTGFSGRVDVTNTSDATSFADNSVALTTDGGFRVSKNAWVGGDFYVWDDANSRNAFYVDTSTGDATLHNTLTVGGNLVVNGTTTTVNSTVTTLDDPIITLGGDTAPASNDGKDRGVEFRYYDGTAKIGFFGFDRSANQFSFLVDATNTAEVHSGTDAALRAGSLNLTAAGTALDVDNDANIDGALTVDGQIVSNKASGAPFSIASTTKVANLNVDLLDGMTTASANTASTVVNRDSSGDFAANIITVASGIGAAAGIQGNALTADTLKTARTITIDGVVDGSVSFNGSADVTISTTYNDADITALAAMAGTGFVSRTAANTYAQRTLQVTASSGITLTNADGVSGDPTINVASSSTNSANNLVIRDASGNFAAGTITADLTGDVTGDLTGNASNATAVSTGSGGGTTLYLAQFNGVGATSGRTIYSNSNVVLTYSNPDWTLTVDKVAADLTGNVTGNADTATTLATARNFTTSGDATAPAVSFDGSGNVDLVLTLADSGVVAGTVGASNLIPRITVDSKGRVTSITQNALAIIQDTTPELGGDLDLNSNDVTGTGNINITGTVTATSFSGPITGNVTGTVSDISNHDTDALSEGSTNLYYTTTRANTDFDTKLAAADTDDLSEGSTNLYYTDARADARIAAADTDALSEGAVNLYFTDARADARIAAATTDDLSEGSTNQYYTEARVQAKLDNAFAQLQAMLNNLATTTTLVLNLSGDPTPGAVVTTTVANGGGGGFSAGTAVATTGGTGSSLTVDTTVVGGVITAAAVNAGGSDYLVNETVTITNPNAGKVLSLNLASLAGGSNYVTGTALATTGGSGSASLTVDITAVGGAITNVTINDGGTGYVAGETITIVQATGADGTNPGAGGTVDISTVTTDATLTLTDVTTMEVGATVTGATSGTTGVITALGTNQITVDTVDGFFKVGEIVSANDVTTLTISSFA

Physico‐chemical properties

protein length:	2110 AA
molecular weight:	215410,64040 Da
isoelectric point:	4,13779
aromaticity:	0,06019
hydropathy:	-0,14057

Domains

Domains [InterPro]

DC_1619
ATT
1–453

DC_1619 DC_0029 DC_1607 DC_1329 DC_0029

SSF69349
STR
4–243

SSF69349 DC_1607 DC_0029

IPR041352
ATT
5–43

IPR041352

WLW37400.1

1 2110

Architecture

ATT

STR

RBD

STR

ATT

RBD

ATT 1-453 | STR 454-945 | RBD 995-1068 | STR 1105-1543 | ATT 1557-1791 | RBD 1792-2110

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_1619	ATT	DC_1619	1	453	Novel HMM	DC_1619	N-terminal	Low	Positional only	123 proteins / 123 hits
SSF69349	STR	SSF69349	4	243	Merged direct domain	SSF69349	Central	Low	Positional only	153 proteins / 153 hits
IPR041352	ATT	DC_0533	5	43	InterPro cluster	Major tropism determinant, N-terminal domain	Central	Medium	Text match	295 proteins / 296 hits
DC_1607	STR	DC_1607	330	945	Novel HMM	DC_1607	Central	Low	Positional only	159 proteins / 159 hits
DC_0029	RBD	DC_0029	995	1068	Novel HMM	DC_0029	C-terminal	Low	Positional only	131 proteins / 131 hits
DC_1607	STR	DC_1607	1105	1543	Novel HMM	DC_1607	Central	Low	Positional only	159 proteins / 159 hits
DC_1329	ATT	DC_1329	1557	1791	Novel HMM	DC_1329	N-terminal	Low	Positional only	27 proteins / 27 hits
DC_0029	RBD	DC_0029	1790	1960	Novel HMM	DC_0029	C-terminal	Low	Positional only	131 proteins / 131 hits
DC_0029	RBD	DC_0029	1951	2110	Novel HMM	DC_0029	C-terminal	Low	Positional only	131 proteins / 131 hits

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Synechococcus phage S-RS29 [NCBI]	3038210	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Synechococcus sp. [NCBI]	1131	cellular organisms > Bacteria > Bacillati > Cyanobacteriota/Melainabacteria group > Cyanobacteriota > Cyanophyceae

Coding sequence (CDS)

Genbank protein accession

WLW37400.1 [NCBI]

Genbank nucleotide accession

OQ504981 [NCBI]

CDS location

range 155999 -> 162331
strand +

CDS

ATGGCAAATAGAATTCAACTAAGACGTGGTGGCGCTCAGGAATGGGCAAACGCGAACCCAACTCTTGCACAAGGAGAACTTGGAATCGAACTTGATACTGGACGTATCAAAATTGGTGATGGTGTTTCTGCGTGGAACACGCTGAGATATGAGCGTCCCGTTGAATCTACCACAAATACGGCAAACACTCTTGTGCAGAGAGATGCTGATGGTAATTTTTCTGCAGGTACAATTACTGCAACTCTGACTGGTAACGCGGCAACCGCAACTCGACTTTCTCAGTCTCGTCAAATTTCAATTGACACTGATATTACTGCTTCCGCCAACTTTGATGGTTCTCAAAACATCACCCTTAATGCACAATTAGGGTTGATTTCTACATTACCACACTATGATGGTACAAATGTCCCTACAGGAACCTACACAAAAGTTCAGGTTGACTCAAAAGGTAGAGTAATCAATGCAACAGCATTGAGTGCAATGACTCTTGCTGAATATGGTCTTGATGGAACCGTTGAAGGTGCGTCAGCACAACCTTATGATAATGACCTTGCCGCAATTGCAGGTCTGTTAACAACAGGATATATTACAAGAACTGGTAACGGTAATATTTTTACCAGAGAAGTAATTGGACAAGCAGGTCAAATTGTAATTACTGATGGTAAAGGTCTCACAGGTAATACAAATGTAGACCTTGCTACTACAACTGTTGTTGCAGGTGACTATAATACCGAATCCTTAACGTCTGTTTCTGCACTTGGTGCCAACAATGAACCTTTTGGTACAGAAACTGTAAACGCTACGAAATTTACGGTTGATGACCGTGGTAGACTGCAATCTGCTACAAATGTACCTATTGCTACAGCTACCGAGGGTAGTAAGTATGCTAGCTATGATGCAGGTACAACCTATTCTAGATATGACATCATCGAAGAAGGCGGTAATGTATACCAAGCTCTTGCAACAATCGCTGCTGGTGGCGGTGCTCCTTCTCATACCAGTGGCGATACTGGACAGTGGCGTTACCTCGCGGCTGCGGCAACCGAACAGAAGGGATTGGCTTCCTTTGCACAGGAAGATTTCGATGTTGACAACAACGGGCACGTCACCATCGCCGCGTTAGGCGTAGATAATACACAATTACAAAATAATAGAATTTCTTTTGCTGATGGAAACACAAAAGAAGATTTTGAACTTGATCAAGAACTTACTAGCACCACTGGATACCGAGGATTCAATTATCTTAACTACGTCAAAGTTAATGATACGAGCGGTAATTTACTGTTTGGGGCTAATAATACAGGTGACAGTGGAGCTGGTGAGATTGATGTCAATGTACGCTCGTACTTCTCTGATCCTGACATCACTCTTGATGGTGCTGTTGCTCAGACATTGGATAAGTCTGGGGACGGCAACCTTACTTTCTCCCTGACACAAAACTCTGCATCTGCTAGAAACCTTAGCATCATCTCTACAAATGCTGGTTCTGGTACAAGCACAGTTACTATCAGTGCAGAAGATGTCATCGACATTGACACAACCGATGCAAATGGTAAAGTCCACGTCGAAGATTTAAGAATCCAAGCAAACTATCTTGCTTCTACTGGTCAACTCAATCTTGACCCTGGTGATGACCGTGCTGCTACTGGTCTGGTTCGTATTTTTGGTAACCTTCAGATTGATGGCACTACAACAACCGTTAACTCTACTGAACTGACAGTTGATGATGTCACTCTCCTTCTTGGTGGTGATACTGCACCTACATCCGACGATAACCTTGATCGTGGTCTTCAGTTCCGCTACTACGATACTCAAGCACGTTTAGGTTTCTATGGTTGGGATACTAACTATACTGATTTGGGTGGTCATGAAGGTGGTTACCGTTTCCTTCATGCTGCTACAAATACTTCCGAAGTCTTTACTGGTACTGATTCTGGTATTATTGCTGGTAATGTAAAACTCACCACTAATACTAACTCTACCTCCAATACAACTGGCGACCTCGTAGTTGCTGGTGGTGCTGGTATCGGTCAAGATGTAAATATCGGCGGTCTGCTGGATGTTGATGGCACATTCCGTGCTAACAGCACTTCTCGCTTTGACGATAACATCGTCCTGCAAGGTGCATCCAAGACCCTGCAACTTAACAACGGTAGTGGCACAACCAAGATTGAGTTCCAATCCACAACTGGTAATGCAAGTATCGGTGGTGTAACTGATGTAACTGGTAACTTTAACGTCAACACCAACAAGTTCAATGTTGTTGCTGCTTCTGGTAACACAACTGTTGCTGGCACTCTTGGGGTTACTGGTGCTACAACTCTAACAGGTGCTCTTGACCTTAACAACACTCTGAATGTTTCTGGTGATATTCATCTCGAAAGCACTAATGACATCACGGTTGCTAAGAACGCTACCACTGGTGTTTGGGAGATTCAGTCTAACGACTATGGTGCTCTCCGTCTTGATGGTGGTGCTTATGTTGCTGGTGATGCACTAGTTGATGGTACATTACACGTCAACGGCGCGATTGAAGTTAAGGATAGTGCGACAGAGGCAGAATCGAGACTGAACTGGTTGCGTGTCAGATACAGAGGTCGTTTCGGTGACTCTTACGGTGCAACACCCTCTTATGCATCTCACAATACTACAACCATCAGAGCACATGGTGGTGCTGGTGTTGAAAAGACTCTGCACGTTGGCGCTACAGGTTCTGGTGAAGGTCTGTTTGTTGGTAAGAGATACTCTGGAGATACCGTTAAGTTCTCTGTCCTTGGTGCATCTGGTAATACCGATATTCAAGGCACGCTCGATGTTGCTGGTAACTCTGAGTTCAACGGCACAGTCGATGTTGATGCGGACTTCGCTGTTAGAAGTGGCACAACCGACAAGTTCTTCGTTGATAATGTAACTGGCAACACCGATATTCAAGGCACTTTGGATGTCAATGGTGCGACCGAGATTACAAACACTCTGGATGTTAGTAACGCTGTTACATTTGATTCAACTCTGACAGTTGATGGTGAAACTAATATCACTGATACTCTAAATGTCTCTGCTAATGGCGAATACTTTAGAGTTAGAAATGGCAATAATGCCAACAAGTTTACCGTTGACACTGACAATGGTAACACCGAAGTATATGGAACACTGGACGTTTCTGGTAACTCTGAATTCAATGGAACTGTTGATGTTGATGCAGACTTTGCTGTTAGGAATGGCACAACCGATAAGTTCTTTGTTGACAATGTAACTGGCAATACAAACATCATCGGTACACTGACTGTTGGTGATGCAACTCAGATTAATGACACCTTTGGTGCATCTGGTATTGTTACTCTTACCAATAACACTGATCAAACTCTGACAGGTAACTACGGTGCTGACGGTGCTCTGAGACTAACTGGTGGTGCTGCAATCCAAAGAAACCTCGCTGTTGGCGGCAACATGCGTGTCTATGGTGACTTTGAGATTACTGGTAGCACTACACAGTCTGGTAACACTGGTTTCAGTGGTAGAGTTGACGTTACTAACACTTCTGATGCTACATCTTTTGCTGATAACTCTGTTGCACTTACAACTGATGGTGGTTTCCGAGTAAGCAAGAATGCATGGGTCGGTGGTGACTTCTATGTCTGGGATGATGCAAACTCTAGAAATGCATTCTATGTAGATACAAGCACTGGTGATGCAACCCTACACAATACACTTACAGTTGGTGGAAATCTTGTAGTCAATGGAACAACAACTACTGTCAATTCTACGGTCACAACTCTCGATGACCCTATTATTACTCTGGGTGGTGACACAGCACCAGCGTCTAACGACGGTAAGGACCGTGGTGTTGAGTTCCGTTATTACGACGGCACTGCGAAAATTGGCTTCTTCGGATTCGATAGATCCGCCAACCAATTCTCCTTCTTAGTCGATGCAACTAACACCGCTGAAGTTCATTCTGGTACAGATGCTGCTCTTCGTGCTGGTTCTCTCAATCTTACTGCTGCTGGAACGGCTCTTGACGTTGATAATGATGCCAATATTGATGGTGCCTTAACAGTTGATGGACAAATTGTTTCAAATAAAGCATCTGGCGCTCCATTCTCCATTGCTTCGACTACTAAGGTTGCAAACCTGAACGTTGACTTGCTGGATGGCATGACAACCGCAAGTGCAAACACTGCATCCACAGTTGTCAATCGTGATTCTTCTGGCGATTTCGCTGCTAACATCATTACTGTTGCTTCTGGCATTGGTGCTGCTGCTGGTATTCAGGGTAACGCTCTTACTGCAGATACTCTTAAAACTGCAAGAACTATCACCATCGATGGTGTTGTAGATGGTAGCGTTTCCTTCAATGGTTCTGCTGATGTAACCATTAGCACTACCTATAACGATGCAGACATTACTGCACTCGCTGCAATGGCAGGCACTGGTTTCGTTTCTAGAACTGCTGCTAACACCTATGCACAACGCACTCTGCAAGTCACAGCATCGTCTGGTATTACATTAACTAATGCTGATGGTGTTTCTGGTGACCCAACTATCAACGTTGCTTCTTCTAGCACCAACTCTGCAAACAACCTGGTTATCCGTGATGCATCTGGTAACTTTGCTGCTGGTACAATTACAGCAGATTTAACTGGTGATGTAACTGGTGATTTGACTGGTAATGCATCTAATGCAACCGCAGTTAGCACTGGTAGTGGCGGTGGCACCACGTTATATCTGGCACAGTTCAATGGAGTTGGTGCTACTTCTGGAAGAACCATCTATTCCAACAGCAACGTAGTTCTCACCTACAGCAACCCCGATTGGACTCTTACTGTTGATAAGGTTGCAGCTGATTTGACAGGTAATGTAACAGGTAATGCTGACACAGCAACTACACTCGCAACAGCACGCAACTTCACTACATCTGGCGATGCAACTGCACCTGCTGTATCATTTGATGGAAGTGGTAACGTTGATTTGGTATTGACTCTTGCTGATAGTGGAGTTGTTGCTGGCACAGTTGGTGCTTCAAATCTCATTCCTAGAATTACAGTTGACTCTAAGGGTAGAGTTACTTCCATTACACAAAATGCTCTTGCTATTATTCAGGACACTACACCCGAACTAGGCGGTGACCTTGATCTCAATAGCAACGATGTAACTGGTACTGGTAATATTAATATCACTGGTACTGTTACAGCAACGTCCTTTAGTGGTCCTATTACTGGTAACGTTACTGGCACAGTATCGGATATCAGCAATCATGACACTGACGCTCTCTCAGAGGGTTCTACAAACCTTTATTACACAACTACAAGGGCAAACACTGACTTTGATACAAAACTCGCTGCAGCGGACACAGACGACCTCTCAGAGGGTTCTACAAATCTTTATTATACAGACGCTCGTGCTGATGCCCGAATCGCTGCTGCAGATACCGATGCGTTAAGCGAGGGTGCTGTTAACCTTTACTTCACCGATGCTCGTGCTGACGCTCGCATCGCTGCTGCAACTACAGATGACCTTTCTGAAGGTTCTACTAATCAGTATTATACTGAAGCAAGAGTTCAGGCAAAACTGGATAACGCATTTGCTCAACTGCAAGCGATGCTCAATAACCTCGCAACCACTACTACTTTGGTCTTGAACTTGTCTGGTGATCCCACTCCTGGTGCTGTTGTTACCACTACGGTTGCAAACGGTGGTGGAGGTGGATTTAGTGCTGGAACTGCTGTTGCTACAACTGGCGGAACAGGTTCCTCGCTGACTGTCGATACTACGGTTGTTGGTGGTGTTATCACTGCTGCAGCAGTTAATGCTGGAGGTAGTGATTATTTGGTTAATGAAACTGTTACTATCACCAATCCCAACGCTGGTAAGGTTCTGTCTCTGAACTTGGCATCTTTGGCAGGTGGTTCTAACTATGTAACAGGGACTGCTTTAGCAACAACTGGTGGTTCTGGTAGTGCATCTTTGACAGTCGATATTACTGCTGTTGGTGGTGCAATTACCAATGTCACTATTAATGATGGTGGTACTGGATATGTTGCTGGTGAAACTATTACTATTGTTCAGGCAACTGGTGCCGATGGAACTAATCCTGGCGCTGGTGGTACGGTTGATATCTCTACCGTTACAACAGACGCAACTCTGACTCTCACCGACGTTACTACAATGGAAGTTGGTGCAACTGTCACTGGTGCTACTAGTGGCACTACAGGTGTTATTACTGCTCTTGGCACTAATCAAATCACCGTTGATACTGTTGATGGATTCTTCAAAGTTGGAGAAATCGTCAGTGCTAATGATGTTACTACACTCACAATCTCTTCATTCGCTTGA

Genome Context

Tertiary structure

PDB ID

2ad0b1dc2ac79b991f68bbe5ff41486b8555db2fd7b3085eb80939e3629910ad

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,4971

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence