Protein

View in Explore

Genbank accession

AMO43454.1 [GenBank]

Protein name

virion structural protein

RBP type

TSP

Evidence RBPdetect

Probability 0,80

Evidence RBPdetect2

Probability 0,96

Protein sequence

MADRFPLIVNASSRKIEELVAGDNLDLTGNGVIIAGDIGDGKYLKSDGGFVVWDNPGDVYLTQTQTLTNKTLESSILSGSLNTFSNIPNSALVNTGITINNQTVALGGTITTPDNNTSYTIGVTDGNIAAQKIVTLTGSDSLTDSFTIAVGSPASVPAGQNAVSLALERSGDTITLSGTVVDNNTITTLQADSNGTPQTGVMRISGSGGVTITQNTSTKTIDVFSRNDDTVTRLRGGVGQVYASGDFTILGGTEVTISQSPNGVTGDPEITINSSDTVTRVKGGGLGTLASGDLTITGGAGGNVTVSQSGSTINIDSENDNTITELGANNNSLASGKFKLQQAGATTLTQSYDAGSGVTTISISSTNDDTGAALSAGDGLSLSNNSFSLKNSGNLIDNRVSKWDDANGQFTNGIITDDGSTITINGDLNVLGINTILETSTLVVEDNTIELRKGSSLTGSDGGIQVNRTTQSDGIVTTFNILQWYEAGAYWRSYDGSVAKRFVTETDTQTLTNKTLTSPSMTNPELGSATATTYNGLNIATTSASTFEIVNLKTFKVDNTLTLKGSDGITIDFEGGGGINAKVAYNTYHLGQFSTTTSSQLSGKISDSTGAGSLVFAQNPVFSNSINSQDSTFSIIDSSVGTVNFAGAATDITIGSTSGTTTIAHGLTVDGNVILTDQVGRTLLVNGVANFDLADIQIRGTNATPIYIGRGGGEVATNTRLGYSALQSNQSGFENTAMGHSTLVSCVDGSENTAFGYNTLRDLTDGSMNVAIGSLAQAELESGDGNVVIGQGAGQNNVSGDYNLCLGHYAGHSVSGSGNVLIGPASTEDTLSPTFAPPSAGGNNQLVIGSGSGVWIRGDSSYNVRLENDLRVEGELRINGNLVVEGSTVSITSSTITIDDKNIELASVTNTTFSSSVTNGSADLTNVAVLGLADSANPTAGLIIGMTVSSPGGAIPAGTVINALNPAAQTITLSNAVTTSSATEQFVAQGPTDSAADGGGMIIKGTPVLNGGTGDKTFLYDHSRVEKYFVSTESIELANNKKFSIANQLVLDQTTLGSTVVNSSLTSVGILSGPTGLPALETDGAVVFGGRIIEEAFSNMSQEFSISAGVASIITAAANTICGKTTATNSAIQTWGFSTADPDGNTLQNGQTMTVTLIIDASPASTYGDVCTVDGASITNGVRWSGGSPPISTSNTDILTFLIVKDSSGNLRVYGQGNTDFS

Physico‐chemical properties

protein length:	1222 AA
molecular weight:	124776,29320 Da
isoelectric point:	4,23231
aromaticity:	0,05074
hydropathy:	-0,06211

Domains

Domains [InterPro]

No domain annotations available.

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

No domain annotations available.

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

AMO43454.1

1 1222

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	721	721	0,5859
Central domain	722	934	214	0,6454
C-terminal	935	1222	287	0,7551

Note: Constraints were applied during segmentation.
Fixed 195 C-terminal predictions appearing before Central domain

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-721

Central
722-934

C-terminal
935-1222

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Cyanophage S-RIM44 [NCBI]	1278485	Uroviricota > Caudoviricetes > Pantevenvirales > Vellamovirus > Vellamovirus rhodeisland44
Host	Synechococcus [NCBI]	1129	cellular organisms > Bacteria > Bacillati > Cyanobacteriota/Melainabacteria group > Cyanobacteriota > Cyanophyceae
Host	Synechococcus sp. [NCBI]	1131	cellular organisms > Bacteria > Bacillati > Cyanobacteriota/Melainabacteria group > Cyanobacteriota > Cyanophyceae

Coding sequence (CDS)

Genbank protein accession

AMO43454.1 [NCBI]

Genbank nucleotide accession

KU594607 [NCBI]

CDS location

range 179517 -> 183185
strand -

CDS

ATGGCAGATCGTTTTCCACTTATTGTTAATGCTAGTTCTAGAAAGATCGAAGAACTTGTAGCAGGTGACAATTTAGATCTCACTGGTAATGGAGTAATCATTGCTGGTGATATAGGTGACGGAAAATATTTAAAGAGTGATGGGGGATTTGTCGTATGGGATAATCCTGGTGATGTTTATCTGACTCAGACTCAGACATTAACTAACAAAACTCTTGAGTCATCCATCCTCTCAGGATCTCTCAATACATTCTCAAACATTCCAAACAGTGCTCTAGTTAACACTGGTATCACGATCAACAACCAGACTGTTGCTCTTGGTGGAACGATCACAACTCCAGATAACAACACATCATATACTATTGGTGTTACTGATGGAAACATTGCTGCTCAAAAAATTGTAACTCTCACTGGTTCTGATTCTCTTACTGATAGCTTCACGATTGCTGTAGGTTCTCCTGCTAGTGTTCCTGCTGGACAGAATGCAGTAAGTTTGGCACTGGAAAGGAGTGGAGACACTATCACCCTTTCAGGAACTGTTGTAGATAACAACACTATCACCACACTGCAAGCAGATAGCAATGGAACTCCTCAAACAGGAGTAATGAGAATCAGTGGTAGTGGTGGAGTTACTATCACACAAAACACTAGCACAAAAACTATCGATGTCTTCAGTAGAAATGACGACACCGTTACAAGACTAAGAGGTGGTGTTGGTCAGGTCTATGCTTCTGGAGACTTCACAATTCTAGGTGGAACTGAAGTCACGATTTCACAATCTCCTAATGGAGTTACTGGAGATCCTGAGATCACAATCAACTCTAGCGATACTGTTACTAGAGTAAAAGGTGGTGGTTTAGGAACTCTTGCATCTGGAGATCTAACAATTACAGGTGGAGCAGGTGGAAATGTAACTGTCTCACAATCTGGTAGCACAATTAACATTGACTCTGAAAATGATAACACCATTACAGAACTAGGTGCTAACAATAATTCACTTGCTTCTGGCAAATTTAAACTACAGCAAGCAGGAGCAACAACACTTACTCAATCATATGATGCTGGATCTGGAGTAACAACTATTTCAATCAGTTCTACAAACGATGACACTGGTGCTGCACTGTCTGCTGGCGATGGATTGTCTCTTTCTAATAATTCCTTCTCTCTAAAGAACTCTGGTAACCTCATCGATAACAGAGTCTCCAAGTGGGATGATGCTAATGGTCAGTTTACAAACGGCATCATCACTGACGATGGTTCTACTATCACAATCAATGGTGACTTGAATGTTCTTGGAATTAATACAATCCTAGAAACATCAACACTAGTTGTTGAAGATAATACTATTGAACTAAGAAAAGGTTCCTCACTAACTGGTTCTGATGGTGGCATTCAAGTCAATAGAACAACTCAATCTGATGGTATTGTAACTACATTCAATATACTACAGTGGTATGAAGCTGGTGCATACTGGAGATCATATGATGGTTCAGTTGCGAAAAGATTTGTAACTGAGACTGATACACAAACTCTTACCAATAAGACACTAACCTCTCCATCAATGACCAACCCCGAACTGGGGTCAGCAACAGCAACAACATACAATGGTCTGAACATTGCAACTACATCTGCATCTACATTTGAAATAGTAAACCTCAAGACATTTAAAGTTGATAACACTCTGACACTGAAGGGTTCTGATGGTATCACTATTGACTTTGAAGGTGGTGGTGGCATCAATGCAAAAGTTGCATACAACACCTACCACCTAGGACAATTCTCTACAACAACTTCCAGTCAGTTGTCAGGTAAAATTTCTGACAGCACTGGTGCTGGTTCTCTGGTATTTGCACAGAACCCTGTATTCTCTAATAGCATTAACTCTCAGGACTCTACATTTAGTATTATAGATTCTTCTGTTGGCACTGTTAACTTTGCTGGTGCTGCAACTGATATTACCATTGGTTCAACATCAGGAACTACAACTATTGCACATGGTCTAACAGTTGATGGCAACGTAATTCTAACTGATCAAGTTGGAAGAACCCTGCTAGTCAACGGTGTTGCCAACTTTGATCTTGCTGACATCCAGATTCGTGGAACAAATGCAACACCTATCTACATTGGTCGTGGTGGTGGTGAAGTTGCAACCAACACCAGACTTGGATATTCTGCTCTACAATCTAACCAATCTGGTTTCGAGAACACTGCCATGGGTCACTCTACCCTGGTAAGTTGTGTTGATGGCAGCGAAAACACTGCTTTTGGTTATAATACACTGAGAGATCTGACAGACGGTAGCATGAACGTGGCTATCGGTTCTCTAGCACAAGCAGAGTTAGAGTCTGGTGATGGTAACGTTGTAATCGGACAAGGTGCTGGTCAAAATAATGTTTCTGGAGACTACAACCTATGCTTGGGTCACTATGCAGGACATTCTGTAAGTGGTAGCGGCAATGTTCTAATCGGTCCAGCATCAACAGAAGATACACTAAGTCCAACTTTTGCTCCTCCATCAGCAGGTGGCAACAACCAGTTAGTTATTGGTTCAGGTTCTGGTGTATGGATTAGAGGTGATTCTTCATACAATGTCAGACTAGAAAATGATCTGAGAGTTGAAGGAGAATTAAGAATCAATGGTAACTTGGTAGTCGAAGGTTCAACTGTATCCATCACATCATCTACCATCACAATTGATGATAAAAACATTGAACTTGCTTCTGTCACAAACACAACCTTTAGTTCAAGTGTCACTAATGGTTCTGCAGACTTAACAAACGTTGCAGTTCTAGGTCTTGCAGACAGTGCAAACCCAACCGCAGGTTTGATTATTGGCATGACAGTCAGTTCTCCTGGCGGTGCTATTCCTGCAGGAACTGTTATTAATGCTCTAAATCCTGCAGCACAGACCATCACACTAAGTAATGCTGTTACAACCAGTAGTGCAACAGAACAGTTTGTTGCACAAGGTCCTACCGATAGTGCTGCTGACGGCGGTGGCATGATTATCAAGGGAACTCCAGTATTGAATGGAGGAACAGGAGACAAAACATTCCTATATGATCATAGCAGAGTTGAAAAATATTTTGTATCCACTGAAAGTATTGAACTTGCTAACAATAAAAAATTCTCTATTGCGAACCAACTAGTTCTTGATCAAACCACTCTTGGTTCTACTGTTGTCAATTCTTCTTTGACATCTGTTGGTATTCTTAGTGGTCCTACTGGACTACCAGCTCTCGAAACTGATGGTGCTGTTGTCTTTGGTGGACGTATTATTGAAGAAGCATTCAGTAACATGTCGCAGGAGTTCTCAATCAGTGCTGGAGTTGCTAGCATTATCACTGCTGCTGCTAACACTATCTGTGGTAAGACCACTGCAACAAACTCTGCAATTCAAACTTGGGGATTCAGCACTGCTGACCCAGATGGAAACACACTACAGAACGGTCAAACTATGACTGTAACTTTGATCATTGATGCTTCTCCTGCGTCTACATATGGTGATGTTTGCACTGTTGATGGAGCGTCTATAACAAATGGTGTTAGATGGTCTGGTGGTTCTCCTCCAATCTCAACATCCAACACAGACATTCTTACTTTCCTAATCGTGAAGGATAGTAGTGGTAACCTTAGAGTATACGGTCAAGGAAACACAGACTTCAGTTGA

Genome Context

Tertiary structure

PDB ID

27e3c1b44a8994131fe8a6401ecdd6e195be6bdabb205b9f962ca9aa030335b9

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,2882

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Literature

Title	Authors	Date	PMID	Source
The genomic content and context of auxiliary metabolic genes in marine cyanophages	Marston,M.F., Martiny,J.B.H. and Crummett,L.T.	2016-12	—	GenBank

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence

Literature