Protein

View in Explore

UniProt accession

M1T238 [UniProt]

Protein name

Structural protein

RBP type

Evidence GenBank

Probability 1,00

Evidence Phold

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,87

TSP

Evidence RBPdetect2

Probability 0,71

Protein sequence

MALTRLKNIITSRTGRIIYVNPDDFDASDSIDNRGNSSLRPFKSLQRAFLEVARFSYRVGLSNDEFDAFSILLYPSEYIVDNRPGEVLYTNIPPLDANSNMDVTSPNNVLYKFNSVEGGMIVPRGCSLVGMDLRRTKIIPKYVPYPTTFPAKGINTEEQVPSKTAIFRVTGGCYFWQFSLFDGDPTGVYYKPDDSETIPPSYSHHKLTGFEFADGNNTLSQLINDLGTVENSAEITGSSIPNLLERTDLDIYYQKVSRGFATIPDTSGDPATDQIQARVEENRIVGPISDEFRVLQITRNGNTATAITVDEQNNPKNHGFSVGVNVNISGVTGSTGPQTDLDAQLYNGSFAVTSASGNVFTYQLAEEPSGNAVGSNIVVKVEIDTVDSASPYMFNLSLRSVWGMNGMHADGAKATGFKSMVVAQYTGLSLQKDDRAFVKYNATTGNYDEGGPGAHLDGFAEYKKGWRHTHVMCSNDSFIQVVSVFAVGYADHFAGFQGADMSITNSNSNFGNTALRSKGFKRAAFTKDKAGTLTHIIPPKSLADVDEISVNWTNIDIKRTLTINPALAGQGGVLGSRLYLYGYTNETAPPPNKVQGYVIGARQDGLGANAVPDKINCLLIPSPGSAPEIKTAEINPFGPDVSGTSAGGDGSPIQFDSSTYTIGGVANTVGGWYISVNATDNQIYQTLVNNSSSGNPPGTYANLNFTPTTFIKRVPDARNLTDRTYRVRYVIPKDQNPPLPRSPIAGFVLQPNNTDNTDYKLSKCYYIYDIQEVQKFERGISDGIFYLTLLCGSISPTTSNFDDMAFSQNVNEVYPAFDRDNPNADPAASVSVADNETIGLVYGTDGASPVPARDDQRSITKEAILFLLNDTGWVAGSSPGWNSINNTLSGIDLTARLGDEETRKIPILEDSANNDALVPINVELRRHSILRSGNHTFEYTGFGPGNYSTAFPQTQVETLSDEQIRLSQSLKEEAGVAFYSGLNSNGDLFIGNQVINPVTGQITSEDIAQLNVLGEENTTIETFSEVVITDKLTVIGGASNNLESIFSGPATFQGTITSQKDILAKKLTYNNQDGTVLKSTLLAPELKTGTPPVGQGTPDLSAVLNYNAPSDGDIVYNIDWEPGKNLGWMYYESVWYKFGLTNTDVFQFGEYDSSYPQHIGLGRAPSSTYRLEVEGSQRITGDLRVDGRGGVAPDKYITRRTQGDGSTLNYQITSYAGVVHNSKSVIVTINGVLQHPDVNYTVDSNGTNVVFASGDAPTSNDFVEIRELPI

Physico‐chemical properties

protein length:	1270 AA
molecular weight:	137791,13440 Da
isoelectric point:	4,77575
aromaticity:	0,09370
hydropathy:	-0,33488

Domains

Domains [InterPro]

DC_0066
STR
1–1268

DC_0066

IPR023366
STR
296–379

IPR023366

M1T238

1 1270

Architecture

STR

STR 1-1268 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0066	STR	DC_0066	1	1268	Novel HMM	DC_0066	Central	Low	Positional only	99 proteins / 99 hits
IPR023366	STR	IPR023366	296	379	Merged direct domain	ATP synthase subunit alpha, N-terminal domain-like superfamily	Central	Low	Positional only	44 proteins / 44 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

M1T238

1 1270

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	91	91	0,9558
Central domain	92	301	211	0,9345
C-terminal	302	1270	968	0,1028

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-91

Central
92-301

C-terminal
302-1270

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Synechococcus phage S-SSM4 [NCBI]	536466	Uroviricota > Caudoviricetes > Pantevenvirales > Greenvirus > Greenvirus ssm4
Host	Synechococcus sp. WH 8018 [NCBI]	166322	Bacteria > Cyanobacteria > Oscillatoriophycideae > Chroococcales > Synechococcus >

Coding sequence (CDS)

Genbank protein accession

AGG54080.1 [NCBI]

Genbank nucleotide accession

HQ316583 [NCBI]

CDS location

range 11295 -> 15107
strand +

CDS

ATGGCACTAACTCGTCTTAAGAATATTATCACGTCCCGTACGGGTCGTATCATTTACGTCAACCCTGACGACTTTGATGCCAGTGATAGTATTGACAACAGAGGTAACTCCTCACTCAGACCGTTCAAATCTCTGCAACGTGCATTCCTTGAGGTGGCACGTTTCTCATATCGTGTTGGATTAAGTAATGACGAGTTTGATGCCTTCAGTATTCTCTTATATCCTTCAGAGTATATTGTTGACAACAGACCTGGCGAAGTATTATATACAAATATTCCCCCATTAGACGCTAACTCCAACATGGATGTTACGTCTCCTAACAACGTATTATATAAATTTAATTCAGTTGAAGGTGGTATGATCGTACCTAGAGGTTGTTCTCTAGTTGGTATGGATCTTAGAAGGACTAAGATTATTCCTAAGTACGTTCCTTATCCTACAACATTCCCTGCTAAAGGTATCAACACCGAGGAACAGGTTCCTTCAAAAACTGCTATCTTCCGTGTTACAGGTGGTTGCTATTTCTGGCAGTTCAGTTTATTTGATGGTGATCCTACAGGTGTATATTACAAACCTGATGATTCAGAGACAATCCCACCATCTTATTCACACCACAAACTTACAGGTTTTGAATTCGCAGACGGAAACAATACATTAAGTCAATTAATTAACGACTTGGGAACTGTAGAAAACTCTGCAGAGATTACAGGTTCATCTATCCCGAACCTATTAGAAAGAACTGACCTAGATATCTATTATCAGAAAGTATCTCGTGGTTTTGCTACCATCCCTGATACATCTGGAGACCCTGCAACTGACCAAATTCAGGCAAGGGTAGAAGAAAACAGAATCGTTGGACCTATCTCAGATGAATTTAGAGTTCTCCAAATTACACGCAATGGCAACACTGCTACAGCAATTACAGTTGACGAGCAGAATAACCCTAAGAACCACGGATTTTCTGTTGGTGTTAACGTTAACATTTCTGGTGTCACTGGATCTACTGGACCCCAAACAGACTTAGATGCTCAATTATATAATGGTTCGTTCGCTGTTACTTCAGCATCTGGTAACGTATTCACTTATCAGTTAGCAGAAGAACCATCTGGTAATGCTGTTGGTTCTAACATTGTTGTTAAAGTTGAGATTGATACTGTTGACTCAGCATCACCATATATGTTTAACCTTTCACTAAGATCAGTGTGGGGTATGAACGGTATGCATGCTGATGGTGCCAAGGCAACTGGATTTAAGTCAATGGTTGTTGCCCAGTATACGGGACTATCATTGCAGAAAGACGACAGAGCATTTGTTAAATATAATGCTACGACAGGAAACTATGATGAGGGAGGACCTGGTGCTCACTTAGATGGTTTTGCTGAATATAAAAAAGGATGGCGACATACTCACGTTATGTGCAGTAATGACTCATTCATTCAGGTCGTTTCGGTGTTCGCTGTGGGATACGCAGATCACTTTGCTGGATTCCAAGGTGCTGACATGTCTATTACTAACAGTAATAGTAACTTTGGTAATACTGCATTGAGATCAAAAGGATTTAAGAGAGCAGCATTCACTAAAGATAAAGCAGGCACACTTACACATATCATTCCACCTAAGTCACTTGCTGATGTTGATGAGATCTCAGTCAACTGGACTAACATTGATATTAAGAGAACACTTACAATTAACCCTGCACTTGCTGGTCAGGGTGGTGTACTTGGTTCTAGATTATATCTCTATGGATATACTAACGAGACAGCACCGCCACCGAACAAAGTTCAGGGTTATGTGATTGGTGCTAGACAGGATGGTTTAGGTGCTAACGCAGTACCTGACAAGATTAATTGTTTACTTATTCCTTCACCAGGTTCTGCACCTGAGATTAAAACTGCAGAGATCAACCCATTTGGACCTGATGTATCTGGTACAAGTGCAGGTGGTGATGGATCTCCTATTCAATTTGATAGTAGCACATATACTATCGGTGGTGTCGCTAACACAGTCGGTGGTTGGTATATATCTGTTAATGCTACTGACAATCAAATCTATCAAACTCTAGTTAATAATAGTAGTTCTGGTAACCCACCAGGCACATATGCTAACCTGAACTTTACTCCTACAACGTTCATTAAGCGTGTACCTGACGCTAGAAACCTGACTGACAGAACTTATCGTGTTCGTTATGTCATTCCTAAAGATCAGAACCCACCTCTACCTAGATCACCTATTGCAGGTTTCGTATTACAACCGAACAATACTGACAACACAGACTATAAGTTATCTAAGTGTTATTATATCTACGACATTCAAGAAGTCCAGAAGTTTGAGCGTGGTATAAGTGATGGTATATTCTATCTCACATTATTGTGTGGTAGTATCTCACCAACAACATCAAACTTTGACGACATGGCATTCTCTCAGAATGTTAATGAAGTTTATCCTGCATTTGACAGAGACAATCCAAACGCAGACCCTGCAGCATCTGTATCTGTTGCTGACAATGAAACAATCGGTCTAGTATATGGTACTGACGGTGCATCACCTGTACCTGCAAGGGATGATCAAAGAAGTATTACTAAAGAAGCAATTCTATTCTTATTAAATGATACTGGATGGGTCGCTGGATCCTCACCAGGTTGGAATAGTATTAACAATACTCTATCTGGTATTGATTTGACTGCTAGATTAGGTGATGAAGAAACTAGAAAGATTCCTATTCTAGAAGATAGTGCAAACAATGATGCACTGGTTCCTATTAACGTAGAACTGAGACGACACTCCATTCTTAGATCTGGTAACCATACATTTGAATACACTGGTTTCGGACCAGGTAACTATTCAACTGCATTCCCACAGACACAGGTTGAAACTCTATCTGATGAACAGATTAGATTATCACAGTCTCTCAAAGAAGAGGCAGGCGTTGCATTCTACTCTGGACTTAACTCTAACGGTGACCTATTTATTGGTAACCAAGTTATCAACCCTGTTACTGGTCAGATCACATCTGAAGATATTGCACAGTTAAATGTATTAGGTGAAGAGAATACTACCATTGAAACATTCTCTGAAGTTGTTATTACTGACAAACTAACTGTTATCGGTGGTGCAAGTAACAACTTAGAATCTATCTTCTCAGGTCCTGCTACATTCCAAGGCACTATTACTTCTCAGAAAGATATTCTTGCTAAGAAGTTAACATATAACAACCAAGATGGTACGGTTCTTAAATCTACTCTCTTAGCACCTGAATTGAAAACTGGTACTCCCCCAGTTGGTCAAGGTACACCTGATTTAAGTGCAGTATTGAACTACAATGCTCCTAGTGATGGTGACATTGTATATAATATTGACTGGGAACCTGGTAAAAACCTAGGTTGGATGTACTATGAATCTGTATGGTACAAGTTTGGACTAACTAACACCGATGTATTCCAATTTGGAGAGTATGATTCATCCTACCCTCAACATATTGGTTTAGGTAGAGCGCCATCGTCCACATATAGATTAGAAGTAGAGGGATCGCAGCGTATTACTGGTGACCTTCGTGTTGATGGTCGTGGTGGTGTTGCTCCTGATAAATATATTACTAGACGTACTCAGGGTGATGGTTCTACCCTGAACTATCAGATTACATCATACGCTGGTGTTGTACACAATTCTAAGTCGGTGATTGTTACTATCAATGGTGTATTACAGCATCCTGATGTTAACTATACTGTTGATTCAAACGGTACTAACGTAGTGTTCGCATCTGGCGATGCTCCTACATCAAATGATTTTGTTGAAATTAGAGAACTACCTATCTAA

Genome Context

Tertiary structure

PDB ID

c3a492bf0e50c287127b25241ffe0dc4a666df17db81efc0146362dfc9d88e44

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,3454

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence