Protein

View in Explore

UniProt accession

Q58MX0 [UniProt]

Protein name

Phage tail fiber-like protein

RBP type

Evidence UniProt/TrEMBL

Probability 1,00

Evidence GenBank

Probability 1,00

TSP

Evidence DepoScope

Probability 0,99

Evidence RBPdetect

Probability 0,83

Evidence RBPdetect2

Probability 0,93

Protein sequence

MANIKKTFNFRNGVQVDDDNLIVNQTGLVGIGTTVPTEALDVRGKVKVIADPNVTGSGEINATTGIITSLTVTNLTVSGNNYSGGVIGVGISVGTAGIITATEPTGIVTYYGDGKELLNLPTSQWLDKDVGLGYTSIYAQGGVGVGTVDPRFTFQVSGNNDLTNFEEGVGINDKGGIVATGVITATTFKGHVDGSVSSGLSTITQLQSTNANVTGVVTATEFKGDVTGDVVSGVSTITTLQSTTINAGLINATGAGFTGALSGDVTGNVTGNVNGNINAVTGISTLNILKILGTIDGDTVSGILTTGRLTAATSTIGVATAASLNVQGKLGVGINNPIGDIQVYKSGISTVNVVGEEFAVLQLGQRDSIGIGASTAQFKFGETSQELDIINGDPGSINSIIHGGGSAGINTGSFNWIYGVNNSTLMSLDYTGKLGVNKPDPEYPLDVSGIGTFSSDVYVRNSLDVGVLLTVGGNATVAGTLGVTSSVTVGGDLNVTGVFNYPSDVPADKLPDQIDVRINSAGVSTFLGGVNLGAVQVGGLNGVISGVSTIGILTSAENIPLAMGVYSPTAKAVFNRLGVGNTDPINALDVTGTIQATQYLGVGNQPIGAAVDFSNAGRGLTVPSLQNRNFMLPPKVTTTERSNLAGLAAGAIIYNTTTNKLQVYNGSSWQNLH

Physico‐chemical properties

protein length:	673 AA
molecular weight:	68141,29740 Da
isoelectric point:	4,52151
aromaticity:	0,05349
hydropathy:	0,17415

Domains

Domains [InterPro]

DC_0326
STR
495–673

DC_0326

IPR059888
RBD
629–672

IPR059888

Q58MX0

1 673

Architecture

STR

STR 495-673

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0326	STR	DC_0326	495	673	Novel HMM	DC_0326	Central	Low	Positional only	28 proteins / 28 hits
IPR059888	RBD	DC_0792	629	672	InterPro cluster	Phage tail-like, trimerisation region	C-terminal	Low	Positional only	22 proteins / 22 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

Q58MX0

1 673

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	448	448	0,7219
Central domain	449	647	200	0,5264
C-terminal	648	673	25	0,9909

Note: Constraints were applied during segmentation.
Fixed 49 C-terminal predictions appearing before Central domain

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-448

Central
449-647

C-terminal
648-673

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Prochlorococcus phage P-SSM2 [NCBI]	268746	Uroviricota > Caudoviricetes > Pantevenvirales > Salacisavirus > Salacisavirus pssm2
Host	Prochlorococcus [NCBI]	1218	Bacteria > Cyanobacteria > Prochlorales > Prochlorococcaceae >
Host	Prochlorococcus marinus str. NATL1A [NCBI]	167555	Bacteria > Cyanobacteria > Prochlorales > Prochlorococcaceae > Prochlorococcus >

Coding sequence (CDS)

Genbank protein accession

AAX44412.1 [NCBI]

Genbank nucleotide accession

AY939844 [NCBI]

CDS location

range 34286 -> 36307
strand +

CDS

ATGGCTAATATTAAGAAGACATTTAATTTCCGTAATGGTGTTCAGGTTGATGATGATAATCTGATCGTAAACCAAACGGGTCTGGTTGGTATCGGAACTACTGTTCCAACTGAGGCTTTGGATGTCCGAGGAAAAGTTAAAGTTATTGCAGATCCTAATGTTACTGGATCTGGAGAGATTAATGCAACTACAGGTATAATTACATCTTTAACTGTAACCAATTTAACCGTTAGTGGAAATAATTATTCTGGTGGTGTAATTGGTGTTGGTATTAGTGTTGGAACAGCAGGTATTATAACTGCAACAGAACCAACTGGTATTGTTACTTATTATGGTGATGGTAAAGAATTATTGAATCTTCCCACATCACAGTGGTTAGATAAAGACGTAGGATTAGGATATACAAGTATATACGCTCAAGGTGGCGTAGGTGTGGGGACAGTAGATCCTCGATTTACCTTCCAAGTTAGTGGAAATAATGACTTAACTAACTTTGAAGAAGGTGTAGGTATTAATGATAAGGGTGGTATTGTAGCGACAGGTGTTATTACTGCTACTACCTTTAAAGGACATGTTGATGGATCTGTATCTAGTGGATTATCAACCATTACACAGTTACAGTCTACAAATGCAAATGTTACTGGTGTAGTTACTGCTACTGAATTTAAAGGAGATGTTACTGGTGATGTAGTTAGTGGTGTATCAACAATCACTACCTTACAATCAACCACGATAAATGCAGGTCTTATAAACGCTACTGGTGCAGGATTTACTGGTGCTTTATCGGGTGATGTTACTGGTAATGTTACTGGTAATGTTAATGGTAATATTAATGCGGTAACAGGTATTTCAACACTTAATATACTTAAGATACTTGGAACTATTGATGGTGATACTGTTTCTGGTATTCTTACTACTGGAAGATTAACTGCTGCTACTTCAACTATAGGTGTGGCAACAGCAGCATCATTAAATGTTCAAGGTAAATTGGGAGTTGGTATCAATAACCCAATAGGTGATATTCAGGTATATAAGTCAGGAATTTCTACTGTTAATGTTGTTGGTGAAGAGTTTGCTGTTCTACAATTAGGTCAGAGAGATTCGATTGGTATTGGAGCAAGCACAGCACAGTTTAAGTTTGGTGAAACTAGTCAAGAACTTGATATTATTAATGGAGATCCTGGTAGCATCAATAGTATTATTCATGGTGGTGGATCTGCTGGTATTAATACTGGATCATTTAACTGGATATATGGTGTAAATAACAGCACACTAATGTCACTAGACTATACTGGAAAGTTGGGTGTTAATAAACCTGATCCAGAATATCCTTTAGATGTAAGTGGTATTGGAACATTCTCAAGTGATGTTTATGTAAGAAATTCTTTAGATGTTGGTGTTTTACTGACTGTTGGTGGTAATGCAACTGTTGCTGGAACATTAGGAGTTACTAGTAGTGTGACTGTTGGTGGAGATTTAAATGTTACTGGAGTATTTAATTATCCTTCAGACGTTCCTGCTGATAAATTGCCAGATCAAATTGATGTTAGAATAAATTCTGCTGGAGTATCTACATTCTTAGGTGGTGTTAACCTTGGAGCAGTTCAAGTTGGTGGATTAAATGGAGTTATCTCTGGTGTATCCACGATTGGAATCTTAACTTCTGCGGAAAATATTCCATTAGCTATGGGTGTTTATTCACCAACAGCAAAGGCAGTTTTCAATAGACTGGGTGTTGGTAATACTGATCCTATAAATGCGTTGGATGTTACTGGTACTATTCAAGCAACTCAATATCTTGGAGTTGGTAATCAACCAATAGGTGCTGCGGTTGACTTCTCTAATGCTGGTAGGGGACTTACTGTACCATCTTTACAGAATAGAAACTTTATGCTCCCACCAAAAGTTACTACAACTGAGAGAAGTAACTTAGCAGGATTAGCTGCTGGTGCAATAATATACAATACTACTACAAACAAACTTCAAGTTTATAATGGATCTTCGTGGCAGAACCTTCACTAA

Genbank protein accession

ACY75910.1 [NCBI]

Genbank nucleotide accession

GU071092 [NCBI]

CDS location

range 36294 -> 38315
strand +

CDS

ATGGCTAATATTAAGAAGACATTTAATTTCCGTAATGGTGTTCAGGTTGATGATGATAATCTGATCGTAAACCAAACGGGTCTGGTTGGTATCGGAACTACTGTTCCAACTGAGGCTTTGGATGTCCGAGGAAAAGTTAAAGTTATTGCAGATCCTAATGTTACTGGATCTGGAGAGATTAATGCAACTACAGGTATAATTACATCTTTAACTGTAACCAATTTAACCGTTAGTGGAAATAATTATTCTGGTGGTGTAATTGGTGTTGGTATTAGTGTTGGAACAGCAGGTATTATAACTGCAACAGAACCAACTGGTATTGTTACTTATTATGGTGATGGTAAAGAATTATTGAATCTTCCCACATCACAGTGGTTAGATAAAGACGTAGGATTAGGATATACAAGTATATACGCTCAAGGTGGCGTAGGTGTGGGGACAGTAGATCCTCGATTTACCTTCCAAGTTAGTGGAAATAATGACTTAACTAACTTTGAAGAAGGTGTAGGTATTAATGATAAGGGTGGTATTGTAGCGACAGGTGTTATTACTGCTACTACCTTTAAAGGACATGTTGATGGATCTGTATCTAGTGGATTATCAACCATTACACAGTTACAGTCTACAAATGCAAATGTTACTGGTGTAGTTACTGCTACTGAATTTAAAGGAGATGTTACTGGTGATGTAGTTAGTGGTGTATCAACAATCACTACCTTACAATCAACCACGATAAATGCAGGTCTTATAAACGCTACTGGTGCAGGATTTACTGGTGCTTTATCGGGTGATGTTACTGGTAATGTTACTGGTAATGTTAATGGTAATATTAATGCGGTAACAGGTATTTCAACACTTAATATACTTAAGATACTTGGAACTATTGATGGTGATACTGTTTCTGGTATTCTTACTACTGGAAGATTAACTGCTGCTACTTCAACTATAGGTGTGGCAACAGCAGCATCATTAAATGTTCAAGGTAAATTGGGAGTTGGTATCAATAACCCAATAGGTGATATTCAGGTATATAAGTCAGGAATTTCTACTGTTAATGTTGTTGGTGAAGAGTTTGCTGTTCTACAATTAGGTCAGAGAGATTCGATTGGTATTGGAGCAAGCACAGCACAGTTTAAGTTTGGTGAAACTAGTCAAGAACTTGATATTATTAATGGAGATCCTGGTAGCATCAATAGTATTATTCATGGTGGTGGATCTGCTGGTATTAATACTGGATCATTTAACTGGATATATGGTGTAAATAACAGCACACTAATGTCACTAGACTATACTGGAAAGTTGGGTGTTAATAAACCTGATCCAGAATATCCTTTAGATGTAAGTGGTATTGGAACATTCTCAAGTGATGTTTATGTAAGAAATTCTTTAGATGTTGGTGTTTTACTGACTGTTGGTGGTAATGCAACTGTTGCTGGAACATTAGGAGTTACTAGTAGTGTGACTGTTGGTGGAGATTTAAATGTTACTGGAGTATTTAATTATCCTTCAGACGTTCCTGCTGATAAATTGCCAGATCAAATTGATGTTAGAATAAATTCTGCTGGAGTATCTACATTCTTAGGTGGTGTTAACCTTGGAGCAGTTCAAGTTGGTGGATTAAATGGAGTTATCTCTGGTGTATCCACGATTGGAATCTTAACTTCTGCGGAAAATATTCCATTAGCTATGGGTGTTTATTCACCAACAGCAAAGGCAGTTTTCAATAGACTGGGTGTTGGTAATACTGATCCTATAAATGCGTTGGATGTTACTGGTACTATTCAAGCAACTCAATATCTTGGAGTTGGTAATCAACCAATAGGTGCTGCGGTTGACTTCTCTAATGCTGGTAGGGGACTTACTGTACCATCTTTACAGAATAGAAACTTTATGCTCCCACCAAAAGTTACTACAACTGAGAGAAGTAACTTAGCAGGATTAGCTGCTGGTGCAATAATATACAATACTACTACAAACAAACTTCAAGTTTATAATGGATCTTCGTGGCAGAACCTTCACTAA

Genome Context

Tertiary structure

PDB ID

df0ef53a749528cc20cf13267afd33c59bd4d56c548b779daab8ca958722d1ba

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,5419

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence