Protein

View in Explore

Genbank accession

YP_007349017.1 [GenBank]

Protein name

tail spike protein

RBP type

TSP

Evidence UniProt/TrEMBL

Probability 1,00

TSP

Evidence DepoScope

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,91

TSP

Evidence RBPdetect2

Probability 0,95

Protein sequence

MNPRFTQPKSAVSEMTNLAAVSRIFGYETKNSEYIHVGLDIGSYKVVFDDTTSTCWLVKNATGNVVSYSRSQDTLVVVTSVGTFKLNRAKAVDMELLFKSEQHLQYYYDLLGNWDDAFFMAQVNVFLKGYSPRIILPVAEITITRPILNGVALGDKIHATYPELNFYNSTTGNYLAAWPLVIHGTYRKQQDGGLGGYSGSQIIFRGCNNRDDMTWTQWAIIHSGPNPTEVGQLRRTDTLLKNWPAFADLRDFNIRAINKDGVPISNVHGMYFHYGTQVSAVNMSIYQCYGAGVAVDNTWDSKFENLKVLQCGRMSPVFGQYVTDGNFGPQYQTYAPIHVMRSPLSDNSNFIRFHNCHVEDNMHAAVDVIVSGNSSPVWLTDLHVEAQTGLGGTTNNGQRTIVGLGNFGVTYFGQDAQPGYDYKARPDTGTGGNVVWTGGGMYSDTYSHIARLTRYSAFVLSDMVFPNSGNINVVGGNAAPYVYLSNCVVGDISFTGGNGSLSPLKASNCRIKSLTMDYTYGPQLSNCEISGAFNITNMYSNKPEGGVQLTNCNIGSMSGVIQFGQGIVTLTSTTDPSPFVVYYGHIDVSRYAYYNTNNLVGG

Physico‐chemical properties

protein length:	602 AA
molecular weight:	66122,42500 Da
isoelectric point:	6,26408
aromaticity:	0,11794
hydropathy:	-0,18970

Domains

Domains [InterPro]

G3DSA:3.30.2020.50
ATT
1–93

G3DSA:3.30.2020.50 DC_1709

G3DSA:3.30.2020.50
ATT
1–100

G3DSA:3.30.2020.50

YP_007349017.1

1 602

Architecture

ATT

STR

ATT 1-100 | STR 184-602

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
G3DSA:3.30.2020.50	ATT	G3DSA:3.30.2020.50	1	93	Merged direct domain	G3DSA:3.30.2020.50	N-terminal	Low	Positional only	289 proteins / 289 hits
G3DSA:3.30.2020.50	ATT	G3DSA:3.30.2020.50	1	100	Merged direct domain	G3DSA:3.30.2020.50	N-terminal	Low	Positional only	289 proteins / 289 hits
DC_1709	STR	DC_1709	184	602	Novel HMM	DC_1709	Central	Low	Positional only	31 proteins / 31 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

YP_007349017.1

1 602

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	115	115	0,9489
Central domain	116	586	472	0,9866
C-terminal	587	602	15	0,8415

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-115

Central
116-586

C-terminal
587-602

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Serratia phage phiMAM1 [NCBI]	1262513	Uroviricota > Caudoviricetes > Pantevenvirales > Miltonvirus > Miltonvirus MAM1
Host	Serratia sp. [NCBI]	616	Bacteria > Proteobacteria > Gammaproteobacteria > Enterobacteriales > Enterobacteriaceae > Serratia

Coding sequence (CDS)

Genbank protein accession

YP_007349017.1 [NCBI]

Genbank nucleotide accession

NC_020083 [NCBI]

CDS location

range 35198 -> 37006
strand +

CDS

ATGAACCCAAGATTCACGCAACCGAAGAGCGCGGTTTCGGAGATGACCAATCTGGCAGCAGTGTCCAGGATTTTTGGTTATGAAACCAAGAACTCTGAATACATCCATGTCGGCCTGGACATCGGCAGCTACAAGGTTGTGTTTGATGACACGACTTCTACCTGCTGGCTCGTCAAGAACGCCACAGGCAACGTTGTGTCCTACAGCCGATCTCAGGACACTCTTGTCGTTGTCACATCTGTCGGCACATTCAAGCTGAACCGCGCCAAGGCCGTGGATATGGAACTGCTGTTTAAATCAGAGCAGCACCTCCAGTATTATTACGATCTTCTGGGCAACTGGGACGACGCTTTCTTCATGGCACAGGTGAACGTGTTCCTCAAGGGTTACTCCCCAAGAATCATCCTTCCTGTGGCCGAAATCACTATCACTCGCCCTATCCTGAATGGGGTTGCTCTCGGTGACAAAATTCATGCCACGTACCCAGAATTGAACTTCTACAACTCCACCACTGGAAACTATCTCGCTGCTTGGCCTTTGGTCATCCATGGAACCTACCGCAAACAACAAGACGGTGGTCTGGGTGGTTACAGTGGCTCACAGATCATATTCCGTGGTTGCAACAACCGTGACGACATGACTTGGACTCAATGGGCGATTATCCATTCTGGCCCGAACCCAACGGAAGTCGGCCAGCTGCGCCGCACGGACACTCTGTTGAAGAACTGGCCTGCATTCGCTGACCTGCGCGACTTCAACATCCGGGCGATCAACAAAGACGGCGTCCCGATTTCAAACGTCCACGGCATGTATTTCCACTATGGGACTCAGGTCTCAGCGGTCAACATGTCTATCTACCAGTGCTATGGTGCTGGCGTCGCGGTGGACAACACCTGGGACTCCAAATTCGAGAACCTGAAAGTGCTGCAGTGTGGTCGCATGTCTCCTGTGTTCGGGCAATACGTGACTGACGGAAACTTCGGTCCCCAATACCAGACCTATGCTCCGATTCACGTGATGCGCTCGCCTCTGTCTGACAATAGCAACTTCATCCGTTTCCACAACTGTCACGTGGAAGACAACATGCATGCTGCTGTAGACGTGATCGTGTCCGGTAACTCTTCGCCGGTATGGTTGACAGACCTCCACGTGGAAGCGCAGACTGGATTGGGCGGTACGACCAACAACGGCCAACGAACCATCGTCGGCTTGGGTAACTTCGGTGTGACCTACTTCGGTCAAGATGCCCAGCCGGGTTATGATTACAAGGCGCGCCCGGATACCGGTACTGGCGGCAACGTTGTTTGGACTGGCGGTGGTATGTATTCAGACACGTACAGCCATATTGCCCGGCTGACTCGTTATTCTGCCTTCGTTCTGTCTGATATGGTGTTCCCAAACAGCGGCAACATCAACGTCGTCGGCGGCAACGCGGCTCCATACGTGTATCTGTCCAACTGCGTGGTCGGGGATATCAGCTTCACTGGCGGTAACGGTTCACTGTCTCCCCTGAAGGCAAGCAACTGCCGTATCAAATCCTTGACAATGGATTACACTTATGGTCCACAGCTGTCCAACTGTGAGATATCTGGCGCGTTCAACATCACGAACATGTACAGCAACAAGCCGGAAGGTGGGGTACAGCTGACCAACTGTAACATCGGCTCAATGTCTGGTGTAATCCAGTTCGGCCAGGGTATCGTCACTCTTACTTCGACGACTGACCCTTCACCGTTCGTGGTCTACTATGGTCATATCGACGTTTCTCGCTATGCCTATTACAACACCAATAATCTGGTAGGTGGTTAA

Genome Context

Tertiary structure

PDB ID

acdda1cb6d6f086f69b5158f38a4ebffb7dcaa2753e085b9fe308b8525f19b4a

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,6113

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence