Protein

View in Explore

Genbank accession

YP_004893846.1 [GenBank]

Protein name

tail protein

RBP type

TSP

Evidence DepoScope

Probability 1,00

TSP

Evidence RBPdetect2

Probability 0,69

Protein sequence

MYPIPCLFLTLSGGGTEPLPPGSVKKVAFTRGLVGGATKRSMAILLIDGRLYTQGDNAWSECANGNISPFKDHWHLAANGVADVFGGGRAFVVKYNNGGWQYCGDTSQFTGSGSIYSSWTSFPSSITGTVSLANLQSVSCALGNTLWQMVDGRLYGSGSNTNGCLGSGNTTVISIPRSISASSVRAYSLNACVTYLNNIGLPRVCGATHQIDGTSTTQTQNFIDVSFASVTETVYVKEWLANETNSMAIASTGVDDTEHYLYTRGIGTAQYSKKEGIGPFETFRVIDGGQSHFLIADNKLYGLGDLSAQLGLGTPSTMVLEPTLVPVPTGRDWDLSKLTYIVDMKTDVLNQGNSISHWMVYDGNLYYAGNLYGFFGSTDSTGEFTNIPEASFGGTTADAITTGSIPYAIKGSRSQLTWTVEPADAEIYDISFTSSAPNIATVDSNGIMTFLEEGGFDITMTAKTGSGADAKTLTDTSGGYVSIFSVTTDSIPQKEVGDVFVFMDKNSPDYTPGPNVVGMEISPANVDTNFIDGELTTTNPDVVMIDEGGFLSCIAVGDARCGVRLIYREGQVEAFDDSYVSVSDFTAPPDPVDPGEPVVPSQPQ

Physico‐chemical properties

protein length:	604 AA
molecular weight:	64057,50670 Da
isoelectric point:	4,36827
aromaticity:	0,09768
hydropathy:	-0,08129

Domains

Domains [InterPro]

IPR009091
STR
37–402

IPR009091 G3DSA:2.60.40.1080

IPR009091
STR
41–376

IPR009091 IPR008964 DC_1711

DC_0918
STR
77–202

DC_0918 DC_0179

IPR000408
STR
151–183

IPR000408 IPR003343

YP_004893846.1

1 604

Architecture

STR

RBD

STR 37-500 | RBD 501-601 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
IPR009091	STR	IPR009091	37	402	Merged direct domain	Regulator of chromosome condensation 1/beta-lactamase-inhibitor protein II	Central	Low	Positional only	141 proteins / 141 hits
IPR009091	STR	IPR009091	41	376	Merged direct domain	Regulator of chromosome condensation 1/beta-lactamase-inhibitor protein II	Central	Low	Positional only	141 proteins / 141 hits
DC_0918	STR	DC_0918	77	202	Novel HMM	DC_0918	Central	Low	Positional only	78 proteins / 78 hits
IPR000408	STR	DC_0062	151	183	InterPro cluster	Regulator of chromosome condensation, RCC1	Central	Low	Positional only	52 proteins / 98 hits
DC_0179	STR	DC_0179	330	500	Novel HMM	DC_0179	Central	Low	Positional only	58 proteins / 58 hits
G3DSA:2.60.40.1080	STR	G3DSA:2.60.40.1080	403	475	Merged direct domain	G3DSA:2.60.40.1080	Central	Low	Positional only	18 proteins / 18 hits
IPR008964	RBD	IPR008964	405	468	Merged direct domain	Invasin/intimin cell-adhesion fragments	C-terminal	Low	Positional only	2 proteins / 2 hits
IPR003343	STR	DC_0008	409	472	InterPro cluster	Bacterial Ig-like domain, group 2	C-terminal	Medium	Text match	304 proteins / 473 hits
DC_1711	RBD	DC_1711	474	601	Novel HMM	DC_1711	C-terminal	Low	Positional only	141 proteins / 141 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

YP_004893846.1

1 604

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	86	86	0,0793
Central domain	87	346	261	0,7614
C-terminal	347	604	257	0,1336

Note: Constraints were applied during segmentation.
Fixed 89 C-terminal predictions appearing before Central domain

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-86

Central
87-346

C-terminal
347-604

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Salmonella phage PVPSE1 [NCBI]	889338	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Salmonella enteritidis [NCBI]	149539	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales

Coding sequence (CDS)

Genbank protein accession

YP_004893846.1 [NCBI]

Genbank nucleotide accession

NC_016071 [NCBI]

CDS location

range 24069 -> 25883
strand -

CDS

ATGTATCCTATTCCATGTCTCTTCTTGACATTATCTGGAGGAGGAACAGAACCACTACCACCAGGTAGTGTTAAGAAGGTGGCCTTTACCCGTGGTCTGGTTGGTGGTGCTACCAAAAGGTCAATGGCGATCCTCCTGATTGATGGGAGACTCTATACCCAAGGGGATAATGCGTGGTCTGAATGCGCAAACGGGAACATAAGCCCGTTTAAGGATCATTGGCACTTGGCGGCTAATGGTGTAGCTGATGTTTTTGGTGGTGGTAGAGCCTTTGTTGTCAAATACAACAATGGTGGCTGGCAGTATTGTGGGGACACCAGTCAATTCACTGGTAGTGGGTCTATCTATTCTTCTTGGACAAGCTTCCCTTCATCAATCACAGGCACAGTATCCCTCGCAAATTTACAAAGTGTTTCTTGTGCTCTCGGTAACACACTCTGGCAGATGGTAGATGGAAGACTTTATGGAAGCGGGTCAAACACAAATGGATGCCTTGGCTCTGGTAATACTACCGTAATATCGATCCCAAGAAGTATTAGTGCATCCTCTGTGAGAGCTTACAGCTTAAATGCTTGCGTGACATACCTGAACAATATTGGACTTCCCCGTGTTTGTGGGGCCACCCATCAGATAGATGGTACTTCAACAACACAAACACAAAACTTTATCGATGTTAGTTTTGCCTCTGTGACTGAAACCGTCTATGTTAAAGAGTGGTTAGCGAACGAAACAAACTCAATGGCTATCGCCTCTACAGGTGTTGATGATACAGAGCATTATTTATATACGAGGGGTATCGGGACAGCCCAATACTCTAAGAAAGAGGGTATTGGTCCTTTCGAGACATTCAGGGTTATCGACGGTGGTCAGTCTCATTTCCTGATTGCTGATAACAAGCTTTACGGTCTTGGTGACCTAAGTGCTCAACTTGGCCTTGGCACACCATCAACAATGGTGTTAGAACCGACCCTTGTTCCAGTTCCTACAGGAAGGGATTGGGATCTTTCGAAGCTGACATACATTGTAGACATGAAGACAGATGTCCTTAACCAGGGGAACTCTATCAGCCATTGGATGGTGTATGACGGGAACCTTTACTACGCTGGTAACCTTTATGGTTTCTTTGGGTCAACCGATAGCACTGGTGAGTTCACAAACATCCCAGAAGCATCCTTTGGGGGGACAACTGCGGATGCTATCACCACAGGGTCTATCCCATACGCTATCAAAGGGTCGAGAAGTCAACTTACGTGGACTGTTGAGCCAGCAGATGCTGAGATTTATGATATTTCGTTCACATCGAGTGCTCCTAATATCGCAACTGTAGACTCAAATGGTATCATGACCTTCCTTGAAGAGGGTGGTTTTGACATCACAATGACTGCTAAAACAGGGTCTGGCGCGGATGCTAAAACACTCACAGATACTTCTGGCGGTTATGTTTCCATCTTCTCTGTGACTACCGATTCCATCCCACAAAAGGAAGTTGGTGATGTGTTCGTGTTCATGGATAAAAACAGTCCTGACTATACACCAGGTCCGAACGTTGTCGGAATGGAAATTTCTCCAGCCAATGTTGATACTAACTTCATAGACGGAGAATTAACAACTACAAATCCGGATGTGGTGATGATTGATGAGGGTGGATTCCTTTCCTGTATTGCAGTTGGTGATGCCCGTTGTGGTGTTCGTCTTATTTACAGGGAGGGTCAGGTTGAGGCATTTGATGATTCGTATGTCAGTGTTTCAGACTTCACAGCCCCACCAGATCCTGTGGACCCCGGCGAACCAGTTGTACCTTCTCAACCGCAATAA

Genome Context

Tertiary structure

PDB ID

e670d188c718777041af9f817ec5dd156aada8ad1c24f8edeae834c6a8839469

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,8323

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence