Protein

View in Explore

Genbank accession

XKC24406.1 [GenBank]

Protein name

tail protein

RBP type

TSP

Evidence DepoScope

Probability 1,00

Evidence RBPdetect

Probability 0,78

Evidence RBPdetect2

Probability 0,78

Protein sequence

MAVTTKIIVQQILNIDDTKATASKFPRYTVTLGNSISSITASELVSSIEAAAKSAAAAKDSEIAAKTSELNAKNSEQEAAISAGASEASAAQSATSATQSAASADRSAESATAAKVSETNAKASETKAKTSETNAKVSETNAKSSETKAKTSETNAKTSETNAAASAAAAKISETNAKTSETRAAESAASAADSKGFRDEAEAFAAQAAASAAAAKVSETKAKTSETNAKSSETKAKASETNAASSATSASQSVTTIQGLKSDVEALKSDTQTIKNSAVTETTALKNQAATSATNAAASATEAGKQATNAANSANSAKTEADRSKTEADRAKAEADRSEAAINGTPELQPLPDVWIPFNDSLDMITGFSPSYKKIIIGDDEITMPGDKIVKFKRASTATYINKSGVFTVAEIDEPRFERDGLLIEGQRSNYILNSLTVSKWGASSWLTISSSGVDSFGFTYGRFDVQSSNVGSTTSGNIAVAPSPRAFDVTGDEKYCTISCRCKCESDIDIRCRLRFENYDGTATSFIGDAYMNMQTLDITTTGGAANRITAKAVKDNATGWIFFEATIKALDTENMIGGQVQIAPSQRVGSFADGDHIIVATPQFEGGATASSFIISDTVAATRASDMVTVPIKNNLYSLPFTVLCEVHKNWYKTPNAAPRVFDTGGHQTGAAIILGFGSSADYDGFPYCDIGGANRRVNENASLEKMVMGMRVKEDQMTCAVSNGRISSETKTTWTYIQSSATIRIGGQTTTGQRHLFGHVRNFRVWHKALTDRELKESV

Physico‐chemical properties

protein length:	782 AA
molecular weight:	82110,77870 Da
isoelectric point:	5,73945
aromaticity:	0,05754
hydropathy:	-0,36803

Domains

Domains [InterPro]

DC_0608
ATT
2–207

DC_0608 DC_1979

Coil
Unmapped
314–341

Coil IPR013320

XKC24406.1

1 782

Architecture

ATT

STR

ATT 2-207 | STR 233-782

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0608	ATT	DC_0608	2	207	Novel HMM	DC_0608	N-terminal	Low	Positional only	308 proteins / 308 hits
DC_1979	STR	DC_1979	233	782	Novel HMM	DC_1979	Central	Low	Positional only	21 proteins / 21 hits
Coil	Unmapped	-	314	341	Coils	Coil	-	-	-	-
IPR013320	STR	IPR013320	642	780	Merged direct domain	Concanavalin A-like lectin/glucanase domain superfamily	Central	Low	Positional only	237 proteins / 237 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

XKC24406.1

1 782

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	613	613	0,4289
Central domain	614	771	159	0,3976
C-terminal	772	782	10	0,9963

Note: Constraints were applied during segmentation.
C-terminal too short, adjusted boundary

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-613

Central
614-771

C-terminal
772-782

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Salmonella phage HMD-P4 [NCBI]	3374742	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Escherichia coli [NCBI]	562	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales

Coding sequence (CDS)

Genbank protein accession

XKC24406.1 [NCBI]

Genbank nucleotide accession

PQ462666 [NCBI]

CDS location

range 80483 -> 82831
strand -

CDS

ATGGCAGTAACTACTAAAATTATCGTACAGCAGATATTAAATATTGATGATACTAAAGCTACTGCTAGTAAGTTTCCTAGATATACAGTAACTCTAGGTAACTCTATTAGTTCTATTACTGCAAGTGAGCTAGTATCGTCTATTGAGGCAGCAGCTAAGTCTGCTGCAGCTGCAAAAGATTCTGAGATAGCTGCTAAGACTTCAGAACTTAACGCTAAGAACTCTGAACAGGAGGCTGCTATTTCTGCTGGAGCTTCTGAAGCCTCTGCCGCTCAGTCCGCTACATCTGCTACTCAATCTGCTGCATCAGCGGATAGATCTGCAGAATCAGCCACAGCAGCTAAAGTATCTGAGACTAATGCGAAAGCTAGTGAAACTAAGGCTAAAACCTCAGAGACTAATGCAAAAGTATCAGAAACTAATGCAAAGTCTAGTGAAACCAAAGCTAAAACCTCGGAAACTAACGCTAAAACCAGTGAGACCAACGCTGCTGCTTCCGCTGCCGCTGCAAAAATTAGTGAAACTAATGCTAAGACTAGTGAAACTAGAGCTGCTGAATCTGCTGCGTCTGCTGCCGATTCTAAAGGTTTTAGGGATGAAGCGGAAGCATTTGCTGCACAAGCGGCTGCCTCTGCTGCGGCTGCTAAAGTATCCGAGACTAAGGCAAAAACATCAGAAACTAATGCAAAGTCTAGCGAAACTAAAGCTAAGGCTAGTGAAACAAATGCTGCTAGTTCTGCAACTTCAGCTAGTCAATCAGTAACCACTATTCAAGGTCTAAAATCTGATGTTGAGGCATTAAAATCTGATACTCAAACCATCAAGAATAGTGCTGTAACTGAGACAACAGCTTTAAAAAATCAAGCGGCTACTTCTGCAACTAATGCTGCTGCATCTGCTACTGAAGCGGGAAAACAAGCTACTAATGCTGCTAATAGTGCTAATAGTGCTAAAACTGAGGCTGACCGTTCAAAAACTGAAGCTGATCGTGCTAAAGCTGAAGCAGATAGATCTGAAGCTGCTATTAATGGTACTCCCGAGCTACAGCCATTACCGGATGTATGGATACCTTTTAATGACTCCTTAGATATGATTACTGGCTTCTCACCTAGCTATAAAAAGATTATAATTGGTGACGATGAAATTACAATGCCTGGTGACAAGATTGTTAAGTTTAAACGTGCATCAACTGCGACATATATTAATAAATCCGGCGTTTTCACTGTTGCGGAAATTGATGAACCACGTTTTGAACGTGATGGTCTGCTTATTGAAGGGCAAAGATCAAACTATATTCTTAACTCCCTTACTGTTTCTAAATGGGGTGCATCTTCGTGGTTGACAATCTCATCAAGCGGAGTTGATAGCTTTGGTTTTACATATGGCCGATTTGATGTTCAGTCTAGTAATGTTGGAAGCACAACATCAGGTAATATTGCTGTGGCTCCTTCACCAAGAGCATTTGACGTTACTGGTGATGAGAAGTATTGCACTATATCTTGCCGATGCAAATGTGAATCAGACATAGATATTCGATGTAGACTCAGATTTGAGAACTACGACGGGACTGCCACATCCTTCATTGGAGATGCGTACATGAATATGCAGACTTTAGATATAACAACTACAGGTGGCGCGGCAAATAGAATTACAGCTAAAGCGGTCAAGGATAATGCTACAGGATGGATATTTTTTGAAGCGACAATAAAAGCACTAGATACCGAAAATATGATTGGTGGTCAAGTTCAGATAGCACCATCTCAAAGAGTTGGATCTTTTGCAGATGGCGATCATATTATTGTTGCAACGCCGCAATTCGAAGGTGGGGCGACTGCATCGTCATTCATCATATCTGATACAGTTGCAGCGACAAGGGCTAGCGATATGGTGACAGTGCCAATTAAAAACAATCTTTATAGCTTACCTTTTACGGTTCTTTGTGAGGTACATAAGAATTGGTACAAAACACCGAACGCAGCACCTCGAGTTTTTGATACTGGAGGTCATCAAACCGGAGCGGCTATTATTCTTGGCTTCGGTTCTTCAGCAGATTACGACGGATTTCCTTATTGCGATATTGGAGGAGCTAACCGACGTGTAAACGAAAACGCATCGCTTGAAAAAATGGTCATGGGTATGCGTGTGAAGGAAGATCAGATGACATGTGCAGTAAGTAACGGGCGTATATCTAGTGAAACAAAGACAACTTGGACTTATATTCAAAGCTCTGCAACCATTCGTATTGGTGGTCAGACAACAACAGGTCAGCGTCATTTATTCGGGCATGTCAGAAATTTTCGAGTATGGCATAAAGCATTGACTGACCGTGAATTGAAGGAGTCTGTATGA

Genome Context

Tertiary structure

PDB ID

db07d644e20f2d7e9986d65966ec909f6cf048481f09dfdd907aeb5780ac59f8

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,4154

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence