Protein

View in Explore

Genbank accession

XXK86180.1 [GenBank]

Protein name

tail protein

RBP type

TSP

Evidence DepoScope

Probability 1,00

Evidence RBPdetect

Probability 0,87

Protein sequence

MKLLFLLELLKLLLLSPLHLLLSLQNQQLLLKLLRLMQRLAKLVLLSMLPLLKLLRLMQRLAKLVHLDMLMQQKLVKLMQKLVRLMQKLVRLAAKTSETNAKASEVSASGYADAAKTSETNAKTSETNAKTSETNAKTSETNAAASASSSRGSRDEAEVFATQAAASAAAAKNSESNASASEVNSKASEDAAKQAQVDAAGSANIASQAVSTIQGLKSEVEQLKTDTQGIKDSAVRETTALKDATAASAAQAITTIEGLKSDVEQLKTDTQSIKNSAVSETQAIKDAAVTDTTALKNAAAASAAQASNSATEAGQQAGNAASSANSAKIDADRAKAEADRAEVAANKAPDLQPFPDVWIPFNDSLDMLAGYSPGYKKITVGEDVITMPSDKVVSFSRASNATYINKHGEFCIANIDEPRFEKQGLLIEGQRTNHITFSNDPASLNTDKYRSDVTYNVDKYGFAYATAIANENSQGEYPSLFYCETVNAINCQQNEYVSLSIRVKANLDIYITPQFYLVGEDGGLILVARSFINCETGEVSSVVEGRGTIAHRIYREDNGWLKVEAMCKFVERGGSSIGSVNYCRNNDQPAQVGDTISFCTPQFEKGFCASSFIITGSTPATRALDYVTIPARNNFSGTNISFLAEVSINWDSFELVNTYPMIIDNSKYNIPGESFVSEMLIATRVPSVYFLNKETGRSTVSNGSSFSEVGIPSVWGFIHTKDGDVTSFLNGFKNITSSGSTWEGLSPDSLLEIGGRPSDSTKLYGHIRNLRIWNRVLTDSQMREGV

Physico‐chemical properties

protein length:	786 AA
molecular weight:	84824,45220 Da
isoelectric point:	5,69097
aromaticity:	0,06616
hydropathy:	-0,22481

Domains

Domains [InterPro]

Coil
Unmapped
75–95

Coil DC_0415 Coil Coil G3DSA:2.60.120.200

Coil
Unmapped
206–226

Coil DC_0353

IPR013320
STR
601–783

IPR013320

XXK86180.1

1 786

Architecture

STR

STR 114-249 | STR 254-786

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
Coil	Unmapped	-	75	95	Coils	Coil	-	-	-	-
DC_0415	STR	DC_0415	114	249	Novel HMM	DC_0415	Central	Low	Positional only	100 proteins / 100 hits
Coil	Unmapped	-	206	226	Coils	Coil	-	-	-	-
Coil	Unmapped	-	249	276	Coils	Coil	-	-	-	-
DC_0353	STR	DC_0353	254	786	Novel HMM	DC_0353	Central	Low	Positional only	163 proteins / 163 hits
Coil	Unmapped	-	324	344	Coils	Coil	-	-	-	-
G3DSA:2.60.120.200	STR	G3DSA:2.60.120.200	585	784	Merged direct domain	G3DSA:2.60.120.200	Central	Low	Positional only	153 proteins / 153 hits
IPR013320	STR	IPR013320	601	783	Merged direct domain	Concanavalin A-like lectin/glucanase domain superfamily	Central	Low	Positional only	237 proteins / 237 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

XXK86180.1

1 786

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	593	593	0,5596
Central domain	594	775	183	0,5049
C-terminal	776	786	10	0,9668

Note: Constraints were applied during segmentation.
Fixed 268 C-terminal predictions appearing before Central domain|C-terminal too short, adjusted boundary

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-593

Central
594-775

C-terminal
776-786

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Salmonella phage WP85 [NCBI]	3446685	Viruses >
Host	No host information

Coding sequence (CDS)

Genbank protein accession

XXK86180.1 [NCBI]

Genbank nucleotide accession

PV844355 [NCBI]

CDS location

range 21089 -> 23449
strand +

CDS

ATGAAGCTGCTATTTCTGCTGGAGCTTCTGAAGCTTCTGCTACTCAGTCCGCTGCATCTGCTACTCAGTCTGCAGAATCAGCAACTGCTGCTAAAACTTCTGAGACTAATGCAAAGGCTAGCGAAGTTAGTGCTGCTGAGTATGCTGCCGCTGCTAAAACTTCTGAGACTAATGCAAAGGCTAGCGAAGTTAGTGCATCTGGATATGCTGATGCAGCAAAAACTAGTGAAACTAATGCAAAAACTAGTGAGACTAATGCAAAAACTAGTGAGACTAGCTGCTAAAACTTCTGAGACTAATGCAAAGGCTAGCGAAGTTAGTGCATCTGGATATGCTGATGCAGCAAAAACTAGTGAAACTAATGCAAAAACTAGTGAGACTAATGCAAAAACTAGTGAGACTAATGCAAAAACTAGTGAGACTAATGCAGCTGCATCTGCTTCTAGCTCTAGAGGATCTAGGGATGAGGCAGAAGTATTCGCAACACAAGCTGCCGCATCAGCAGCAGCAGCAAAAAATTCGGAAAGTAATGCAAGTGCTAGTGAGGTTAATTCAAAAGCTAGTGAAGATGCTGCCAAGCAAGCGCAAGTAGATGCTGCTGGTTCTGCCAACATTGCATCACAAGCTGTAAGCACAATTCAAGGTCTTAAATCAGAGGTTGAGCAGTTAAAAACAGACACACAGGGTATTAAGGATAGTGCAGTAAGGGAAACTACTGCGTTAAAAGATGCCACCGCTGCATCAGCTGCACAAGCTATAACCACAATTGAAGGTCTTAAATCCGATGTTGAACAGTTAAAAACCGACACACAAAGTATTAAGAATAGCGCAGTAAGCGAGACGCAAGCAATTAAAGACGCTGCCGTAACGGATACTACAGCGCTAAAAAACGCTGCCGCTGCATCGGCTGCTCAAGCAAGTAATAGTGCTACCGAAGCTGGACAACAAGCTGGTAACGCGGCTAGTAGTGCAAATAGCGCTAAAATAGACGCAGACCGTGCAAAGGCAGAAGCAGACCGTGCGGAAGTTGCCGCTAACAAGGCTCCTGATCTTCAACCATTTCCTGACGTATGGATTCCATTTAATGACTCACTTGATATGCTTGCTGGTTATTCGCCTGGGTATAAAAAAATAACAGTTGGTGAAGATGTTATCACAATGCCTTCTGATAAGGTTGTTAGTTTCTCGCGTGCGTCAAATGCAACATACATAAATAAGCATGGTGAATTTTGTATCGCCAATATTGATGAACCTAGATTTGAAAAGCAAGGACTCTTAATTGAAGGCCAGCGGACAAATCACATTACTTTCAGTAATGACCCCGCTTCATTAAATACAGATAAATACCGTAGTGATGTTACTTATAATGTTGATAAGTATGGTTTTGCATATGCAACGGCAATAGCAAACGAAAATTCACAAGGTGAATATCCTTCATTATTTTATTGTGAAACAGTAAATGCAATCAACTGTCAGCAAAATGAATACGTTTCTTTATCTATACGAGTAAAGGCAAACTTGGATATCTATATCACCCCACAATTTTATTTAGTAGGTGAGGATGGAGGTCTTATTCTCGTCGCTAGATCTTTCATAAATTGCGAAACCGGCGAAGTTTCTTCTGTAGTAGAAGGGAGGGGGACTATAGCACATAGAATATATAGAGAAGACAACGGATGGTTGAAAGTTGAAGCTATGTGTAAATTTGTAGAACGTGGAGGTAGTTCTATTGGATCTGTAAATTATTGTCGGAATAATGATCAACCTGCGCAAGTTGGGGATACAATATCATTTTGTACTCCTCAATTTGAAAAGGGTTTTTGTGCATCCTCCTTCATTATTACGGGAAGCACGCCTGCAACAAGGGCACTGGATTATGTTACTATACCTGCAAGAAATAATTTCTCAGGGACGAATATTTCATTCCTTGCTGAGGTAAGTATTAACTGGGATAGCTTTGAATTAGTTAATACATACCCTATGATAATAGATAATAGTAAATATAATATACCAGGGGAATCTTTTGTATCGGAGATGCTTATAGCTACAAGAGTGCCTAGCGTTTACTTTTTAAATAAGGAAACTGGACGTTCTACAGTCTCAAACGGATCTTCATTTAGTGAGGTAGGTATCCCATCCGTATGGGGATTTATACATACAAAAGATGGAGATGTAACATCGTTTTTGAATGGTTTTAAGAATATAACATCCTCTGGTTCAACGTGGGAAGGACTATCCCCGGATTCCTTGCTGGAGATAGGCGGTAGACCTTCAGATTCAACTAAACTGTATGGTCATATTCGTAACCTTAGAATATGGAATCGAGTATTAACGGATAGTCAAATGAGGGAGGGAGTTTAA

Genome Context

Tertiary structure

PDB ID

5975cee13ff7fedc33ff35ebf01d1ffed2002dbf1a95308d446433ca326cdee1

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,8018

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence