Protein

View in Explore

Genbank accession

YP_009196676.1 [GenBank]

Protein name

tail fiber protein

RBP type

TSP

Evidence DepoScope

Probability 1,00

Evidence GenBank

Probability 1,00

Evidence Phold

Probability 1,00

Evidence RBPdetect

Probability 0,85

Evidence RBPdetect2

Probability 0,96

Evidence UniProt/TrEMBL

Probability 1,00

Protein sequence

MALYREGKAAMAADGTVTGTGTKWQSSLSLIRPGATIMFLSSPIQMAVVNKVVSDTEIKAITTKGAVVASTDYAILLSDSLTVDGLAQDVAETLRYYQSQETVIADAVEFFKNFDFDSLQNLANQVKQDSEFAGASATAAAASETAAKTSETNAKASENKAKTSETNAKASETAAKTSETNAKASETAAKTSETNAKSSENKAKTSETNAKASETAAKTSETNAKASENKAKTSETNAKASETAAKTSETNAKASENAANSAKNDAQTAKGQTQNLRDQVVDLVAGVQVPDKIAGTFAREKWMKIAKVKSAGDGYAFAQFIIGGGTGYGSANLPVDIFSLSGRGLPASPLTSDNIDIWFTQRTLIAARPSDTRRINLGVVKNTDSSFDVYLHASGGWVPELWLNHVNVQANNGSITGPIIDRTGYTWIDTEPSGIVYNSQSDYLMANDNTIPRTNVANTFSQPQAISVPGGNATLTLNGCVVRANNSNAIVYATPENGQGMYFRPNGDTNSAKQVVFDASNFSVTGLNANFSNAVTMSSTLRVNGAASLLGGVNVNGSINSNGVVSKNGDIKTDSGNIELYNASPLIDFHFNKSNADFTARIINDAVDQLTFDCRSVRAMNDFTARGLIRACHNDAFVAWPIEDPNGGNGAILKAPSFISRFNVNGNAARCAMWLEEHRGYEHRAVIEVSKWGDSGTTQYWQFKSDGKISSTANGEVVFAGLSDINYKDNVVAYDGLQSLENIKAMNLVKFTYKDDAKKRERRGVIAQQVRNIDSCYVKESNASYQDDEGNVVENKKLVLDNNALLLDAICAIKSLSAQVDELKEEIKNLKG

Physico‐chemical properties

protein length:	832 AA
molecular weight:	88835,42960 Da
isoelectric point:	5,54757
aromaticity:	0,06971
hydropathy:	-0,37584

Domains

Domains [InterPro]

DC_0036
ATT
1–170

DC_0036 DC_1159

DC_0849
ATT
165–213

DC_0849 Coil IPR030392

IPR030392
CHP
723–773

IPR030392 Coil

YP_009196676.1

1 832

Architecture

ATT

STR

ATT 1-213 | STR 214-831 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0036	ATT	DC_0036	1	170	Novel HMM	DC_0036	N-terminal	Low	Positional only	41 proteins / 41 hits
DC_0849	ATT	DC_0849	165	213	Novel HMM	DC_0849	N-terminal	Low	Positional only	30 proteins / 30 hits
DC_1159	STR	DC_1159	203	831	Novel HMM	DC_1159	Central	Low	Positional only	94 proteins / 94 hits
Coil	Unmapped	-	252	279	Coils	Coil	-	-	-	-
IPR030392	CHP	DC_0088	723	827	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits
IPR030392	CHP	DC_0088	723	773	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits
Coil	Unmapped	-	806	826	Coils	Coil	-	-	-	-

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

YP_009196676.1

1 832

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	344	344	0,6833
Central domain	345	543	200	0,5260
C-terminal	544	832	288	0,8158

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-344

Central
345-543

C-terminal
544-832

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Klebsiella phage Sushi [NCBI]	1675609	Uroviricota > Caudoviricetes > Drexlerviridae > Webervirus sushi >
Host	Klebsiella pneumoniae [NCBI]	573	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales

Coding sequence (CDS)

Genbank protein accession

YP_009196676.1 [NCBI]

Genbank nucleotide accession

NC_028774.1 [NCBI]

CDS location

range 21004 -> 23502
strand -

CDS

ATGGCACTATACAGAGAAGGCAAAGCGGCTATGGCCGCAGACGGAACCGTTACCGGGACTGGCACAAAATGGCAATCTTCGCTTTCGCTGATTCGCCCCGGCGCGACGATTATGTTTTTGTCGTCACCGATTCAAATGGCCGTCGTAAACAAGGTGGTTAGCGATACTGAAATTAAAGCCATCACCACAAAAGGCGCTGTCGTAGCGTCTACAGATTACGCGATCCTGTTAAGCGACTCGCTAACCGTTGACGGCCTGGCGCAAGATGTTGCCGAAACTCTGCGCTACTATCAGTCACAGGAAACCGTAATTGCGGATGCAGTCGAGTTCTTCAAGAACTTTGATTTCGATTCCCTGCAAAATCTTGCCAATCAGGTTAAGCAAGATTCTGAATTTGCTGGCGCAAGCGCTACGGCTGCGGCGGCATCTGAAACCGCTGCAAAGACTTCAGAGACCAATGCAAAAGCATCTGAAAATAAGGCGAAGACCTCGGAGACAAATGCGAAGGCATCCGAAACAGCCGCAAAGACTTCAGAGACAAATGCGAAGGCATCAGAAACCGCAGCTAAGACCTCGGAGACGAACGCTAAATCTTCGGAAAATAAGGCCAAAACTTCAGAGACCAACGCGAAGGCATCAGAAACCGCAGCTAAGACCTCGGAGACAAATGCAAAGGCATCCGAAAATAAGGCGAAGACCTCGGAGACGAACGCCAAGGCTTCAGAAACCGCAGCGAAGACCTCGGAGACTAATGCAAAGGCGTCAGAGAATGCGGCCAACTCCGCGAAGAACGACGCGCAAACTGCGAAGGGTCAGACGCAAAATCTTCGGGATCAGGTTGTCGACCTTGTGGCTGGCGTTCAGGTGCCTGATAAAATTGCTGGCACTTTCGCTAGGGAGAAGTGGATGAAGATCGCCAAAGTCAAGAGCGCTGGTGATGGCTATGCTTTTGCTCAGTTCATCATTGGCGGAGGCACTGGTTATGGCTCTGCAAATCTCCCGGTTGATATCTTTTCTCTTTCTGGTCGCGGCCTTCCAGCTTCACCGCTAACAAGTGATAACATTGACATTTGGTTTACTCAGCGCACCCTAATTGCTGCCAGACCAAGCGACACCAGACGCATTAATCTTGGGGTGGTGAAAAACACAGACTCCTCGTTTGATGTTTATCTTCATGCTTCCGGCGGATGGGTTCCTGAACTGTGGTTGAATCATGTAAACGTACAGGCTAACAATGGGTCGATTACGGGGCCAATCATCGATCGCACTGGTTACACCTGGATTGACACGGAGCCATCCGGGATTGTATATAATTCACAATCTGATTATTTGATGGCTAACGATAACACGATCCCGCGCACCAACGTAGCTAACACGTTCAGTCAGCCGCAGGCAATTAGCGTCCCTGGAGGAAACGCCACGCTTACCCTGAACGGTTGTGTAGTTAGGGCCAATAACAGTAATGCGATCGTGTACGCAACCCCTGAAAATGGTCAGGGGATGTACTTCCGCCCTAATGGTGATACGAACAGCGCGAAGCAGGTTGTTTTTGATGCATCAAACTTTAGTGTTACCGGATTGAATGCAAACTTTAGCAATGCTGTTACAATGTCAAGCACGCTGCGCGTTAATGGGGCTGCCAGCCTTCTCGGTGGCGTAAATGTTAATGGAAGCATCAATAGTAATGGCGTAGTGTCAAAAAATGGGGATATTAAAACAGATAGCGGAAACATCGAACTTTACAATGCATCGCCGCTTATCGACTTTCACTTTAACAAATCGAACGCGGATTTCACGGCGAGGATTATAAACGACGCAGTAGATCAGCTAACTTTTGATTGCAGAAGCGTGCGCGCGATGAATGACTTCACGGCGCGAGGGCTAATTAGGGCTTGCCATAATGACGCATTCGTTGCCTGGCCCATTGAAGATCCAAATGGAGGCAATGGGGCTATCCTTAAAGCTCCATCATTTATCTCACGGTTCAACGTTAATGGTAACGCTGCGCGTTGCGCTATGTGGCTTGAGGAGCACAGGGGGTATGAACATCGCGCCGTCATTGAGGTAAGCAAGTGGGGTGATAGCGGTACTACGCAGTATTGGCAGTTTAAATCAGATGGTAAAATTTCAAGCACTGCTAATGGTGAGGTTGTTTTTGCTGGCCTTTCTGACATTAACTACAAAGACAATGTTGTTGCTTATGATGGTTTGCAGTCACTCGAAAACATCAAAGCAATGAATCTTGTCAAGTTCACCTATAAGGATGATGCTAAGAAACGCGAGCGTAGGGGGGTTATTGCACAGCAGGTGAGAAATATCGATTCGTGCTACGTTAAAGAAAGCAACGCATCCTATCAGGATGATGAGGGTAACGTAGTTGAAAATAAGAAACTTGTGCTTGACAATAACGCGCTTTTGTTGGATGCAATTTGCGCAATCAAATCTCTGTCTGCGCAAGTAGATGAACTGAAAGAGGAGATCAAGAATCTGAAGGGGTAA

Genome Context

Tertiary structure

PDB ID

0fce6ae8cd9051c0fd0518cdbc5b8bf612b1c34f7a4567b0decce3bc9ef96895

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,6303

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence