Protein

View in Explore

Genbank accession

WOZ56054.1 [GenBank]

Protein name

tail fiber protein

RBP type

Evidence Phold

Probability 1,00

TSP

Evidence DepoScope

Probability 1,00

Evidence RBPdetect

Probability 0,90

Evidence RBPdetect2

Probability 0,96

Protein sequence

MSTKFKTVITTAGAAKLAAATAPGGRKVNITTMAVGDGGGKLPVPDAGQTGLIHEVWRHTLNKISQDKRNSNYIIAELVIPPEVGGFWMRELGLYDDAGTLIAVANMAESYKPALAEGSGRSQTCRMVIIVSSVASVELTIDTTTVMATQDYVDDKIAEHEQSRRHPDASLTAKGFTQLSSATNSTSETLAATPKAVKAAYDLANGKYTAQDATTARKGLVQLSSATNSTSETLAATPKAVKAAYDLANGKYTAQDATTARKGLVQLSSVTNSDSETLAATPKAVKTAYDLANGKYTAQDATTARKGLVQLSSATNSDSETLAATPKAVKSAYDNAEKRLQKDQNGADIPGKDTFTKNIGACRAYSGALSTEAGNWTTAQFIEWLDSRGAFNHPYWMCKGSWSYANNKIITDTGCGDIHLAGCVVEVMGTKSAITIRVTTPTTSSGGGTTSAQFTYINHGDGYSPGWRRDWNRQGDSMTGTINQDGGSQNAYMSTALCSGTRGGKKYLRKFRGGEGDTIWHETVQGGVVRWATGNTDAQEELSLSSAYGLRSRGEITSLSANGLRIAYGNYGFFIRNDGSSTYFMLTKSGDRLGTYNNLRPLIINDATGAVSMGHGLSVTGDIVSSTKVRAGSGKKFTVSSSNTSTKEAAFNLWGNSSRPVVAELGDDAGWHFYSQRNTDNSITFAVNGQVSPSNYSNFDSRYARDIRLGTRVVQTMQKGVMYEKAGHVITGLGIVGEVDGDDPAVFRPIQKYINGTWYNVAQV

Physico‐chemical properties

protein length:	764 AA
molecular weight:	81329,55960 Da
isoelectric point:	8,90800
aromaticity:	0,07723
hydropathy:	-0,38390

Domains

Domains [InterPro]

IPR051934
Unmapped
1–201

IPR051934 IPR005068 IPR005068 IPR005068 DC_0128

IPR022225
ATT
1–151

IPR022225 IPR005068 DC_1371 IPR048390

DC_1371
STR
1–256

DC_1371

WOZ56054.1

1 764

Architecture

ATT

STR

RBD

ATT

RBD

ATT 1-151 | STR 152-456 | RBD 473-500 | ATT 501-604 | RBD 605-740 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
IPR051934	Unmapped	-	1	201	InterPro	Bacteriophage Tail Fiber Structural Protein	-	-	-	-
IPR022225	ATT	DC_0271	1	151	InterPro cluster	Phage tail fibre protein, N-terminal domain	Central	Medium	Text match	271 proteins / 271 hits
DC_1371	STR	DC_1371	1	256	Novel HMM	DC_1371	Central	Low	Positional only	130 proteins / 130 hits
IPR005068	STR	DC_0738	170	211	InterPro cluster	Bacteriophage lambda, Tail fiber protein, repeat-2	Central	High	Text match	217 proteins / 347 hits
IPR005068	STR	DC_0738	214	255	InterPro cluster	Bacteriophage lambda, Tail fiber protein, repeat-2	Central	High	Text match	217 proteins / 347 hits
DC_1371	STR	DC_1371	250	456	Novel HMM	DC_1371	Central	Low	Positional only	130 proteins / 130 hits
IPR005068	STR	DC_0738	258	299	InterPro cluster	Bacteriophage lambda, Tail fiber protein, repeat-2	Central	High	Text match	217 proteins / 347 hits
IPR005068	STR	DC_0738	302	342	InterPro cluster	Bacteriophage lambda, Tail fiber protein, repeat-2	Central	High	Text match	217 proteins / 347 hits
DC_0128	RBD	DC_0128	473	740	Novel HMM	DC_0128	C-terminal	Low	Positional only	16 proteins / 16 hits
IPR048390	ATT	DC_0836	501	604	InterPro cluster	Long-tail fiber proximal subunit, trimerization domain	C-terminal	Medium	Text match	656 proteins / 656 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

WOZ56054.1

1 764

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	245	245	0,9732
Central domain	246	444	200	0,1616
C-terminal	445	764	319	0,8572

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-245

Central
246-444

C-terminal
445-764

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Yersinia phage vB_YpM_117 [NCBI]	3092592	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Yersinia pestis EV76-CN [NCBI]	665028	Pseudomonadota > Gammaproteobacteria > Enterobacterales > Yersiniaceae > Yersinia > Yersinia pestis

Coding sequence (CDS)

Genbank protein accession

WOZ56054.1 [NCBI]

Genbank nucleotide accession

OR545057.1 [NCBI]

CDS location

range 12737 -> 15031
strand +

CDS

ATGAGCACAAAATTCAAAACCGTTATCACCACTGCCGGTGCAGCAAAGCTGGCAGCGGCAACCGCACCGGGAGGGCGGAAGGTCAACATTACCACGATGGCCGTCGGGGATGGCGGTGGTAAATTGCCTGTCCCGGATGCCGGACAGACCGGGCTTATCCACGAAGTCTGGCGACATACGCTGAACAAAATCAGCCAGGACAAACGAAACAGTAATTATATTATCGCAGAGCTGGTTATTCCGCCGGAGGTGGGCGGTTTCTGGATGCGTGAGCTTGGCCTGTACGATGATGCGGGAACGTTAATTGCCGTGGCGAACATGGCCGAAAGTTATAAGCCAGCTCTTGCCGAAGGCTCAGGGCGTTCGCAGACCTGTCGCATGGTCATCATCGTCAGCAGTGTGGCCTCGGTGGAGCTGACCATTGACACCACAACGGTGATGGCGACACAGGATTACGTTGATGACAAAATTGCAGAGCACGAACAGTCACGACGTCACCCGGACGCCTCGCTGACCGCCAAAGGTTTTACTCAGTTAAGCAGTGCGACCAACAGCACGTCTGAAACACTGGCCGCAACGCCGAAAGCGGTAAAGGCCGCGTATGACCTTGCTAACGGGAAATATACTGCGCAGGATGCCACCACAGCGCGAAAAGGTCTTGTCCAGCTCAGTAGTGCCACCAACAGCACGTCTGAAACGCTCGCCGCAACACCAAAAGCGGTAAAGGCCGCGTATGACCTTGCTAACGGGAAATACACTGCACAGGACGCCACCACAGCGCGAAAAGGTCTTGTCCAGCTCAGTAGCGTCACCAACAGCGATTCTGAAACGCTTGCGGCAACACCAAAGGCGGTTAAGACAGCGTATGACCTTGCTAACGGGAAATACACTGCACAGGATGCCACCACGGCGCGAAAAGGGCTTGTCCAGCTCAGTAGCGCCACCAACAGTGATTCTGAAACCCTCGCGGCAACGCCAAAAGCAGTGAAGTCTGCCTATGACAATGCTGAAAAACGTCTTCAGAAAGATCAGAACGGTGCGGATATTCCGGGAAAGGATACCTTCACGAAAAATATCGGTGCCTGTCGTGCTTATAGCGGCGCTTTGAGCACTGAAGCCGGAAACTGGACAACCGCTCAGTTTATTGAATGGCTGGATTCCCGTGGTGCATTTAATCATCCGTACTGGATGTGCAAAGGCTCCTGGTCATATGCAAATAACAAAATCATTACGGATACCGGATGTGGTGATATCCACCTGGCTGGTTGTGTCGTCGAGGTCATGGGAACTAAATCTGCAATCACTATCCGAGTGACCACGCCGACAACATCAAGTGGTGGCGGTACAACCAGCGCGCAATTCACTTACATTAATCATGGGGACGGCTACTCCCCCGGCTGGCGTCGTGACTGGAATCGTCAGGGCGACTCAATGACCGGAACGATTAATCAGGATGGCGGAAGCCAGAATGCCTATATGTCTACGGCCTTATGTTCAGGCACCAGAGGCGGCAAAAAATATCTCAGAAAGTTTCGTGGTGGAGAAGGAGACACTATCTGGCATGAAACAGTACAGGGCGGGGTAGTTCGCTGGGCGACTGGTAATACTGATGCTCAGGAAGAATTATCACTCAGCTCCGCTTATGGTCTCCGTTCAAGAGGTGAGATTACATCACTCAGTGCTAATGGTCTGCGCATTGCTTATGGCAATTATGGATTCTTTATCAGGAATGATGGCAGCAGCACTTATTTTATGTTGACTAAATCAGGTGACAGATTAGGTACTTATAATAATTTAAGACCACTGATTATAAATGATGCCACGGGTGCTGTATCAATGGGGCATGGCCTGAGTGTTACTGGTGATATTGTCTCAAGTACCAAAGTACGTGCCGGTAGCGGGAAAAAATTCACGGTCAGCAGCAGTAATACATCCACGAAGGAAGCCGCATTCAATTTGTGGGGAAACTCAAGTCGTCCGGTGGTGGCTGAATTAGGTGATGATGCAGGCTGGCATTTTTACAGTCAGAGAAATACAGATAACAGCATCACTTTTGCTGTTAACGGTCAGGTATCACCATCTAACTATAGTAATTTTGATTCCCGTTATGCACGCGATATCCGGCTTGGGACTCGAGTTGTCCAGACCATGCAGAAAGGGGTGATGTATGAGAAAGCAGGGCACGTAATTACCGGGCTTGGTATTGTCGGTGAAGTCGATGGTGATGACCCCGCAGTATTCAGACCAATACAAAAATACATCAATGGCACATGGTATAACGTCGCACAGGTGTAA

Genome Context

Tertiary structure

PDB ID

13e78a49250ead181e5699019203085789dfbe530623b66c996f344f4ed651b3

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,7279

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence