Protein

View in Explore

Genbank accession

WYM30818.1 [GenBank]

Protein name

tail fiber

RBP type

Evidence UniProt/TrEMBL

Probability 1,00

Evidence GenBank

Probability 1,00

TSP

Evidence DepoScope

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,88

Evidence RBPdetect2

Probability 0,87

Protein sequence

MSRELMPKSGIMMPHVVVTRDAAVVGVSTVDGQTGAINLTGKYLQKTDAAATYQTKTEGASKDFVLDSIQPIMSGALFREDPWVVNDTPFRSTGANGVESVDMMKVTTDNSIKIGSYASSVQGVEIHSAGRLQVVDQNDSGVETKYPVYSKRYRPEIEDLPFAAIGSYVKDSKGRTVGVTRTGINSDIKQLTQKVTFTQPVTVPDAVGDYDAVTLRQLRNSGGGSGGPTMSGISNFGIGDFHLRDSRAFIPAFEVVSDGQLLNRADYPDLWAYAQLLSPIEDSLWLSNIYQRGRYSTGNGTTTFRVPDRNGIQEGSLRALYGRGDGGNSAANGQVFDSAAPNITYASPHTMVTLASAPGQVATNGAIQSITSTDDVAPVGAGGKYISTNFDASRSSPIYGRSTEEILTRNFVGVWTIRAHGGFTAANTSWSVINSDANRPAGGTRVTSGSVVSEYKIGSEVEASTTLQTDAYIDGAYYGIINVYNKTKGVTKQLAFDDSGTLNSDRYVARSRTLMSWSETGSRRGTFSIDNQGVGANYSFNSILSASQASQGGYKTTTHVGMIHNDAGSFADSCWHVSGDEDNKYGCRLTLRPNRNEIYYYTWQPSSTGTYTLAMNPVSDEKLKHNIQDISPDEAIRAIKGLDFKSFVYNNDNQGRTRRGIIAQQAEKVEPLYVKTRKFHDNDGVEQEQKELDATPMLLDTMQVVQDLLKRIEVLEAKLAEK

Physico‐chemical properties

protein length:	722 AA
molecular weight:	78344,06300 Da
isoelectric point:	5,80738
aromaticity:	0,08310
hydropathy:	-0,42645

Domains

Domains [InterPro]

DC_1514
STR
20–377

DC_1514 DC_1985

IPR030392
CHP
619–719

IPR030392

IPR030392
CHP
619–671

IPR030392

WYM30818.1

1 722

Architecture

STR

RBD

STR 20-377 | RBD 440-722

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_1514	STR	DC_1514	20	377	Novel HMM	DC_1514	Central	Low	Positional only	115 proteins / 115 hits
DC_1985	RBD	DC_1985	440	722	Novel HMM	DC_1985	C-terminal	Low	Positional only	107 proteins / 107 hits
IPR030392	CHP	DC_0088	619	719	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits
IPR030392	CHP	DC_0088	619	671	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

WYM30818.1

1 722

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	125	125	0,5509
Central domain	126	324	200	0,2176
C-terminal	325	722	397	0,9223

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-125

Central
126-324

C-terminal
325-722

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Escherichia phage EC.W14-3 [NCBI]	3135715	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Escherichia coli [NCBI]	562	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales

Coding sequence (CDS)

Genbank protein accession

WYM30818.1 [NCBI]

Genbank nucleotide accession

PP496998.1 [NCBI]

CDS location

range 33526 -> 35694
strand -

CDS

ATGTCTAGAGAATTAATGCCCAAATCTGGTATAATGATGCCTCATGTGGTTGTAACCAGAGACGCGGCTGTTGTTGGGGTTTCTACTGTAGATGGACAGACTGGAGCTATTAACCTCACCGGAAAATATTTACAGAAAACCGACGCAGCTGCTACCTATCAAACTAAAACAGAGGGTGCATCTAAAGATTTTGTGCTGGATTCGATTCAACCTATTATGTCTGGTGCGCTGTTCCGAGAAGACCCTTGGGTTGTTAATGATACCCCATTCCGTTCTACTGGAGCTAATGGTGTAGAATCAGTTGATATGATGAAAGTTACTACTGATAACTCAATCAAGATTGGTAGTTATGCCTCTTCAGTTCAAGGTGTAGAGATTCATTCTGCTGGTCGTCTTCAGGTTGTTGACCAGAATGACTCTGGGGTAGAAACTAAGTATCCAGTTTATTCTAAACGTTACCGTCCTGAGATTGAGGATTTGCCTTTTGCTGCAATTGGTTCTTATGTTAAAGACTCTAAAGGTCGTACGGTAGGTGTTACTCGTACAGGGATTAACTCTGATATCAAACAGCTCACACAGAAAGTTACTTTCACTCAACCAGTAACTGTCCCTGATGCAGTTGGTGATTATGATGCGGTTACTTTGAGACAGCTTCGAAACAGTGGTGGTGGCTCTGGTGGTCCTACGATGAGCGGTATCTCTAACTTTGGTATTGGTGATTTCCATTTACGTGACAGTCGAGCTTTCATCCCAGCTTTTGAGGTTGTGTCGGATGGGCAGCTTTTGAATCGTGCTGACTACCCAGATTTATGGGCTTATGCACAACTGCTATCCCCAATTGAAGACTCTCTTTGGTTGTCTAATATCTATCAGAGGGGTAGGTATTCTACCGGAAATGGTACAACAACTTTCCGTGTTCCTGACCGAAATGGTATCCAAGAGGGGTCACTGAGAGCTTTATATGGCCGTGGTGATGGTGGTAATTCTGCTGCAAATGGCCAAGTGTTTGATTCTGCTGCACCGAATATCACATATGCGTCCCCTCACACAATGGTAACACTAGCCTCCGCTCCGGGGCAGGTGGCGACTAACGGGGCAATTCAATCAATCACCTCTACAGACGATGTGGCTCCAGTGGGGGCTGGAGGTAAATACATATCCACAAACTTTGACGCATCGCGTTCCAGTCCTATTTATGGTCGCTCCACTGAGGAGATTCTGACCCGTAACTTTGTAGGTGTTTGGACTATTCGTGCTCATGGAGGTTTTACTGCTGCTAACACCTCTTGGTCAGTTATTAACAGTGATGCAAACCGTCCTGCTGGTGGAACTAGGGTAACTAGCGGTTCAGTTGTTTCTGAATATAAAATAGGTTCAGAAGTAGAAGCCTCTACTACGCTCCAAACTGATGCTTATATCGACGGAGCTTATTATGGGATTATCAATGTTTATAATAAAACCAAAGGAGTTACCAAGCAATTAGCTTTTGACGATTCTGGAACCCTGAACTCTGATAGATATGTTGCTCGGTCTAGAACATTGATGTCTTGGAGTGAAACAGGAAGTCGCAGAGGGACGTTTTCTATAGACAACCAAGGGGTTGGTGCTAACTACTCTTTTAACTCTATACTGAGTGCTTCCCAAGCATCCCAAGGTGGATACAAAACTACTACCCATGTAGGGATGATTCACAATGATGCTGGATCTTTTGCTGATTCCTGTTGGCATGTTTCGGGAGATGAAGACAACAAATATGGTTGTCGTTTAACTCTCCGACCAAACAGGAACGAGATTTACTACTACACTTGGCAGCCAAGTTCAACCGGAACTTATACTCTTGCTATGAATCCTGTATCTGATGAAAAGTTGAAACATAACATCCAAGATATCTCTCCTGATGAAGCAATTCGTGCGATAAAAGGTTTGGATTTCAAATCGTTTGTGTACAACAATGATAATCAAGGAAGAACTCGTCGTGGTATCATTGCACAGCAGGCAGAGAAAGTTGAACCTCTTTATGTTAAAACTCGTAAATTCCATGACAACGATGGGGTAGAGCAGGAACAGAAAGAGTTGGATGCAACTCCAATGCTTTTAGATACCATGCAGGTTGTTCAAGATCTGCTGAAGCGTATTGAAGTTCTAGAAGCGAAGTTAGCAGAGAAGTGA

Genome Context

Tertiary structure

PDB ID

5eaa8c6c5dd8c3bff8b93788e2c2bd27c8644357b4d91aaff7454c623cb7030b

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,6049

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence