Protein

View in Explore

Genbank accession

WDS30446.1 [GenBank]

Protein name

tail fiber

RBP type

Evidence GenBank

Probability 1,00

TSP

Evidence DepoScope

Probability 1,00

Evidence RBPdetect

Probability 0,88

Evidence RBPdetect2

Probability 0,95

Protein sequence

MAIYKTGQASVSADGVVTGYGTKWKDALSLIRKGCTIAFATSPTTFATISDIRTDTEMTVTDAPGVEIPRGDYVILLTTSITVDGLAQDVAETLRYYQGRETQYEQFVEFLENFDWEKFETVTQDVKANADAAQASADAAKTSETKAAASASAAKTSETNAANSAASIGNAERNAAASAAAAKTSETNAAASASAAAGSASAAKTSETNAKTSETNAASSATAANNSKTAAATSATNAAGSATSASNSASAAKTSETNAASSASAAKTSETNAAASASAAAGSATTAKNEADRAKSLADSLDTSKLMMKGNNLSDVASVSQARANLGLGDASNVNFNSVTTSGYINATRTSDTPTRSPAITSRIVGSNGTVLAQAELWADTNSKSVALVNRNPTAPRFFMINDDGSVNPSGRIISNYGADYAMNLAAPILDARNGYVNTIASSNSVNCHVYFKNADERNRGVIYCNDNQVINIRPDNVGTGAIGSTLSINGANGVCTAVQFSSTSDERAKFWIKPVTDALDKVCSLKGVTYSMHTTTQNTVRNAGLIAQDVQKVLPEAVHVGEVGKTLDKNCFEVEDPLSLDYNAMSALYVEAFKEVRSEMQAMRDEIQSLKAEIELLKNPQ

Physico‐chemical properties

protein length:	622 AA
molecular weight:	64492,14980 Da
isoelectric point:	5,05091
aromaticity:	0,05305
hydropathy:	-0,27540

Domains

Domains [InterPro]

DC_0036
ATT
1–183

DC_0036 DC_0022

DC_0401
STR
171–244

DC_0401 IPR030392 Coil

IPR030392
CHP
505–608

IPR030392

WDS30446.1

1 622

Architecture

ATT

STR

ATT 1-183 | STR 184-622

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0036	ATT	DC_0036	1	183	Novel HMM	DC_0036	N-terminal	Low	Positional only	41 proteins / 41 hits
DC_0401	STR	DC_0401	171	244	Novel HMM	DC_0401	Central	Low	Positional only	66 proteins / 66 hits
DC_0022	STR	DC_0022	230	622	Novel HMM	DC_0022	Central	Low	Positional only	38 proteins / 38 hits
IPR030392	CHP	DC_0088	505	560	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits
IPR030392	CHP	DC_0088	505	608	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits
Coil	Unmapped	-	594	621	Coils	Coil	-	-	-	-

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

WDS30446.1

1 622

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	140	140	0,9879
Central domain	141	339	200	0,7952
C-terminal	340	622	282	0,8960

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-140

Central
141-339

C-terminal
340-622

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Cronobacter phage SG01 [NCBI]	2973489	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Cronobacter sakazakii [NCBI]	28141	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales

Coding sequence (CDS)

Genbank protein accession

WDS30446.1 [NCBI]

Genbank nucleotide accession

OP120783.1 [NCBI]

CDS location

range 21769 -> 23637
strand -

CDS

ATGGCTATTTACAAAACCGGGCAGGCATCGGTTAGCGCCGATGGCGTCGTTACAGGTTACGGCACTAAATGGAAAGACGCGCTTTCTCTGATCCGCAAAGGCTGCACCATTGCTTTTGCCACCAGCCCGACCACTTTCGCAACTATCAGTGATATCAGAACCGATACTGAGATGACGGTAACGGATGCCCCCGGCGTGGAAATTCCTCGCGGCGACTACGTGATCCTGTTAACAACCTCCATAACCGTTGACGGCCTGGCGCAAGATGTGGCGGAAACCCTTCGCTATTATCAGGGCCGGGAGACCCAATACGAGCAATTCGTCGAGTTCCTTGAAAACTTCGATTGGGAAAAGTTTGAAACGGTCACGCAAGATGTGAAGGCTAACGCTGATGCCGCCCAGGCAAGCGCAGACGCTGCCAAGACCAGCGAAACCAAAGCTGCCGCCAGCGCATCGGCTGCAAAAACGAGTGAGACGAATGCCGCCAATAGTGCGGCAAGCATTGGCAATGCTGAAAGAAATGCTGCTGCCAGCGCTGCCGCTGCCAAGACCAGCGAAACGAACGCGGCGGCAAGCGCCTCTGCGGCGGCTGGTAGTGCTTCTGCGGCAAAGACCAGCGAGACAAATGCAAAGACCAGCGAAACCAACGCTGCGTCCAGCGCTACCGCCGCAAACAACAGCAAAACCGCCGCTGCGACTTCCGCAACCAATGCCGCAGGTAGTGCTACCTCTGCGTCTAACAGCGCATCAGCGGCCAAGACCAGCGAAACCAATGCTGCGTCCAGCGCTTCTGCGGCAAAGACCAGCGAAACCAACGCCGCCGCCAGCGCATCGGCTGCTGCCGGATCTGCAACGACAGCGAAGAATGAAGCTGATCGCGCAAAGAGTCTGGCAGACAGCCTGGATACCTCCAAGCTGATGATGAAGGGAAACAACCTTTCAGATGTTGCCAGTGTTTCACAAGCAAGGGCTAATCTTGGCCTGGGGGATGCGAGCAACGTTAACTTTAATAGCGTTACAACCTCTGGTTATATTAATGCAACAAGGACAAGTGACACACCAACTAGAAGCCCGGCCATCACATCAAGGATTGTCGGAAGTAATGGAACCGTTCTTGCTCAGGCTGAGTTGTGGGCCGATACCAATTCGAAATCAGTCGCCCTGGTAAATAGAAACCCAACAGCGCCGCGTTTTTTTATGATTAACGACGATGGATCTGTGAACCCATCCGGCAGGATAATATCTAATTATGGCGCTGACTACGCTATGAATCTTGCCGCTCCTATACTGGATGCAAGAAACGGATATGTAAACACGATCGCGTCGTCAAACAGCGTAAACTGTCACGTTTATTTTAAGAATGCTGACGAAAGAAATCGCGGAGTCATATATTGCAACGATAACCAGGTTATCAACATTCGACCGGACAACGTTGGAACTGGCGCAATTGGCAGCACATTAAGCATCAATGGAGCAAATGGTGTTTGTACTGCCGTACAGTTTTCGTCAACTTCTGATGAGCGCGCAAAGTTCTGGATCAAGCCAGTAACAGACGCTCTAGATAAGGTTTGTTCGTTGAAAGGCGTTACATATTCAATGCACACAACGACGCAAAACACTGTCAGGAACGCCGGTCTTATTGCCCAAGATGTACAGAAAGTATTGCCGGAAGCTGTTCACGTTGGCGAGGTTGGCAAGACGCTTGATAAAAATTGCTTTGAGGTAGAGGATCCGTTAAGCCTTGACTACAACGCTATGTCAGCGCTTTATGTGGAAGCATTTAAGGAGGTCAGATCGGAGATGCAGGCGATGAGAGATGAAATTCAGTCTCTAAAAGCGGAAATTGAGTTGCTTAAGAATCCACAATAA

Genome Context

Tertiary structure

PDB ID

aa3349a6a935225affcc690cf34e4481f2e9d3ff36f370946b07c006ec582a3e

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,7166

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence