Protein

View in Explore

Genbank accession

UPW35688.1 [GenBank]

Protein name

tail fibers protein

RBP type

Evidence GenBank

Probability 1,00

TSP

Evidence DepoScope

Probability 1,00

Evidence RBPdetect

Probability 0,72

Evidence RBPdetect2

Probability 0,94

Protein sequence

MADLKAGTTVGGNTIWSQANLPLLPSGNTITYKGFKIYTENDKPTKAEIGLGNVTNDAQVKKAGDTMQGTLELQGSATELKLPFRIAMVRATEPYLVATRTDNNPVTNGFPSAETRTFVIHSKTTSPTSDPNAGANLVDLICTQRPAGGGAYYIRAFGAPNTTTGAAGAIRAELQMLGDNGLVSLTGTQLNIGMQTVVNGTIFGTQMSIKGDSNRNLYFQDAAGNELGLIYADTGKNVYVRSGGGAYATRFASDGTLVLANHLTVPGQATFNGMGVFNNRASVGVDYDSQGTNSAILRVDTSGDGNGVGDGVTHLGYKDGNGRYNHYFRGTGSVYLTNKLGTIFTSQSYYNDVPQGTPAQYFLPTVGQGAKNYLRQFRGGNADTIWHETVQGGTYRLATGNTDAQEEFQITSAGNIRARVEVQSSSCGSAGQFRAVQGDYGFFIRNDGNNTYFMLTPSGNPYGTWGTLRPLTISNSAGTVTMSNGVNVGSGLDVSGAAKFNNGLGCGTANGLGATAISLGDNDTGFVQEGDGILNAYANSQRIMRWTTGATANYKQLQVQGVNGPALLLNNTATNQSCYLLITLAGNNGAYFGFGGADDNVSVHNYRLNTTLQLRASDLYMNRGLYVEGNVNANDVYIRSDIRLKSNLVELKDSLSKIEHLKGYIYDKQSKDADDIVYHRESGLIAQDVEKVLPEAVREDIDTGMLTISPSGINALLVNAINELRERLEAIENKLGA

Physico‐chemical properties

protein length:	737 AA
molecular weight:	78387,09540 Da
isoelectric point:	5,73979
aromaticity:	0,08141
hydropathy:	-0,31085

Domains

Domains [InterPro]

DC_0466
STR
1–169

DC_0466 DC_1202

DC_0749
RBD
149–347

DC_0749 IPR048390 G3DSA:6.20.80.10 IPR051577 Coil

IPR030392
CHP
640–735

IPR030392

IPR030392
CHP
640–698

IPR030392

UPW35688.1

1 737

Architecture

STR

RBD

STR

ATT

STR

STR 1-169 | RBD 170-336 | STR 337-411 | ATT 412-473 | STR 474-737

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0466	STR	DC_0466	1	169	Novel HMM	DC_0466	Central	Low	Positional only	392 proteins / 392 hits
DC_0749	RBD	DC_0749	149	347	Novel HMM	DC_0749	C-terminal	Low	Positional only	42 proteins / 42 hits
DC_1202	STR	DC_1202	337	737	Novel HMM	DC_1202	Central	Low	Positional only	153 proteins / 153 hits
IPR048390	ATT	DC_0836	412	473	InterPro cluster	Long-tail fiber proximal subunit, trimerization domain	C-terminal	Medium	Text match	656 proteins / 656 hits
G3DSA:6.20.80.10	STR	G3DSA:6.20.80.10	564	623	Merged direct domain	G3DSA:6.20.80.10	Central	Low	Positional only	37 proteins / 37 hits
IPR051577	Unmapped	-	624	708	InterPro	Myelin Regulatory Factor-like	-	-	-	-
IPR030392	CHP	DC_0088	640	735	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits
IPR030392	CHP	DC_0088	640	698	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits
Coil	Unmapped	-	714	734	Coils	Coil	-	-	-	-

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

UPW35688.1

1 737

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	464	464	0,1288
Central domain	465	663	200	0,1937
C-terminal	664	737	73	0,9976

Note: Constraints were applied during segmentation.
Fixed 420 C-terminal predictions appearing before Central domain

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-464

Central
465-663

C-terminal
664-737

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Cronobacter phage Dev_CS701 [NCBI]	2936918	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Cronobacter sakazakii [NCBI]	28141	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales

Coding sequence (CDS)

Genbank protein accession

UPW35688.1 [NCBI]

Genbank nucleotide accession

ON157416.1 [NCBI]

CDS location

range 170657 -> 172870
strand +

CDS

ATGGCAGATTTAAAAGCGGGTACTACCGTTGGCGGTAATACTATCTGGAGTCAGGCGAACTTGCCTTTGCTCCCTTCTGGAAACACAATCACATATAAAGGCTTTAAAATCTACACCGAAAACGATAAGCCAACAAAGGCAGAAATCGGATTAGGCAACGTAACGAACGATGCACAGGTGAAGAAAGCTGGTGATACAATGCAAGGAACTTTGGAATTACAAGGTTCTGCAACTGAATTGAAATTACCATTCAGGATCGCAATGGTTAGGGCAACAGAACCGTATCTCGTTGCAACTCGCACAGACAATAACCCAGTAACAAACGGGTTTCCTAGCGCAGAAACACGCACATTTGTTATACATTCAAAAACCACGTCACCAACGTCAGATCCAAACGCAGGTGCAAACCTTGTTGATCTGATTTGTACCCAACGCCCTGCGGGTGGTGGTGCTTATTATATCCGTGCTTTTGGCGCACCAAACACGACAACTGGTGCTGCTGGGGCTATCCGTGCTGAATTGCAAATGTTGGGTGATAATGGTCTTGTTAGTTTAACAGGCACACAACTCAACATCGGGATGCAAACTGTTGTTAATGGTACGATCTTTGGTACGCAAATGTCTATCAAAGGGGATTCGAACCGAAACTTATATTTCCAGGATGCGGCGGGCAATGAACTTGGTTTGATCTATGCTGATACAGGAAAGAACGTATATGTTCGTTCTGGTGGTGGTGCTTACGCAACTCGTTTTGCATCTGATGGAACTTTAGTTCTTGCTAACCATCTAACCGTTCCTGGACAGGCTACATTTAATGGTATGGGTGTGTTCAATAACCGTGCTTCTGTAGGCGTAGATTACGATTCGCAAGGAACAAACTCAGCGATTCTTCGTGTTGATACAAGCGGTGATGGAAACGGGGTTGGTGATGGTGTTACCCACTTAGGCTATAAAGATGGTAACGGAAGATATAACCATTATTTCCGTGGTACTGGTTCAGTTTATCTGACCAACAAATTAGGTACTATCTTTACGTCACAATCATATTATAATGATGTTCCCCAGGGTACGCCAGCGCAATATTTCTTACCTACTGTTGGACAGGGTGCGAAAAACTATTTGCGTCAGTTCCGTGGCGGTAATGCGGATACGATCTGGCATGAAACTGTTCAGGGTGGTACATATCGTTTAGCAACAGGCAACACCGATGCACAGGAAGAGTTTCAGATCACCAGTGCTGGTAATATCCGCGCCCGTGTTGAAGTTCAGAGTTCTTCATGTGGTTCCGCTGGACAGTTCCGAGCGGTTCAGGGCGATTATGGATTTTTTATCCGAAATGATGGAAACAACACCTATTTTATGTTGACTCCTTCCGGCAACCCTTACGGTACATGGGGTACTCTGCGTCCGCTTACGATAAGCAACTCCGCTGGGACAGTAACAATGTCAAACGGTGTTAACGTTGGCAGTGGATTAGATGTCAGTGGTGCTGCTAAGTTTAATAACGGTCTTGGTTGCGGAACTGCAAACGGTTTAGGCGCTACTGCGATTTCGCTAGGTGATAATGATACAGGTTTTGTTCAAGAAGGCGACGGTATTCTTAACGCTTACGCAAACAGCCAACGTATTATGCGATGGACTACGGGTGCAACTGCTAACTATAAACAGTTACAGGTTCAGGGTGTTAACGGGCCAGCATTACTTCTGAACAATACCGCTACTAACCAATCGTGTTATTTGCTTATTACTTTGGCGGGTAACAACGGTGCGTACTTCGGATTTGGTGGTGCTGATGATAACGTATCGGTACACAACTACCGACTGAATACGACCTTACAGTTGCGTGCTTCGGATCTGTATATGAACCGTGGTCTGTATGTTGAAGGTAACGTAAACGCCAACGATGTGTATATTCGTTCCGATATTCGACTGAAATCGAATTTAGTTGAACTGAAAGATTCATTAAGCAAGATTGAACATCTTAAAGGTTATATCTACGATAAGCAATCAAAAGATGCTGATGATATCGTATACCATCGCGAATCCGGTCTGATCGCTCAGGATGTTGAGAAGGTATTGCCGGAAGCAGTGCGCGAAGACATCGACACTGGTATGTTAACCATTTCACCTTCGGGAATTAACGCGCTTCTGGTTAACGCAATCAACGAACTGCGTGAACGTCTGGAAGCAATCGAAAACAAATTAGGGGCTTAA

Genome Context

Tertiary structure

PDB ID

156155667af53dca691d665e5d84cec3df4d50d09a7867f04cac31c0c7e5d441

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,6167

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence