Protein

View in Explore

Genbank accession

YP_003335798.1 [GenBank]

Protein name

tail fiber protein

RBP type

Evidence UniProt/TrEMBL

Probability 1,00

TSP

Evidence DepoScope

Probability 1,00

Evidence RBPdetect

Probability 0,90

Evidence RBPdetect2

Probability 0,96

Protein sequence

MFYIDNDSGVTVMPPVSAQRSAIVRWFSEGDGNNVITWPGMDWFNIVQAELLNTLEEAGIQPDKTKLNQLALSIKAIMSNNALLIKNNLSEIKTAGASAQRTARENLDIYDASLNKKGLVQLTSATDSPSETLAATAKAVKIAMDNANARLAKDRNGADIPNKPLFIQNVGLQETVNKAGNAVQKTGDTLSGGLTFENDSILAWIRNTDWAKIGFKNDADGDTDSYMWFETGDNGNEYFKWRSKRGTTTKDLMNLKWDALYVLVNAIVNGEVISKSANGLRIAYGNYGFFIRNDGSNTYFMLTNSGDNMGTYNGLRPLWINNATGAVSMGRGLNVSGETLQTVCYNSSNGMWIQMRDNNAIFGKNIVNTDSAQALLRQNHADRKFMIGGLGNKQFGIYMINNSRTANGTDGQAYMDNNGNWLCGAQIIPGNYGNFDSRYVSDVRLGTRVVQTMQKGVMYEKSGHAITGLGIVGEVDGDDPAVFRPIQKYINGTWYNVAQV

Physico‐chemical properties

protein length:	500 AA
molecular weight:	54798,88210 Da
isoelectric point:	6,24140
aromaticity:	0,09000
hydropathy:	-0,36600

Domains

Domains [InterPro]

DC_0512
STR
1–221

DC_0512 DC_0482

IPR051934
Unmapped
95–156

IPR051934 IPR048390

IPR005068
STR
113–153

IPR005068

YP_003335798.1

1 500

Architecture

STR

ATT

RBD

STR 1-209 | ATT 210-320 | RBD 321-499 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0512	STR	DC_0512	1	221	Novel HMM	DC_0512	Central	Low	Positional only	27 proteins / 27 hits
IPR051934	Unmapped	-	95	156	InterPro	Bacteriophage Tail Fiber Structural Protein	-	-	-	-
IPR005068	STR	DC_0738	113	153	InterPro cluster	Bacteriophage lambda, Tail fiber protein, repeat-2	Central	High	Text match	217 proteins / 347 hits
IPR048390	ATT	DC_0836	210	320	InterPro cluster	Long-tail fiber proximal subunit, trimerization domain	C-terminal	Medium	Text match	656 proteins / 656 hits
DC_0482	RBD	DC_0482	249	499	Novel HMM	DC_0482	C-terminal	Low	Positional only	20 proteins / 20 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

YP_003335798.1

1 500

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	245	245	0,7581
Central domain	246	444	200	0,2512
C-terminal	445	500	55	0,9984

Note: Constraints were applied during segmentation.
Fixed 58 C-terminal predictions appearing before Central domain

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-245

Central
246-444

C-terminal
445-500

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Escherichia phage D108 [NCBI]	665033	Uroviricota > Caudoviricetes > Muvirus >
Host	Escherichia coli [NCBI]	562	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales

Coding sequence (CDS)

Genbank protein accession

YP_003335798.1 [NCBI]

Genbank nucleotide accession

NC_013594 [NCBI]

CDS location

range 31507 -> 33009
strand +

CDS

ATGTTTTATATTGATAACGACAGCGGCGTAACCGTCATGCCGCCCGTATCCGCCCAGCGTAGTGCTATCGTTCGCTGGTTTTCAGAAGGTGACGGGAATAATGTTATCACATGGCCCGGCATGGACTGGTTTAATATTGTTCAGGCGGAGTTATTAAACACGCTGGAAGAAGCCGGTATTCAACCGGATAAAACAAAATTAAACCAGCTTGCACTGTCCATTAAAGCCATTATGAGCAATAACGCGCTGCTGATAAAAAATAACCTCAGCGAAATTAAAACTGCCGGGGCATCAGCACAGCGTACAGCACGTGAAAATCTGGATATCTATGATGCCAGCCTGAACAAAAAAGGACTCGTTCAGCTAACCAGTGCCACTGACAGCCCCAGTGAAACGCTGGCAGCCACCGCAAAAGCGGTGAAAATTGCGATGGATAATGCCAATGCTCGTCTGGCAAAAGACCGGAACGGAGCAGATATTCCCAATAAGCCGCTGTTTATCCAAAACGTCGGTTTACAGGAAACGGTAAACAAGGCTGGTAACGCTGTTCAAAAGACAGGCGATACCTTGTCCGGTGGGCTTACTTTTGAAAATGACTCAATCCTTGCCTGGATTCGAAATACTGACTGGGCGAAGATTGGATTTAAAAATGATGCCGATGGTGACACTGATTCATACATGTGGTTTGAAACAGGCGACAACGGCAATGAATATTTCAAATGGAGAAGCAAACGAGGCACCACAACAAAAGACCTGATGAATCTTAAATGGGATGCTTTGTATGTTCTTGTCAATGCCATTGTAAACGGCGAAGTCATATCAAAATCAGCAAACGGCCTACGTATTGCTTATGGTAATTACGGATTCTTTATTCGTAATGATGGTTCAAATACATACTTCATGTTGACAAACTCCGGTGACAACATGGGGACTTATAACGGATTAAGGCCATTATGGATTAATAACGCTACTGGCGCTGTTTCGATGGGGCGTGGCCTTAATGTTTCAGGGGAGACGCTTCAGACCGTTTGCTATAACAGCAGTAATGGTATGTGGATTCAGATGCGCGATAACAACGCTATCTTTGGGAAAAATATAGTTAACACTGATAGCGCTCAGGCGTTGCTTCGCCAGAATCACGCTGACCGCAAGTTCATGATAGGTGGACTGGGGAACAAGCAATTTGGCATCTACATGATTAATAACTCAAGGACAGCCAATGGCACCGATGGTCAGGCGTACATGGACAATAACGGTAACTGGCTTTGCGGTGCGCAAATTATTCCCGGAAATTATGGCAATTTTGACTCACGCTATGTGAGCGATGTCCGACTTGGCACACGTGTTGTTCAGACTATGCAAAAAGGCGTGATGTATGAGAAATCAGGTCATGCAATTACGGGGCTTGGCATTGTCGGTGAAGTTGATGGCGATGATCCGGCAGTATTCAGACCAATACAAAAATACATCAATGGCACATGGTATAACGTCGCACAGGTGTAA

Genome Context

Tertiary structure

PDB ID

98b158871d6a8b5f2365775e766c4a6aab22e79ad5c90ba0427a1782352eaf51

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,7454

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence