Protein

View in Explore

Genbank accession

YP_009798040.1 [GenBank]

Protein name

tail fiber protein

RBP type

Evidence UniProt/TrEMBL

Probability 1,00

Evidence GenBank

Probability 1,00

TSP

Evidence DepoScope

Probability 1,00

Evidence RBPdetect

Probability 0,90

Evidence RBPdetect2

Probability 0,96

Protein sequence

MANVIKTVLTYQLDGSNRDFNIPFEYLARKFVVVTLIGVDRKVLTLNTDYRFATRTTISLTKSWGPADGYTTIELRRVTSTTDRLVDFTDGSILRAYDLNVAQIQTMHVAEEARDLTADTIGVNNDGHLDARGRRIVNLANAVDDRDAVPLGQLKTMNQNSWQARNETLQFRNDAEGFRNDAERFMNSASASSDSANSAKDAAHQSNVEAYQHRLAAETAKTAAQQSNVESYTWSNKSKEYAESASMDAAKAEQQANRAKTEADKLANTNAFAATLKTVQGGTVEWHKEWGLKANSFDALSDITALNGTMNSMDVRASRNVAVAGVTYPQGGIQQTIGTNQWNHLVRLHINGRPSWVGDKQGLHLAWNENGSGEADLICNQGAGAGGFLFRTVNDKDNVEIGRVTFTGAGAVHANHFQVGHSRMESNGNVVAGSVLYAGNGSSQMAPDGNVHGPLWGGWLSSYLNNRYLFAKPPGGVQLFTSRGGDYLEGVVDNQAVGFRWFLSDRRLKENINVLRSADDMLNIIRSYIPVTYKYKDSEYTDNRGRTITVTGKKSRAGFITQDLIRIWPEAVDVLSDGMQSPDPNQIIGGLMLLVKNLDERVQELEKKNNV

Physico‐chemical properties

protein length:	611 AA
molecular weight:	67227,96440 Da
isoelectric point:	6,34195
aromaticity:	0,07856
hydropathy:	-0,48020

Domains

Domains [InterPro]

IPR005604
ATT
1–131

IPR005604 Coil G3DSA:6.20.70.20 IPR030392 Coil

DC_0264
STR
1–604

DC_0264

IPR030392
CHP
504–609

IPR030392

YP_009798040.1

1 611

Architecture

ATT

STR

ATT 1-131 | STR 132-609 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
IPR005604	ATT	DC_0240	1	131	InterPro cluster	Bacteriophage T7 tail fibre protein-like, N-terminal domain	Central	Medium	Text match	1326 proteins / 1328 hits
DC_0264	STR	DC_0264	1	604	Novel HMM	DC_0264	Central	Low	Positional only	128 proteins / 128 hits
Coil	Unmapped	-	242	269	Coils	Coil	-	-	-	-
G3DSA:6.20.70.20	RBD	G3DSA:6.20.70.20	436	468	Merged direct domain	G3DSA:6.20.70.20	C-terminal	Low	Positional only	31 proteins / 31 hits
IPR030392	CHP	DC_0088	504	572	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits
IPR030392	CHP	DC_0088	504	609	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits
Coil	Unmapped	-	588	608	Coils	Coil	-	-	-	-

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

YP_009798040.1

1 611

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	168	168	0,9807
Central domain	169	368	201	0,5895
C-terminal	369	611	242	0,8487

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-168

Central
169-368

C-terminal
369-611

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Escherichia phage HZ2R8 [NCBI]	2079317	Uroviricota > Caudoviricetes > Autographivirales > Studiervirinae > Teseptimavirus
Host	Escherichia coli [NCBI]	562	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales

Coding sequence (CDS)

Genbank protein accession

YP_009798040.1 [NCBI]

Genbank nucleotide accession

NC_047923.1 [NCBI]

CDS location

range 37599 -> 39434
strand +

CDS

ATGGCTAACGTAATTAAGACCGTTTTGACTTACCAGTTAGATGGTTCGAATCGAGATTTTAACATCCCGTTTGAATATCTAGCCCGTAAGTTTGTAGTGGTAACTCTCATTGGTGTTGACCGTAAGGTCCTCACACTCAATACAGATTATCGCTTTGCTACGCGTACTACTATCTCGCTAACCAAATCTTGGGGACCTGCGGATGGTTACACTACCATTGAGCTGCGCCGAGTAACCTCCACGACTGACCGTCTGGTTGACTTTACGGATGGCTCGATCCTGCGTGCGTATGACCTTAACGTGGCTCAGATTCAGACTATGCATGTGGCAGAAGAGGCCCGTGACTTAACTGCTGATACTATTGGTGTCAACAATGATGGTCACTTGGATGCCCGTGGTCGTCGTATCGTGAACCTAGCGAACGCTGTGGATGACCGTGACGCTGTTCCGCTTGGTCAACTAAAGACGATGAACCAGAACTCTTGGCAAGCTCGCAATGAGACTCTACAGTTCCGTAATGACGCTGAGGGTTTCCGTAATGACGCTGAGCGGTTCATGAACTCTGCTAGTGCTTCGTCTGATTCGGCTAACTCCGCTAAGGATGCGGCCCATCAATCCAACGTGGAAGCGTATCAACATCGCCTTGCTGCGGAAACAGCTAAGACCGCTGCTCAGCAGTCAAACGTAGAGTCGTACACTTGGTCTAATAAGTCCAAGGAGTACGCCGAGTCTGCCTCTATGGATGCTGCGAAAGCTGAGCAACAAGCTAACCGCGCTAAGACCGAGGCTGACAAACTAGCTAATACCAACGCGTTTGCTGCTACCTTGAAGACAGTTCAGGGTGGGACCGTTGAGTGGCACAAAGAGTGGGGACTCAAGGCTAACAGCTTCGATGCACTCAGTGATATTACTGCCCTAAACGGTACGATGAACTCTATGGACGTTCGAGCGTCTCGTAACGTAGCAGTAGCTGGTGTGACTTACCCTCAGGGGGGCATTCAGCAGACTATCGGTACTAACCAGTGGAACCATCTTGTACGGCTGCATATTAACGGTAGACCAAGCTGGGTGGGGGATAAACAAGGACTCCACTTAGCATGGAACGAGAATGGAAGTGGTGAGGCAGACTTAATCTGCAACCAAGGTGCTGGGGCTGGAGGCTTCCTCTTTAGGACTGTGAACGACAAGGACAACGTAGAGATTGGTCGTGTCACCTTTACTGGTGCTGGTGCTGTGCACGCTAACCACTTCCAAGTCGGCCATAGTCGCATGGAGTCCAACGGGAACGTAGTGGCTGGTAGCGTACTGTATGCTGGGAATGGTTCCAGTCAAATGGCTCCAGACGGGAACGTCCATGGTCCTCTTTGGGGCGGCTGGCTGTCCAGCTACCTGAACAATAGGTACCTTTTCGCTAAGCCGCCTGGAGGGGTTCAGTTATTTACCTCTCGCGGTGGGGACTACCTTGAGGGCGTTGTGGATAACCAAGCCGTTGGGTTCCGGTGGTTCCTATCAGACAGAAGGCTTAAGGAAAACATAAATGTTCTACGCTCAGCCGACGATATGCTAAATATCATCCGGTCGTACATCCCAGTCACGTACAAGTATAAGGATTCGGAGTATACTGATAACCGTGGGAGAACTATTACTGTTACTGGTAAGAAGTCTCGTGCAGGCTTCATTACTCAGGACTTGATTAGAATCTGGCCCGAAGCAGTGGATGTTCTATCGGACGGTATGCAGTCCCCAGACCCTAACCAAATCATCGGTGGACTAATGCTTCTTGTTAAGAACCTAGATGAGCGGGTTCAGGAGCTAGAGAAGAAGAATAACGTTTAA

Genome Context

Tertiary structure

PDB ID

27f7881dede6497410dd853d30c2ab587f9ca55e6483fedeec36e196651280f9

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,6705

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence