Protein

View in Explore

Genbank accession

YP_009791782.1 [GenBank]

Protein name

tail fiber protein

RBP type

Evidence UniProt/TrEMBL

Probability 1,00

Evidence GenBank

Probability 1,00

TSP

Evidence DepoScope

Probability 1,00

Evidence RBPdetect

Probability 0,89

Evidence RBPdetect2

Probability 0,96

Protein sequence

MLFYKGGHMATNIKTVMTYPLDGSTTDFNIPFEYLARKFVRVTLIGVDRKELILNQDYRFATKTTISTTRALGPADGYNLIEIRRYTSATERLVDFTDGSILRAYDLNISQVQTLHVAEEARDLTADTIGVNNDGDLDARGRRIVNVADAKDPGDAINLGQVQKWNDSALNSANRAKQEADRATARANDANNSANASASSASSSAGSAELSKQWAVKETAVEPNLESSRTYAIHSMSYRNEAKDAADRAKTSEASAKDSESNAKNSENNAKSSEVKAKASEERAIEEASKLGNMNDFAAAIDSVDGNHVNMKGNIKTPGNITGGGLIATGDARVTGTIAAGEFSTLGKEVTINQRTSDWRVPLYTWKALNLRNDLVQELRDNGGSDHYNHLYRLHIDNRPVHVGNRQGLHIGWNENTNGESNFINNRGGGGGGFIFRTVNNENTVETGRVTFTGGGQVHANHFQAANGARIEANNNIVGQNLYAGMGNAALGPDGNLSGGVWSGVGGSLWSCLNDRYQFAKPPAGVRLYTARGGDYLEGNVDGKSVGFRWFLSDRRLKENLKVVRSADDMLNIIRSYIPVSYKYKDSEYVDSRGKTVTITGKNSRAGFITQDLIRIWPEAVDVMSDGMQSPDPNQIIGGLMLLVKNLDERVQALESKSTTD

Physico‐chemical properties

protein length:	661 AA
molecular weight:	71883,68460 Da
isoelectric point:	6,31728
aromaticity:	0,06959
hydropathy:	-0,55461

Domains

Domains [InterPro]

DC_0657
STR
1–643

DC_0657

IPR005604
ATT
9–139

IPR005604 Coil Coil IPR030392

IPR030392
CHP
553–658

IPR030392

YP_009791782.1

1 661

Architecture

ATT

STR

CHP

ATT 1-139 | STR 140-643 | CHP 644-658 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0657	STR	DC_0657	1	643	Novel HMM	DC_0657	Central	Low	Positional only	143 proteins / 143 hits
IPR005604	ATT	DC_0240	9	139	InterPro cluster	Bacteriophage T7 tail fibre protein-like, N-terminal domain	Central	Medium	Text match	1326 proteins / 1328 hits
Coil	Unmapped	-	166	193	Coils	Coil	-	-	-	-
Coil	Unmapped	-	256	283	Coils	Coil	-	-	-	-
IPR030392	CHP	DC_0088	553	621	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits
IPR030392	CHP	DC_0088	553	658	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

YP_009791782.1

1 661

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	221	221	0,9045
Central domain	222	420	200	0,5742
C-terminal	421	661	240	0,8179

Note: Constraints were applied during segmentation.
Sequence started with non-N-terminal domain

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-221

Central
222-420

C-terminal
421-661

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Serratia phage 2050H2 [NCBI]	2024251	Uroviricota > Caudoviricetes > Autographivirales > Studiervirinae > Teetrevirus
Host	Serratia marcescens [NCBI]	615	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales

Coding sequence (CDS)

Genbank protein accession

YP_009791782.1 [NCBI]

Genbank nucleotide accession

NC_047844.1 [NCBI]

CDS location

range 33385 -> 35370
strand +

CDS

ATGCTATTTTACAAAGGAGGTCACATGGCTACAAATATTAAGACCGTGATGACTTACCCGCTGGATGGTTCAACTACGGACTTTAATATTCCGTTCGAGTATCTGGCTCGTAAGTTCGTCCGAGTGACCCTTATCGGTGTTGACCGAAAGGAACTCATCTTGAATCAAGACTATCGTTTTGCGACTAAGACCACAATCTCCACAACGAGAGCGTTGGGGCCAGCGGACGGTTATAACCTTATCGAGATTCGTCGGTACACCTCAGCGACTGAACGTCTGGTTGACTTTACGGATGGCTCAATCCTCCGTGCGTATGACCTGAACATCTCGCAGGTGCAGACCCTCCACGTTGCTGAGGAAGCGCGTGACCTTACCGCTGATACGATTGGCGTTAACAACGATGGTGACTTGGATGCTCGTGGTCGTCGTATCGTGAACGTTGCGGACGCTAAAGACCCCGGTGACGCAATCAACTTAGGTCAAGTCCAGAAGTGGAACGACTCTGCGTTGAACTCTGCGAATCGAGCGAAACAGGAAGCTGACCGTGCGACCGCTCGTGCAAACGATGCGAACAACTCTGCGAACGCATCTGCAAGCTCTGCAAGCTCTTCTGCTGGGTCTGCTGAGTTATCAAAACAGTGGGCCGTTAAGGAAACCGCTGTGGAGCCAAATCTAGAATCATCACGAACCTATGCGATTCACTCCATGTCATACCGGAATGAGGCTAAAGATGCAGCCGACAGGGCAAAAACTTCTGAGGCCAGTGCGAAGGATTCCGAAAGTAACGCGAAGAACTCTGAGAACAACGCTAAGTCCTCCGAGGTCAAAGCAAAGGCTTCTGAGGAACGAGCCATTGAGGAAGCCAGTAAGTTGGGCAATATGAATGACTTCGCGGCTGCGATTGATAGTGTGGATGGTAATCATGTGAATATGAAGGGAAACATTAAAACTCCCGGTAATATCACAGGTGGTGGCCTAATCGCTACCGGAGATGCCCGCGTTACCGGTACGATTGCTGCTGGTGAGTTCAGCACGCTAGGTAAGGAGGTCACTATAAATCAACGAACTAGTGACTGGCGTGTTCCACTGTATACATGGAAAGCCCTAAACTTACGTAACGACCTAGTTCAAGAGTTGCGCGATAATGGCGGCTCTGATCACTATAACCATTTATACCGCCTTCATATAGACAACCGACCTGTCCATGTAGGTAATAGGCAAGGATTACATATAGGGTGGAATGAGAATACCAACGGTGAATCTAACTTCATCAACAACCGTGGTGGCGGCGGTGGTGGTTTCATCTTCCGAACGGTGAACAATGAGAACACTGTAGAGACTGGAAGGGTGACTTTCACCGGAGGTGGTCAGGTTCACGCCAACCACTTCCAAGCCGCCAACGGTGCCCGAATTGAGGCGAACAACAACATCGTTGGTCAGAACCTCTACGCAGGAATGGGCAACGCGGCACTTGGCCCGGATGGGAACCTTAGCGGTGGCGTATGGAGTGGAGTAGGTGGCTCTTTATGGTCTTGCTTGAATGACCGATACCAGTTCGCCAAGCCTCCTGCTGGGGTTAGACTGTACACCGCCCGTGGTGGAGACTACCTAGAGGGTAACGTTGATGGTAAATCAGTTGGTTTCCGCTGGTTCCTGTCTGACAGAAGGCTTAAAGAGAACCTCAAGGTTGTTCGCTCTGCTGATGATATGCTCAATATTATCCGCTCATATATTCCGGTTTCCTACAAATATAAGGACTCTGAGTACGTTGACAGCCGTGGGAAGACTGTTACTATCACTGGTAAGAACTCTCGTGCTGGTTTCATTACTCAGGACTTGATTCGAATCTGGCCAGAAGCGGTTGACGTAATGTCAGATGGGATGCAGTCTCCAGACCCTAACCAGATTATTGGCGGACTGATGCTGCTTGTTAAGAACCTAGATGAACGTGTTCAGGCGCTTGAATCGAAGAGCACGACAGACTAA

Genome Context

Tertiary structure

PDB ID

8ee939a6df6372f10d295c8764d141df6a6f373bec3f765fe6f3bd4bf0160b18

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,6412

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence