Protein

View in Explore

UniProt accession

A0A8F2JFH8 [UniProt]

Protein name

Tail fiber protein

RBP type

Evidence UniProt/TrEMBL

Probability 1,00

Evidence GenBank

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,88

Evidence RBPdetect2

Probability 0,76

Protein sequence

MSTYKVFNAAGKIVEYGYYDAGRGHLDIHPDGITDGDTRVSDITGTSVAVYAPYTSPNNTSTPQVMVGDPIEQGLYITVESNEVDGVVLKAPNGLGISFSYMSGYPSLSGNIGTIYDPTGGSDFSGVLVPNDTFSLVSAWTNTDVDLSGGGYQVVSVSEGTVTFIVPGGLIGRWQEIRPGSFFRGDGEASLQPDNTYEKTLTDWVSINRTEVERIVANIAAANGMYKDNGKSKTLAFVTAEIQYQLLDENSVPYGPIYTAQGTVSGRTPDYNGVTIYADLPIASRVRVRARRVTDLDFNFEGSVVDEITYVNLYGQTRDNTPHYGNRTTVHSMRKQTPRAAEVKQPQLRMIATEMVYKYLGNGVFEDTMTPNTQAVQSLIRLARDPDVGGLNLTVRNMDKLLAVQNEVEAYFGDKQAGEFCYTFDDYKTTMQDIVSTIADAIFCTPYRRGADILLDFERPRMGPEMVFTHRSKAGTSEKWTRTFNDAQVFDSLKFSYIDPKTNVKETITIPETGGLKTETYDSKGIRNYKQAFWAANRRHQKNILKKISVSFTATEEGIFALPNRAISVVKGSRMATYDGYITAVNGLTVELSQPVKFTAGDDHSLILKLRDGGVQSVNVVPGAHDRQVIMTSVPQEAIYAGNSALKTEFSFGNEARHNAQMILVSTVDPGDDRTVKITGFNYDKDFYKFDNVPPFGRAFSNGFDNGFN

Physico‐chemical properties

protein length:	709 AA
molecular weight:	78091,35960 Da
isoelectric point:	5,24956
aromaticity:	0,10296
hydropathy:	-0,35106

Domains

Domains [InterPro]

DC_0016
STR
10–709

DC_0016

NF040662
Unmapped
209–689

NF040662

A0A8F2JFH8

1 709

Architecture

STR

STR 10-709

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0016	STR	DC_0016	10	709	Novel HMM	DC_0016	Central	Low	Positional only	34 proteins / 34 hits
NF040662	Unmapped	-	209	689	NCBIfam	host specificity factor TipJ family phage tail protein	-	-	-	-

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

A0A8F2JFH8

1 709

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	74	74	0,8986
Central domain	75	273	200	0,7100
C-terminal	274	709	435	0,2002

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-74

Central
75-273

C-terminal
274-709

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Salmonella phage fmb-p1 [NCBI]	2849081	Uroviricota > Caudoviricetes > Sarkviridae > Jerseyvirus > Jerseyvirus fmbp1
Host	Salmonella typhimurium [NCBI]	90371	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales

Coding sequence (CDS)

Genbank protein accession

QWT71866.1 [NCBI]

Genbank nucleotide accession

MZ274225 [NCBI]

CDS location

range 20048 -> 22177
strand -

CDS

ATGTCTACTTATAAGGTGTTTAACGCTGCCGGTAAAATTGTAGAGTACGGCTACTACGACGCCGGGCGTGGCCACCTCGACATACACCCGGATGGCATAACGGACGGTGATACCCGGGTATCGGATATAACAGGTACGTCGGTTGCCGTGTACGCGCCGTATACGTCACCAAATAATACATCTACACCCCAGGTCATGGTAGGGGACCCCATAGAGCAGGGCCTGTACATCACCGTAGAATCTAACGAAGTGGATGGCGTGGTTTTGAAAGCGCCCAACGGTCTCGGCATTTCTTTCTCTTACATGTCGGGGTATCCGTCTTTGTCAGGAAACATTGGCACTATATACGACCCTACAGGCGGCTCGGATTTTTCTGGAGTACTGGTGCCTAATGACACGTTTTCGCTGGTGTCCGCGTGGACAAATACAGACGTTGACCTGTCCGGCGGCGGGTATCAGGTAGTCAGCGTGTCCGAAGGGACTGTTACCTTTATAGTACCTGGTGGTCTCATTGGTAGGTGGCAAGAAATAAGACCGGGTTCGTTTTTCCGCGGTGACGGAGAGGCCTCGCTGCAACCAGACAACACGTATGAGAAAACCTTAACCGATTGGGTTTCAATAAACCGCACCGAGGTTGAGCGCATCGTGGCCAATATCGCCGCTGCGAACGGCATGTATAAAGACAACGGCAAATCGAAAACACTGGCGTTTGTCACCGCTGAGATACAGTACCAGCTACTCGATGAAAATAGCGTTCCTTACGGGCCAATATACACGGCGCAAGGAACTGTGTCCGGGCGTACACCGGACTACAACGGCGTCACTATTTACGCCGACCTGCCGATTGCGTCTCGCGTAAGGGTCAGGGCCCGCAGGGTTACAGACCTTGATTTCAATTTTGAAGGGTCTGTGGTTGATGAAATAACGTACGTTAACTTATACGGACAAACACGCGATAACACTCCGCACTACGGCAACAGAACAACCGTACACTCGATGCGCAAGCAGACGCCGCGCGCTGCAGAGGTTAAGCAACCGCAGTTACGTATGATTGCCACTGAAATGGTGTACAAATACCTTGGTAATGGTGTTTTCGAAGACACGATGACTCCCAATACACAAGCCGTGCAATCTCTTATCCGCCTGGCGCGTGACCCAGATGTGGGCGGTTTAAACCTGACAGTACGCAACATGGATAAGTTACTTGCTGTGCAGAACGAGGTCGAAGCGTATTTTGGTGACAAACAGGCTGGAGAATTTTGTTACACGTTTGATGACTATAAAACCACTATGCAGGATATAGTTAGTACTATAGCCGACGCTATCTTCTGTACTCCGTACAGGCGTGGGGCGGATATCCTTCTCGATTTTGAACGCCCTCGCATGGGCCCTGAGATGGTGTTCACCCACCGGAGTAAGGCCGGTACTTCCGAAAAATGGACCAGAACCTTTAACGATGCTCAGGTGTTCGATAGCCTTAAATTCTCGTACATAGACCCTAAAACAAACGTTAAAGAAACCATAACAATACCTGAAACCGGGGGCCTTAAAACGGAGACTTATGACTCTAAAGGTATTCGCAACTATAAGCAGGCTTTCTGGGCCGCTAATCGCCGCCACCAGAAGAACATTTTAAAGAAAATTTCAGTGTCGTTTACCGCCACGGAAGAGGGTATCTTTGCTTTACCAAATCGTGCCATTAGTGTGGTTAAGGGTTCACGTATGGCGACCTACGATGGCTACATAACCGCAGTAAACGGGCTCACTGTAGAACTATCGCAACCGGTTAAGTTCACAGCAGGAGATGACCATTCTTTGATTCTCAAGTTACGTGATGGTGGGGTGCAAAGTGTTAATGTAGTCCCTGGAGCGCACGACAGGCAGGTGATTATGACATCAGTGCCGCAAGAAGCCATTTACGCAGGTAATAGTGCTTTGAAAACTGAATTTTCATTCGGCAACGAAGCAAGGCATAATGCTCAGATGATTCTTGTTTCTACGGTAGACCCAGGAGATGACAGAACAGTCAAAATAACCGGGTTTAACTATGACAAGGATTTCTATAAGTTCGACAACGTACCGCCTTTCGGCCGTGCGTTCTCCAACGGATTCGATAACGGTTTTAACTAA

Genome Context

Tertiary structure

PDB ID

9a7d54e5d24ea5e9bbe2fa7512b82898f0608ead0da05c29537b7456800c8a07

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,8637

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence