Protein

View in Explore

UniProt accession

A0A7S6HUX6 [UniProt]

Protein name

Tail fiber protein

RBP type

Evidence UniProt/TrEMBL

Probability 1,00

Evidence GenBank

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,72

Evidence RBPdetect2

Probability 0,94

Protein sequence

MPIAMIDNIVASARSSSYDWNASKAALADSLNTVTTRTLDKIFEGNKSYRSQQDRQKLLRSSAAPCSVVYGKTRTSGLLAFLEQDRDRTLHCAIVLANHPLEGIEDILIDGNPISSYGDLVSWELHTDRKTSDPFMGTHCPSWSPDMIGRGISWLRASFKFDPNKFPFGLPNVTLVKVGKKCYDPRISKEVYTNNAALVILDYLRTYLKCPDETINWESFKEAANICDEAVKNADGTSERRYTINGEFDMDEAPASIMAEMLKACGADLSYVAGKYGLLVGAYYGPATMTLSEDCVCGEVKIYPEASFDKRSNTITGRFTSPTKGYSETDFPSVFVPEWIEKDGERKIIDIDYRFVTSPYQAQRVSAIFLRRARAGRIIEVTCNMRGFKFKPGRYVTMDLPSIGIVGQEMRVLEWEFTKKGGVKVKLRQDAKEWNDATGQLPDSGDVDIPISPSGVAQPQNFRYSVLQAGEVTHGVLAWDNVGTYAQNIVQVRKNGEIVWTAQTVEQFVRVEGLTKGSYTATVVATSYKGGVSPEAYCEFNIQAPEAPVSVEVKQGYFAITLIPHSRDLASVSTQYDFWTSGMTRLPDTSDATVTSKATRMGVGSTWTSEGLQNDKIYYWYIRTTNAFGSSQFVECAARCYTSIEDLMPQIDAEFKKTETYKELMSTLDSSIEEVENRVTELNKYMDGRVDEAFQQLGDRIGAVVTETTQKFEDVNGNITALDKKLVAAQNKFTNDLNTESGRLASLIETTNKATTDLLNKKTEALDEKLVAAKGELVEQIGGVESGYLAGDKTLDGKINTQRTELDASILSTNKATVDLLNRTSETLDQKISQTNATVSKNYTTLDGKITTAKTDLNTLIANTNKATTDLLNQKTSALSEQITSARGEISTNKQAIKDLDGKLTSTKTALDATISDTNKATVDLINGTASAIRQELAVAKQEIINDVGDVSELRAAVATTSKAVTDLEGKVNAQWGTKIQVDSAGNKYVAGIQLGMEGSGGQVQSYFMVSANNFAVYNPGNGTATLAFAIKNNQAFLKDAFIENGTISSAKIAQEISSNNYDGNGYHKYGRYINKNGHAQFMDVWVKGNINASAGNFTGAVNATSGTFRGDVYANNGSFRGTIDATGGTFRGRVEASVIRANQFEGAIVAHRTYGDCPPVYNSQQRVCRWRWRYVDNVQGQGKNVTFFFKLNGTRANSQLNAWIAGHQLLAGKKYGNDNDGMCAVGITGLGEQTIDIIIEIYTPWSTGNVTGITISCPTVVVSRSNSSFQGPWNESHD

Physico‐chemical properties

protein length:	1279 AA
molecular weight:	140159,42680 Da
isoelectric point:	5,62947
aromaticity:	0,08600
hydropathy:	-0,36779

Domains

Domains [InterPro]

DC_0187
STR
1–819

DC_0187 G3DSA:1.10.287.1490

IPR053171
Unmapped
470–1119

IPR053171

IPR057587
ATT
547–651

IPR057587 DC_1281

IPR015406
RBD
957–1097

IPR015406

A0A7S6HUX6

1 1279

Architecture

STR

ATT

STR

RBD

STR

RBD

STR 1-546 | ATT 547-651 | STR 652-819 | RBD 820-840 | STR 841-984 | RBD 985-1272 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0187	STR	DC_0187	1	819	Novel HMM	DC_0187	Central	Low	Positional only	466 proteins / 466 hits
IPR053171	Unmapped	-	470	1119	InterPro	Viral Tip Attachment Protein	-	-	-	-
IPR057587	ATT	DC_0130	547	651	InterPro cluster	Tip attachment protein J, second Ig-like domain	Central	Medium	Text match	309 proteins / 309 hits
DC_1281	RBD	DC_1281	784	1272	Novel HMM	DC_1281	C-terminal	Low	Positional only	31 proteins / 31 hits
G3DSA:1.10.287.1490	STR	G3DSA:1.10.287.1490	841	984	Merged direct domain	G3DSA:1.10.287.1490	Central	Low	Positional only	5 proteins / 5 hits
IPR015406	RBD	DC_0135	957	1097	InterPro cluster	Tip attachment protein J, central straight fiber domain	C-terminal	High	Text match	1265 proteins / 1266 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

A0A7S6HUX6

1 1279

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	1075	1075	0,8372
Central domain	1076	1268	194	0,4056
C-terminal	1269	1279	10	0,9815

Note: Constraints were applied during segmentation.
Fixed 142 C-terminal predictions appearing before Central domain|C-terminal too short, adjusted boundary

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-1075

Central
1076-1268

C-terminal
1269-1279

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Escherichia phage JEP1 [NCBI]	2759218	Uroviricota > Caudoviricetes > Vequintavirinae > Vequintavirus JEP1 >
Host	Escherichia coli [NCBI]	562	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales

Coding sequence (CDS)

Genbank protein accession

QOC67656.1 [NCBI]

Genbank nucleotide accession

MT740314 [NCBI]

CDS location

range 27917 -> 31756
strand +

CDS

ATGCCAATTGCAATGATTGATAACATCGTTGCTTCTGCAAGATCTTCAAGTTATGACTGGAACGCATCCAAGGCAGCTCTGGCTGACAGCCTGAACACTGTTACCACCAGAACTCTGGATAAGATTTTCGAAGGAAACAAATCTTACAGGAGTCAGCAAGATAGACAAAAACTTCTCAGATCTTCTGCTGCACCTTGCTCTGTAGTGTATGGGAAGACACGCACATCTGGGTTGCTTGCGTTTTTGGAGCAGGACAGGGACAGAACCCTTCATTGTGCTATTGTTCTTGCCAATCATCCCTTGGAAGGTATAGAAGATATACTTATCGACGGTAATCCTATTTCTTCGTATGGCGATTTGGTATCGTGGGAGTTACATACCGACAGGAAAACCTCTGATCCTTTCATGGGCACACACTGCCCTTCATGGTCACCAGACATGATAGGCAGAGGGATCAGTTGGCTACGTGCCAGCTTCAAGTTTGACCCTAACAAGTTTCCTTTTGGGTTGCCAAACGTTACACTTGTCAAGGTTGGTAAAAAATGCTATGATCCTCGTATCAGTAAAGAGGTGTATACCAATAACGCGGCCTTGGTGATCCTAGACTATTTAAGAACGTACCTCAAATGTCCTGACGAAACCATTAACTGGGAGTCCTTCAAGGAGGCTGCCAACATATGCGACGAGGCGGTAAAAAACGCTGACGGAACCAGTGAGCGACGTTACACCATTAACGGTGAGTTTGACATGGATGAGGCCCCAGCAAGCATTATGGCAGAAATGCTGAAAGCTTGTGGTGCAGATCTCAGCTATGTAGCTGGTAAGTATGGTTTGCTGGTTGGTGCATACTATGGCCCGGCAACAATGACACTGAGTGAGGATTGTGTCTGTGGTGAGGTCAAGATCTATCCGGAAGCCTCATTTGACAAAAGATCCAACACAATAACTGGCAGATTCACCAGTCCTACCAAAGGGTATTCTGAAACAGATTTTCCATCAGTGTTTGTCCCAGAGTGGATAGAGAAGGATGGAGAAAGAAAGATAATCGATATAGACTATCGCTTTGTTACCAGCCCTTATCAAGCTCAGCGTGTTTCTGCAATCTTCTTAAGACGTGCCAGAGCTGGCAGGATTATTGAAGTCACCTGCAATATGCGAGGTTTTAAATTTAAGCCTGGCCGTTATGTTACAATGGACCTCCCAAGTATTGGTATAGTGGGCCAAGAAATGAGGGTTCTTGAATGGGAGTTTACCAAAAAGGGTGGTGTCAAGGTAAAACTCCGTCAAGATGCTAAAGAGTGGAATGATGCCACAGGGCAACTTCCGGATTCTGGCGATGTAGATATTCCGATATCTCCATCTGGTGTAGCTCAACCGCAAAACTTCAGATATTCCGTTCTCCAAGCTGGAGAAGTAACTCACGGTGTTTTGGCTTGGGACAACGTTGGGACCTACGCTCAAAATATTGTGCAGGTAAGAAAGAACGGAGAGATTGTTTGGACAGCACAAACAGTTGAGCAGTTTGTCCGAGTAGAAGGCTTGACCAAAGGGTCATACACAGCAACCGTGGTTGCAACATCTTATAAAGGTGGCGTATCTCCGGAAGCATATTGTGAGTTCAACATTCAGGCACCTGAAGCTCCTGTTTCTGTAGAGGTTAAGCAAGGATACTTTGCTATCACCTTGATTCCGCATAGTAGGGATTTAGCAAGTGTTAGCACTCAGTACGACTTTTGGACATCTGGGATGACAAGATTGCCAGATACCAGTGATGCAACCGTTACTTCAAAAGCCACCCGCATGGGTGTTGGTTCAACTTGGACATCTGAAGGTCTGCAGAACGATAAGATTTATTATTGGTATATTCGAACCACAAATGCTTTTGGTAGTTCTCAGTTTGTAGAGTGTGCTGCACGCTGCTATACCTCCATTGAAGATTTGATGCCTCAGATAGATGCTGAATTTAAAAAGACAGAAACTTATAAAGAGTTGATGAGCACTTTAGATTCCTCTATTGAAGAGGTTGAAAATCGTGTCACAGAACTTAACAAGTACATGGACGGAAGGGTAGATGAGGCATTCCAACAACTTGGGGATAGGATAGGTGCTGTAGTTACAGAGACAACTCAGAAGTTTGAGGATGTCAATGGCAATATTACAGCGCTGGATAAGAAACTTGTTGCTGCACAGAACAAGTTCACCAACGATCTGAACACTGAAAGTGGAAGACTGGCATCCCTGATTGAGACAACCAATAAAGCAACCACTGATCTTCTGAACAAAAAGACAGAGGCTTTAGACGAGAAATTGGTTGCAGCCAAAGGGGAGTTGGTAGAACAAATAGGTGGAGTGGAGAGCGGATACCTTGCCGGAGATAAAACTCTGGATGGCAAGATCAATACCCAGAGAACAGAACTTGACGCAAGCATCTTGAGCACCAATAAGGCGACAGTGGATCTTCTTAACAGGACCTCTGAAACTCTGGATCAAAAGATCAGTCAGACAAACGCGACGGTATCTAAGAACTATACCACCCTTGACGGTAAGATAACTACCGCAAAAACTGATCTCAATACCTTGATTGCCAATACCAACAAGGCTACCACAGATTTGTTGAATCAGAAAACCTCTGCACTGTCAGAGCAGATAACTTCTGCACGTGGGGAGATTTCTACCAACAAACAGGCGATTAAGGATTTGGATGGGAAGCTGACCTCCACAAAAACAGCACTGGACGCTACAATCTCCGATACCAACAAAGCAACTGTGGATCTTATTAACGGCACAGCGTCAGCTATTCGTCAAGAACTTGCTGTTGCTAAGCAGGAGATCATTAATGATGTTGGGGATGTATCAGAGCTAAGAGCTGCAGTGGCTACAACATCTAAGGCTGTGACCGACTTAGAGGGCAAAGTAAATGCTCAATGGGGCACAAAAATACAGGTAGACTCCGCAGGGAATAAGTATGTGGCAGGTATCCAATTGGGCATGGAAGGCTCTGGAGGCCAAGTTCAATCATACTTCATGGTTAGTGCAAACAACTTTGCGGTATACAACCCCGGAAATGGAACAGCAACCCTTGCTTTCGCAATCAAGAACAACCAAGCGTTCTTGAAAGATGCTTTTATAGAGAACGGGACGATCTCTTCTGCCAAGATTGCACAAGAAATTTCGTCAAACAACTACGATGGCAACGGGTACCATAAATACGGTCGGTATATTAACAAGAACGGGCACGCCCAGTTTATGGATGTGTGGGTGAAAGGTAATATCAACGCTAGTGCAGGTAACTTCACAGGGGCAGTTAACGCCACCAGTGGTACCTTCCGTGGAGATGTTTATGCCAATAATGGTAGCTTTAGAGGCACCATAGATGCAACAGGAGGTACATTCCGTGGACGTGTAGAAGCTTCCGTTATCCGTGCTAACCAGTTCGAAGGTGCAATCGTTGCACATAGGACCTATGGTGACTGCCCTCCGGTATATAACTCGCAGCAGAGGGTTTGCCGTTGGAGGTGGAGATATGTGGACAACGTGCAAGGCCAAGGTAAAAACGTAACATTCTTCTTTAAACTGAACGGTACTCGTGCCAACTCTCAACTAAATGCGTGGATAGCTGGTCACCAATTACTTGCTGGCAAGAAGTACGGAAACGATAACGATGGCATGTGTGCAGTTGGGATAACAGGTCTAGGTGAACAAACTATAGACATTATTATCGAGATTTACACACCATGGTCAACAGGGAACGTGACAGGCATTACAATATCTTGTCCTACAGTCGTTGTAAGTCGTTCTAACTCAAGTTTCCAAGGTCCTTGGAATGAGTCTCACGACTAA

Genome Context

Tertiary structure

PDB ID

5fc54a57584b95745e691d923857e81bfcd314c643142ca0bacf83e24217aab7

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,6439

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence