Protein

View in Explore

Genbank accession

XHH63262.1 [GenBank]

Protein name

tail fiber protein

RBP type

Evidence GenBank

Probability 1,00

TSP

Evidence DepoScope

Probability 1,00

Evidence RBPdetect

Probability 0,90

Evidence RBPdetect2

Probability 0,96

Protein sequence

MADYKLSELNSIDTIRSDDLLHVRVKKRPEMLGDEDRRMTYQDFLASFKLERFVQIAGSNMTGDLGIVKLLYGGKAVFDPTGSSEVTIGDVLKTFKINANGLKLIIADASRSATVYHTLNKPSPNELGMRTNEENDARYARLAVTNTFSGTQQIQGDANLLRLRNQNANNAQYIEGVDLDGSARWWVGIGRNGGDTVNLYNNKYDSALTVASNISVNKSLVITGQVQPSDFSNLDARYFTQTVANQRFAQLAGNNTFSGANTFRKDVIFNSDVPVVLKNLTANKPLYIQGKDSQNTNLWFVGKGGTGTEIKFYNYVTDTVLELSKTARFNKTLKITGQVQPSDWANIDSRYIPAATLSTIARTNATNTFSGTQQIQGDANLLRLRNQNANNAQYIEGVDLDGSARWWVGIGRNGSDEVKLYNNKYDSALTVASNISVNKSLAITGQVQPSDFSNLDARYFTQSASDSRYLRIRSTGFNRGNGEKWTKIATVVMPQSASTAVIEVFGGSGFNVNTPHQAGKCEIILRTSNNNPKGLNAVAWRISENTIVTDIGYVNTSGDTYDIYCRVGTYQNGTTSRVQSSSNASVQLFEFPQTSDDAPQGIVKGTIAKYYTSLQKPTPSDIGAYTKAETDQKIAQAVSDSTDLNKIYPVGIVTWFNSNVNPNTALPGLTWTYLNNGVGRTIRIAAANGSDVATTGGSDSVTLSVGNLPSHTHSFSATTSSFDYGTKTTNTTGAHTHSVSGSTNNTGAHTHTVGGRYGGDSIGGKQRVQVSGTAQVSSSAGAHTHTVSGTAASNGNHAHTVGIGAHSHTVSGNTGGTGSGSAFSVTNQFYKLMAWVRTA

Physico‐chemical properties

protein length:	839 AA
molecular weight:	90251,62910 Da
isoelectric point:	9,12165
aromaticity:	0,08224
hydropathy:	-0,41144

Domains

Domains [InterPro]

DC_0032
ATT
1–272

DC_0032 IPR048388 G3DSA:6.20.80.10 IPR051934

G3DSA:6.20.80.10
STR
159–218

G3DSA:6.20.80.10 DC_1993 IPR048388 IPR005003 IPR005003 IPR005003 DC_2042

IPR048388
ATT
159–247

IPR048388 G3DSA:6.20.80.10 DC_0387 IPR005003 IPR005003

XHH63262.1

1 839

Architecture

ATT

STR

RBD

ATT 1-360 | ATT 380-464 | STR 465-718 | RBD 760-839

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0032	ATT	DC_0032	1	272	Novel HMM	DC_0032	N-terminal	Low	Positional only	139 proteins / 139 hits
G3DSA:6.20.80.10	STR	G3DSA:6.20.80.10	159	218	Merged direct domain	G3DSA:6.20.80.10	Central	Low	Positional only	37 proteins / 37 hits
IPR048388	ATT	DC_0224	159	247	InterPro cluster	Tail fibre protein gp37, trimerization region	Central	Medium	Text match	404 proteins / 802 hits
DC_1993	STR	DC_1993	241	360	Novel HMM	DC_1993	Central	Low	Positional only	126 proteins / 126 hits
IPR048388	ATT	DC_0224	274	354	InterPro cluster	Tail fibre protein gp37, trimerization region	Central	Medium	Text match	404 proteins / 802 hits
G3DSA:6.20.80.10	STR	G3DSA:6.20.80.10	275	331	Merged direct domain	G3DSA:6.20.80.10	Central	Low	Positional only	37 proteins / 37 hits
G3DSA:6.20.80.10	STR	G3DSA:6.20.80.10	380	439	Merged direct domain	G3DSA:6.20.80.10	Central	Low	Positional only	37 proteins / 37 hits
IPR048388	ATT	DC_0224	380	464	InterPro cluster	Tail fibre protein gp37, trimerization region	Central	Medium	Text match	404 proteins / 802 hits
DC_0387	STR	DC_0387	416	718	Novel HMM	DC_0387	Central	Low	Positional only	34 proteins / 34 hits
IPR051934	Unmapped	-	526	811	InterPro	Bacteriophage Tail Fiber Structural Protein	-	-	-	-
IPR005003	Unmapped	-	710	719	InterPro	Bacteriophage lambda, Tail fiber protein, repeat-1	-	-	-	-
IPR005003	Unmapped	-	730	743	InterPro	Bacteriophage lambda, Tail fiber protein, repeat-1	-	-	-	-
IPR005003	Unmapped	-	744	755	InterPro	Bacteriophage lambda, Tail fiber protein, repeat-1	-	-	-	-
DC_2042	RBD	DC_2042	760	839	Novel HMM	DC_2042	C-terminal	Low	Positional only	65 proteins / 65 hits
IPR005003	Unmapped	-	778	791	InterPro	Bacteriophage lambda, Tail fiber protein, repeat-1	-	-	-	-
IPR005003	Unmapped	-	802	814	InterPro	Bacteriophage lambda, Tail fiber protein, repeat-1	-	-	-	-

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

XHH63262.1

1 839

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	389	389	0,6855
Central domain	390	588	200	0,1263
C-terminal	589	839	250	0,9306

Note: Constraints were applied during segmentation.
Fixed 109 C-terminal predictions appearing before Central domain

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-389

Central
390-588

C-terminal
589-839

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Salmonella phage vB_Si_CECAV_FGS030 [NCBI]	3237255	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Salmonella enterica subsp. enterica serovar Infantis [NCBI]	595	Pseudomonadota > Gammaproteobacteria > Enterobacterales > Enterobacteriaceae > Salmonella > Salmonella enterica

Coding sequence (CDS)

Genbank protein accession

XHH63262.1 [NCBI]

Genbank nucleotide accession

PP429241.1 [NCBI]

CDS location

range 51488 -> 54007
strand +

CDS

ATGGCAGATTACAAGTTGAGTGAATTAAACTCAATCGATACAATCCGTTCAGATGACCTTCTTCATGTCAGAGTTAAAAAGAGACCTGAAATGCTTGGCGATGAAGACCGTAGAATGACCTATCAAGATTTCTTAGCTTCCTTCAAACTAGAAAGGTTTGTTCAGATTGCTGGGAGTAATATGACAGGTGACTTAGGGATTGTTAAGTTACTTTATGGTGGTAAGGCAGTATTTGACCCAACAGGCTCTTCTGAGGTTACTATTGGGGATGTTTTAAAGACTTTTAAAATCAACGCAAATGGCCTTAAACTGATTATTGCAGATGCTTCAAGGTCAGCAACTGTTTATCATACCCTGAATAAACCAAGTCCTAATGAGCTTGGGATGAGAACTAATGAAGAGAATGATGCAAGATATGCAAGACTTGCTGTCACAAACACATTCTCTGGGACTCAGCAAATTCAAGGTGATGCTAACTTACTTCGCCTTAGAAACCAAAATGCAAATAATGCACAATATATTGAAGGTGTAGACCTAGATGGTTCAGCTAGATGGTGGGTTGGTATTGGTCGAAATGGCGGTGATACAGTAAACCTGTATAACAACAAATACGACTCAGCCTTGACTGTTGCAAGTAATATTTCTGTTAATAAGTCTTTAGTAATCACTGGTCAAGTCCAACCTTCAGATTTCTCTAACTTAGATGCTAGATACTTTACTCAGACAGTTGCTAATCAGAGATTTGCACAGTTAGCTGGCAATAACACATTTAGTGGTGCTAATACATTTAGAAAAGATGTTATCTTTAACTCAGATGTTCCAGTTGTTCTTAAGAACTTAACAGCCAATAAGCCGCTGTATATTCAAGGTAAAGACAGTCAAAATACTAATTTGTGGTTTGTTGGTAAGGGTGGAACGGGTACTGAGATTAAGTTTTATAACTATGTGACTGATACAGTTTTAGAGTTGTCTAAGACGGCTAGATTTAATAAAACTTTGAAGATTACTGGGCAAGTTCAACCTTCAGATTGGGCTAACATTGACTCTAGATATATTCCGGCAGCAACATTAAGTACGATTGCAAGAACTAATGCAACCAATACATTCTCTGGGACTCAGCAAATTCAAGGTGATGCTAACTTACTTCGCCTTAGAAACCAAAATGCAAATAATGCACAATATATTGAAGGTGTAGACCTAGATGGTTCGGCTAGATGGTGGGTCGGTATTGGTCGAAATGGCTCTGACGAAGTAAAACTGTACAATAACAAATACGACTCAGCCTTGACTGTTGCAAGTAATATTTCTGTTAATAAGTCTTTAGCAATCACTGGCCAAGTTCAACCCTCAGATTTTTCTAACTTAGATGCTAGATACTTTACTCAAAGTGCTAGTGATAGTAGATACCTGAGAATCAGAAGTACTGGCTTCAATCGGGGAAATGGTGAAAAGTGGACTAAAATTGCTACTGTTGTAATGCCGCAATCCGCATCTACTGCGGTGATTGAAGTGTTTGGTGGGTCAGGTTTTAATGTTAACACACCACATCAAGCAGGTAAGTGTGAGATTATTTTGCGAACATCAAATAATAACCCAAAAGGTTTAAATGCTGTAGCTTGGAGAATCTCAGAGAATACCATTGTCACAGACATTGGTTATGTTAATACATCTGGTGACACTTACGATATTTACTGTAGGGTCGGTACGTATCAAAACGGAACAACGTCAAGGGTTCAGTCTTCTAGTAATGCAAGTGTGCAGTTGTTTGAATTCCCACAAACATCTGATGATGCTCCGCAAGGTATTGTAAAGGGTACAATTGCAAAATACTACACAAGTCTGCAAAAACCAACCCCTTCAGATATCGGTGCATACACTAAAGCTGAAACTGACCAGAAGATTGCACAGGCAGTAAGTGACTCTACAGACCTTAATAAAATCTATCCAGTAGGGATTGTGACATGGTTTAACAGTAATGTTAACCCTAATACAGCACTCCCTGGGTTAACTTGGACGTATCTGAACAATGGTGTTGGTAGAACTATTAGAATTGCAGCAGCAAACGGTTCAGATGTTGCTACAACTGGTGGTTCAGATTCTGTAACGTTATCTGTTGGTAACTTACCTTCACACACTCATAGCTTCTCTGCGACTACTTCATCATTTGACTATGGTACTAAAACCACTAACACTACTGGTGCTCACACCCACTCAGTGAGTGGTTCTACTAACAACACTGGTGCTCATACACATACAGTTGGTGGTCGTTATGGTGGTGACTCTATCGGTGGTAAACAACGTGTTCAGGTCTCAGGGACTGCTCAGGTATCTAGCTCTGCTGGTGCTCACACTCACACTGTATCTGGTACTGCTGCCTCTAACGGAAACCATGCTCACACTGTTGGTATTGGTGCTCACAGTCATACAGTTAGTGGTAACACTGGTGGTACAGGTTCTGGTTCAGCATTTAGTGTAACTAACCAGTTCTATAAGCTGATGGCTTGGGTAAGAACTGCTTAA

Genome Context

Tertiary structure

PDB ID

2ac9171f862fa93c8c1b29f50d070a68c663668c441c727094391c9031f1cd07

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,6588

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence