Protein

View in Explore

Genbank accession

URQ04057.1 [GenBank]

Protein name

tail fiber protein

RBP type

Evidence GenBank

Probability 1,00

TSP

Evidence DepoScope

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,85

Evidence RBPdetect2

Probability 0,82

Protein sequence

MATIKQIQFKRSNVAGKRPLPADIAEGELAINIKDSTLFTKNADGQIIDLGFAKGGKIDGDVTQVGNYTTSGDISAKTFLASAGVSSNGDIVAERGVIRTRAAASGNAHLWFEGEEVTGENRNKERGVLYAAQQTDTDGRVNLRVYNGKSHAANTNNALFVFNGAGDFAAPKDLYGQRSRLSIESVAPTMNTSRVYTRDRDWNQFGGNESYAWNDLVTYTAGTNGALALNYVYKGRAHLTGTIWHHLIDERDGPEWALYTGGTPDRKMFSIRSIGNLGHAQVTGSLFLGPGGGGLGVTSGMGQGSLALGDNDTGLRNDGDGAFSVMANSRELVNYNSSAAKYQIEHRKATRITHTDNANTPILPTNNNPLLEIDTSLDSNNSGGNGLTLLGYNSGGKYYHYFRGNGNAVFDMSLGVSINKGGLNVNGNSAFSGTVSSPRFDALGDISFKNTVNRHIRFEYTNSSGATAVDGYIFKDGPSNTSRRPGIRVNCTAPNSSSGSGDFVFGEDGHFTVPRQVQPGDFGNFDSRYQNLFQLGANVNLDTLTGDSQIGEYAQHANANTSLALNYPEAQAGHLTITSGAGVQQTYRVYNSSRMYLRSKYSTSPWTPWDRVVTDDYLASGIGGSIVSKAADGFRIAYGGYGFFIRNDGGNTYFMLTNSGDSMGTWNGLRPLSINNSNGNVTMSHSLTVGGSSSFGSALTVGNGLTVNGASGINVTSTAGNAISWGNAGACLANDGNLKGSRWKSFGGSEWAGDALSWVNNNNVAKAGDTMTGKLVIQNTSGDMVRMNCTAGGAVYVLGQRAGTNAFYVGVGGSGNNATFHSYLNNTTIELRPSDIYFNRTVYGAGDANFNNVYIRSDVTLKRNFKKIENALDKVDKLDGLIYEKKNTPTSTEYESVEAGIIAQSLQEILPEAVVEKEGILNVSASGTIALLVNAIKELKARVEYLESK

Physico‐chemical properties

protein length:	949 AA
molecular weight:	101145,34990 Da
isoelectric point:	6,59340
aromaticity:	0,09062
hydropathy:	-0,38251

Domains

Domains [InterPro]

DC_0538
STR
1–420

DC_0538 cd19958 IPR048390 G3DSA:6.20.80.10 IPR030392 Coil

DC_1202
STR
540–949

DC_1202

IPR048388
ATT
791–849

IPR048388 IPR030392

URQ04057.1

1 949

Architecture

STR

ATT

STR

ATT

STR

STR 1-420 | STR 534-621 | ATT 622-674 | STR 675-790 | ATT 791-849 | STR 850-949

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0538	STR	DC_0538	1	420	Novel HMM	DC_0538	Central	Low	Positional only	380 proteins / 380 hits
cd19958	STR	DC_0464	534	612	InterPro cluster	cd19958	Central	Low	Positional only	1183 proteins / 1674 hits
DC_1202	STR	DC_1202	540	949	Novel HMM	DC_1202	Central	Low	Positional only	153 proteins / 153 hits
IPR048390	ATT	DC_0836	622	674	InterPro cluster	Long-tail fiber proximal subunit, trimerization domain	C-terminal	Medium	Text match	656 proteins / 656 hits
G3DSA:6.20.80.10	STR	G3DSA:6.20.80.10	781	840	Merged direct domain	G3DSA:6.20.80.10	Central	Low	Positional only	37 proteins / 37 hits
IPR048388	ATT	DC_0224	791	849	InterPro cluster	Tail fibre protein gp37, trimerization region	Central	Medium	Text match	404 proteins / 802 hits
IPR030392	CHP	DC_0088	857	914	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits
IPR030392	CHP	DC_0088	857	949	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits
Coil	Unmapped	-	929	949	Coils	Coil	-	-	-	-

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

URQ04057.1

1 949

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	225	225	0,1280
Central domain	226	424	200	0,2741
C-terminal	425	949	524	0,8280

Note: Constraints were applied during segmentation.
Fixed 27 C-terminal predictions appearing before Central domain

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-225

Central
226-424

C-terminal
425-949

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Enterobacter phage vB_EclM-UFV01 [NCBI]	2945895	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Enterobacter cloacae ATCC 13047 [NCBI]	336306	Pseudomonadota > Gammaproteobacteria > Enterobacterales > Enterobacteriaceae > Enterobacter > Enterobacter cloacae

Coding sequence (CDS)

Genbank protein accession

URQ04057.1 [NCBI]

Genbank nucleotide accession

ON454249.1 [NCBI]

CDS location

range 56980 -> 59829
strand +

CDS

ATGGCAACTATCAAACAAATTCAATTTAAGCGTTCTAATGTTGCTGGTAAAAGACCGCTTCCAGCTGATATCGCTGAAGGCGAATTAGCAATTAACATCAAAGATTCCACGTTATTTACAAAGAACGCTGATGGACAAATTATTGACCTCGGTTTTGCTAAAGGTGGTAAAATCGACGGCGACGTTACTCAAGTAGGTAATTACACCACTTCTGGTGATATTAGTGCTAAAACCTTTTTAGCCTCAGCAGGTGTTTCATCAAATGGTGATATTGTTGCTGAAAGGGGTGTAATTAGAACTCGTGCTGCCGCTTCAGGCAACGCTCATTTATGGTTTGAAGGCGAAGAAGTAACTGGCGAAAACCGTAATAAAGAACGAGGTGTTTTATATGCGGCTCAACAAACAGATACCGATGGGCGAGTAAACCTTCGAGTTTATAATGGTAAATCCCACGCGGCTAATACAAACAACGCATTGTTCGTGTTTAACGGGGCTGGGGATTTCGCTGCTCCTAAAGATTTGTATGGCCAGCGCTCTCGTTTAAGTATTGAGTCTGTTGCTCCTACGATGAATACTTCACGTGTTTATACTCGTGATAGAGATTGGAACCAATTTGGTGGTAACGAGTCATACGCCTGGAATGACCTTGTAACTTATACTGCTGGAACGAATGGTGCACTGGCGCTGAACTATGTATATAAAGGTAGAGCACACTTAACCGGAACAATTTGGCATCATTTAATCGACGAACGCGATGGCCCTGAATGGGCACTTTATACTGGCGGTACTCCTGATAGAAAAATGTTCTCTATCCGTTCTATAGGAAATTTAGGTCATGCTCAAGTTACAGGAAGCTTATTCTTAGGTCCTGGTGGTGGCGGCCTTGGGGTAACATCTGGAATGGGTCAAGGTTCTTTGGCATTAGGTGATAATGATACCGGATTAAGAAATGATGGCGATGGTGCGTTTAGCGTAATGGCCAATTCTCGTGAGTTGGTTAATTACAATTCATCAGCGGCTAAATATCAAATTGAACACAGAAAAGCAACTAGAATTACTCACACTGATAATGCTAACACACCAATTTTGCCAACTAATAACAACCCATTATTAGAAATTGATACTTCGTTAGATTCTAATAATTCTGGCGGTAATGGATTGACTTTATTAGGTTATAATTCCGGCGGGAAATATTATCATTATTTTCGCGGAAATGGTAATGCCGTATTTGATATGTCTTTAGGCGTTAGCATTAATAAAGGCGGGTTGAATGTTAATGGTAACAGTGCATTTTCAGGTACTGTGTCTTCACCGCGTTTTGATGCATTAGGTGATATTTCATTTAAAAATACAGTGAATCGCCATATTCGTTTTGAATATACAAATTCATCCGGTGCAACTGCAGTAGATGGTTATATTTTTAAAGATGGACCTAGCAATACTTCCAGACGTCCTGGTATTCGTGTTAACTGCACGGCTCCTAATTCCAGTTCCGGTTCAGGTGATTTTGTATTTGGCGAAGATGGACATTTTACTGTTCCAAGACAAGTTCAACCAGGCGATTTTGGTAACTTTGATTCACGTTATCAGAATTTGTTCCAGCTTGGTGCAAACGTAAACTTAGATACGCTAACTGGTGACAGCCAAATTGGTGAATATGCTCAGCACGCTAATGCTAATACTTCTTTGGCATTAAATTATCCTGAAGCACAAGCTGGTCATTTAACTATTACTTCCGGCGCCGGTGTTCAACAGACGTATCGTGTGTATAATTCTAGCCGTATGTATCTTCGTTCCAAATATTCTACTTCTCCTTGGACTCCTTGGGATAGAGTTGTAACAGATGATTATTTGGCTTCTGGTATCGGCGGTTCTATAGTTTCTAAAGCAGCAGATGGTTTCCGTATTGCATATGGTGGCTACGGGTTCTTTATCCGTAACGATGGTGGCAATACTTATTTCATGCTGACAAACTCCGGCGACTCTATGGGGACTTGGAATGGTCTTCGCCCGCTGTCTATTAATAACTCTAACGGCAACGTAACAATGAGTCATTCATTGACCGTTGGTGGTTCTTCATCATTTGGTAGTGCTTTAACAGTAGGTAATGGATTGACTGTTAACGGCGCCTCAGGTATTAACGTTACTAGTACTGCCGGTAATGCTATTTCCTGGGGTAACGCTGGCGCTTGTCTGGCAAATGATGGTAACTTAAAAGGCTCGCGTTGGAAATCGTTTGGTGGTTCTGAATGGGCTGGCGATGCTTTAAGCTGGGTTAACAATAATAACGTTGCCAAAGCTGGCGATACTATGACTGGTAAGCTAGTTATCCAGAATACTTCAGGTGATATGGTTCGTATGAACTGTACAGCTGGCGGTGCTGTTTATGTTCTTGGTCAACGTGCTGGCACTAATGCTTTTTATGTAGGTGTTGGCGGTTCTGGCAATAATGCCACGTTCCATAGCTATTTAAATAACACGACAATAGAACTTCGCCCGAGCGATATTTACTTTAACAGAACTGTTTATGGTGCTGGCGACGCAAACTTTAACAACGTTTATATTCGTTCTGATGTTACTTTAAAACGTAACTTCAAGAAAATTGAAAACGCTCTTGATAAAGTTGATAAGCTTGATGGTTTGATTTACGAGAAGAAAAACACTCCTACTTCAACCGAATACGAGTCTGTAGAAGCCGGTATTATCGCTCAGAGCCTTCAGGAAATTTTACCAGAAGCTGTCGTTGAAAAAGAAGGTATTTTAAACGTTTCTGCTTCAGGTACTATTGCTCTGCTGGTTAACGCTATCAAAGAGCTTAAGGCTCGTGTTGAATATCTTGAATCAAAATAA

Genome Context

Tertiary structure

PDB ID

77d4ec4aef788ae85d73d976d3b2dc6e65c1da0957ce8adbfb7ecd4fba6e09f8

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,5743

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence