Protein

View in Explore

Genbank accession

UTN90646.1 [GenBank]

Protein name

tail fiber

RBP type

Evidence GenBank

Probability 1,00

TSP

Evidence DepoScope

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,87

Evidence RBPdetect2

Probability 0,92

Protein sequence

MATLKQIQFKRSKTAGARPAASVLAEGELAINLKDRVLFTKDDQGNIIDLGFAKGGSIDGNVIHIGNYNQTGDYTLNGTFTQTGNFNLTGIARVTRDIIAAGQIMTEDGELITKSSGTAHVRFFDGNSRERGIIYAPANDGLTAQVLNIRVQDYAAGNESTYAFSGSGLFTSPEVSAWKSISSPQILTNKVITNNKSTGDYDIYSMADNVPLSESTTAINHLRVMRNAVGSGIFHEVKDNDGITWYAGDGLDTYLWSFTWSGGIKSSHSISIGLTPGNKDYSILGPSSIALGDNDTGFKWHQDGYYFSVNNGTKTFLFSPSETTSLRKFVAGYSTNGTDLTTPPTENYALATVVTYHDNNAFGDGQTLLGYYQGGNYHHYFRGKGTTNINTHGGLLVTPGNIDVIGGSVNIDGRNNSSTLMFRGNTTGSSSVDNMTISVWGNTFTNPSVGNRKNVMEISDATSWMSYIQRLTTGEVEMNVNGSFESSGVTAGHRGVHTTGEISSGAVNALRIWNADYGVIFRRSENSLHIIPTSYGEGKNGDIGPLRPFRMDLDTGKVSIPNMDTTNLTMNPNGSIKFTGRGNGTELYINQYGQAAPIYQEINNDSASAYIPIIKQKYLNGGIMWSMGTELNSGDFVIHRINAAGDENRIIKFDSNCIPHFPDNVSVGGGEATIGKDGNIWSDIWKTFTSAGDVTNLLGAVWSRVSKEGDTMTGRLTLNTNSDAIVINSAATESGYVKGQKAGVNNWYVGNGGADNALSFYSFQTNSGVNIHNSGEIGLAPQGSDTFYFNRDRLYIKGSQWVAHKSGAWGDQWGLEAPIFVDFGSVSNDCYYPIIKGKSGITNEGYFSGVDFGMRRITNTWAQGIIRVGNQENGHDPQAVYEFNHNGTFYAPNTVQTGARLSAGGGTPVWTGPCLVIGDNDTGLVHGGDGRINMVANGVHIASWSAGYQIHQGLWDTTGAFWTEVGRAIVSHGHLVQENDSYSTFVRDVYVRSDIRVKKDLVKFENASQKLSKINGYTYMQKRGLDEEGNQKWEPNAGLIAQEVQAILPELVEGDPDGEALLRLNYNGVIGLNTAAINEHTTEIAELKSEIEELKALVKSLLK

Physico‐chemical properties

protein length:	1103 AA
molecular weight:	119363,75450 Da
isoelectric point:	5,52904
aromaticity:	0,09610
hydropathy:	-0,35748

Domains

Domains [InterPro]

DC_0538
STR
1–683

DC_0538 G3DSA:6.20.80.10 IPR030392

IPR048390
ATT
450–549

IPR048390 DC_0339 Coil

IPR030392
CHP
993–1052

IPR030392

DC_2320
RBD
1020–1103

DC_2320

UTN90646.1

1 1103

Architecture

STR

ATT

STR

RBD

STR 1-449 | ATT 450-549 | STR 550-1039 | RBD 1040-1103

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0538	STR	DC_0538	1	683	Novel HMM	DC_0538	Central	Low	Positional only	380 proteins / 380 hits
IPR048390	ATT	DC_0836	450	549	InterPro cluster	Long-tail fiber proximal subunit, trimerization domain	C-terminal	Medium	Text match	656 proteins / 656 hits
DC_0339	STR	DC_0339	616	1039	Novel HMM	DC_0339	Central	Low	Positional only	187 proteins / 187 hits
G3DSA:6.20.80.10	STR	G3DSA:6.20.80.10	722	776	Merged direct domain	G3DSA:6.20.80.10	Central	Low	Positional only	37 proteins / 37 hits
IPR030392	CHP	DC_0088	993	1091	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits
IPR030392	CHP	DC_0088	993	1052	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits
DC_2320	RBD	DC_2320	1020	1103	Novel HMM	DC_2320	C-terminal	Low	Positional only	17 proteins / 17 hits
Coil	Unmapped	-	1077	1097	Coils	Coil	-	-	-	-

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

UTN90646.1

1 1103

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	648	648	0,0877
Central domain	649	847	200	0,2081
C-terminal	848	1103	255	0,8857

Note: Constraints were applied during segmentation.
Fixed 17 C-terminal predictions appearing before Central domain

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-648

Central
649-847

C-terminal
848-1103

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Escherichia phage vB_Eco-B1.1 [NCBI]	2961838	Viruses >
Host	Escherichia sp. [NCBI]	1884818	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales

Coding sequence (CDS)

Genbank protein accession

UTN90646.1 [NCBI]

Genbank nucleotide accession

ON871820.1 [NCBI]

CDS location

range 140529 -> 143840
strand -

CDS

ATGGCTACTTTAAAACAAATACAATTTAAAAGAAGCAAAACTGCAGGAGCACGTCCTGCTGCTTCAGTATTAGCCGAAGGTGAATTGGCTATAAACTTAAAAGACCGTGTACTTTTTACTAAAGATGACCAAGGAAATATTATTGATCTTGGTTTTGCTAAGGGCGGTAGTATTGACGGGAATGTTATTCATATAGGAAATTATAATCAAACTGGTGATTATACTTTAAATGGCACCTTCACTCAGACAGGTAATTTTAATTTAACTGGTATTGCTCGAGTAACTCGCGATATTATTGCCGCCGGGCAAATTATGACTGAGGATGGAGAACTTATTACAAAAAGTTCAGGTACAGCGCATGTTCGTTTTTTCGATGGCAATAGTCGCGAACGTGGAATCATTTATGCCCCGGCTAATGATGGTTTAACTGCACAAGTACTTAATATCAGGGTTCAAGACTACGCCGCTGGTAACGAAAGCACTTATGCATTTTCAGGCAGTGGCCTATTTACTTCACCTGAAGTATCAGCATGGAAATCTATTTCGTCTCCACAAATTCTAACCAACAAAGTCATTACTAATAATAAATCTACGGGTGATTATGACATCTATTCGATGGCAGACAATGTTCCATTGTCTGAAAGCACTACTGCTATTAATCATCTTCGTGTCATGCGTAATGCCGTTGGTTCTGGTATTTTCCATGAAGTTAAAGATAATGATGGAATAACTTGGTATGCAGGTGATGGACTTGACACCTATCTTTGGTCATTTACTTGGAGCGGCGGAATTAAATCAAGTCACTCAATTTCTATTGGTTTAACACCTGGTAATAAAGATTATTCAATATTAGGACCATCTAGTATTGCTTTAGGAGATAATGATACTGGATTTAAATGGCATCAAGATGGATATTATTTTAGCGTTAATAATGGAACAAAAACGTTTTTATTTAGTCCTAGCGAAACAACTAGCCTAAGAAAATTTGTAGCTGGATATTCTACTAACGGAACCGATTTAACTACTCCTCCAACTGAAAACTATGCTCTCGCTACTGTCGTGACATATCACGATAATAACGCGTTTGGAGATGGTCAGACTCTTTTAGGATATTATCAAGGCGGTAACTATCATCATTATTTCCGCGGTAAGGGTACTACAAACATTAATACTCACGGTGGTTTATTAGTCACTCCTGGTAATATTGACGTTATTGGTGGTTCTGTTAATATTGATGGTCGTAATAATTCTTCTACGCTGATGTTTAGAGGTAACACAACAGGTAGTAGTTCTGTGGATAACATGACAATTTCCGTGTGGGGTAACACGTTTACTAATCCTAGTGTAGGTAATCGTAAAAACGTCATGGAAATTTCTGATGCAACTAGTTGGATGAGCTATATTCAAAGACTTACAACAGGTGAAGTAGAAATGAACGTTAACGGTTCATTTGAATCATCTGGTGTTACTGCTGGACATAGAGGAGTTCACACAACAGGTGAAATTTCATCTGGAGCAGTGAATGCGCTTCGCATTTGGAATGCAGATTATGGAGTCATTTTCCGTCGTTCAGAAAACAGTCTTCATATTATTCCGACTTCTTACGGTGAAGGTAAAAATGGTGATATCGGTCCACTTCGCCCGTTCCGTATGGACCTTGATACAGGTAAAGTAAGTATTCCTAATATGGATACTACTAATTTGACTATGAACCCAAATGGTTCTATTAAATTTACTGGTCGTGGTAATGGTACCGAGCTGTATATTAATCAGTATGGGCAAGCGGCACCGATTTATCAAGAAATTAATAATGATTCCGCTTCTGCTTATATTCCAATTATAAAACAGAAATACTTAAATGGCGGTATAATGTGGTCTATGGGGACCGAACTTAATTCCGGTGATTTTGTAATCCATAGAATTAATGCCGCTGGTGATGAAAACCGAATTATTAAATTTGATAGTAACTGCATTCCGCATTTCCCGGATAACGTTTCGGTTGGCGGCGGTGAAGCTACTATTGGCAAAGATGGCAACATCTGGTCTGATATCTGGAAAACGTTTACTTCTGCCGGTGATGTAACCAATCTTCTTGGCGCTGTCTGGAGCCGTGTTTCTAAAGAAGGCGACACGATGACCGGCCGTTTAACTCTGAATACAAACTCGGATGCTATTGTTATTAACAGTGCGGCAACTGAATCTGGTTATGTGAAAGGACAAAAAGCAGGCGTTAATAACTGGTATGTGGGCAATGGCGGCGCTGATAACGCCCTATCGTTTTATAGTTTCCAAACTAATTCGGGTGTTAATATTCATAATAGTGGGGAAATTGGTTTAGCTCCTCAAGGGTCGGATACTTTTTATTTTAATAGGGACCGTCTTTATATAAAGGGTTCACAATGGGTTGCGCATAAATCTGGCGCCTGGGGTGACCAATGGGGTTTAGAAGCTCCTATATTTGTAGATTTTGGATCCGTCAGCAATGACTGTTATTATCCTATTATTAAAGGAAAATCTGGTATTACTAACGAAGGATATTTTTCCGGCGTAGATTTTGGTATGCGACGCATTACTAATACATGGGCGCAAGGTATTATTCGTGTAGGTAACCAGGAAAATGGACATGACCCGCAAGCTGTCTATGAATTCAATCATAACGGCACTTTTTATGCTCCTAACACGGTTCAAACTGGAGCAAGATTATCAGCTGGAGGTGGAACCCCGGTATGGACTGGACCATGTCTTGTTATTGGTGATAATGATACTGGATTAGTTCATGGTGGTGACGGCCGAATCAATATGGTTGCAAATGGAGTGCATATTGCTTCTTGGTCAGCGGGTTACCAGATTCATCAAGGTCTTTGGGATACCACTGGTGCTTTTTGGACAGAAGTTGGAAGAGCTATCGTTTCTCATGGGCATCTCGTTCAGGAAAATGATAGTTATTCAACGTTTGTCCGTGATGTTTATGTCCGTTCTGATATTCGTGTTAAAAAAGACCTCGTTAAATTTGAAAATGCTTCTCAGAAGCTTTCTAAAATTAACGGTTACACTTATATGCAGAAGCGAGGCCTAGATGAAGAAGGCAATCAGAAATGGGAACCTAACGCCGGTTTGATAGCCCAAGAAGTTCAAGCTATTTTACCAGAATTAGTTGAAGGTGACCCTGATGGCGAAGCTTTACTTCGTTTGAACTATAACGGTGTAATTGGTTTAAATACAGCTGCAATAAATGAACATACTACAGAAATTGCGGAACTTAAATCAGAAATTGAAGAACTTAAAGCATTAGTTAAATCATTGTTAAAATAA

Genome Context

Tertiary structure

PDB ID

6ae48ffa730ff0db105c38554e3ce73455e96524635b9a6f4297ed88a49b6117

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,5402

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence