Protein

View in Explore

Genbank accession

QUE39228.1 [GenBank]

Protein name

tail fiber protein

RBP type

Evidence Phold

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,84

Protein sequence

MEVHNNFSPLAFRKKESKATYEKWYAFGKNYAIPASANTLIPFQFTDVNVGEVQPDSIEVVAVNQETGEGIKTGVYVSRDDMPEHGSVLYVSPGKNSFSEALPQGTYRAEFSIGTQFYISTPFCVIPGIETSSKYLLIEYWNDEKIAYPGGFITTGANNDFRYQMYVPATICKPKYEFEEELTKRAGYKFLELQTSTKVYAFTFVAPEFICDAMRLIRLSDYIRISHDGEYYNALNFEFDVDWQEQLYLAAVDCQFETDSIIQKLPSFNRRDKASFYNALLANIDTPIMFSPDTVGLYYKEYRETEQVVKGKLIRELSPIDLIDENTTIAVDLGTGEARKFNLYRMLQDYISKTHEDATDFLLHLRGGATFGEGITGSAASINAVGDAEVQGLNARVTKVKSLDSEDYVTVNKTAFTVNKQGDTALNALNARGDSHLQQDVYTGNNTGKITKEGQLQYLSAIIYEFLSSETFVPGFLGEGFKIWLENGNWHIECDNLTVRQTMNIFELLIQKIRSVNGAIVVSQSNGKLSAVEEVGTQYKLNTGEEFPTFQEGDLVRCQTFAGYQGEGLTFDFTQFAKYDYSGSPFDSSLIDVTPDSISFNLNDTGNSGFAFYKFSESSPTPIEIPSFTLTLEGGYPGMMAFAAGLDSNDSPVEGVGVLLQNGDNVIPAIKSEQGIHNFAIIITGDSGHGNGKVTVKQKKAAGSAPSNNFVKFYWVEVKSVDGTSFFVDKSEFNGVVPAVGDEVVQMGNTKNPERQALIYITAQESGHPYIEILNGVKTKSLSGTNRTRLGDLSNIQDSAFPEGQQPSGSGLYCDNAFLRGIFLLRNGKSVEDEVNQAKQDAANAATDAERAQQTAQEAKDRLNKWADDGFISPTEKPALIDEGKRIQAEFLQIKNNADKYGVSVTEYTKAYEDYLNELRYHSAQQPEDIAVRPELAQSQTAYYDKRNGALNAIATAAKSYVDEADKKLKEYLDTEITAIPGKIELAVRSMKTADVNLLNGSYEEKANNSYRFAAYNYDTPVIDGKEYTLTVCYTIGSGNTNIGVYSNGGTNTIANLTTKGERVIESTKVTMKGYKPGEPLSFFQFPNGAFGSKVHWAVLTDGNLGVTNWIPSASEKNVGLKNLCSFKRITDAGFTYASRYDDDGTILMLPSVLHKESFVANKDMFGLTYDSQKRYYVFIDHSVPSTTIPSGTRSIFLRIVYTDGTIEDMSVFNDSIENNFILTSKAIKYILGSCGTSVSTYLRIGVFKTNTPVTWSPAPEDQLYQSVKYTDTQILAVDGKIELSVTTQLNKRVIGGANLCLKSGVCITGVDNHLRINMSKYWRDLRGKKVTLSFDYEYSNLVLGRNSRIGLEEDVLKDGTSSYYHIGAWKYFDSTSLKADTGRFVHTITVPNDIVNAQNIGIGFYIQVGDGTTMKICNPQIEIGNTATGWKPAPEDGVNSSIEYTNSQISVVEGKITSTVKKINTVDGRVTGLASRVDQTEKSITLKR

Physico‐chemical properties

protein length:	1489 AA
molecular weight:	164791,52590 Da
isoelectric point:	5,09058
aromaticity:	0,10745
hydropathy:	-0,34070

Domains

Domains [InterPro]

DC_0204
STR
1–1489

DC_0204

Coil
Unmapped
835–869

Coil G3DSA:1.20.5.2280

QUE39228.1

1 1489

Architecture

STR

STR 1-1489

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0204	STR	DC_0204	1	1489	Novel HMM	DC_0204	Central	Low	Positional only	68 proteins / 68 hits
Coil	Unmapped	-	835	869	Coils	Coil	-	-	-	-
G3DSA:1.20.5.2280	RBD	G3DSA:1.20.5.2280	1422	1489	Merged direct domain	G3DSA:1.20.5.2280	C-terminal	Low	Positional only	2 proteins / 2 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

QUE39228.1

1 1489

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	521	521	0,9126
Central domain	522	1295	775	0,4769
C-terminal	1296	1489	193	0,0366

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-521

Central
522-1295

C-terminal
1296-1489

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Bacteroides phage GEC_vB_Bfr_VA7 [NCBI]	2829146	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Bacteroides fragilis [NCBI]	817	cellular organisms > Bacteria > Pseudomonadati > FCB group > Bacteroidota/Chlorobiota group > Bacteroidota

Coding sequence (CDS)

Genbank protein accession

QUE39228.1 [NCBI]

Genbank nucleotide accession

MW916539.1 [NCBI]

CDS location

range 10863 -> 15332
strand -

CDS

ATGGAAGTACATAACAACTTTAGTCCTTTGGCGTTTAGAAAGAAAGAATCTAAAGCCACATACGAAAAATGGTACGCTTTCGGGAAGAATTATGCTATCCCCGCAAGCGCAAATACGCTTATACCTTTCCAGTTTACCGATGTAAATGTAGGAGAGGTTCAGCCCGATTCTATTGAGGTTGTAGCGGTAAACCAAGAAACCGGAGAGGGCATTAAAACAGGTGTGTATGTTAGTCGTGACGACATGCCCGAACATGGCAGCGTTCTGTACGTGTCACCCGGTAAGAACTCGTTTAGTGAGGCTTTGCCACAGGGTACATATCGGGCGGAGTTTTCAATAGGAACACAGTTTTATATTTCAACTCCTTTTTGTGTTATTCCCGGTATCGAAACAAGTAGCAAATATCTGTTGATTGAGTATTGGAATGATGAAAAGATCGCATATCCGGGTGGCTTTATTACAACGGGTGCGAACAATGACTTCCGGTATCAGATGTATGTTCCTGCAACGATCTGCAAACCTAAATACGAGTTTGAAGAAGAGCTAACCAAACGTGCCGGATACAAGTTTTTGGAACTGCAAACGTCTACGAAGGTGTACGCCTTTACATTCGTTGCACCGGAGTTTATTTGTGACGCTATGCGACTGATTCGCCTATCTGACTATATCCGAATTTCGCACGATGGCGAATATTACAACGCTCTCAACTTCGAGTTTGATGTTGATTGGCAGGAGCAATTGTACTTGGCGGCTGTTGACTGTCAGTTTGAGACAGATTCGATCATTCAAAAACTACCTTCTTTCAATAGACGAGATAAAGCGTCTTTTTATAATGCCCTATTAGCGAACATTGATACACCTATAATGTTCTCTCCCGATACCGTAGGGCTGTATTACAAAGAGTATCGGGAAACAGAGCAAGTAGTCAAGGGTAAATTGATACGGGAGTTATCCCCTATTGACTTGATAGATGAAAATACAACTATTGCCGTTGATTTGGGTACAGGTGAGGCGAGAAAGTTTAACTTATATCGAATGTTGCAGGACTACATTTCTAAAACCCATGAAGATGCAACAGACTTTTTGTTACACCTTCGTGGAGGCGCAACGTTCGGTGAGGGCATAACTGGTTCTGCCGCTTCTATCAACGCAGTAGGAGATGCGGAGGTTCAAGGGCTAAACGCACGTGTAACCAAAGTTAAATCGCTTGATTCGGAAGATTATGTAACTGTTAATAAAACAGCATTCACCGTAAACAAACAAGGTGATACGGCTTTAAATGCGCTTAATGCGAGGGGAGATTCCCACTTGCAGCAAGATGTGTATACCGGAAACAATACCGGAAAGATCACCAAAGAAGGACAATTGCAGTACCTATCAGCTATTATCTACGAGTTCCTTTCGTCCGAAACGTTCGTTCCTGGCTTCTTAGGTGAGGGCTTCAAAATATGGTTGGAGAATGGTAATTGGCATATCGAATGCGATAACCTAACCGTCCGTCAAACTATGAACATCTTTGAATTGCTGATTCAAAAGATTCGCAGCGTCAACGGTGCTATTGTCGTATCTCAGTCAAACGGTAAATTGTCAGCCGTTGAAGAAGTGGGGACGCAATACAAGCTAAACACTGGTGAAGAATTTCCCACTTTTCAAGAGGGAGATTTAGTCCGGTGCCAGACGTTTGCAGGCTATCAAGGTGAGGGGCTGACTTTTGACTTTACTCAGTTTGCAAAATATGACTATTCCGGATCTCCTTTTGATAGCAGCTTGATTGATGTTACACCCGACTCTATTAGCTTTAACTTGAATGATACTGGTAATTCCGGTTTTGCATTCTATAAATTTTCAGAGTCAAGCCCTACACCAATTGAAATACCTTCATTTACCTTGACTTTGGAGGGAGGCTATCCTGGTATGATGGCTTTTGCTGCCGGACTTGATTCAAATGACAGTCCGGTAGAGGGTGTAGGCGTATTGTTGCAAAACGGTGATAATGTCATTCCGGCTATTAAATCAGAACAAGGCATACACAACTTTGCTATAATAATAACTGGTGATTCAGGTCACGGTAATGGTAAGGTTACAGTAAAGCAAAAGAAAGCGGCAGGAAGTGCACCAAGCAATAACTTTGTTAAATTTTACTGGGTCGAAGTAAAGTCGGTTGATGGTACTTCATTCTTTGTCGATAAATCAGAATTTAACGGTGTCGTTCCGGCTGTCGGTGATGAAGTCGTTCAGATGGGAAATACGAAGAACCCCGAACGGCAGGCGTTAATTTATATCACAGCGCAGGAAAGCGGACACCCGTACATAGAGATATTGAACGGAGTTAAAACTAAATCGTTGTCCGGTACGAATAGAACACGTCTTGGCGATTTAAGTAACATACAGGACTCTGCGTTTCCGGAAGGACAACAGCCATCCGGTAGCGGCTTGTATTGCGATAACGCTTTTCTTCGTGGTATATTCTTGCTGAGAAACGGCAAGTCAGTTGAGGATGAAGTAAACCAAGCGAAGCAAGATGCAGCTAACGCAGCAACAGATGCGGAGAGAGCACAACAGACAGCGCAGGAGGCGAAAGATCGGCTTAATAAATGGGCTGACGATGGATTTATATCTCCTACTGAAAAGCCCGCTTTGATTGATGAAGGAAAGCGCATACAGGCAGAGTTTTTGCAGATAAAAAATAACGCTGACAAATACGGTGTATCCGTTACTGAATATACCAAGGCTTATGAAGATTATTTAAATGAACTTAGATACCATTCCGCCCAACAGCCGGAAGATATTGCGGTGCGTCCGGAATTGGCACAGAGTCAAACGGCTTACTACGACAAACGTAACGGAGCGTTGAATGCTATTGCAACGGCTGCTAAATCGTATGTAGATGAAGCGGATAAGAAGCTAAAGGAGTATTTAGATACGGAGATCACAGCGATACCAGGTAAGATCGAACTTGCTGTACGGAGTATGAAAACGGCTGATGTTAACTTGTTGAATGGTTCGTATGAAGAAAAAGCAAATAACTCTTATAGATTTGCCGCATATAACTATGATACACCAGTTATAGACGGGAAGGAATACACTTTGACTGTATGCTATACTATTGGGAGTGGTAATACCAATATAGGTGTTTATTCTAATGGTGGTACAAACACGATAGCAAATCTCACAACTAAGGGGGAAAGAGTTATAGAAAGCACAAAAGTAACCATGAAAGGATATAAGCCGGGTGAACCATTGTCTTTCTTTCAATTCCCGAACGGAGCTTTCGGTTCAAAAGTACATTGGGCTGTTTTAACCGATGGTAATTTGGGTGTTACAAATTGGATACCATCTGCAAGCGAGAAAAACGTAGGGCTAAAAAACCTATGTTCTTTTAAGCGTATTACTGATGCGGGATTTACTTATGCTTCACGTTATGACGATGATGGAACAATATTAATGCTACCATCGGTATTGCACAAGGAATCATTTGTAGCTAATAAGGATATGTTCGGTTTGACCTATGACTCTCAAAAAAGGTATTATGTGTTTATAGATCATTCTGTTCCATCGACTACAATTCCTAGTGGCACAAGAAGTATCTTTTTGCGGATCGTATACACTGATGGCACAATCGAGGACATGTCGGTATTTAATGATAGCATAGAAAACAATTTCATCCTTACATCAAAGGCTATTAAGTATATATTAGGCTCTTGTGGTACTTCTGTATCTACTTATTTGCGTATTGGCGTATTTAAAACCAACACTCCTGTAACCTGGAGCCCAGCCCCAGAAGATCAATTGTATCAATCGGTGAAGTATACAGATACGCAAATATTGGCTGTTGATGGGAAAATCGAACTATCTGTAACTACGCAATTGAACAAGCGTGTAATTGGTGGTGCCAATCTCTGTTTAAAATCGGGTGTATGTATTACTGGCGTAGACAATCATCTTCGTATAAACATGTCTAAGTATTGGCGTGATTTAAGGGGAAAGAAAGTTACTTTGTCTTTTGATTATGAATATAGCAACCTTGTTTTAGGTCGAAATAGTCGTATAGGGCTGGAAGAAGATGTATTAAAGGATGGTACATCAAGCTATTACCATATCGGTGCGTGGAAGTACTTCGATTCCACTTCTTTAAAAGCTGATACAGGTAGATTTGTTCATACTATTACCGTTCCCAATGATATTGTTAACGCTCAGAATATCGGTATAGGTTTCTATATTCAAGTCGGTGACGGTACTACGATGAAGATATGTAACCCTCAGATTGAAATCGGTAACACAGCTACCGGATGGAAGCCTGCGCCTGAGGATGGTGTAAATTCGTCTATTGAATATACCAATAGTCAAATTAGTGTAGTAGAAGGTAAGATAACATCCACCGTTAAAAAGATAAATACTGTTGATGGACGTGTTACCGGACTTGCTTCACGGGTAGACCAAACCGAAAAGAGTATAACGTTAAAAAGATAA

Genome Context

Tertiary structure

PDB ID

00975cbc7bfe25e09c42cf2cb0208bacb559fc5ee58619587df86ab99cee44fe

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,7592

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence