Protein

View in Explore

Genbank accession

QPX75370.1 [GenBank]

Protein name

tail fiber protein

RBP type

Evidence Phold

Probability 1,00

TSP

Evidence DepoScope

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,86

Protein sequence

MIKLKGILRDASENPIPDVRIILRSVKNGDVPTGVETVIISGKDGSYETEISTGSYICYLMIDDKETAMPGYVNIYKYSGTGTLQEYLYAPCEIDARPMFLYMIDLALQQMRILVESKEEIRGYYIRAEDAASRAEAAIAASGKIYTSIEQGIAGTSSGDSFIVSFSEQNDEYKDIALGVYNNKDGSAEFVTSIYSKVVIDRIISMISKRNGNELSSGISSDGKPYFVFAPNGGLMLRGINGFIQDIDTVKNPEKYKKLAGVVDIVDESTLSENIDSEGKGYSLFAPNGGLMLRGLASSVQESIKTIANRVNAIDGGVTPPKSVENKVIPIYAIDDNGGMYSASVTFSAAVDNVTEPSHMSSWPQGKMRKNSKGVIYQGYNNTTSHGGSGMIPRIKYSEDNGKTWSDGYTVDVIPGKARGTDHWAIGVDGSDNLYSIVRARGATNKLGDTDHRLYKSTDSGKSWSYVKSLNYVTQKIGADDFVPELYHDMLYFDGYFYTGYHFANSSRLGVLKFNPLSPDTDYQEYEFIAHGEMSTTTLVEINIDYDPFARKFYGGIGTQSDSVPARLFYVNTDMSSLKMFDAPYSVKFNVMAVKRCGDYVYYTTIERFNTGEMKVFATYKNNYYSGDNTKFFSFNIGKIISKKPSGASNVGVQSMVEVNGDLLLSFGTQDNNDNSLVYVAKIGINNNENQITYSDIEV

Physico‐chemical properties

protein length:	699 AA
molecular weight:	77083,52280 Da
isoelectric point:	5,08643
aromaticity:	0,11016
hydropathy:	-0,32003

Domains

Domains [InterPro]

IPR013609
ATT
2–107

IPR013609 DC_1164 G3DSA:2.120.10.10

G3DSA:2.120.10.10
STR
360–695

G3DSA:2.120.10.10

IPR036278
STR
373–471

IPR036278

cd15482
ENZ
395–484

cd15482

QPX75370.1

1 699

Architecture

ATT

STR

ATT 2-107 | ATT 123-218 | STR 347-695 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
IPR013609	ATT	DC_0732	2	107	InterPro cluster	Lambda-like tail fibre protein, N-terminal	N-terminal	Medium	Text match	183 proteins / 183 hits
DC_1164	ATT	DC_1164	123	218	Novel HMM	DC_1164	N-terminal	Low	Positional only	84 proteins / 84 hits
G3DSA:2.120.10.10	STR	G3DSA:2.120.10.10	347	695	Merged direct domain	G3DSA:2.120.10.10	Central	Low	Positional only	42 proteins / 42 hits
G3DSA:2.120.10.10	STR	G3DSA:2.120.10.10	360	695	Merged direct domain	G3DSA:2.120.10.10	Central	Low	Positional only	42 proteins / 42 hits
IPR036278	STR	IPR036278	373	471	Merged direct domain	Sialidase superfamily	Central	Low	Positional only	56 proteins / 56 hits
cd15482	ENZ	DC_0018	395	484	InterPro cluster	cd15482	Central	High	Text match	33 proteins / 44 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

QPX75370.1

1 699

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	325	325	0,9874
Central domain	326	539	215	0,8292
C-terminal	540	699	159	0,2787

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-325

Central
326-539

C-terminal
540-699

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Serratia phage vB_SmaS_Opt-148 [NCBI]	2777365	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	No host information

Coding sequence (CDS)

Genbank protein accession

QPX75370.1 [NCBI]

Genbank nucleotide accession

MW021766.1 [NCBI]

CDS location

range 14891 -> 16990
strand +

CDS

ATGATTAAGCTCAAAGGCATTTTGAGGGACGCAAGCGAAAATCCTATTCCTGATGTAAGGATTATCCTGCGCTCAGTTAAAAATGGCGATGTTCCAACTGGAGTTGAAACGGTCATTATATCTGGCAAGGACGGCTCTTACGAAACAGAGATTTCAACTGGTAGCTACATTTGCTATCTGATGATTGACGACAAAGAGACCGCCATGCCTGGGTATGTAAATATTTATAAATACTCGGGAACCGGCACGCTTCAAGAATACCTGTACGCACCATGCGAGATTGATGCCCGCCCGATGTTTCTGTATATGATTGATTTAGCATTGCAGCAAATGCGAATCCTGGTTGAGTCAAAGGAAGAGATTCGCGGCTATTATATTCGAGCTGAAGACGCTGCATCCAGGGCGGAAGCGGCAATTGCTGCAAGCGGAAAAATCTACACGTCGATAGAGCAGGGCATCGCTGGAACCAGTAGCGGTGATTCTTTTATTGTTTCATTCAGCGAACAGAATGATGAATACAAAGATATCGCCCTTGGTGTTTACAACAACAAAGATGGAAGCGCGGAGTTTGTTACGTCAATTTACTCTAAGGTTGTCATTGACCGTATTATTTCAATGATTTCCAAGAGAAACGGCAACGAGCTTTCATCCGGCATTAGCTCGGACGGCAAGCCATATTTCGTGTTCGCACCAAACGGCGGTCTTATGCTGCGCGGAATTAATGGGTTTATTCAGGATATAGATACTGTAAAAAATCCAGAAAAATATAAAAAGCTTGCTGGAGTTGTTGACATAGTTGACGAATCAACACTTTCTGAAAATATAGACTCAGAAGGAAAAGGCTATTCACTGTTCGCACCAAACGGCGGTCTTATGCTGCGCGGCCTGGCTTCATCGGTTCAGGAATCAATCAAAACAATCGCAAACAGGGTTAACGCTATTGATGGCGGGGTAACACCACCAAAGTCAGTCGAAAATAAAGTAATACCGATTTACGCGATTGACGACAACGGCGGCATGTACTCCGCTAGCGTTACGTTTAGCGCAGCAGTAGACAACGTAACAGAGCCTAGTCACATGTCATCATGGCCGCAGGGCAAAATGCGAAAAAATTCAAAAGGTGTTATTTATCAGGGTTACAACAACACCACTTCGCACGGCGGAAGCGGCATGATTCCAAGAATCAAATATTCTGAAGACAATGGAAAAACATGGTCTGACGGTTACACTGTTGACGTAATACCAGGAAAGGCCAGGGGAACTGACCACTGGGCAATTGGTGTTGATGGCTCTGATAATTTATACTCAATTGTTAGAGCTAGGGGCGCAACAAATAAACTCGGGGATACAGACCATAGGCTATACAAATCAACTGACAGCGGGAAAAGCTGGAGTTACGTAAAAAGCCTCAACTATGTAACACAAAAAATCGGAGCAGATGATTTCGTTCCTGAGCTTTACCATGATATGCTGTATTTTGATGGCTATTTCTATACTGGATATCATTTTGCAAATTCGTCTCGCCTTGGCGTTCTTAAATTCAACCCACTTTCACCTGATACGGACTATCAGGAGTATGAATTTATCGCTCATGGAGAAATGAGCACCACCACGCTAGTAGAGATTAATATCGATTATGACCCTTTCGCCAGAAAGTTTTACGGCGGGATTGGAACGCAAAGCGACTCTGTTCCAGCCAGGCTTTTTTATGTGAACACTGATATGTCCAGTCTGAAGATGTTTGATGCGCCGTATTCTGTTAAGTTTAACGTTATGGCCGTAAAGCGTTGCGGGGACTATGTGTATTACACAACAATAGAGCGATTCAACACTGGCGAGATGAAGGTATTCGCCACCTACAAAAACAACTATTATTCTGGAGATAATACCAAATTCTTCTCGTTCAACATCGGGAAGATTATCAGCAAAAAACCTAGCGGAGCGTCTAACGTTGGCGTTCAATCAATGGTTGAAGTTAATGGCGACTTGCTGCTATCATTTGGCACGCAAGACAACAATGACAATTCATTAGTTTATGTTGCTAAAATCGGCATAAACAACAATGAAAATCAAATCACTTACAGCGATATAGAGGTGTAA

Genome Context

Tertiary structure

PDB ID

1af910498a3d0a74fe3bdcf1b2857277652485ed8368b85a30209fd378aa925b

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,6319

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence