Protein

View in Explore

Genbank accession

QQM14281.1 [GenBank]

Protein name

L-shaped tail fiber protein

RBP type

Evidence GenBank

Probability 1,00

TSP

Evidence DepoScope

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,74

Evidence RBPdetect2

Probability 0,96

Protein sequence

MGPKPHAMADQNLKQIQFKRTSTENKAPGADIVARGEIVLNTHGRTLAIYTKDEADNVVQLAGKGVPFLDTAGNLNVDGTTTLKDNVTISPNKAINFEASDLSGALVRHITGKCANNDGWYIGAGGASDQGFLEIGTYDNGNEPIYFVQRTGGTTQAEVRRLALLDGFGDTSIPGDLRLTNKTVKISNGSTLVLEMGVGSNDAYIKNQRGVGVLQLTNDSNLTFRNSQVYYAMNGRGPGKSGTLLTNVENNRQAWQYVISAATAGTPRWVKVATIKHPGDASSQLDLMITGGIDSGHGRHYVDFITLSGRNLTSWSTSNLDNWVEWRRIGSPNKGNVPEYYVVKNDAATDSEASFDFYAKVPRYGNGLYVTVLNTAGYNGQDSGKVIIYETGQDTGATTPSGSILVSMKQIFDSISKPDFSDTTGTLPVNRGGTGATNVGDARNNLGLRTAAIRDVGESSGNVMEVGAFGLGGTVGAGNIAKGSLAETVKYLNTYGTCFFRVEDNIAVLPQYSPSIYVKTGSNQLILSANHRNGVISVVTTDKADGTNLTVSEVYTTLNKPSKADVGLDNLTNDTQVKKAGDTMTGDLAAPNLHASGPGTASVYINAGNGNAHVWFRTDANERGVIWATPNTADLGQINIRAKTTGNTSAGDFSFRSDGRLDVPVAVKVGGAAMLTKDGNITSGSLFGGNLNNYLNTIKNDIVAGDNKQVSKTGDTMTGNLTINANLKVENPNGTFVDLGSENSDKYSRLTLARKVGDGAAVAMLKVTPEGHVQFGYQTAVSTPAPSKYLLVKSSGLEVEGDLVFNQTYRGTEDAVDITDKTNDLNNMVIKGSDLGTRQLYKCVSSGGGSNISNKPTSDGNFVLEVLSLRKISDNDWTCKQTFTTKNGNVEGTYVRYCQNGTWSAWKEVVAGVQPINLGGTGATSVAAARNNLGVGEGQTVTFGGLNVNGIGTNDPYITFKNGARIREGQGNGIGALILSASSSTDSKYLALRPYGDNSTVDIKVKANGSSEALLEWSYGPGIRSNSSGAFVIYSKAGQALHLRPNGDSSNQATVIDQNGKMTVGGEFEAQNSKITGNLNVSEDNRMIVLGKNSDIGLVKKNGMPGKMAISKSNSFTVMVSTNTNNQINPADTFNDIFKVDADGNQTVYGNSQINRQLTVASVINANGGIIVPTTKYVQIADAPTQNNQATNKKYVDDKVASAISNAGDTYLPLAGGTVTGNLDVTGTRLKTWKLEVDGGGAVLGGTIDVVGKANFSNELMANTSINVMNDGNSHLFFRKADGTEKGLLYADDPGNVSIRAGGGSGPVWNFWNSGSCQFPGAISNYNGINSTTYYPGGNKNDYLNTAGLVSRFSNGAYASLYFQEYVGNYHQAILNVNGYGQDNSFYFRSGGDFFCTRNGSFDNVEIRSDRRAKSDIKVIENALEKVETLSGNTYELHNTSGGTTRSAGLIAQEVQEVLPEAVTQDNEEDGGMLRLNYNSVIALLVESVKELSAEVKGLKAEIEELKSK

Physico‐chemical properties

protein length:	1509 AA
molecular weight:	160125,68240 Da
isoelectric point:	5,81846
aromaticity:	0,07290
hydropathy:	-0,36296

Domains

Domains [InterPro]

DC_1942
ATT
11–621

DC_1942 cd19958 DC_0246

DC_0468
STR
559–1200

DC_0468 IPR030392 Coil

IPR030392
CHP
1409–1503

IPR030392

QQM14281.1

1 1509

Architecture

ATT

STR

RBD

ATT 11-621 | STR 622-1200 | RBD 1201-1509

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_1942	ATT	DC_1942	11	621	Novel HMM	DC_1942	N-terminal	Low	Positional only	254 proteins / 254 hits
DC_0468	STR	DC_0468	559	1200	Novel HMM	DC_0468	Central	Low	Positional only	72 proteins / 72 hits
cd19958	STR	DC_0464	822	909	InterPro cluster	cd19958	Central	Low	Positional only	1183 proteins / 1674 hits
DC_0246	RBD	DC_0246	1124	1509	Novel HMM	DC_0246	C-terminal	Low	Positional only	127 proteins / 127 hits
IPR030392	CHP	DC_0088	1409	1464	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits
IPR030392	CHP	DC_0088	1409	1503	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits
Coil	Unmapped	-	1482	1509	Coils	Coil	-	-	-	-

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

QQM14281.1

1 1509

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	1093	1093	0,1245
Central domain	1094	1292	200	0,4249
C-terminal	1293	1509	216	0,8733

Note: Constraints were applied during segmentation.
Fixed 47 C-terminal predictions appearing before Central domain

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-1093

Central
1094-1292

C-terminal
1293-1509

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Klebsiella phage vB_KpnM_17-11 [NCBI]	2800822	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Klebsiella pneumoniae [NCBI]	573	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales

Coding sequence (CDS)

Genbank protein accession

QQM14281.1 [NCBI]

Genbank nucleotide accession

MW239157.1 [NCBI]

CDS location

range 7945 -> 12474
strand +

CDS

ATGGGGCCGAAGCCCCATGCAATGGCCGATCAAAACTTAAAACAAATACAATTTAAAAGAACTAGCACAGAGAATAAAGCACCAGGTGCAGATATCGTAGCCCGTGGCGAAATCGTGTTGAATACACATGGGCGTACTCTTGCCATTTACACTAAAGATGAAGCCGATAACGTTGTTCAGCTTGCAGGTAAAGGGGTTCCTTTCTTAGATACTGCAGGTAATCTTAATGTTGATGGAACTACTACGTTAAAAGACAACGTTACTATTTCTCCGAATAAAGCGATCAATTTTGAAGCTTCGGATTTAAGCGGAGCATTAGTACGTCATATCACCGGTAAGTGTGCTAATAATGATGGCTGGTACATTGGAGCTGGTGGTGCATCTGACCAGGGATTTCTTGAAATCGGTACGTATGATAACGGAAATGAACCTATCTATTTTGTTCAAAGAACCGGTGGAACGACTCAAGCTGAAGTTCGTCGTTTAGCATTATTAGATGGGTTTGGCGATACATCTATACCTGGGGACCTTCGTTTAACTAATAAAACGGTAAAAATTTCAAACGGAAGCACACTTGTCCTTGAAATGGGTGTAGGCTCTAACGACGCTTACATTAAAAACCAACGAGGCGTAGGTGTTCTTCAATTAACTAATGACAGCAATTTAACGTTCAGAAATTCACAGGTGTATTACGCCATGAACGGAAGAGGTCCTGGTAAATCTGGTACTCTTCTGACGAATGTAGAAAACAACCGTCAGGCATGGCAATACGTAATTTCTGCTGCAACCGCTGGAACTCCACGTTGGGTTAAAGTAGCTACAATTAAACACCCAGGAGATGCGTCTTCACAGTTAGATTTAATGATTACCGGCGGCATTGATTCTGGACACGGAAGACATTATGTTGATTTTATCACGTTATCTGGTCGCAATTTAACATCCTGGAGCACTAGCAATTTAGATAACTGGGTTGAATGGCGCAGGATTGGTTCTCCTAATAAAGGAAACGTTCCGGAATATTATGTTGTTAAAAACGATGCTGCTACAGATTCAGAGGCTTCATTTGATTTTTACGCTAAAGTTCCTCGATACGGCAATGGACTTTATGTTACAGTGCTGAACACTGCTGGATACAACGGCCAAGATAGTGGTAAAGTAATTATCTATGAAACCGGCCAAGATACTGGTGCTACTACACCATCTGGAAGCATTCTTGTTTCAATGAAACAGATTTTTGATAGTATCTCAAAACCAGATTTCAGCGATACTACCGGTACTCTTCCAGTTAACCGTGGTGGTACAGGTGCTACTAACGTAGGAGATGCTAGAAATAACCTAGGTCTTAGAACTGCTGCTATACGTGATGTCGGTGAATCCAGCGGAAACGTGATGGAAGTTGGTGCATTTGGTCTTGGCGGTACGGTCGGCGCTGGAAATATTGCAAAGGGCTCTTTAGCAGAGACTGTTAAGTATCTTAATACATACGGAACATGCTTCTTCAGGGTAGAAGATAACATTGCTGTACTGCCCCAGTATTCTCCTAGCATTTATGTTAAAACCGGAAGTAATCAGTTAATTCTTTCAGCTAACCACAGAAACGGTGTTATTAGTGTCGTCACTACGGATAAAGCTGATGGTACTAATTTAACAGTATCTGAAGTATATACTACGCTGAATAAGCCATCTAAGGCTGATGTCGGACTTGATAATCTGACAAACGATACTCAAGTTAAGAAAGCCGGCGACACCATGACCGGTGATTTAGCTGCACCTAACCTCCATGCTTCTGGACCGGGAACCGCATCGGTGTATATTAACGCGGGCAACGGAAACGCTCATGTGTGGTTTAGAACAGACGCCAATGAACGCGGTGTAATTTGGGCAACTCCAAATACAGCGGACTTAGGTCAGATTAATATTCGTGCAAAAACAACTGGAAATACTTCTGCCGGTGATTTTAGTTTCCGTTCTGATGGTCGACTTGATGTTCCTGTAGCAGTTAAAGTTGGTGGAGCAGCAATGCTAACCAAAGACGGAAACATTACCTCAGGTTCATTGTTTGGCGGTAACCTTAATAACTATTTGAATACCATTAAAAATGATATCGTTGCTGGCGATAATAAGCAAGTAAGTAAGACTGGTGACACCATGACCGGTAACTTGACTATTAACGCTAACTTAAAGGTTGAAAATCCTAATGGGACATTTGTTGATTTGGGTTCAGAGAACTCAGACAAGTACAGCAGATTGACTCTTGCACGTAAAGTTGGCGATGGCGCAGCTGTAGCGATGCTTAAAGTTACTCCTGAAGGACATGTGCAATTTGGTTATCAAACTGCAGTTTCTACTCCAGCTCCTAGCAAGTACCTCCTGGTTAAATCCAGTGGTCTTGAGGTAGAAGGGGATTTAGTTTTTAATCAGACATATCGCGGTACTGAAGACGCAGTTGATATTACTGATAAGACTAATGACCTTAACAACATGGTTATTAAAGGCAGTGATTTAGGTACTCGTCAGCTGTATAAATGTGTATCATCTGGTGGTGGTTCTAATATATCTAATAAACCTACATCTGACGGCAACTTTGTTCTTGAAGTTCTGTCTTTGCGTAAAATTTCTGATAACGATTGGACGTGTAAGCAGACCTTTACTACAAAGAACGGTAATGTTGAAGGCACATATGTTCGATACTGCCAAAACGGCACATGGTCTGCATGGAAAGAAGTTGTTGCTGGTGTTCAACCAATTAATTTAGGCGGTACCGGAGCAACTTCTGTAGCTGCTGCTCGTAATAACCTTGGTGTTGGTGAAGGACAAACTGTAACGTTTGGTGGATTGAATGTCAACGGCATTGGAACCAACGACCCGTATATCACATTTAAAAATGGCGCAAGAATACGAGAAGGACAAGGCAATGGTATTGGAGCTTTGATTTTATCAGCTTCTTCATCCACTGACTCAAAATACCTTGCGTTACGTCCTTACGGTGATAACTCTACTGTTGACATTAAAGTAAAAGCCAACGGCTCGAGTGAAGCATTGCTTGAATGGTCTTATGGCCCAGGTATTCGTTCGAATTCATCAGGTGCTTTTGTTATCTACTCAAAAGCCGGGCAAGCACTTCATTTAAGACCGAATGGTGATAGCTCTAATCAAGCTACAGTTATCGATCAGAACGGTAAAATGACAGTCGGTGGTGAGTTCGAGGCCCAGAACTCGAAAATCACAGGCAACTTGAACGTTTCTGAAGATAACAGAATGATCGTTCTTGGCAAAAACTCTGATATTGGTTTAGTCAAGAAAAACGGTATGCCAGGAAAAATGGCTATCAGTAAATCTAACTCATTTACTGTTATGGTATCAACAAATACCAACAACCAAATTAATCCTGCTGACACGTTTAACGACATATTCAAAGTAGATGCTGATGGAAACCAAACGGTCTACGGAAACTCGCAGATTAACAGACAGTTAACAGTAGCAAGTGTTATTAATGCCAACGGCGGTATCATTGTTCCGACTACTAAGTACGTGCAAATCGCTGATGCTCCTACGCAGAATAACCAAGCCACCAACAAGAAATATGTTGATGATAAGGTTGCTTCTGCTATTAGTAATGCTGGCGATACTTATCTCCCATTAGCAGGTGGTACTGTGACTGGTAACTTAGATGTTACAGGAACTCGACTCAAAACTTGGAAGTTAGAGGTTGACGGTGGAGGCGCAGTACTCGGCGGAACTATTGATGTTGTTGGTAAAGCTAATTTTTCTAATGAGCTTATGGCTAATACTTCTATTAACGTCATGAATGATGGAAATAGTCATTTGTTCTTCCGTAAAGCAGACGGTACAGAAAAAGGGCTGTTATACGCCGATGACCCTGGTAATGTTAGTATAAGAGCAGGTGGTGGTTCTGGACCAGTATGGAATTTCTGGAACAGTGGTTCATGTCAATTCCCGGGTGCTATTAGTAACTATAACGGAATTAACAGCACTACCTATTACCCTGGTGGTAATAAAAACGACTATTTAAACACAGCAGGATTAGTATCTAGATTTAGTAATGGTGCTTATGCTTCGTTATATTTCCAAGAATATGTAGGAAACTATCACCAGGCTATTCTTAACGTCAACGGATACGGCCAAGACAATAGCTTTTACTTTAGATCCGGCGGTGACTTCTTCTGTACTCGTAACGGGTCATTCGATAACGTAGAGATTCGTTCTGACCGTAGAGCTAAATCTGATATTAAAGTTATTGAAAACGCTTTGGAAAAAGTAGAGACCTTAAGCGGTAATACTTACGAGCTTCATAATACTTCTGGCGGTACTACTCGTTCTGCTGGGTTGATTGCTCAAGAAGTTCAAGAAGTTCTTCCTGAAGCAGTTACTCAGGATAATGAAGAAGATGGCGGTATGCTTCGTCTGAATTATAACTCAGTAATTGCTCTTCTTGTTGAATCAGTGAAAGAACTTTCAGCTGAGGTCAAAGGTCTTAAAGCCGAAATTGAAGAACTTAAATCTAAATAA

Genome Context

Tertiary structure

PDB ID

8be441dc72ed017b6c83ad51f4df6cd812f0bc407d0ab56af1d1ca9e21abb33e

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,6685

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence