Genbank accession
XTJ60600.1 [GenBank]
Protein name
tail fiber protein
RBP type
TF
Evidence Phold
Probability 1,00
TSP
Evidence DepoScope
Probability 0,91
TSP
Evidence RBPdetect
Probability 0,76
TF
Evidence RBPdetect2
Probability 0,96
Protein sequence
MADQNLKQIQFKRTSTENKAPGADIVARGEIALNTHGRTLAIYTKDEADNVVQLAGKGVPFLDTAGNLNVDGTTTLKDNVTISPNKAINFEASDLSGALVRHITGKCANNDGWYIGAGGASDQGFLEIGTYDNGNEPIYFVQRTGGTTQAEVRRLALLDGFGDTSIPGDLRLTGKTVKISNGSTLTLEMGVGANDAYIKNLRGTGVLQLTNDSNLTFRNSQVYYAMNGRGPGKSGTLLTNVENNRQAWQYTISAATAATPRWVKVATIKHPGDASSQLDLMITGGIDSGHGRHYVDFITLSGRNLTSWSTSNLDNWVEWRRMGSPNKGNVPEYYVVKNDAATDSEASFDFYAKVPRYGNGLYVTVLNTAGYNGQDSGKVIIYETGQDTGATAPSGSILVSMKQIFDSIAKPDFGDTTGTLPVNRGGTGATNVGDARNNLGLGTAAVRNVGEGTGNLLENGAYGLGGNGGKSISDIISNADMLTRLKAYGGTFWRGVTKSGVSVQNGLYSHGSGIFMNAGDTMSAINIDYASAKVRVYAANNSGLAAGNVNYNELYGTANKPSKADVGLGNLTNDTQVKKAGDTMTGDLTVPNLHASGPGTASVYVNAGSGNAHVWFRTNANERGVIWATPNTADLGQINIRAKTTGDVSAGDFSFRSDGRLDVPVAVKVGGAAMLTKDGNITSGSMFGGNLNNYLTSIKNDIVAGDNKQVSKTGDTMTGNLTINANLKVENPNGTMVDLGSENSDKYSRLTLARKVGSGATVAMLKVTPEGHVQFGYQDAVATPAPTKYILVKSNGLEVEGDLVFNQTYCGAEDAINITDKTNDLNNMVIKGSDLGTRLLYKCTSTGGASNILNRPTSDGNFVLEVLSLRKISDTDWTCKQTFTTKNGNVEGTYVRYCQNGTWSAWKEVVAGVQPINLGGTGATSVAAARNNLGVGEGQTVSFGNLVTNDLTANGNARLVGRLNLGSTSATGVLRANETGAVVLGSASGQNIHIRAGSPDTSSGETRFEPNGNVLVGGVLTSSGSLQVNGEATMGRSLIVSQNIKNTNDNSFILMGKDSDLGFVKKSNSGAKLVFASGKSFTVAKSSATTIANPATETYTDVFKVDADGNQTVYGNSAVSRALTVSSTATVNGVINANGGIIVPTTKYVQIADAPTQNNQATNKKYVDDKVASAISNAGDTYLPLAGGTVTGNLDVTGTRLKTWKLEVDGGGAVLGGTIDVVGKANFSNELTSNTSINVMNDGNSHLFFRKANGTEKGLLWADDPGNVSIRAGGASGPVWNFWASGSCQFPGAISNYNGISSTTYYPGGNKNDYLNTAGLVSRFSNGAYASLYFQEYVGNYHQAILNVNGYGQDNSFYFRSGGDFFCTRNGSFDNVEIRSDRRAKSDIKVIENALEKVETLSGNTYELHNTSGGTTRSAGLIAQEVQEVLPEAVTQDNEEDGGMLRLNYNSVIALLVESVKELSAEVKGLKAEIEELKSK
Physico‐chemical
properties
protein length:1480 AA
molecular weight: 155708,74460 Da
isoelectric point:5,96982
aromaticity:0,07162
hydropathy:-0,30851

Domains

Domains [InterPro]
DC_1942
ATT
4–622
DC_0468
STR
485–1011
IPR030392
CHP
1380–1435
XTJ60600.1
1 1480
Architecture
ATT
STR
RBD
ATT 4-622 | STR 623-1011 | RBD 1083-1480
Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout
N-terminal
Central
C-terminal
XTJ60600.1
1 1480
Domain Start End Length (AA) Confidence
N-terminal 1 1057 1057 0,1017
Central domain 1058 1256 200 0,4057
C-terminal 1257 1480 223 0,8692
Legend: N-terminal Central domain C-terminal
3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring
N-terminal
1-1057
Central
1058-1256
C-terminal
1257-1480

Taxonomy

  Name Taxonomy ID Lineage
Phage Klebsiella_phage LAL003
[NCBI]
3384966 Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host Klebsiella pneumoniae
[NCBI]
573 cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
XTJ60600.1 [NCBI]
Genbank nucleotide accession
PQ658157.1 [NCBI]
CDS location
range 93690 -> 98132
strand +
CDS
ATGGCCGATCAAAACTTAAAACAAATACAATTTAAAAGAACTAGCACAGAGAATAAAGCACCAGGTGCAGATATCGTAGCCCGTGGCGAAATCGCGTTGAATACACATGGGCGTACTCTTGCCATTTACACTAAAGATGAAGCCGATAACGTTGTTCAGCTTGCCGGTAAAGGTGTTCCTTTCTTAGATACTGCAGGTAATCTTAATGTTGATGGAACTACTACGTTAAAAGACAACGTTACTATTTCTCCGAATAAAGCGATCAATTTTGAAGCTTCAGATTTAAGCGGAGCATTAGTACGTCATATCACCGGTAAGTGTGCTAATAATGATGGCTGGTACATTGGAGCTGGCGGTGCATCTGACCAAGGATTTCTTGAAATCGGTACGTATGATAACGGAAATGAACCTATCTATTTTGTTCAAAGAACCGGTGGAACGACTCAAGCTGAAGTTCGTCGTTTAGCATTATTAGATGGGTTTGGCGATACCTCTATACCTGGGGACCTTCGTTTAACTGGTAAAACAGTAAAAATTTCAAACGGCAGCACTCTTACTTTGGAAATGGGTGTAGGCGCTAATGACGCGTACATTAAAAACCTGAGAGGAACCGGTGTTCTTCAATTAACCAATGACAGTAACCTTACGTTCAGAAATTCACAGGTTTATTACGCCATGAACGGAAGAGGTCCTGGTAAATCCGGTACTCTTCTGACAAATGTAGAAAACAATCGTCAGGCATGGCAATATACTATTTCTGCTGCAACTGCTGCAACTCCACGTTGGGTTAAAGTAGCTACAATTAAACACCCAGGAGATGCGTCTTCACAGTTAGATTTAATGATTACCGGTGGCATTGATTCTGGACACGGAAGACATTATGTTGATTTTATCACGTTATCTGGTCGCAATTTAACGTCCTGGAGCACTAGCAATTTAGATAACTGGGTTGAATGGCGCAGGATGGGTTCTCCTAATAAAGGAAACGTTCCAGAATATTACGTTGTTAAAAACGATGCTGCTACAGATTCAGAGGCTTCATTTGATTTTTACGCTAAAGTTCCTCGATACGGCAATGGGCTTTATGTTACAGTGCTGAACACTGCTGGATACAATGGCCAAGATAGCGGTAAAGTAATTATCTATGAAACTGGCCAAGATACTGGTGCTACTGCACCGTCTGGAAGCATTCTTGTTTCAATGAAACAGATTTTTGATAGTATTGCAAAACCAGATTTCGGCGATACTACCGGTACTCTTCCAGTTAATCGTGGCGGTACAGGTGCTACTAACGTAGGAGACGCTCGAAATAACTTAGGTTTAGGTACTGCTGCTGTACGTAATGTCGGTGAAGGCACTGGTAACCTTTTAGAAAATGGCGCTTACGGTTTAGGTGGTAATGGTGGTAAATCCATCAGCGATATTATCTCTAACGCGGATATGCTGACCCGTTTAAAAGCCTACGGCGGTACTTTCTGGCGTGGTGTTACTAAATCTGGTGTTAGTGTTCAAAACGGTCTTTATAGTCACGGCTCCGGTATTTTTATGAATGCTGGCGATACCATGTCAGCTATTAATATCGACTACGCTAGTGCTAAAGTTCGTGTATATGCAGCTAACAACAGTGGTCTTGCCGCAGGAAATGTTAACTACAATGAACTTTATGGTACAGCAAACAAACCATCTAAGGCTGATGTCGGACTTGGCAATCTGACAAACGATACCCAAGTCAAGAAAGCTGGCGACACCATGACTGGTGATTTAACTGTTCCTAATTTACATGCTTCCGGTCCGGGTACTGCATCAGTATATGTTAATGCAGGAAGCGGAAATGCTCATGTATGGTTTAGAACAAACGCCAATGAACGCGGTGTAATTTGGGCAACTCCGAATACAGCGGACTTGGGTCAGATTAATATTCGTGCAAAAACTACTGGTGATGTTTCTGCCGGTGATTTTAGCTTCCGTTCTGACGGCCGACTTGATGTTCCTGTAGCAGTTAAAGTTGGTGGAGCAGCAATGCTAACCAAAGACGGGAATATTACCTCTGGTTCGATGTTTGGTGGTAACCTTAACAACTATTTGACTTCTATTAAAAACGATATCGTTGCTGGTGATAATAAGCAAGTAAGCAAGACTGGTGATACCATGACCGGTAACTTGACTATTAACGCTAACTTAAAAGTCGAAAATCCTAATGGAACGATGGTTGATTTAGGTTCAGAGAACTCAGACAAGTACAGCAGATTAACCCTTGCACGTAAAGTTGGTAGCGGTGCTACCGTAGCAATGCTTAAAGTTACTCCTGAAGGACATGTGCAATTTGGTTATCAAGATGCAGTTGCTACTCCAGCTCCTACCAAGTACATCCTGGTTAAATCTAACGGCCTTGAGGTAGAAGGTGATTTGGTTTTTAATCAGACTTATTGTGGTGCTGAAGATGCAATTAATATTACTGATAAGACTAATGACCTTAACAACATGGTTATTAAAGGCAGTGATTTAGGTACTCGTCTATTATACAAGTGTACTTCTACCGGCGGTGCTTCTAATATATTGAACAGACCTACCTCTGATGGCAACTTTGTTCTTGAAGTTCTTTCTTTGCGTAAAATTTCTGATACCGATTGGACGTGCAAACAGACCTTTACTACAAAGAACGGTAATGTTGAAGGTACATATGTTCGATACTGCCAAAACGGTACATGGTCTGCATGGAAAGAGGTTGTTGCTGGTGTTCAACCAATCAATTTAGGCGGTACTGGAGCAACATCTGTAGCTGCTGCTCGTAATAACCTCGGTGTTGGTGAAGGACAAACAGTATCATTCGGTAATTTAGTTACAAACGATTTAACTGCAAACGGAAACGCTAGATTAGTTGGAAGACTGAACCTTGGTTCTACTTCTGCGACTGGCGTATTACGAGCTAATGAAACTGGTGCGGTTGTCTTAGGTTCTGCTAGTGGTCAAAACATCCACATCAGAGCAGGAAGCCCAGATACTTCTTCTGGTGAAACCCGCTTTGAGCCAAATGGAAACGTTTTAGTTGGTGGAGTTCTGACGTCTTCAGGAAGCTTGCAAGTAAATGGCGAAGCCACGATGGGCAGAAGCTTGATCGTTTCTCAAAACATAAAGAATACTAACGATAACAGTTTTATTCTGATGGGAAAAGATTCGGATTTAGGTTTCGTTAAAAAATCTAACTCAGGCGCTAAACTGGTATTTGCTTCAGGAAAATCGTTTACTGTCGCTAAATCGTCAGCAACTACCATAGCTAACCCAGCGACGGAAACTTATACTGATGTGTTTAAAGTTGATGCAGACGGAAACCAAACTGTTTACGGAAATTCAGCAGTTTCTAGAGCTTTGACTGTATCAAGTACAGCTACAGTTAATGGTGTTATTAATGCCAATGGCGGTATTATTGTTCCTACTACCAAGTATGTACAAATTGCTGATGCTCCTACGCAGAATAACCAAGCCACCAACAAGAAATATGTTGATGATAAGGTTGCTTCTGCTATTAGTAATGCTGGCGATACTTATCTCCCATTAGCAGGTGGTACTGTAACTGGTAACTTAGATGTTACAGGAACTCGACTCAAAACTTGGAAGCTAGAGGTTGACGGTGGAGGCGCAGTACTCGGCGGAACTATTGATGTTGTTGGTAAAGCTAATTTTTCTAATGAGCTTACGTCTAATACTTCTATTAACGTCATGAATGATGGAAATAGTCATTTGTTCTTCCGTAAAGCAAATGGTACAGAAAAAGGACTTCTTTGGGCTGATGACCCTGGTAATGTTAGTATAAGAGCCGGCGGTGCTTCTGGACCAGTATGGAATTTCTGGGCAAGTGGTTCATGCCAATTCCCTGGAGCCATTAGTAACTATAACGGAATTAGCAGCACTACCTATTACCCTGGTGGTAATAAAAACGACTATTTAAACACAGCAGGATTAGTATCTAGATTTAGTAATGGTGCTTATGCTTCGTTATATTTCCAAGAATATGTAGGAAACTATCACCAGGCTATTCTTAACGTCAACGGATACGGCCAAGACAATAGCTTTTACTTTAGATCTGGCGGTGACTTCTTCTGTACTCGTAACGGGTCATTCGATAACGTAGAGATTCGTTCTGACCGTAGAGCTAAATCTGATATTAAAGTTATTGAAAACGCTTTGGAAAAAGTAGAGACCTTAAGCGGTAATACTTACGAGCTTCATAATACTTCTGGCGGTACTACTCGTTCTGCTGGGTTGATTGCTCAAGAAGTTCAAGAAGTTCTTCCTGAAGCAGTTACTCAGGATAATGAAGAAGATGGCGGTATGCTTCGTCTGAATTATAACTCAGTAATTGCTCTTCTTGTTGAATCAGTGAAAGAACTTTCAGCTGAGGTCAAAGGTCTTAAAGCCGAAATTGAAGAACTTAAATCTAAATAA

Genome Context

Genome Context

Tertiary structure

PDB ID
9d8397997010a1640b8685acec19ad04be89f6058d0eba31ce49cd5db62dd26e
ESMFold
Source ESMFold
Method ESMFold
Resolution 0,4924
Oligomeric State monomer
Model Confidence
Very high
pLDDT > 90
High
90 > pLDDT > 70
Low
70 > pLDDT > 50
Very low
pLDDT < 50