Genbank accession
XSD91901.1 [GenBank]
Protein name
tail fiber protein
RBP type
TF
Evidence GenBank
Probability 1,00
TSP
Evidence RBPdetect
Probability 0,82
TF
Evidence RBPdetect2
Probability 0,96
Protein sequence
MADQNLKQIQFKRTSTENKAPGADIVARGEIALNTHGRTLAIYTKDEADNVVQLAGKGVPFLDTSGTLSVDGTTTLKDNVTISPNKAINFETTNLSGAIVRHIVGKCATNDGWYIGAGGTSNSGILEIGTIDDGAETIQFVQRGAGNVEARKLVLLDGSGNTTLPGDLRLSTNKTVKINSGSTLVLEMGVGSNDVYIKNRRGVGFLQLTNDSNLTFRNSQVYYAMDGRGPGKSGTLLTNVENNRQAWQYTISAATASTARWVKVATIKHPGMSSSQLDLMISGGIDSGHGRHYVDFITLSGRNLTSWSTNSLDNWVEWRRVGSPSKTNVPEYYVVKNDSATDADASFDFYAKIPRYGNGLYVTVLNTAGYNGQDSGTVIIYETNQDTGDTGPSGSILVSMKQIFDSLAKPDFGDTTGTLPVNRGGTGATNVGDARNNLGLRTAAVRDVGESNGNLMEVGAFGIGGNGKSLVDITSDVDLMTRLKALGGTVFRANTASGYTGAPYYSHGTGFYGRASDTMAALNIDYATGNVRVFAINDSGLASGRVNSNVLYGTANKPSKADVGLGNLTNDTQVKKAGDTMTGDLAAPNLHASGTGTASVYVNAGSGNAHVWFRTDANERGVIWATPNTANLGQINIRAKTTGGTSAGDFSFRSDGRLGVPVAVKVGGAAMLTKDGNITSGSMFGGNLNNYLNSIKNDIVSGDNKQVSKTGDTMTGNLTINANLKVENPNGTMADFGSENSDKYSRITLARKIGSGAAVAMLKITPEGYVQFGYQDAVANPSPTKYIRVKPDGLDVEGDLVFNQTYCGTEEAVDISNKTIDLNNLVIKRTDPGTRQLYKCVSSGGGSKIANKPTSDGNFVLEVLSLRKVSDNDWTCKQTFTTKNNTTVGTYVRYCQNGSWTAWKEVVSGVQPINLGGTGATSVAAARNNLGVGKGQTVTFGNLVTTDLTANGNARLVGRLNLGSASATGVLRANETGAVVLGSASGQNIHVRAGSADTSAGETRFEPNGNVTVGGAITASGSLQVNGEAAMSRSLIVSQNIKNTNDNSFILMGKDSDLGFVKKSNSGAKLVFASGKSFIVAKSSATTIANPATETYTDVFKVDADGNQTVYGNSTVSRALTVSSTATVNGVINANGGIIVPTTKYVQIADAPTQNNQATNKKYVDDKVASAISNAGDTYLPLAGGTVTGNLDVTGSRLKTTSLWVTGDAAVNGVLTVDGKARFNQEFSVSTSVNVQNTGNSHVFFRKADGTEKGLLWADEPGNVSIRAGGASGPVWNFWTSGSCQFPGAISNYNGISSTTNYPAGQPNGTYNNTAGLVSRFSNGAYASLYFQEYVGNFHQAIINVNGFGRDDSFYFRAGGDFICTRNGSFDNVEIRSDRRAKSDIKVIENALEKVETLSGNTYELHNTSGGTTRSAGLIAQEVQEVLPEAVTQDIEADGGLLRLNYNSVIALLVESVKELSAEVKGLKAEIEELKSK
Physico‐chemical
properties
protein length:1477 AA
molecular weight: 155265,36360 Da
isoelectric point:7,17356
aromaticity:0,07041
hydropathy:-0,28389

Domains

Domains [InterPro]
DC_1942
ATT
4–618
DC_0468
STR
483–1004
IPR030392
CHP
1377–1432
XSD91901.1
1 1477
Architecture
ATT
STR
RBD
ATT 4-618 | STR 619-1004 | RBD 1080-1477
Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout
N-terminal
Central
C-terminal
XSD91901.1
1 1477
Domain Start End Length (AA) Confidence
N-terminal 1 774 774 0,1032
Central domain 775 973 200 0,2336
C-terminal 974 1477 503 0,7219
Legend: N-terminal Central domain C-terminal
3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring
N-terminal
1-774
Central
775-973
C-terminal
974-1477

Taxonomy

  Name Taxonomy ID Lineage
Phage Klebsiella phage vB_Kpl_K65_evo3
[NCBI]
3412898 Viruses >
Host Raoultella planticola K59
[NCBI]
1212665 Ascomycota > Pichiomycetes > Serinales > Metschnikowiaceae > Clavispora >

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
XSD91901.1 [NCBI]
Genbank nucleotide accession
PQ569696.1 [NCBI]
CDS location
range 103066 -> 107499
strand -
CDS
ATGGCCGATCAAAACTTAAAACAAATACAATTTAAAAGAACTAGCACAGAGAATAAAGCACCAGGTGCAGATATCGTAGCCCGTGGCGAAATCGCGTTGAATACACATGGGCGTACTCTTGCTATCTATACCAAAGATGAAGCTGATAATGTTGTTCAGCTTGCTGGTAAAGGGGTTCCTTTCTTAGATACATCTGGAACTCTTAGCGTTGATGGAACTACTACATTAAAAGACAACGTTACTATTTCTCCGAATAAAGCGATCAATTTTGAAACTACTAATTTAAGCGGAGCAATAGTGCGTCATATCGTTGGCAAATGTGCTACTAACGATGGCTGGTACATCGGTGCCGGTGGTACAAGCAACAGTGGTATTCTTGAGATCGGTACTATTGACGATGGCGCTGAAACTATTCAATTCGTACAACGCGGTGCAGGCAACGTTGAAGCCCGAAAATTGGTATTGCTTGACGGCTCGGGTAATACGACTCTTCCTGGTGATTTAAGATTATCTACCAATAAGACTGTTAAAATTAACAGTGGAAGCACTCTTGTTCTTGAAATGGGTGTAGGCTCTAACGACGTCTATATTAAAAACCGACGAGGCGTCGGTTTTCTTCAATTAACTAATGATAGCAATTTAACGTTCAGAAATTCCCAAGTTTATTACGCTATGGATGGAAGAGGTCCTGGTAAATCCGGTACTCTTCTGACGAATGTAGAAAACAACCGTCAGGCATGGCAATATACTATTTCTGCTGCAACTGCGTCAACTGCTCGCTGGGTAAAAGTAGCTACAATAAAGCATCCAGGAATGTCTTCTTCGCAACTGGATTTAATGATTAGCGGTGGTATTGATTCTGGGCACGGTAGACATTACGTTGATTTTATCACGTTATCAGGACGAAATTTAACATCATGGAGCACCAACAGTTTAGATAACTGGGTTGAATGGCGCCGGGTTGGGTCTCCTTCTAAAACGAACGTTCCAGAGTATTACGTTGTTAAAAACGATTCTGCTACTGATGCGGATGCGTCATTTGATTTTTATGCTAAGATTCCTCGTTATGGCAATGGCCTTTATGTTACAGTGCTAAACACAGCTGGATACAACGGCCAAGATTCAGGTACAGTAATTATCTATGAAACTAATCAGGACACTGGTGATACTGGACCGTCCGGAAGTATTCTTGTTTCAATGAAACAGATTTTTGATAGTTTAGCAAAACCAGATTTCGGTGATACCACAGGTACTCTTCCGGTTAACCGTGGTGGTACAGGTGCTACTAATGTAGGAGATGCCCGAAACAACCTGGGCCTTAGAACTGCAGCTGTTCGCGATGTTGGTGAATCTAACGGAAACTTGATGGAAGTTGGTGCCTTTGGTATTGGCGGTAACGGAAAATCACTGGTAGATATTACTTCTGACGTTGATTTAATGACTCGCCTTAAGGCTCTTGGTGGTACAGTGTTCAGAGCCAACACAGCGAGTGGCTATACTGGGGCTCCTTATTACTCCCATGGCACCGGGTTTTATGGAAGAGCTTCTGACACAATGGCTGCGCTTAATATAGATTATGCAACTGGTAACGTCAGAGTATTTGCTATAAACGATAGCGGTTTAGCAAGTGGAAGAGTAAATTCTAATGTTCTCTACGGCACAGCAAATAAGCCATCTAAGGCTGACGTCGGACTTGGTAATCTGACAAACGATACCCAAGTTAAGAAAGCTGGCGACACCATGACCGGTGATTTAGCTGCACCTAACCTCCATGCTTCCGGCACCGGTACTGCATCAGTGTATGTTAATGCAGGAAGCGGAAATGCTCATGTATGGTTTAGAACAGACGCCAATGAACGTGGTGTAATTTGGGCAACTCCAAATACTGCTAATTTAGGACAAATTAATATTCGTGCAAAAACTACTGGTGGTACTTCTGCCGGTGATTTTAGCTTCCGTTCTGACGGCCGACTTGGTGTTCCTGTAGCAGTTAAAGTTGGTGGGGCAGCAATGCTAACCAAAGACGGGAACATCACCTCTGGTTCAATGTTTGGCGGTAACCTTAACAACTATTTGAATTCTATTAAAAACGACATCGTTTCTGGGGATAATAAGCAAGTAAGTAAAACCGGTGACACAATGACCGGTAACTTGACTATTAACGCTAACTTAAAAGTCGAAAACCCTAATGGAACAATGGCTGATTTTGGTTCAGAGAACTCAGATAAGTATAGCAGAATAACTCTTGCTCGCAAAATTGGCTCTGGCGCTGCCGTAGCAATGCTTAAAATTACTCCTGAAGGATACGTGCAATTTGGTTATCAAGATGCAGTTGCTAATCCGTCTCCTACTAAGTACATCCGAGTTAAACCCGATGGCCTTGATGTAGAAGGGGATTTGGTTTTTAATCAGACATATTGCGGTACTGAAGAGGCAGTTGATATTTCTAATAAGACTATTGACCTTAATAATCTTGTCATTAAAAGAACCGATCCAGGTACTCGTCAGCTGTATAAATGTGTATCTTCTGGCGGTGGTTCTAAGATAGCAAACAAACCCACATCTGACGGTAACTTTGTTCTCGAAGTTCTGTCTTTACGTAAAGTTTCTGATAACGATTGGACATGTAAGCAGACCTTTACTACAAAGAATAACACCACTGTTGGCACATATGTTCGATACTGCCAAAATGGCTCATGGACTGCATGGAAAGAAGTTGTATCTGGTGTACAACCGATTAATCTTGGTGGTACTGGAGCAACTTCTGTAGCTGCTGCTCGTAACAACCTCGGTGTTGGTAAAGGCCAAACTGTAACATTCGGTAATTTAGTTACAACCGATTTAACCGCAAACGGAAACGCTAGATTAGTCGGAAGACTGAACCTTGGTTCTGCTTCTGCGACTGGCGTATTACGAGCTAATGAAACGGGTGCTGTTGTTTTAGGGTCTGCAAGTGGTCAAAATATCCATGTTAGAGCAGGAAGTGCCGATACTTCTGCGGGTGAAACTCGCTTTGAACCAAATGGAAACGTCACAGTTGGTGGTGCTATTACAGCTTCCGGAAGCCTGCAAGTAAATGGCGAAGCCGCTATGAGTAGAAGCTTGATCGTTTCTCAAAATATAAAGAATACTAACGATAACAGTTTTATTCTGATGGGAAAAGATTCGGATTTAGGTTTCGTTAAAAAATCTAACTCAGGAGCTAAACTAGTATTTGCTTCAGGAAAATCGTTTATTGTCGCTAAATCGTCAGCAACTACCATAGCTAATCCAGCGACGGAAACTTACACTGATGTGTTTAAAGTTGATGCTGATGGAAACCAAACTGTTTATGGAAATTCAACAGTTTCTAGAGCTTTAACCGTTTCTAGCACAGCGACAGTTAATGGCGTTATTAATGCCAACGGCGGTATCATTGTTCCTACTACTAAGTATGTGCAAATTGCTGATGCTCCTACACAGAATAACCAAGCCACCAACAAGAAATATGTTGATGACAAGGTTGCTTCTGCTATTAGTAATGCCGGTGATACATATCTTCCATTAGCAGGTGGTACTGTAACTGGTAACTTAGATGTTACAGGAAGCCGGTTAAAAACTACATCGCTCTGGGTTACCGGTGATGCTGCTGTTAACGGTGTTTTAACTGTTGATGGAAAGGCTAGGTTTAATCAAGAGTTCAGTGTATCAACCTCAGTTAACGTTCAGAACACCGGTAATAGCCATGTGTTCTTCCGTAAAGCAGATGGTACAGAAAAAGGTCTTCTTTGGGCTGATGAGCCTGGTAATGTTAGTATAAGAGCCGGCGGTGCTTCTGGACCAGTATGGAATTTCTGGACCAGTGGTTCATGTCAATTCCCAGGAGCCATTTCTAACTATAACGGAATTAGCAGCACTACTAATTATCCTGCAGGACAACCCAATGGCACATATAACAATACCGCTGGGTTAGTAAGCAGATTTAGTAATGGTGCTTATGCCTCTCTGTATTTCCAAGAATATGTTGGTAACTTCCACCAAGCTATCATTAATGTTAATGGATTCGGTCGAGATGACAGTTTCTATTTCAGAGCTGGCGGTGACTTCATCTGTACTCGCAATGGTTCATTTGATAACGTTGAGATTCGTTCTGACCGTAGAGCTAAATCTGATATTAAAGTTATTGAAAACGCTTTGGAAAAAGTAGAGACCTTAAGCGGTAATACTTATGAGCTTCATAATACTTCTGGCGGTACTACTCGTTCTGCTGGGTTGATTGCTCAAGAAGTTCAAGAAGTTCTTCCGGAAGCAGTTACTCAAGATATTGAAGCGGACGGCGGATTATTGCGTCTGAATTACAACTCAGTAATTGCACTTCTTGTTGAATCTGTTAAAGAGCTTTCTGCTGAGGTTAAAGGCCTTAAAGCGGAAATTGAAGAACTTAAATCTAAATAA

Genome Context

Genome Context

Tertiary structure

PDB ID
12537486d317091dfb2a517b9cdf847101ec6c6b4bb1bcda9a2561340f907941
ESMFold
Source ESMFold
Method ESMFold
Resolution 0,4978
Oligomeric State monomer
Model Confidence
Very high
pLDDT > 90
High
90 > pLDDT > 70
Low
70 > pLDDT > 50
Very low
pLDDT < 50