Protein

View in Explore

Genbank accession

XSD91901.1 [GenBank]

Protein name

tail fiber protein

RBP type

Evidence GenBank

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,82

Evidence RBPdetect2

Probability 0,96

Protein sequence

MADQNLKQIQFKRTSTENKAPGADIVARGEIALNTHGRTLAIYTKDEADNVVQLAGKGVPFLDTSGTLSVDGTTTLKDNVTISPNKAINFETTNLSGAIVRHIVGKCATNDGWYIGAGGTSNSGILEIGTIDDGAETIQFVQRGAGNVEARKLVLLDGSGNTTLPGDLRLSTNKTVKINSGSTLVLEMGVGSNDVYIKNRRGVGFLQLTNDSNLTFRNSQVYYAMDGRGPGKSGTLLTNVENNRQAWQYTISAATASTARWVKVATIKHPGMSSSQLDLMISGGIDSGHGRHYVDFITLSGRNLTSWSTNSLDNWVEWRRVGSPSKTNVPEYYVVKNDSATDADASFDFYAKIPRYGNGLYVTVLNTAGYNGQDSGTVIIYETNQDTGDTGPSGSILVSMKQIFDSLAKPDFGDTTGTLPVNRGGTGATNVGDARNNLGLRTAAVRDVGESNGNLMEVGAFGIGGNGKSLVDITSDVDLMTRLKALGGTVFRANTASGYTGAPYYSHGTGFYGRASDTMAALNIDYATGNVRVFAINDSGLASGRVNSNVLYGTANKPSKADVGLGNLTNDTQVKKAGDTMTGDLAAPNLHASGTGTASVYVNAGSGNAHVWFRTDANERGVIWATPNTANLGQINIRAKTTGGTSAGDFSFRSDGRLGVPVAVKVGGAAMLTKDGNITSGSMFGGNLNNYLNSIKNDIVSGDNKQVSKTGDTMTGNLTINANLKVENPNGTMADFGSENSDKYSRITLARKIGSGAAVAMLKITPEGYVQFGYQDAVANPSPTKYIRVKPDGLDVEGDLVFNQTYCGTEEAVDISNKTIDLNNLVIKRTDPGTRQLYKCVSSGGGSKIANKPTSDGNFVLEVLSLRKVSDNDWTCKQTFTTKNNTTVGTYVRYCQNGSWTAWKEVVSGVQPINLGGTGATSVAAARNNLGVGKGQTVTFGNLVTTDLTANGNARLVGRLNLGSASATGVLRANETGAVVLGSASGQNIHVRAGSADTSAGETRFEPNGNVTVGGAITASGSLQVNGEAAMSRSLIVSQNIKNTNDNSFILMGKDSDLGFVKKSNSGAKLVFASGKSFIVAKSSATTIANPATETYTDVFKVDADGNQTVYGNSTVSRALTVSSTATVNGVINANGGIIVPTTKYVQIADAPTQNNQATNKKYVDDKVASAISNAGDTYLPLAGGTVTGNLDVTGSRLKTTSLWVTGDAAVNGVLTVDGKARFNQEFSVSTSVNVQNTGNSHVFFRKADGTEKGLLWADEPGNVSIRAGGASGPVWNFWTSGSCQFPGAISNYNGISSTTNYPAGQPNGTYNNTAGLVSRFSNGAYASLYFQEYVGNFHQAIINVNGFGRDDSFYFRAGGDFICTRNGSFDNVEIRSDRRAKSDIKVIENALEKVETLSGNTYELHNTSGGTTRSAGLIAQEVQEVLPEAVTQDIEADGGLLRLNYNSVIALLVESVKELSAEVKGLKAEIEELKSK

Physico‐chemical properties

protein length:	1477 AA
molecular weight:	155265,36360 Da
isoelectric point:	7,17356
aromaticity:	0,07041
hydropathy:	-0,28389

Domains

Domains [InterPro]

DC_1942
ATT
4–618

DC_1942 cd19958 DC_0246

DC_0468
STR
483–1004

DC_0468 IPR030392

IPR030392
CHP
1377–1432

IPR030392 Coil

XSD91901.1

1 1477

Architecture

ATT

STR

RBD

ATT 4-618 | STR 619-1004 | RBD 1080-1477

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_1942	ATT	DC_1942	4	618	Novel HMM	DC_1942	N-terminal	Low	Positional only	254 proteins / 254 hits
DC_0468	STR	DC_0468	483	1004	Novel HMM	DC_0468	Central	Low	Positional only	72 proteins / 72 hits
cd19958	STR	DC_0464	819	906	InterPro cluster	cd19958	Central	Low	Positional only	1183 proteins / 1674 hits
DC_0246	RBD	DC_0246	1080	1477	Novel HMM	DC_0246	C-terminal	Low	Positional only	127 proteins / 127 hits
IPR030392	CHP	DC_0088	1377	1471	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits
IPR030392	CHP	DC_0088	1377	1432	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits
Coil	Unmapped	-	1450	1477	Coils	Coil	-	-	-	-

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

XSD91901.1

1 1477

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	774	774	0,1032
Central domain	775	973	200	0,2336
C-terminal	974	1477	503	0,7219

Note: Constraints were applied during segmentation.
Fixed 543 C-terminal predictions appearing before Central domain

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-774

Central
775-973

C-terminal
974-1477

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Klebsiella phage vB_Kpl_K65_evo3 [NCBI]	3412898	Viruses >
Host	Raoultella planticola K59 [NCBI]	1212665	Ascomycota > Pichiomycetes > Serinales > Metschnikowiaceae > Clavispora >

Coding sequence (CDS)

Genbank protein accession

XSD91901.1 [NCBI]

Genbank nucleotide accession

PQ569696.1 [NCBI]

CDS location

range 103066 -> 107499
strand -

CDS

ATGGCCGATCAAAACTTAAAACAAATACAATTTAAAAGAACTAGCACAGAGAATAAAGCACCAGGTGCAGATATCGTAGCCCGTGGCGAAATCGCGTTGAATACACATGGGCGTACTCTTGCTATCTATACCAAAGATGAAGCTGATAATGTTGTTCAGCTTGCTGGTAAAGGGGTTCCTTTCTTAGATACATCTGGAACTCTTAGCGTTGATGGAACTACTACATTAAAAGACAACGTTACTATTTCTCCGAATAAAGCGATCAATTTTGAAACTACTAATTTAAGCGGAGCAATAGTGCGTCATATCGTTGGCAAATGTGCTACTAACGATGGCTGGTACATCGGTGCCGGTGGTACAAGCAACAGTGGTATTCTTGAGATCGGTACTATTGACGATGGCGCTGAAACTATTCAATTCGTACAACGCGGTGCAGGCAACGTTGAAGCCCGAAAATTGGTATTGCTTGACGGCTCGGGTAATACGACTCTTCCTGGTGATTTAAGATTATCTACCAATAAGACTGTTAAAATTAACAGTGGAAGCACTCTTGTTCTTGAAATGGGTGTAGGCTCTAACGACGTCTATATTAAAAACCGACGAGGCGTCGGTTTTCTTCAATTAACTAATGATAGCAATTTAACGTTCAGAAATTCCCAAGTTTATTACGCTATGGATGGAAGAGGTCCTGGTAAATCCGGTACTCTTCTGACGAATGTAGAAAACAACCGTCAGGCATGGCAATATACTATTTCTGCTGCAACTGCGTCAACTGCTCGCTGGGTAAAAGTAGCTACAATAAAGCATCCAGGAATGTCTTCTTCGCAACTGGATTTAATGATTAGCGGTGGTATTGATTCTGGGCACGGTAGACATTACGTTGATTTTATCACGTTATCAGGACGAAATTTAACATCATGGAGCACCAACAGTTTAGATAACTGGGTTGAATGGCGCCGGGTTGGGTCTCCTTCTAAAACGAACGTTCCAGAGTATTACGTTGTTAAAAACGATTCTGCTACTGATGCGGATGCGTCATTTGATTTTTATGCTAAGATTCCTCGTTATGGCAATGGCCTTTATGTTACAGTGCTAAACACAGCTGGATACAACGGCCAAGATTCAGGTACAGTAATTATCTATGAAACTAATCAGGACACTGGTGATACTGGACCGTCCGGAAGTATTCTTGTTTCAATGAAACAGATTTTTGATAGTTTAGCAAAACCAGATTTCGGTGATACCACAGGTACTCTTCCGGTTAACCGTGGTGGTACAGGTGCTACTAATGTAGGAGATGCCCGAAACAACCTGGGCCTTAGAACTGCAGCTGTTCGCGATGTTGGTGAATCTAACGGAAACTTGATGGAAGTTGGTGCCTTTGGTATTGGCGGTAACGGAAAATCACTGGTAGATATTACTTCTGACGTTGATTTAATGACTCGCCTTAAGGCTCTTGGTGGTACAGTGTTCAGAGCCAACACAGCGAGTGGCTATACTGGGGCTCCTTATTACTCCCATGGCACCGGGTTTTATGGAAGAGCTTCTGACACAATGGCTGCGCTTAATATAGATTATGCAACTGGTAACGTCAGAGTATTTGCTATAAACGATAGCGGTTTAGCAAGTGGAAGAGTAAATTCTAATGTTCTCTACGGCACAGCAAATAAGCCATCTAAGGCTGACGTCGGACTTGGTAATCTGACAAACGATACCCAAGTTAAGAAAGCTGGCGACACCATGACCGGTGATTTAGCTGCACCTAACCTCCATGCTTCCGGCACCGGTACTGCATCAGTGTATGTTAATGCAGGAAGCGGAAATGCTCATGTATGGTTTAGAACAGACGCCAATGAACGTGGTGTAATTTGGGCAACTCCAAATACTGCTAATTTAGGACAAATTAATATTCGTGCAAAAACTACTGGTGGTACTTCTGCCGGTGATTTTAGCTTCCGTTCTGACGGCCGACTTGGTGTTCCTGTAGCAGTTAAAGTTGGTGGGGCAGCAATGCTAACCAAAGACGGGAACATCACCTCTGGTTCAATGTTTGGCGGTAACCTTAACAACTATTTGAATTCTATTAAAAACGACATCGTTTCTGGGGATAATAAGCAAGTAAGTAAAACCGGTGACACAATGACCGGTAACTTGACTATTAACGCTAACTTAAAAGTCGAAAACCCTAATGGAACAATGGCTGATTTTGGTTCAGAGAACTCAGATAAGTATAGCAGAATAACTCTTGCTCGCAAAATTGGCTCTGGCGCTGCCGTAGCAATGCTTAAAATTACTCCTGAAGGATACGTGCAATTTGGTTATCAAGATGCAGTTGCTAATCCGTCTCCTACTAAGTACATCCGAGTTAAACCCGATGGCCTTGATGTAGAAGGGGATTTGGTTTTTAATCAGACATATTGCGGTACTGAAGAGGCAGTTGATATTTCTAATAAGACTATTGACCTTAATAATCTTGTCATTAAAAGAACCGATCCAGGTACTCGTCAGCTGTATAAATGTGTATCTTCTGGCGGTGGTTCTAAGATAGCAAACAAACCCACATCTGACGGTAACTTTGTTCTCGAAGTTCTGTCTTTACGTAAAGTTTCTGATAACGATTGGACATGTAAGCAGACCTTTACTACAAAGAATAACACCACTGTTGGCACATATGTTCGATACTGCCAAAATGGCTCATGGACTGCATGGAAAGAAGTTGTATCTGGTGTACAACCGATTAATCTTGGTGGTACTGGAGCAACTTCTGTAGCTGCTGCTCGTAACAACCTCGGTGTTGGTAAAGGCCAAACTGTAACATTCGGTAATTTAGTTACAACCGATTTAACCGCAAACGGAAACGCTAGATTAGTCGGAAGACTGAACCTTGGTTCTGCTTCTGCGACTGGCGTATTACGAGCTAATGAAACGGGTGCTGTTGTTTTAGGGTCTGCAAGTGGTCAAAATATCCATGTTAGAGCAGGAAGTGCCGATACTTCTGCGGGTGAAACTCGCTTTGAACCAAATGGAAACGTCACAGTTGGTGGTGCTATTACAGCTTCCGGAAGCCTGCAAGTAAATGGCGAAGCCGCTATGAGTAGAAGCTTGATCGTTTCTCAAAATATAAAGAATACTAACGATAACAGTTTTATTCTGATGGGAAAAGATTCGGATTTAGGTTTCGTTAAAAAATCTAACTCAGGAGCTAAACTAGTATTTGCTTCAGGAAAATCGTTTATTGTCGCTAAATCGTCAGCAACTACCATAGCTAATCCAGCGACGGAAACTTACACTGATGTGTTTAAAGTTGATGCTGATGGAAACCAAACTGTTTATGGAAATTCAACAGTTTCTAGAGCTTTAACCGTTTCTAGCACAGCGACAGTTAATGGCGTTATTAATGCCAACGGCGGTATCATTGTTCCTACTACTAAGTATGTGCAAATTGCTGATGCTCCTACACAGAATAACCAAGCCACCAACAAGAAATATGTTGATGACAAGGTTGCTTCTGCTATTAGTAATGCCGGTGATACATATCTTCCATTAGCAGGTGGTACTGTAACTGGTAACTTAGATGTTACAGGAAGCCGGTTAAAAACTACATCGCTCTGGGTTACCGGTGATGCTGCTGTTAACGGTGTTTTAACTGTTGATGGAAAGGCTAGGTTTAATCAAGAGTTCAGTGTATCAACCTCAGTTAACGTTCAGAACACCGGTAATAGCCATGTGTTCTTCCGTAAAGCAGATGGTACAGAAAAAGGTCTTCTTTGGGCTGATGAGCCTGGTAATGTTAGTATAAGAGCCGGCGGTGCTTCTGGACCAGTATGGAATTTCTGGACCAGTGGTTCATGTCAATTCCCAGGAGCCATTTCTAACTATAACGGAATTAGCAGCACTACTAATTATCCTGCAGGACAACCCAATGGCACATATAACAATACCGCTGGGTTAGTAAGCAGATTTAGTAATGGTGCTTATGCCTCTCTGTATTTCCAAGAATATGTTGGTAACTTCCACCAAGCTATCATTAATGTTAATGGATTCGGTCGAGATGACAGTTTCTATTTCAGAGCTGGCGGTGACTTCATCTGTACTCGCAATGGTTCATTTGATAACGTTGAGATTCGTTCTGACCGTAGAGCTAAATCTGATATTAAAGTTATTGAAAACGCTTTGGAAAAAGTAGAGACCTTAAGCGGTAATACTTATGAGCTTCATAATACTTCTGGCGGTACTACTCGTTCTGCTGGGTTGATTGCTCAAGAAGTTCAAGAAGTTCTTCCGGAAGCAGTTACTCAAGATATTGAAGCGGACGGCGGATTATTGCGTCTGAATTACAACTCAGTAATTGCACTTCTTGTTGAATCTGTTAAAGAGCTTTCTGCTGAGGTTAAAGGCCTTAAAGCGGAAATTGAAGAACTTAAATCTAAATAA

Genome Context

Tertiary structure

PDB ID

12537486d317091dfb2a517b9cdf847101ec6c6b4bb1bcda9a2561340f907941

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,4978

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence