Protein

View in Explore

Genbank accession

YP_009789815.1 [GenBank]

Protein name

tail fiber protein

RBP type

Evidence GenBank

Probability 1,00

Evidence Phold

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,74

Protein sequence

MTNINESMRWDDAIPMIMRGDKVEGGRAAKPNLQAGVLANRTQYLRSELEKYSGTLQAGEQPYSSEEDAQQAINNGMIAAGAKFSVRSHESGSWVDEYKNVDGIATPTGKKLPSLAAVTTLQEMLSEKSSELMLFLFSDMDDFHIADISFDEETGKPKFNIGRMALKRSQGAVFEVVDSDGFGISGDDMINRLRSLESGRYIYNGLKITRSENNILEVTDPDGFSLSIDDMLSRLMSIEKGSFNYSGQSLQRSPDHIFEIKDPDGFALTAERLIERITALEKATGDSGDVSRSGEIIAHMEGEAQAARAAATEWVSPPVAPLRKGLNLFFIYGQSLAIGDEAFSVVTRQPSQLGNLMLGKSPRGRYYGRTSDADFGVIGGENIYYPLTEHRQDGPNIITDPDINTRLGETVASGFMETLKTLHNRSKGVKNDEETILACSVTGCSGTNIATLLKGAGAATPYYERLMSALRGHMEAAAKMGITDVQVCGMLFLQGENDYGITNRENYLNMLNQLINDFNADARAITGQTDNIGFYLYQTGGTYVSQAEGNTLPIDMAQLDITSRVDAFMAAPMFPYPQASNNRTHKAANSYRWWGCAAANTVFRVLSNENRTPFRMIKAVYDGEDIYVSFMTPCPPLATQPYYRIAAAVMNTDMGFTVIDGTGNLYGTSLVTEIISPCVIKISPPRKLSGNIRLNLGDQLHGGGHNVADSSPQQSFFNWQYYGDDNQSVNENIDALNDKPYPLYNFAAIQTINVDGVEL

Physico‐chemical properties

protein length:	759 AA
molecular weight:	83261,43690 Da
isoelectric point:	4,87027
aromaticity:	0,08564
hydropathy:	-0,33768

Domains

Domains [InterPro]

DC_0547
STR
2–749

DC_0547

IPR036514
STR
328–619

IPR036514

SSF52266
STR
444–639

SSF52266

YP_009789815.1

1 759

Architecture

STR

STR 2-749 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0547	STR	DC_0547	2	749	Novel HMM	DC_0547	Central	Low	Positional only	72 proteins / 72 hits
IPR036514	STR	IPR036514	328	619	Merged direct domain	SGNH hydrolase superfamily	Central	Low	Positional only	180 proteins / 180 hits
SSF52266	STR	SSF52266	444	639	Merged direct domain	SSF52266	Central	Low	Positional only	227 proteins / 227 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

YP_009789815.1

1 759

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	474	474	0,7837
Central domain	475	701	228	0,6117
C-terminal	702	759	57	0,8083

Note: Constraints were applied during segmentation.
Fixed 85 C-terminal predictions appearing before Central domain

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-474

Central
475-701

C-terminal
702-759

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Klebsiella phage 3LV2017 [NCBI]	1960657	Uroviricota > Caudoviricetes > Peduoviridae > Reginaelenavirus rv3LV2017 >
Host	Klebsiella pneumoniae [NCBI]	573	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales

Coding sequence (CDS)

Genbank protein accession

YP_009789815.1 [NCBI]

Genbank nucleotide accession

NC_047817.1 [NCBI]

CDS location

range 21929 -> 24208
strand +

CDS

ATGACAAACATCAATGAAAGTATGCGCTGGGATGATGCGATCCCCATGATTATGCGTGGTGATAAGGTTGAAGGCGGACGCGCAGCAAAACCAAATTTGCAGGCAGGTGTATTAGCGAACCGTACACAATACTTGCGCAGCGAGCTTGAAAAATATTCGGGAACTCTACAGGCGGGTGAGCAACCATATTCCAGCGAGGAAGATGCGCAGCAGGCGATCAATAATGGAATGATAGCGGCTGGCGCTAAATTTTCGGTCCGTTCTCATGAGTCAGGTTCATGGGTGGATGAATATAAAAATGTTGACGGCATCGCCACGCCAACCGGCAAGAAACTGCCATCACTGGCGGCGGTAACAACATTGCAGGAAATGCTGTCCGAGAAATCATCGGAGCTAATGTTATTTCTTTTTTCTGATATGGATGATTTCCATATTGCTGATATTTCATTTGACGAAGAGACCGGAAAGCCGAAATTTAATATCGGACGAATGGCATTAAAGCGTAGTCAGGGGGCCGTATTTGAAGTAGTTGATTCTGACGGCTTTGGTATTTCTGGCGATGATATGATAAATCGCCTTCGTTCGCTTGAGTCAGGGCGATATATTTATAATGGACTGAAAATTACACGCAGTGAAAATAATATATTAGAAGTGACTGACCCGGACGGATTTTCGCTTTCCATTGATGACATGCTGTCACGTCTGATGAGCATTGAAAAAGGCTCATTTAATTACAGCGGACAAAGTTTACAGAGAAGCCCTGACCATATTTTTGAGATTAAAGACCCTGACGGATTCGCATTAACGGCGGAAAGGCTGATTGAGCGCATTACCGCGCTGGAAAAGGCGACTGGTGACAGCGGTGACGTCTCGCGTAGTGGCGAAATTATTGCTCATATGGAAGGGGAGGCACAGGCAGCGCGAGCTGCTGCGACGGAGTGGGTTAGTCCGCCGGTTGCTCCGCTACGTAAAGGGCTGAATCTGTTTTTTATCTACGGGCAGTCGCTGGCTATCGGCGATGAAGCGTTTTCAGTCGTCACACGTCAGCCATCGCAGCTTGGAAACCTTATGCTGGGGAAATCACCTCGTGGCAGGTATTACGGGAGAACTAGCGACGCTGACTTTGGTGTTATTGGCGGCGAGAATATCTATTACCCTCTGACTGAGCACAGACAAGATGGTCCAAATATTATTACAGATCCAGATATAAACACCCGCCTCGGTGAGACTGTCGCATCTGGTTTTATGGAAACCCTCAAGACTCTGCATAACCGCTCGAAGGGGGTGAAAAACGATGAAGAAACAATCCTTGCCTGTTCCGTAACGGGATGCTCTGGCACCAATATTGCCACCCTGTTAAAAGGTGCTGGCGCGGCCACGCCATACTATGAACGCCTTATGTCGGCTTTACGCGGGCACATGGAAGCGGCGGCGAAAATGGGGATTACCGATGTACAGGTGTGCGGGATGCTGTTCCTCCAGGGAGAGAATGATTATGGCATCACAAACCGTGAAAATTACCTGAACATGCTGAATCAGCTGATTAATGATTTTAATGCTGATGCAAGAGCGATAACCGGTCAGACGGATAATATCGGATTTTATCTGTATCAGACTGGGGGAACCTATGTCAGCCAGGCAGAGGGCAACACCCTGCCGATTGATATGGCTCAACTGGATATCACGTCACGCGTCGATGCCTTTATGGCCGCTCCCATGTTTCCGTATCCGCAGGCGTCAAATAATCGCACTCATAAGGCAGCAAACAGTTATCGATGGTGGGGATGTGCGGCAGCGAATACTGTTTTTCGCGTGCTGAGTAATGAAAACAGAACGCCATTTCGCATGATAAAAGCGGTTTATGATGGCGAGGATATTTATGTTTCATTTATGACGCCCTGTCCGCCGCTGGCGACGCAGCCATATTACCGGATTGCCGCGGCGGTAATGAATACCGACATGGGATTTACTGTCATTGATGGCACAGGGAATCTGTATGGAACATCACTGGTGACGGAAATTATCTCCCCGTGCGTGATTAAAATATCACCACCAAGAAAGCTGAGCGGAAATATCCGCCTCAATCTCGGCGACCAGCTTCATGGCGGAGGGCATAACGTTGCAGACTCCAGCCCTCAGCAGTCTTTTTTTAACTGGCAATATTACGGCGATGATAATCAGTCAGTGAATGAAAATATTGATGCGTTAAACGATAAACCTTATCCGCTGTATAACTTCGCGGCGATTCAGACAATTAATGTTGATGGAGTGGAATTATGA

Genome Context

Tertiary structure

PDB ID

486811180e977aa3881cce529c69c90181e689a22f5bcc1a706603ef857fe75b

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,7826

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence