Protein

View in Explore

Genbank accession

CAK1257532.1 [GenBank]

Protein name

tail fiber protein

RBP type

Evidence GenBank

Probability 1,00

TSP

Evidence DepoScope

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,91

Evidence RBPdetect2

Probability 0,92

Protein sequence

MNINQIGVCIMATYKVGKVKINGNGLMTGTGTNWTAANALVRVGATVVLATNPVRIYTVGSIISATSIQLSDWGSDAAITTDTNYSILLHDGLTVQGLAQDTAETLRYYRNFENTLGDAAKATIGEAPGNVMKVGAFGLGANKPGGTIASTTYPSANALFKALMDAGCGWWRSPGSSENGIFGHGSSYFSYVSDTCSAINVAYETGRVIVLASNRAKINNGYQPARNVLYGSANPPDLNNETRGVLNMANGGTGSTNASDARLAFGLRMIDVPANTSGAVRCIKIASIRTPGAAGSFASMSIYGGSGIGSGPRVNIDTVIISGRNSGNENNPQGDVSILHRCLRAGNDTLKFGLVKTGEGQYDVYMKVMGYVQGLRIVVDTILSQSFIDGPVYTGSFGSIGYVNESEIPTPAGNIGWASTYDIVNQYNKDIAQEFSEVTINRASTNDQEARLLFNFGKTESRGAELRSTYTNGNIVLATGHNGASSPVFGEIYLRTAGSTSSTGQFKFDKEGSATATGGQWKNSSDIRLKRDFKPISSPLESVMSFRGATYEMKASGVRAIGVIAQDIEKLCPDAIGRMEIELDGEVIPDAMSVDTAGFAAAYSVQALKEVVKLMDLMLEDPEAASVRIKALKEMINDELPE

Physico‐chemical properties

protein length:	642 AA
molecular weight:	67883,54910 Da
isoelectric point:	5,56132
aromaticity:	0,07477
hydropathy:	-0,11558

Domains

Domains [InterPro]

DC_0022
STR
2–641

DC_0022

IPR030392
CHP
525–575

IPR030392

CAK1257532.1

1 642

Architecture

STR

STR 2-641 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0022	STR	DC_0022	2	641	Novel HMM	DC_0022	Central	Low	Positional only	38 proteins / 38 hits
IPR030392	CHP	DC_0088	525	575	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

CAK1257532.1

1 642

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	410	410	0,3658
Central domain	411	609	200	0,0765
C-terminal	610	642	32	0,8645

Note: Constraints were applied during segmentation.
Fixed 263 C-terminal predictions appearing before Central domain

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-410

Central
411-609

C-terminal
610-642

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Klebsiella phage vB_Ko_K29PH164C1 [NCBI]	3071669	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	No host information

Coding sequence (CDS)

Genbank protein accession

CAK1257532.1 [NCBI]

Genbank nucleotide accession

OY757094.1 [NCBI]

CDS location

range 24124 -> 26052
strand +

CDS

GTGAATATTAACCAGATAGGAGTTTGCATAATGGCAACTTACAAAGTAGGTAAAGTGAAAATCAATGGCAATGGCCTAATGACTGGCACGGGAACTAACTGGACGGCGGCAAACGCTCTTGTTCGCGTTGGGGCGACGGTTGTTCTTGCAACTAACCCGGTCAGGATCTACACGGTCGGCTCTATCATCTCGGCAACTTCAATCCAGCTTTCCGATTGGGGATCTGACGCTGCGATCACAACCGATACAAACTATTCTATTCTGCTTCACGATGGGTTGACGGTTCAGGGGCTGGCGCAAGATACCGCCGAAACGCTTCGTTACTACCGTAACTTTGAGAACACGTTAGGCGACGCCGCAAAGGCTACGATCGGCGAGGCTCCAGGTAACGTGATGAAGGTCGGAGCGTTTGGTTTGGGTGCAAATAAACCTGGCGGGACAATTGCGAGCACTACATACCCATCGGCTAACGCGCTTTTTAAAGCCTTGATGGATGCTGGTTGCGGATGGTGGAGGAGTCCGGGTTCAAGTGAGAACGGGATATTCGGGCATGGGTCAAGCTATTTTTCATACGTTAGCGACACATGTTCAGCGATAAACGTAGCCTATGAAACAGGTCGGGTTATTGTTCTTGCATCAAACAGAGCGAAAATTAACAACGGCTACCAGCCAGCAAGAAACGTTCTTTATGGCTCAGCTAACCCGCCTGATCTTAACAATGAAACTCGCGGCGTGCTTAACATGGCAAACGGGGGAACCGGATCGACTAATGCCAGCGACGCAAGGCTTGCGTTTGGCCTTAGAATGATAGATGTACCAGCCAACACATCGGGCGCTGTGCGATGCATCAAGATCGCCTCTATAAGAACTCCTGGTGCTGCTGGCTCATTTGCATCCATGTCAATTTACGGCGGATCTGGAATCGGAAGCGGCCCGCGAGTTAATATTGACACGGTTATAATTTCAGGTCGAAACTCAGGCAACGAGAACAACCCGCAAGGTGATGTTTCTATCCTTCACCGCTGCTTAAGGGCTGGAAATGATACACTAAAATTTGGCTTAGTGAAAACCGGAGAGGGTCAATATGACGTTTACATGAAAGTGATGGGTTATGTTCAGGGTTTGAGGATTGTTGTTGATACTATACTATCTCAAAGCTTCATTGATGGCCCGGTTTACACTGGTTCTTTTGGTTCAATCGGTTACGTGAACGAATCTGAGATACCAACCCCGGCGGGAAACATTGGATGGGCTAGCACTTACGATATTGTTAACCAGTATAATAAGGATATCGCCCAAGAGTTTAGCGAGGTTACGATAAACAGAGCAAGCACGAATGATCAAGAGGCCAGGTTGCTTTTTAACTTTGGCAAAACAGAATCAAGGGGCGCGGAGCTTAGATCGACGTATACAAACGGTAATATTGTTCTTGCGACTGGTCACAACGGAGCATCATCTCCAGTTTTTGGGGAAATATACCTAAGAACGGCGGGCAGTACAAGCTCAACTGGGCAATTCAAATTTGACAAGGAAGGAAGCGCAACGGCGACAGGTGGTCAGTGGAAAAACTCCTCAGATATTAGGCTGAAGCGAGATTTCAAGCCGATCTCTTCTCCGCTTGAATCTGTTATGTCATTCCGTGGGGCCACTTACGAAATGAAAGCTAGCGGGGTTAGGGCGATTGGTGTTATAGCTCAGGATATCGAGAAACTTTGCCCCGACGCAATCGGCAGAATGGAAATTGAACTTGATGGGGAGGTGATACCGGATGCAATGAGCGTTGATACGGCTGGCTTTGCTGCGGCTTACAGCGTGCAGGCATTGAAGGAAGTTGTTAAGCTGATGGATTTGATGCTTGAAGATCCTGAAGCGGCTAGCGTGCGAATTAAGGCGCTGAAGGAAATGATTAATGATGAGTTGCCGGAGTAA

Genome Context

Tertiary structure

PDB ID

b6f0a177ae2926adb23f776ec172e7b02d7c92b3be25f4d4f05893e22b44b625

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,6655

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence