Protein

View in Explore

Genbank accession

CAM0052648.1 [GenBank]

Protein name

tail spike protein with colonic acid degradation activity

RBP type

Evidence Phold

Probability 1,00

TSP

Evidence DepoScope

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,91

TSP

Evidence RBPdetect2

Probability 0,94

Protein sequence

MTTKVPNTMIEGSTINVKDFGAKGDGVTDDTAAIQDAINAGRRIYIPTGVYLINEVAIPDNRIIEGDGVESKLVVPVGVTHTRGMFYNAMSRWSNTTIRDLHFDGSNNYPTDKSVYYGDVAINNVMIRKSGACTDVTIQDCYFTKASTSSIYVSDGDHTTSLKIINNKFNDGNYKLKTIGIYGSNNVSDAKAPRGIEVSGNVINGGGSRIHKDGRIEGFTSSTDAIHLDNCRHSIISKNIIRENSGDAIRVEQSKYIMVSDNSIYRSGSAGITVYHSSQRCSIIGNTIDGWGYTIQAYCIRSHGGKYYICREFPDATHAVLPTDPSTVSWIIECPYNLTGIDTSTILPYSSTDYYSSGSSTGILPFRGSSAISVTSSSYAVKIIGNICNGNTSKDASNKYHTASEHGYSNKHTVNSPVGVTGDSNTVSGNAFSNCQGHELYAGEYQDPINQRGKSGLQYISDDNSYSAHRGHGKNTDKYYTIHDNLSITSGGGEFTPTLTPSTSGSITLTGAYNALSWYRVGQMVTISGQIRVGSVSSPVGGVKIEGLPFTQLNLADGAERVAGVALCNNVEAATPPITQFFVSGAGNVMWISGTTGTTTRNIGDLIKSGTVIDVNFTYRTQI

Physico‐chemical properties

protein length:	623 AA
molecular weight:	66844,34300 Da
isoelectric point:	6,46245
aromaticity:	0,08347
hydropathy:	-0,30321

Domains

Domains [InterPro]

IPR011050
STR
12–172

IPR011050 IPR006626 IPR006626 IPR006626 IPR006626 DC_1508

IPR012334
STR
14–316

IPR012334 IPR006626

IPR012334
STR
14–310

IPR012334

IPR024535
ENZ
15–272

IPR024535

IPR006626
Unmapped
93–119

IPR006626 IPR006626 IPR011050

CAM0052648.1

1 623

Architecture

STR

STR 12-623

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
IPR011050	STR	IPR011050	12	172	Merged direct domain	Pectin lyase fold/virulence factor	Central	Low	Positional only	572 proteins / 572 hits
IPR012334	STR	IPR012334	14	316	Merged direct domain	Pectin lyase fold	Central	Low	Positional only	867 proteins / 867 hits
IPR012334	STR	IPR012334	14	310	Merged direct domain	Pectin lyase fold	Central	Low	Positional only	867 proteins / 867 hits
IPR024535	ENZ	DC_0410	15	272	InterPro cluster	Rhamnogalacturonase A/B/Epimerase-like, pectate lyase domain	Central	High	Text match	420 proteins / 426 hits
IPR006626	Unmapped	-	93	119	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	133	155	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	193	230	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR011050	STR	IPR011050	195	299	Merged direct domain	Pectin lyase fold/virulence factor	Central	Low	Positional only	572 proteins / 572 hits
IPR006626	Unmapped	-	231	253	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	254	276	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	278	304	InterPro	Parallel beta-helix repeat	-	-	-	-
DC_1508	STR	DC_1508	310	623	Novel HMM	DC_1508	Central	Low	Positional only	5 proteins / 5 hits
IPR006626	Unmapped	-	422	461	InterPro	Parallel beta-helix repeat	-	-	-	-

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

CAM0052648.1

1 623

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	28	28	0,8660
Central domain	29	295	268	0,9918
C-terminal	296	623	327	0,6081

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-28

Central
29-295

C-terminal
296-623

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Vibrio phage K452 [NCBI]	3105720	Viruses > unclassified bacterial viruses >
Host	No host information

Coding sequence (CDS)

Genbank protein accession

CAM0052648.1 [NCBI]

Genbank nucleotide accession

OZ196320.1 [NCBI]

CDS location

range 87000 -> 88871
strand -

CDS

ATGACAACAAAAGTTCCAAATACAATGATTGAAGGTTCGACCATAAACGTAAAAGATTTTGGCGCTAAAGGTGATGGTGTAACTGATGATACTGCTGCTATTCAAGATGCCATTAACGCAGGCAGGCGTATATATATCCCAACAGGCGTATATCTAATAAATGAGGTTGCTATACCCGACAACCGCATCATTGAAGGTGACGGCGTTGAGTCAAAACTGGTAGTTCCTGTTGGCGTTACTCACACCAGAGGCATGTTCTATAATGCCATGTCTCGTTGGTCGAATACTACAATTCGAGACTTACATTTTGATGGTAGTAATAATTACCCTACCGACAAAAGCGTATATTACGGCGACGTGGCCATAAACAATGTTATGATTCGAAAATCTGGAGCGTGTACAGATGTTACTATCCAAGACTGCTATTTCACAAAGGCGTCAACTAGTAGCATTTATGTATCGGACGGTGACCACACCACTAGTTTGAAAATCATCAATAACAAATTCAATGACGGTAACTATAAACTGAAAACTATAGGAATTTATGGTTCTAACAACGTGTCTGACGCTAAAGCCCCTCGCGGTATTGAGGTTAGTGGTAATGTTATCAATGGAGGCGGGTCACGAATACACAAAGACGGGCGTATTGAGGGGTTCACTTCGTCAACTGATGCTATCCACTTAGACAACTGTAGACATTCAATAATCAGTAAGAATATCATTCGTGAGAATAGCGGTGATGCAATTCGGGTTGAACAATCGAAGTATATCATGGTATCTGACAATAGCATTTACCGTTCTGGTTCTGCTGGTATCACAGTGTACCATTCATCACAACGTTGTTCTATTATAGGAAACACTATCGATGGTTGGGGTTACACTATCCAAGCGTATTGTATCCGATCGCACGGCGGGAAGTATTACATATGTCGAGAGTTCCCCGACGCAACTCACGCAGTATTACCTACTGACCCTAGTACTGTGTCTTGGATTATAGAGTGCCCATACAACCTCACAGGGATTGATACGTCGACTATTTTACCTTATAGTTCTACTGATTATTACTCTAGCGGTTCGTCCACTGGTATCCTCCCGTTCCGAGGGTCAAGTGCTATATCAGTAACAAGTTCATCTTACGCAGTGAAAATTATAGGTAATATATGTAATGGTAACACGAGCAAAGATGCTAGTAATAAGTACCACACCGCGAGCGAACATGGATACTCAAATAAACATACAGTGAATAGTCCGGTTGGCGTTACAGGTGATTCGAATACTGTGTCAGGTAATGCGTTTTCTAATTGTCAAGGGCATGAACTATACGCGGGTGAATATCAAGACCCCATAAACCAACGCGGGAAATCAGGCTTGCAATATATCAGTGATGATAATTCATACAGCGCACATCGCGGCCATGGTAAGAATACTGACAAATATTATACGATTCATGACAACTTATCAATAACATCAGGCGGGGGTGAGTTCACCCCAACATTGACGCCGTCAACATCAGGTAGCATTACATTGACGGGGGCGTACAACGCTTTATCGTGGTATCGTGTCGGACAGATGGTGACAATATCAGGCCAAATACGCGTGGGGAGTGTTAGCTCGCCAGTAGGCGGCGTCAAGATTGAAGGTCTACCATTTACACAATTGAACCTTGCTGATGGGGCTGAACGCGTGGCGGGTGTGGCGTTATGCAATAATGTAGAAGCGGCCACGCCGCCTATCACCCAATTCTTTGTATCGGGAGCGGGTAATGTTATGTGGATATCAGGAACAACAGGAACAACAACACGCAACATCGGCGATTTGATAAAATCTGGAACCGTCATCGATGTGAACTTCACATATCGTACACAGATATAA

Genome Context

Tertiary structure

PDB ID

34e1c83328c0143a60c3305b5c4bd8d8ee2601f0a615ec0ae9019b46dd2dbade

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,7266

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence