Protein

View in Explore

Genbank accession

AFX93502.1 [GenBank]

Protein name

putative polygalacturonase

RBP type

TSP

Evidence DepoScope

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,91

TSP

Evidence RBPdetect2

Probability 0,94

Protein sequence

MSTRRPNFNNADLEQAYYYKRRSFGNGYTIKFQREALLWDSADGGDGNYYIWGGALPKSVPSGSTPATSGGLGNTAWINIGTAALANVLYDMLTPEMFGAKGDGVADDTAAVVECWKSAKAKASDQFRIEVVMRHKYLIRAQTLIGSSNVRYSGGGTITTDSTALNYTMITFDDCANFIFTDIKVTRSAFPDPSVMWSKTNQAMVMTNCTDFLVSQCDVSYHTDAISVSSGARYIIEGNRTHELGEEGIAIRRSRKFVCRNNFVFNHHGDGILLKTANVFCHDGLIEGNHVFDGLKKSGIAGGARGGGITLNDEVIGTVSGINFSSLGVVGNLVRNTSYGLSFANVDDLRIEANSCIDIERFGINWDTTVFNNPSLNPMYRGAVVGNNVVNCGQVGISATSLNGINIFNVLVTGNTVESAGTQTGAEYPGITVSGGVVTSNIVTNCTVAYQGSDTVATGNRFIGSTRTTDGVGAVWLKIGGSGVFSDNVVVDSNKGYIRLSSANDLSFSGNDIALQSSFAGLYFTGTFTTGVKAGGNVYSCPNFPSVSNFNVGPTVIRSMELTPAEFGRKRHVYDGVAASGLTHLVGDVVSNRAPAVGFPMDYVVSAINGDGTPALTPLNFNRRLVTVTQDLVVTNGTFIQIKVTGLVGVLSNWMPEGVATSVPAQGLTITAHVTNAQEVTFLVWNHSGNDRNITGVTLSTYVHSVN

Physico‐chemical properties

protein length:	707 AA
molecular weight:	75201,37950 Da
isoelectric point:	6,07640
aromaticity:	0,09052
hydropathy:	-0,01103

Domains

Domains [InterPro]

DC_0352
STR
2–704

DC_0352

G3DSA:2.10.10.80
ATT
17–91

G3DSA:2.10.10.80 IPR011050 IPR006626 IPR006626 IPR006626

IPR040775
RBD
21–81

IPR040775 IPR012334

IPR039448
ENZ
200–315

IPR039448 IPR006626 IPR006626

IPR006626
Unmapped
209–230

IPR006626 IPR006626 IPR006626

AFX93502.1

1 707

Architecture

STR

ATT

STR

STR 2-16 | ATT 17-91 | STR 92-704 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0352	STR	DC_0352	2	704	Novel HMM	DC_0352	Central	Low	Positional only	15 proteins / 15 hits
G3DSA:2.10.10.80	ATT	G3DSA:2.10.10.80	17	91	Merged direct domain	G3DSA:2.10.10.80	N-terminal	Low	Positional only	383 proteins / 383 hits
IPR040775	RBD	DC_0821	21	81	InterPro cluster	Tail spike TSP1/Gp66, N-terminal domain	Central	High	Text match	1281 proteins / 1285 hits
IPR011050	STR	IPR011050	94	392	Merged direct domain	Pectin lyase fold/virulence factor	Central	Low	Positional only	572 proteins / 572 hits
IPR012334	STR	IPR012334	96	382	Merged direct domain	Pectin lyase fold	Central	Low	Positional only	867 proteins / 867 hits
IPR039448	ENZ	DC_0799	200	315	InterPro cluster	Right handed beta helix domain	C-terminal	High	Text match	178 proteins / 183 hits
IPR006626	Unmapped	-	209	230	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	231	253	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	281	313	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	346	368	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	379	401	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	407	435	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	438	460	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	480	526	InterPro	Parallel beta-helix repeat	-	-	-	-

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

AFX93502.1

1 707

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	109	109	0,9872
Central domain	110	563	455	0,9926
C-terminal	564	707	143	0,9861

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-109

Central
110-563

C-terminal
564-707

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Serratia phage phiMAM1 [NCBI]	1262513	Uroviricota > Caudoviricetes > Pantevenvirales > Miltonvirus > Miltonvirus MAM1
Host	Serratia sp. [NCBI]	616	Bacteria > Proteobacteria > Gammaproteobacteria > Enterobacteriales > Enterobacteriaceae > Serratia

Coding sequence (CDS)

Genbank protein accession

AFX93502.1 [NCBI]

Genbank nucleotide accession

JX878496 [NCBI]

CDS location

range 30102 -> 32225
strand +

CDS

ATGTCAACTAGACGCCCCAATTTTAACAACGCCGATCTTGAGCAAGCGTATTATTACAAACGTCGCTCGTTTGGTAATGGATATACCATCAAATTCCAACGAGAAGCACTGCTATGGGATTCTGCTGATGGTGGTGATGGCAACTATTACATTTGGGGAGGCGCACTCCCTAAATCTGTTCCATCTGGTTCCACTCCCGCCACCAGTGGTGGCCTGGGGAATACCGCATGGATTAATATCGGCACGGCGGCGTTGGCCAACGTGTTATATGACATGCTGACGCCGGAAATGTTCGGTGCTAAAGGTGATGGCGTGGCAGATGACACTGCTGCGGTAGTGGAATGCTGGAAGTCTGCAAAGGCCAAGGCCTCCGATCAGTTTAGAATCGAAGTTGTGATGCGCCACAAATATCTTATCCGCGCTCAGACCTTGATCGGTTCTAGCAATGTTCGATACAGCGGGGGCGGCACGATCACCACAGACAGTACTGCTTTGAACTACACTATGATAACATTTGATGACTGTGCCAATTTCATATTCACAGATATCAAGGTAACGCGGTCAGCATTTCCTGATCCTTCTGTCATGTGGTCTAAAACTAATCAGGCCATGGTGATGACCAACTGCACCGATTTCTTGGTGTCACAATGCGACGTTTCTTACCACACTGATGCGATATCTGTGTCATCTGGTGCACGATACATAATCGAAGGGAACCGAACTCACGAACTCGGTGAAGAAGGCATTGCTATTCGCCGGTCGCGCAAATTCGTTTGCCGTAACAATTTTGTGTTCAACCACCATGGCGACGGTATTTTGTTGAAGACCGCAAACGTGTTCTGTCATGACGGCCTGATCGAAGGGAACCACGTATTCGATGGTCTGAAGAAATCTGGTATAGCAGGTGGCGCTCGTGGCGGTGGTATCACTCTGAATGATGAAGTCATCGGGACAGTATCTGGTATTAACTTCAGTTCTCTCGGCGTTGTCGGAAACTTGGTGCGTAACACATCCTATGGGTTGTCATTCGCTAACGTGGACGACCTCAGAATAGAGGCCAACTCTTGTATTGACATCGAAAGATTTGGGATAAACTGGGACACCACAGTGTTTAACAACCCATCCCTCAACCCGATGTACAGGGGTGCCGTGGTAGGCAACAACGTGGTCAATTGCGGCCAGGTCGGGATTAGTGCAACGTCCCTGAACGGAATCAACATATTCAACGTGTTGGTGACTGGTAACACTGTGGAAAGCGCGGGCACACAGACTGGGGCGGAATACCCTGGGATAACTGTCAGTGGTGGGGTTGTAACTTCCAACATCGTCACCAACTGTACTGTGGCGTACCAAGGATCGGATACTGTCGCAACAGGGAACCGCTTTATTGGTTCTACCAGGACGACTGATGGCGTGGGCGCGGTTTGGCTGAAGATCGGCGGCTCTGGAGTGTTCAGTGACAACGTGGTGGTTGATTCCAACAAGGGTTATATTCGGTTGTCCAGCGCCAATGACCTTTCTTTCAGTGGGAACGATATTGCTCTGCAGTCCTCGTTTGCAGGCTTGTATTTCACAGGGACATTTACCACTGGTGTCAAAGCCGGAGGGAACGTTTACTCGTGCCCGAATTTCCCCAGCGTTAGCAACTTTAACGTGGGACCGACCGTGATTCGTTCTATGGAGTTGACTCCAGCAGAGTTCGGGCGCAAGCGGCACGTTTACGACGGTGTTGCTGCCTCTGGTTTGACTCACCTTGTCGGGGATGTTGTGTCTAACCGCGCCCCTGCCGTCGGATTCCCAATGGATTATGTGGTTTCGGCAATAAACGGTGATGGAACTCCGGCCTTAACACCATTGAATTTCAACCGGCGCTTGGTGACCGTCACCCAAGATTTAGTTGTCACCAACGGCACGTTCATACAGATCAAAGTGACGGGGTTGGTGGGGGTGTTATCCAACTGGATGCCAGAAGGAGTGGCTACTAGTGTGCCAGCGCAAGGGTTGACTATCACGGCGCACGTGACCAATGCGCAGGAAGTAACATTCCTCGTCTGGAACCACTCAGGCAACGACAGAAATATCACGGGCGTAACGCTCAGCACATATGTTCACAGCGTGAACTGA

Genome Context

Tertiary structure

PDB ID

d4691df7cc6bd27f10983820063e3d13a924162c5176e0ba493cc7f9efb8d692

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,7982

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence