Protein

View in Explore

Genbank accession

XGD05849.1 [GenBank]

Protein name

pre-neck appendage

RBP type

TSP

Evidence DepoScope

Probability 1,00

TSP

Evidence RBPdetect2

Probability 0,88

Protein sequence

MLKEITKLQTMDLNCSIFSVYDYNGMSMQEILCQFFSKINELIDSQNQVIDLTKWLVGQGLKEEVAKQLNQWLIDGTLSTIINETVFRDLNNKINSNIENIKNNKEEIDKLVTVWNNLKCFNVADFGAIGNGESNNNKAFEDAINSCVENNIRGLLIPSGKFYITEGINTKGVKIIGMGDPYIPFLEWEYTRPNSKLDEYKKYLNKCRGSIITSDKNINIFTNGLYAENIGIFGNRRALSQNGIGQMDGGFGNWIEIEKVKIHGCGNNGINAEYGLITPIINQCWLYQNGNNGIRVGKNKGTYTGETNALIIEKCFINRNESHGIYLDVKGRAYTIKNNDLEQNGEMSDPLRNNKGTDYNDIVYGCYMKVEGEGGFTSGSIDFSNNYSEETLGLLYLESPDNKICQGVKFESNMWRPYNQELYSNGLLLKGWIEGVKIGNNNMYGRHKVRVINANTYGIETDTDITNPVYKNKNISIEKHYDYNGTMVDFRSTGRVEKYSIENMIQSASYDGSTYTNVYLNKPSVPYELQEDGQGNKLIGTTFLTSDGTSIGLVVDFSWTNGLFKIRKDRTSLIKTGNAKFMENGGFTTINGGNTPVKIYVDHDNEIVIL

Physico‐chemical properties

protein length:	610 AA
molecular weight:	68746,58420 Da
isoelectric point:	5,35721
aromaticity:	0,10164
hydropathy:	-0,48000

Domains

Domains [InterPro]

DC_1947
ATT
1–180

DC_1947 DC_0525

Coil
Unmapped
87–111

Coil IPR011050

IPR012334
STR
120–557

IPR012334

XGD05849.1

1 610

Architecture

ATT

STR

RBD

ATT 1-180 | STR 181-557 | RBD 558-610

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_1947	ATT	DC_1947	1	180	Novel HMM	DC_1947	N-terminal	Low	Positional only	16 proteins / 16 hits
Coil	Unmapped	-	87	111	Coils	Coil	-	-	-	-
IPR011050	STR	IPR011050	119	489	Merged direct domain	Pectin lyase fold/virulence factor	Central	Low	Positional only	572 proteins / 572 hits
IPR012334	STR	IPR012334	120	557	Merged direct domain	Pectin lyase fold	Central	Low	Positional only	867 proteins / 867 hits
DC_0525	RBD	DC_0525	345	610	Novel HMM	DC_0525	C-terminal	Low	Positional only	18 proteins / 18 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

XGD05849.1

1 610

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	134	134	0,9891
Central domain	135	505	372	0,9850
C-terminal	506	610	104	0,9130

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-134

Central
135-505

C-terminal
506-610

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Clostridium phage CpP_VarHS [NCBI]	3455035	No lineage information
Host	Clostridium perfringens [NCBI]	1502	cellular organisms > Bacteria > Bacillati > Bacillota > Clostridia > Eubacteriales

Coding sequence (CDS)

Genbank protein accession

XGD05849.1 [NCBI]

Genbank nucleotide accession

PP973485 [NCBI]

CDS location

range 14957 -> 16789
strand +

CDS

ATGTTAAAAGAAATTACTAAACTTCAAACAATGGATTTAAACTGTAGCATATTTTCAGTTTATGATTATAATGGAATGAGTATGCAAGAAATTTTATGTCAATTCTTTAGTAAAATAAATGAATTAATTGACTCACAAAATCAAGTAATAGATTTAACAAAATGGTTAGTAGGTCAAGGTTTAAAAGAAGAAGTTGCAAAACAACTTAATCAATGGTTAATTGATGGTACTTTATCCACAATAATAAATGAAACAGTATTCAGAGATTTAAATAATAAAATTAACTCTAATATAGAAAATATTAAAAACAACAAAGAAGAAATAGATAAACTAGTAACAGTTTGGAATAATCTTAAATGTTTTAATGTTGCTGATTTTGGAGCAATCGGTAATGGAGAATCTAACAACAATAAAGCCTTTGAGGATGCCATAAATTCATGTGTTGAAAATAATATACGCGGTTTATTAATTCCAAGTGGAAAATTTTATATTACAGAGGGTATTAACACAAAGGGCGTAAAAATCATAGGAATGGGTGACCCCTATATTCCATTTTTAGAATGGGAATATACAAGACCAAACTCAAAATTAGATGAATATAAAAAATATTTAAATAAGTGTCGTGGTAGTATAATAACATCAGATAAAAATATTAATATATTTACTAATGGTCTATACGCTGAAAATATAGGTATTTTTGGTAATAGAAGAGCATTATCTCAAAATGGTATAGGCCAAATGGACGGAGGGTTTGGTAACTGGATTGAAATAGAAAAAGTTAAAATCCACGGTTGCGGTAATAATGGTATTAACGCTGAATATGGATTAATAACACCTATCATCAATCAATGTTGGTTGTATCAGAATGGTAATAATGGCATAAGAGTTGGTAAAAACAAGGGTACTTATACTGGTGAAACAAACGCTTTAATAATAGAAAAATGTTTTATTAATAGGAATGAAAGTCACGGTATTTACTTAGATGTTAAAGGTAGAGCTTATACTATTAAAAATAATGACTTAGAGCAAAATGGTGAAATGAGTGACCCATTGAGAAATAATAAAGGTACTGATTATAATGATATAGTTTATGGTTGTTATATGAAGGTTGAAGGTGAAGGTGGTTTCACTAGTGGGTCAATAGATTTTAGTAATAACTATTCAGAAGAAACTTTAGGTTTATTATACTTAGAAAGTCCCGATAATAAAATATGTCAAGGTGTAAAATTTGAATCTAATATGTGGCGACCTTATAATCAAGAATTATATTCAAATGGTTTACTACTAAAAGGTTGGATTGAAGGTGTTAAAATTGGTAATAATAATATGTACGGTAGACATAAAGTAAGAGTTATCAATGCAAATACTTATGGTATTGAAACTGACACAGATATAACAAACCCAGTATATAAAAACAAAAATATATCTATTGAAAAACATTATGACTATAACGGTACAATGGTTGACTTTAGAAGTACAGGAAGAGTTGAAAAATATTCTATTGAAAATATGATACAATCCGCATCTTATGACGGTAGCACATACACCAATGTATATTTAAATAAACCTAGCGTACCATATGAGTTGCAAGAAGACGGGCAAGGTAATAAATTAATTGGTACAACATTTTTAACATCAGACGGTACAAGTATAGGATTAGTTGTTGACTTCTCATGGACTAATGGATTATTTAAAATAAGAAAAGATAGAACATCATTAATAAAAACTGGTAACGCTAAGTTTATGGAGAATGGTGGTTTTACAACAATAAACGGAGGTAATACACCAGTAAAAATCTATGTTGACCATGACAATGAAATAGTAATTTTATAA

Genome Context

Tertiary structure

PDB ID

8cb537f61eb0ea04574f332c3e111f3bdab3d9fe55ad2719bb212b69c286268e

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,6630

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence