Protein

View in Explore

Genbank accession

WIT25839.1 [GenBank]

Protein name

tail spike protein

RBP type

Evidence Phold

Probability 1,00

TSP

Evidence DepoScope

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,91

TSP

Evidence RBPdetect2

Probability 0,95

Protein sequence

MDNTPEIQKDINNIQIDITKFGVTGDGITDDTAAINKALKWIKDNGYDTAYFPSGTYMVDGVNRTTQYNIWRNGGIVVPSDVNIVMDYDTIIKVIPNDAWGYSAFYVGRASNVTIRGGQIIGEKANHTYNTTTGKETNEWGFGICIEASDNVIVEGVRISECIGDGVIISPLGLATDSNYRTSTNVVVRRCIIDGSRRNNISVTGCEYIILEGNTLTNAGADGVTPKFGIDIEGYGEGDIDYEFPLNITAKDNYVAGSRKAAICNFNGYGVIITNNHVDSYLSYGFGTETVISDNVVKKLDSYASEIDTGVTGLGVSNGLPGNNSIVSNNTVTGFSTGIDVRGGDVLVSGNKVYHFDNVGIATWAANKVVVSGNVVSGFVTTSDTTKYGQGVRLFTGSDITVMGNRISETKLGVYTQSTSEVVVKDNYVKRVGIGIQVGGTSAVVENNTLIQGDITDLGYKAEYAIQATGTTLKAVIRGNYVQDFTGTPIYSYKATCKVLSNIIEGVVSYSAIQLNGDKHYVVGNKISMNRSSATCYGIYIEYSTDSSIIDNTMYSISGYVMNNAITTNTTSTGTKIIANKIINGAIASHSTDTVTGNQLI

Physico‐chemical properties

protein length:	601 AA
molecular weight:	64283,94390 Da
isoelectric point:	4,88556
aromaticity:	0,08486
hydropathy:	-0,09201

Domains

Domains [InterPro]

IPR012334
STR
14–310

IPR012334 IPR006626 IPR006626 IPR006626 IPR006626 IPR006626 IPR006626 IPR006626 IPR006626 IPR006626

IPR011050
STR
15–298

IPR011050 IPR039448

IPR024535
ENZ
16–61

IPR024535 IPR039448 IPR006626 IPR006626 DC_1312

IPR012334
STR
20–310

IPR012334 IPR012334

IPR006626
Unmapped
110–148

IPR006626 IPR006626 IPR006626 IPR006626 IPR011050

IPR011050
STR
438–595

IPR011050

WIT25839.1

1 601

Architecture

STR

STR 14-595 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
IPR012334	STR	IPR012334	14	310	Merged direct domain	Pectin lyase fold	Central	Low	Positional only	867 proteins / 867 hits
IPR011050	STR	IPR011050	15	298	Merged direct domain	Pectin lyase fold/virulence factor	Central	Low	Positional only	572 proteins / 572 hits
IPR024535	ENZ	DC_0410	16	61	InterPro cluster	Rhamnogalacturonase A/B/Epimerase-like, pectate lyase domain	Central	High	Text match	420 proteins / 426 hits
IPR012334	STR	IPR012334	20	310	Merged direct domain	Pectin lyase fold	Central	Low	Positional only	867 proteins / 867 hits
IPR039448	ENZ	DC_0799	71	224	InterPro cluster	Right handed beta helix domain	C-terminal	High	Text match	178 proteins / 183 hits
IPR006626	Unmapped	-	110	148	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	149	171	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	183	205	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	206	234	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	245	267	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR011050	STR	IPR011050	247	471	Merged direct domain	Pectin lyase fold/virulence factor	Central	Low	Positional only	572 proteins / 572 hits
IPR006626	Unmapped	-	268	290	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	322	342	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR039448	ENZ	DC_0799	323	449	InterPro cluster	Right handed beta helix domain	C-terminal	High	Text match	178 proteins / 183 hits
IPR006626	Unmapped	-	343	365	InterPro	Parallel beta-helix repeat	-	-	-	-
DC_1312	RBD	DC_1312	354	576	Novel HMM	DC_1312	C-terminal	Low	Positional only	37 proteins / 37 hits
IPR006626	Unmapped	-	366	396	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR012334	STR	IPR012334	379	536	Merged direct domain	Pectin lyase fold	Central	Low	Positional only	867 proteins / 867 hits
IPR006626	Unmapped	-	397	418	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	419	440	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR011050	STR	IPR011050	438	595	Merged direct domain	Pectin lyase fold/virulence factor	Central	Low	Positional only	572 proteins / 572 hits
IPR006626	Unmapped	-	445	470	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	472	494	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	517	543	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	544	570	InterPro	Parallel beta-helix repeat	-	-	-	-

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

WIT25839.1

1 601

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	26	26	0,9397
Central domain	27	590	565	0,9973
C-terminal	591	601	10	0,1658

Note: Constraints were applied during segmentation.
C-terminal too short, adjusted boundary

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-26

Central
27-590

C-terminal
591-601

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Bacillus phage SPO1L1 [NCBI]	3053430	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Bacillus subtilis BEST7003 [NCBI]	1204342	Bacillota > Bacilli > Bacillales > Bacillaceae > Bacillus > Bacillus subtilis BEST7003

Coding sequence (CDS)

Genbank protein accession

WIT25839.1 [NCBI]

Genbank nucleotide accession

OQ921336.1 [NCBI]

CDS location

range 39874 -> 41679
strand +

CDS

ATGGACAATACACCAGAGATACAAAAAGATATTAATAACATACAAATTGACATCACTAAATTTGGAGTAACAGGTGATGGCATAACAGACGATACGGCTGCTATCAATAAGGCGCTAAAGTGGATTAAGGATAATGGATATGATACTGCATACTTCCCTTCAGGTACTTACATGGTAGATGGTGTTAACAGAACAACTCAATATAATATCTGGCGTAACGGTGGTATTGTTGTGCCTAGTGATGTCAACATAGTCATGGACTATGATACAATCATTAAGGTAATCCCAAATGACGCTTGGGGATACTCTGCGTTTTATGTAGGCAGGGCGTCCAATGTCACTATACGTGGGGGTCAAATCATAGGAGAAAAAGCAAACCACACTTATAATACTACTACAGGAAAAGAAACAAATGAATGGGGCTTTGGTATTTGTATTGAAGCTTCGGATAATGTAATTGTTGAAGGGGTAAGAATTAGTGAATGTATAGGTGATGGGGTCATTATCTCACCTCTAGGTCTCGCCACAGATTCTAACTATAGAACTAGTACCAATGTAGTAGTTAGAAGATGTATTATAGATGGATCTCGCAGAAATAATATATCGGTTACTGGATGTGAATATATCATCCTAGAAGGAAATACACTAACAAACGCTGGTGCTGACGGGGTCACTCCTAAGTTCGGTATTGACATTGAAGGTTATGGAGAAGGTGATATTGACTACGAATTCCCTCTTAACATCACCGCCAAAGACAACTATGTTGCAGGAAGTAGAAAAGCGGCTATATGTAACTTTAATGGATATGGTGTAATCATTACCAATAACCATGTTGACAGTTATTTATCCTATGGTTTTGGTACTGAAACCGTTATCTCTGATAATGTGGTCAAGAAATTAGATAGTTATGCTAGTGAAATTGATACTGGAGTCACTGGTCTTGGGGTCTCTAATGGTCTTCCGGGAAACAACTCCATAGTGTCTAATAACACAGTAACTGGATTCTCTACAGGCATAGACGTACGTGGTGGGGATGTCCTAGTATCTGGAAATAAAGTCTATCATTTTGATAATGTGGGTATAGCTACATGGGCGGCAAATAAAGTGGTAGTGAGTGGAAACGTTGTCAGTGGGTTCGTAACTACCAGTGATACTACAAAATATGGTCAAGGGGTAAGGCTATTCACTGGATCAGACATAACTGTAATGGGCAACCGAATCTCAGAAACTAAATTAGGAGTATACACACAGAGTACTTCTGAGGTTGTCGTTAAGGACAATTATGTTAAGCGTGTGGGCATCGGCATTCAGGTGGGAGGAACCTCTGCGGTAGTGGAAAACAACACTCTAATACAAGGAGATATTACAGATCTTGGTTATAAAGCGGAGTATGCTATCCAAGCCACAGGAACAACCCTAAAGGCGGTAATAAGAGGTAACTATGTTCAGGACTTCACAGGTACTCCTATTTATTCCTATAAGGCTACTTGTAAAGTATTAAGCAACATAATTGAGGGTGTGGTCTCCTATTCGGCTATACAGCTAAATGGAGACAAACACTATGTAGTTGGTAATAAAATCAGTATGAATCGTTCTAGTGCCACGTGTTATGGCATCTATATAGAGTACTCAACGGATTCCTCTATTATAGATAATACTATGTATAGTATTTCTGGTTATGTCATGAATAATGCCATAACCACCAACACAACATCTACAGGCACTAAGATTATTGCTAATAAGATCATAAATGGAGCCATAGCTTCACACTCTACAGATACAGTAACGGGTAACCAACTGATATAA

Genome Context

Tertiary structure

PDB ID

8b6fdfbd17ee15cad6b7c0338497fff550d94b1fc7ee6ca86bbd25ca73ec5ac6

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,8999

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence