Protein

View in Explore

Genbank accession

CAB4195881.1 [GenBank]

Protein name

tail spike protein

RBP type

Evidence Phold

Probability 1,00

TSP

Evidence DepoScope

Probability 1,00

TSP

Evidence RBPdetect2

Probability 0,91

Protein sequence

MKTLLSLWLLVASLTASAAVPLPVAVSGNAINLSMTANRVTGVSPLGVVFDATATTASTTSNPFHDIEYRWNFGDTNAGTYTVGAPGQTNKNIATGAVAGHVFEITEGSGTQTFTVTLTAYDGTNTVTQTKTITVTDPASVYSGTATVCLANSTPTAGVGSCPAGAATPAGASVFDTAMANCTANKRCLFKKGDTWTMATAYLPLTAANVSIGAYGTGSKPLITASSGVGGVFTISDGADNMRIADIEVTGVVTPGALNNAILVVGYPVSNLLVLRTTFHNSGGGLVIVSGARLVGVVIADSAWYDFYSSIGYFGETYTAAIIGNTIGPIPESGNAEHGVRIQNGRTIAVANNTFEPANTAAGKQQLTVRSRDHSVGQAYDPYTDTRYIHVSDNKFNAGGQAKVQFAPASYTQCDWGRDVVFERNWTTYSNYASTSVGLSVEWEYVTIRNNIWDSSASLNTLSSPTSISIVNGQGVGTYCTATVAPSDVIDNRIPAPSNIWIYNNTFYSSVAPPSHDRDYFAISVNNGDPSTTRPVANVTIKNNLVYVPGYDYRTFFAYVIGASTIASTTLSNNSTGSNTSAGGGGSNQMYFTNPNFTSLSPFTPANAKPVSGCSSGIGGCPIAGGVAVPVWSDFFLVAQPATRDMGAVIH

Physico‐chemical properties

protein length:	651 AA
molecular weight:	67689,50440 Da
isoelectric point:	5,61111
aromaticity:	0,09370
hydropathy:	0,04946

Domains

Domains [InterPro]

IPR035986
STR
11–138

IPR035986 IPR011050

IPR013783
STR
32–142

IPR013783 IPR006626 IPR006626 IPR006626 IPR006626 IPR006626

IPR022409
ENZ
32–138

IPR022409

CAB4195881.1

1 651

Architecture

STR

STR 11-142 | STR 175-606 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
IPR035986	STR	IPR035986	11	138	Merged direct domain	PKD domain superfamily	Central	Low	Positional only	4 proteins / 4 hits
IPR013783	STR	IPR013783	32	142	Merged direct domain	Immunoglobulin-like fold	Central	Low	Positional only	144 proteins / 144 hits
IPR022409	ENZ	DC_0012	32	138	InterPro cluster	PKD/Chitinase domain	C-terminal	High	Text match	11 proteins / 28 hits
IPR011050	STR	IPR011050	175	606	Merged direct domain	Pectin lyase fold/virulence factor	Central	Low	Positional only	572 proteins / 572 hits
IPR006626	Unmapped	-	239	266	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	269	290	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	443	472	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	497	527	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	536	563	InterPro	Parallel beta-helix repeat	-	-	-	-

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

CAB4195881.1

1 651

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	25	25	0,1175
Central domain	26	640	616	0,9606
C-terminal	641	651	10	0,2799

Note: Constraints were applied during segmentation.
Fixed 21 C-terminal predictions appearing before Central domain|C-terminal too short, adjusted boundary

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-25

Central
26-640

C-terminal
641-651

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	uncultured Caudovirales phage [NCBI]	2100421	Uroviricota > Caudoviricetes > Peduoviridae > Maltschvirus maltsch >
Host	No host information

Coding sequence (CDS)

Genbank protein accession

CAB4195881.1 [NCBI]

Genbank nucleotide accession

LR797237.1 [NCBI]

CDS location

range 31724 -> 33679
strand +

CDS

ATGAAAACTCTACTCTCATTATGGCTGCTGGTCGCGTCGCTCACTGCTTCTGCGGCTGTTCCGTTGCCGGTCGCCGTTAGCGGTAATGCTATCAATTTGTCAATGACTGCAAACCGTGTAACCGGCGTATCGCCTTTGGGTGTGGTGTTCGATGCGACCGCCACCACTGCATCAACTACGTCAAACCCGTTCCATGATATTGAATATCGGTGGAACTTTGGCGATACCAATGCAGGAACCTACACTGTCGGCGCACCGGGCCAGACCAACAAGAACATCGCTACCGGCGCGGTTGCTGGTCATGTGTTCGAGATTACTGAGGGCAGCGGCACTCAGACTTTCACGGTGACGCTGACTGCGTATGACGGCACAAACACTGTCACTCAAACCAAGACGATCACCGTAACAGACCCTGCGTCGGTCTACTCTGGCACCGCTACGGTATGCCTGGCGAACAGCACACCAACGGCGGGTGTGGGTAGCTGCCCTGCTGGTGCGGCCACCCCTGCGGGGGCATCCGTATTCGATACAGCGATGGCAAACTGCACGGCGAACAAGCGCTGCCTGTTCAAGAAGGGCGACACCTGGACGATGGCGACAGCTTATCTGCCGTTGACGGCTGCAAATGTCAGTATTGGTGCATACGGAACGGGTTCTAAGCCCTTGATAACAGCAAGTTCTGGCGTTGGGGGAGTGTTTACGATTTCAGATGGCGCGGATAACATGCGAATCGCAGACATTGAAGTGACTGGCGTGGTCACTCCCGGTGCGCTCAATAATGCGATTCTGGTCGTGGGGTATCCAGTGTCCAATTTACTCGTGCTGCGAACAACCTTCCACAACTCTGGTGGCGGTTTGGTGATCGTTTCCGGAGCGAGATTGGTCGGTGTCGTGATTGCTGATAGCGCGTGGTATGACTTCTATTCGAGCATCGGCTACTTCGGAGAAACTTACACAGCGGCGATCATCGGCAACACGATAGGGCCGATACCCGAAAGTGGCAATGCCGAGCATGGCGTCCGCATCCAGAATGGTCGCACAATCGCGGTAGCGAACAACACCTTTGAGCCAGCGAACACTGCAGCCGGAAAGCAGCAGCTAACCGTGCGCTCCCGCGATCACTCGGTAGGGCAGGCATATGACCCCTATACCGACACACGTTACATCCACGTTAGCGACAACAAGTTCAATGCTGGAGGCCAGGCCAAGGTGCAGTTCGCTCCGGCGTCGTACACTCAATGTGATTGGGGGCGCGATGTAGTATTCGAGCGGAACTGGACTACGTATAGCAATTACGCCAGCACAAGCGTCGGTCTAAGTGTTGAGTGGGAGTACGTAACGATTCGCAATAATATCTGGGATAGCAGTGCGTCGCTGAACACACTAAGCTCCCCGACAAGCATATCCATCGTAAACGGACAGGGCGTCGGAACCTACTGCACTGCCACCGTCGCGCCCAGTGACGTTATAGATAATCGCATACCAGCACCATCAAATATCTGGATATACAACAACACATTCTATTCCTCGGTTGCGCCTCCGTCACACGACAGAGATTACTTTGCCATATCAGTTAATAACGGTGACCCCTCCACAACTAGACCTGTGGCGAATGTGACGATCAAAAATAACCTAGTGTATGTGCCGGGATATGACTATCGCACATTTTTCGCCTATGTTATTGGTGCAAGCACAATCGCGTCTACAACGCTGTCTAACAACTCTACCGGCTCGAACACGTCGGCGGGCGGTGGCGGATCTAACCAGATGTATTTTACCAACCCGAACTTCACCAGCCTGTCGCCGTTCACTCCCGCCAATGCGAAGCCTGTTTCCGGATGCTCAAGCGGTATCGGTGGATGCCCGATTGCAGGAGGTGTAGCTGTGCCGGTGTGGTCGGACTTTTTTCTGGTGGCACAACCTGCGACGCGTGACATGGGCGCAGTAATTCACTGA

Genome Context

Tertiary structure

PDB ID

e553439f31aab487671c8c1f4ca5ed9612437d66ae2ee9b428e519b9f7c3c8f9

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,8064

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence