Protein

View in Explore

Genbank accession

YP_007112749.1 [GenBank]

Protein name

virion structural protein

RBP type

TSP

Evidence DepoScope

Probability 1,00

Protein sequence

MAFNYTPLTETQKLKDMYPKVNDIGNFLKTEVNLSDVKQISQPDFNNILASIPDSGNYYVTNSKGAPSGEATAGFVRLDKRNVNYYKIYYSPYSSNKMYIKTYANGTVYDWISFKLDEGNLYNEGNTLNVKELTESTTQYATLVNPPKENLNTGWVNYKESKNGVSSLVEFNPVNSTSTFKMIRKLPVQEQKPNLLKDSLFVYPETSYSNIKTDNWDTPPFWGYSSNSGRSGVRFRGENTVQIDDGSNTYPLVVSNRFKMGKELSVGDTVTVSVYAKINDPALLKDNLVYFELAGYDTVDDTSKNPYTGGRREITASEITTEWKKYSFTFTIPENTIGASGVKVNYVSLLLRMNCSSSKGNGAVVYYALPKLEKSPKVTPFITHENDVRKYDEIWSNWQEVISKDELKGHSPVDIEYNDYFKYQWWKSEVNEKSLKDLAMTVPQGYHTFYCQGSIAGTPKGRSIRGTIQVDYDKGDPYRANKFVKLLFTDTEGIPYTLYYGGYNQGWKLLKQSETSTLLWEGTLDFGSTEAVNLNDSLDNYDLIEVTYWTRSAGHFSTKRLDIKNTSNLLYIRDFNISNDSTGSSVDFFEGYCTFPTRASVQPGMVKSITLDGSTNTTKVASWNEKERIKVYNIMGINRG

Physico‐chemical properties

protein length:	640 AA
molecular weight:	72581,20130 Da
isoelectric point:	6,25254
aromaticity:	0,12813
hydropathy:	-0,59359

Domains

Domains [InterPro]

DC_0568
STR
5–409

DC_0568

cd19958
STR
44–111

cd19958 G3DSA:2.60.120.260 DC_0448

IPR003305
CBM
237–337

IPR003305

YP_007112749.1

1 640

Architecture

STR

STR 5-639 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0568	STR	DC_0568	5	409	Novel HMM	DC_0568	Central	Low	Positional only	135 proteins / 135 hits
cd19958	STR	DC_0464	44	111	InterPro cluster	cd19958	Central	Low	Positional only	1183 proteins / 1674 hits
G3DSA:2.60.120.260	STR	G3DSA:2.60.120.260	191	366	Merged direct domain	G3DSA:2.60.120.260	Central	Low	Positional only	264 proteins / 264 hits
IPR003305	CBM	DC_0700	237	337	InterPro cluster	Carbohydrate-binding, CenC-like	C-terminal	High	Text match	15 proteins / 15 hits
DC_0448	STR	DC_0448	385	639	Novel HMM	DC_0448	Central	Low	Positional only	142 proteins / 142 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

YP_007112749.1

1 640

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	293	293	0,6162
Central domain	294	505	213	0,2235
C-terminal	506	640	134	0,9575

Note: Constraints were applied during segmentation.
Fixed 106 C-terminal predictions appearing before Central domain

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-293

Central
294-505

C-terminal
506-640

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Staphylococcus phage JD007 [NCBI]	1239383	Uroviricota > Caudoviricetes > Herelleviridae > Kayvirus > Kayvirus JD7
Host	Staphylococcus aureus [NCBI]	1280	cellular organisms > Bacteria > Bacillati > Bacillota > Bacilli > Bacillales

Coding sequence (CDS)

Genbank protein accession

YP_007112749.1 [NCBI]

Genbank nucleotide accession

NC_019726 [NCBI]

CDS location

range 4209 -> 6131
strand -

CDS

ATGGCATTTAACTACACGCCTCTTACTGAAACACAGAAGTTAAAAGATATGTATCCTAAAGTTAATGATATAGGTAACTTTTTAAAAACAGAAGTTAACCTTAGTGATGTAAAACAAATATCACAACCCGACTTTAATAATATTTTAGCATCTATACCTGATAGTGGTAACTACTATGTAACTAATTCAAAAGGTGCTCCTAGTGGAGAAGCTACGGCAGGATTTGTAAGATTGGATAAACGAAATGTAAATTATTATAAAATTTACTATTCACCATATAGTAGTAATAAAATGTATATCAAGACTTATGCTAATGGTACTGTATATGATTGGATTAGTTTTAAATTAGATGAAGGTAACTTATACAATGAAGGTAATACTTTAAATGTAAAGGAACTTACTGAATCTACAACTCAATATGCAACACTAGTTAATCCTCCAAAAGAGAACTTAAATACAGGTTGGGTTAATTACAAAGAAAGTAAAAATGGTGTTTCTTCTTTAGTAGAATTTAACCCGGTTAACTCCACTTCAACTTTTAAGATGATAAGAAAGTTACCAGTACAAGAACAAAAGCCTAACTTATTGAAAGATAGTTTATTTGTTTATCCTGAAACTAGCTATTCTAATATTAAAACAGATAACTGGGATACGCCTCCATTTTGGGGATATTCTTCTAATAGTGGTCGTTCAGGAGTTAGATTTAGAGGAGAGAATACAGTACAGATAGATGATGGGTCTAATACGTACCCTTTAGTAGTTTCTAATAGGTTTAAAATGGGTAAAGAACTTTCTGTAGGTGATACTGTAACGGTATCAGTATATGCTAAAATTAATGACCCTGCTTTACTTAAAGATAACTTAGTTTACTTTGAATTAGCAGGATACGATACTGTAGATGATACTAGTAAAAATCCTTATACAGGAGGACGTAGAGAAATAACAGCAAGTGAGATAACAACTGAGTGGAAAAAATACTCTTTCACATTTACGATACCTGAAAATACAATCGGAGCATCAGGCGTTAAAGTTAATTACGTATCTTTACTACTAAGAATGAATTGTTCATCTAGTAAAGGTAATGGTGCTGTAGTATACTATGCCTTACCTAAATTAGAAAAATCACCTAAAGTTACACCATTTATTACACATGAAAATGATGTTCGTAAATATGATGAGATTTGGTCTAATTGGCAAGAAGTTATTAGTAAAGATGAATTAAAAGGTCACTCTCCTGTAGATATTGAATATAATGATTATTTTAAATATCAGTGGTGGAAATCTGAAGTTAATGAAAAGAGTTTAAAAGATTTAGCTATGACAGTACCTCAAGGATATCATACATTTTATTGTCAAGGCTCTATTGCCGGGACGCCTAAGGGACGTTCTATTAGAGGAACCATTCAGGTAGATTATGACAAAGGTGACCCCTACAGAGCTAATAAGTTTGTTAAATTATTGTTTACTGACACAGAAGGTATACCTTATACATTATACTACGGAGGGTATAATCAAGGTTGGAAACTCTTAAAGCAATCAGAAACTTCTACTTTACTATGGGAAGGTACTTTAGATTTTGGGTCTACGGAAGCTGTTAACTTAAATGACTCATTAGATAATTATGATTTAATTGAGGTAACTTATTGGACTCGTTCAGCAGGACATTTTTCTACAAAAAGATTAGATATAAAAAATACATCAAATTTACTGTATATTAGAGACTTTAATATTTCAAATGATAGTACAGGTTCTAGTGTAGACTTTTTTGAAGGGTATTGCACTTTCCCTACTAGAGCATCAGTACAACCTGGTATGGTAAAATCTATAACTTTAGACGGGTCTACAAATACAACAAAAGTAGCATCATGGAATGAAAAGGAACGTATAAAGGTATACAATATTATGGGAATTAATAGAGGATAA

Genome Context

Tertiary structure

PDB ID

10c9a7f906e8f3c98bf40ce7130ab5d7467da667465b5b07f552ec6647f06fcf

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,7019

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence