Protein

View in Explore

Genbank accession

QSJ04769.1 [GenBank]

Protein name

hypothetical protein

RBP type

TSP

Evidence DepoScope

Probability 1,00

Protein sequence

MPVEPIRLGPFIGGLNTFSDPTSIADNEVAELVNLELDLDGSLRSRPPIVQLTGELPGAAGNGIDILGYYEANGGAKYLVASNRNNATYFWNGLTWTLITNTFAATAMAQARDKAWLVAPPGSANPGGSWDPAAGFTPEANMPKGGCAIAHKDRVWIGPGKTATANGARLYTSTITSSTITWPATPVYLNIGAGDGENIIDLVVYYDSIIVFKEGSTWSFTFSGDPSTGETRKQSDNIGVNAKGCVATFQNQIYVVFDNKVYEFSNYNFNELNKKVPLKSESPDATLPEYVSASYWSDRLFIQFYEKTYVYSLKVGTWSVWESDLIDNMGRLWPIPNQQGERPVAYTYRTGKTGFLGLYRIVDAVGAESEPMVCRVKTKNYDYGSPGNFKALKNWGVNVISKVGLDAAAEPIAWANSTVTWDRLKKGPGGDGGTAYNIDKLKNLVPNPSFESPGVNAQSPTSWAAMPGTGSTVIADSSFTAQMQGSVGAFLMRSTSSGTNVLNGARSDLIPATPGKWRLIRAWVASDTTDVDNVLVTTQYYNAALASLINIGGVVSPPAFYAGQYVYHLYQNPPDAAFMRASIYQRSAVNIPAGKRLWADQVVVAEYDTQAEAQAALDMLTARGYFDASTGTPDAPVVALTDGTLERYKPYNEPNGFTWGKLNADGATWDRLIDPAVIVNDIVETAGSGAGGRKFIKLMQALRFRQINFQISARTNGDIQTAPFHLFDILTRVADKQYVPKRVN

Physico‐chemical properties

protein length:	744 AA
molecular weight:	80675,66580 Da
isoelectric point:	5,48192
aromaticity:	0,11022
hydropathy:	-0,21438

Domains

Domains [InterPro]

DC_0191
STR
15–566

DC_0191

G3DSA:2.60.120.260
STR
441–615

G3DSA:2.60.120.260

QSJ04769.1

1 744

Architecture

STR

STR 15-615 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0191	STR	DC_0191	15	566	Novel HMM	DC_0191	Central	Low	Positional only	113 proteins / 113 hits
G3DSA:2.60.120.260	STR	G3DSA:2.60.120.260	441	615	Merged direct domain	G3DSA:2.60.120.260	Central	Low	Positional only	264 proteins / 264 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

QSJ04769.1

1 744

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	364	364	0,7132
Central domain	365	563	200	0,2918
C-terminal	564	744	180	0,6091

Note: Constraints were applied during segmentation.
Fixed 118 C-terminal predictions appearing before Central domain

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-364

Central
365-563

C-terminal
564-744

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Cellulosimicrobium phage DS1 [NCBI]	2812903	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Cellulosimicrobium sp. [NCBI]	1871614	cellular organisms > Bacteria > Bacillati > Actinomycetota > Actinomycetes > Micrococcales

Coding sequence (CDS)

Genbank protein accession

QSJ04769.1 [NCBI]

Genbank nucleotide accession

MW590223 [NCBI]

CDS location

range 2058 -> 4292
strand +

CDS

ATGCCGGTTGAGCCGATTCGCCTTGGCCCCTTCATCGGGGGCCTTAATACGTTCAGCGACCCCACTTCCATTGCGGATAATGAGGTCGCTGAATTGGTGAACCTGGAACTGGACCTTGACGGGTCTTTGCGCTCCCGTCCGCCTATCGTCCAGTTGACGGGTGAGTTGCCCGGTGCCGCTGGTAACGGTATTGATATCCTCGGATATTATGAGGCTAACGGGGGCGCAAAGTACCTTGTCGCGTCCAACCGGAATAACGCCACGTACTTCTGGAACGGTCTTACGTGGACTCTTATCACGAACACCTTTGCTGCTACGGCTATGGCTCAGGCGCGCGATAAGGCATGGCTTGTTGCGCCTCCTGGCTCGGCTAACCCTGGCGGGTCTTGGGACCCTGCTGCGGGCTTTACGCCTGAGGCTAATATGCCCAAGGGCGGCTGCGCTATCGCGCACAAGGACCGTGTGTGGATCGGACCGGGTAAGACTGCGACCGCTAACGGCGCACGTCTGTACACCTCTACGATTACGAGCAGTACGATTACGTGGCCTGCTACTCCGGTGTACCTGAACATCGGCGCAGGTGACGGTGAGAACATTATTGACCTCGTGGTCTACTACGACAGCATTATCGTGTTCAAGGAAGGGTCTACCTGGTCGTTTACGTTCTCGGGTGACCCCTCCACTGGCGAGACGCGTAAGCAGTCCGACAACATCGGCGTTAACGCCAAGGGCTGTGTCGCCACTTTCCAGAACCAGATTTATGTCGTCTTTGACAACAAGGTCTACGAGTTCTCGAACTACAACTTCAACGAACTGAACAAGAAGGTTCCCCTTAAGTCGGAGAGCCCTGACGCCACGCTGCCTGAATACGTCAGCGCGTCGTACTGGTCTGACCGACTCTTCATCCAGTTCTACGAAAAGACCTACGTCTACTCGTTGAAGGTCGGCACCTGGTCTGTGTGGGAATCTGATCTGATCGATAACATGGGTCGGCTCTGGCCCATTCCTAACCAGCAGGGTGAGCGCCCTGTCGCTTATACGTACCGTACAGGTAAGACCGGCTTCCTCGGGCTCTATCGTATTGTCGACGCTGTCGGCGCTGAGTCTGAGCCTATGGTTTGTCGTGTCAAGACGAAGAACTATGACTACGGCTCTCCGGGTAACTTCAAGGCTCTTAAGAATTGGGGCGTTAACGTTATTTCGAAGGTCGGTCTTGACGCAGCGGCTGAACCTATTGCTTGGGCTAACTCTACCGTTACGTGGGACCGCTTGAAGAAGGGGCCTGGCGGTGACGGGGGCACGGCGTACAACATTGACAAGTTGAAGAATCTTGTCCCTAACCCGTCATTTGAGTCTCCGGGCGTTAACGCGCAGTCCCCTACTTCTTGGGCTGCTATGCCTGGAACTGGCTCTACTGTTATTGCTGATTCCAGCTTTACGGCTCAGATGCAGGGGAGTGTCGGCGCTTTTCTCATGCGTTCGACCTCTAGCGGGACTAACGTTCTGAATGGCGCACGTTCCGATTTGATTCCGGCTACGCCTGGAAAGTGGAGACTTATTCGGGCCTGGGTTGCTTCTGATACTACTGACGTGGACAACGTACTGGTGACCACTCAGTATTACAACGCTGCCTTGGCTAGTCTTATCAATATCGGCGGTGTCGTTTCTCCGCCCGCGTTCTACGCAGGTCAGTACGTTTACCATCTGTACCAGAATCCGCCGGATGCTGCCTTTATGCGGGCAAGTATTTACCAGCGTTCTGCTGTAAATATTCCTGCTGGTAAGCGTCTGTGGGCAGATCAGGTAGTGGTGGCAGAGTACGACACGCAGGCAGAGGCTCAGGCAGCGCTGGATATGCTTACAGCCAGGGGCTACTTTGATGCTTCTACAGGTACGCCTGATGCTCCTGTCGTTGCTCTGACTGACGGTACTCTTGAGCGCTATAAGCCTTATAACGAGCCCAACGGATTCACGTGGGGCAAGTTGAATGCTGATGGTGCCACTTGGGATCGACTTATTGATCCGGCGGTTATCGTTAACGATATCGTCGAGACGGCTGGTTCTGGGGCCGGTGGTCGAAAGTTCATTAAGTTGATGCAGGCTCTCCGGTTCCGTCAGATCAACTTCCAGATTTCCGCACGGACTAACGGAGATATCCAGACTGCTCCGTTCCACCTCTTCGATATCCTGACAAGAGTTGCGGACAAGCAGTACGTCCCGAAGCGCGTTAACTAG

Genome Context

Tertiary structure

PDB ID

922eb1b48a1593ffd742ffa216a8e2962653e34971f0f406882660c8a8dc55c2

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,7241

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence