Protein

View in Explore

Genbank accession

WGL32592.1 [GenBank]

Protein name

structural protein

RBP type

TSP

Evidence RBPdetect

Probability 0,68

Protein sequence

MSNFKPFAAAVAKQWDRMSANELFRTDVGGDELAQLYLDSFPEGTNPIFRVRTEHDGSYDKNVIRRIGNVVSIKNGELTSVWDIQGLEFPYDVVAKALADRVKAAAVNSLFRINERKLGYVETKETLEDGTILTWNHFHVAIADRHYDRSVGETIGAFNTTIAVFKRGLDEITPVALETALDLIDSNSVYRGAEFRKGVAEFQKIKLAYDQMSEREKNTYLWNNASFPQARIRNSAVGTFLTDLSEGKMSIEAAVEAFGRKTDPTNYKRPTSIITKGMVDQAMKTIRELDLEPALERRHAKLSDVNVNDVIWTSGAARQVMKGGVAGLLEAEVTQRPSKDKPEDISAADFFSKVVPQASTMEVFVKNSMQKNLMSITAPVHEDVNPLFKWDNNFGWTYNGNITDAIKERVKAAGGRVDADIRVSLAWYNFDDLDLHALCPYGHVYFGNKMGGTNRNILDVDMNAGGGTTRTPVENLAFNNPKDGPYTIEVNQFSLREKSGEGFTLELEFDGEVHSFSFDAGVPNRSTIQAIRFHVKNGKVEKFEVLDSRLKHSGRSQEIWGLQTETFVPVTTVMNSPNHWGDNEAGNKHWFFLLEGCFNDAPARGIYNEFLRGDLTTHGKVFEVLGAKTMVAPTSEQLSGVGFSETQPQVVTVRVTGQKLSKTYNVQF

Physico‐chemical properties

protein length:	668 AA
molecular weight:	74598,02450 Da
isoelectric point:	5,80522
aromaticity:	0,09731
hydropathy:	-0,39716

Domains

Domains [InterPro]

IPR059268
STR
7–144

IPR059268 DC_1525

WGL32592.1

1 668

Architecture

STR

STR 7-668

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
IPR059268	STR	DC_0305	7	144	InterPro cluster	Domain of unknown function DUF8224	Central	Low	Positional only	5 proteins / 5 hits
DC_1525	STR	DC_1525	145	668	Novel HMM	DC_1525	Central	Low	Positional only	5 proteins / 5 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

WGL32592.1

1 668

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	10	10	0,0713
Central domain	11	405	396	0,8759
C-terminal	406	668	262	0,4279

Note: Constraints were applied during segmentation.
Sequence started with non-N-terminal domain|N-terminal too short, forced to 10 residues

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-10

Central
11-405

C-terminal
406-668

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Salmonella phage Arash [NCBI]	3038319	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Salmonella typhimurium [NCBI]	90371	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales

Coding sequence (CDS)

Genbank protein accession

WGL32592.1 [NCBI]

Genbank nucleotide accession

OQ632216 [NCBI]

CDS location

range 81161 -> 83167
strand -

CDS

ATGAGTAACTTCAAACCGTTTGCTGCAGCGGTAGCTAAACAATGGGACCGTATGTCCGCCAATGAGCTGTTCCGCACCGATGTCGGCGGCGATGAGCTGGCTCAGCTGTACCTGGATTCCTTCCCGGAAGGCACCAACCCGATCTTCCGCGTGCGTACTGAACACGACGGTTCCTACGATAAGAACGTCATCCGTCGCATCGGTAATGTCGTCTCCATCAAGAACGGCGAGCTGACCTCCGTCTGGGATATCCAAGGTCTGGAATTCCCGTATGACGTGGTCGCGAAGGCATTGGCTGATCGCGTGAAAGCTGCAGCGGTTAACTCCCTGTTCCGCATCAACGAACGCAAACTGGGTTACGTTGAGACTAAAGAAACGCTGGAAGACGGCACTATCCTGACCTGGAACCACTTCCACGTAGCGATTGCCGATCGTCACTATGATCGTTCCGTTGGTGAAACCATCGGTGCCTTCAACACGACTATCGCGGTCTTCAAGCGTGGCCTGGATGAGATCACTCCGGTGGCGCTGGAAACGGCACTCGACCTGATCGACTCTAACTCCGTGTACCGCGGCGCCGAGTTCCGTAAGGGCGTGGCTGAGTTCCAGAAGATCAAGCTGGCGTATGACCAGATGTCAGAGCGTGAGAAGAACACCTACCTGTGGAACAATGCGAGCTTCCCACAAGCCCGTATCCGTAACTCCGCAGTCGGTACCTTCCTGACAGATCTGTCCGAAGGTAAGATGAGCATCGAAGCGGCGGTTGAAGCGTTCGGTCGTAAGACTGATCCGACCAACTACAAGCGTCCGACCTCTATCATCACTAAAGGCATGGTCGATCAGGCGATGAAGACTATCCGTGAACTGGACCTCGAGCCGGCTCTGGAACGTCGTCACGCTAAGCTCTCCGATGTGAACGTCAACGACGTGATATGGACCAGCGGTGCCGCTCGTCAGGTCATGAAGGGTGGTGTAGCGGGTCTGCTGGAAGCCGAAGTTACTCAGCGTCCGAGCAAAGACAAGCCTGAGGATATCTCTGCTGCAGACTTCTTCAGCAAGGTCGTACCGCAGGCGTCTACTATGGAAGTCTTCGTGAAGAACTCCATGCAGAAAAACCTGATGAGCATCACTGCTCCGGTACATGAAGACGTGAACCCGCTGTTCAAGTGGGATAACAACTTCGGCTGGACCTACAACGGTAACATCACCGATGCGATCAAAGAGCGTGTGAAGGCGGCCGGCGGCCGGGTGGATGCGGACATCCGTGTCTCTCTGGCGTGGTACAACTTTGACGACCTCGATCTGCACGCGCTGTGCCCGTACGGTCACGTCTACTTCGGCAACAAGATGGGCGGCACCAACCGTAACATCCTCGACGTTGACATGAACGCCGGCGGCGGTACGACTCGTACTCCGGTTGAGAACTTAGCGTTCAATAACCCGAAAGACGGCCCGTACACCATTGAAGTTAACCAGTTCTCTCTGCGTGAGAAGAGCGGCGAAGGCTTCACCTTGGAGCTGGAATTCGACGGTGAAGTTCACTCCTTCTCCTTCGATGCTGGCGTGCCTAATCGCAGTACCATCCAGGCTATCCGCTTCCACGTGAAGAACGGTAAGGTCGAGAAGTTCGAAGTGCTGGACTCCCGTCTGAAGCACTCCGGTCGTTCTCAGGAAATCTGGGGTCTGCAGACCGAGACCTTCGTGCCGGTGACTACCGTGATGAACTCCCCGAACCACTGGGGTGACAACGAAGCGGGTAATAAGCACTGGTTCTTCCTGCTGGAAGGCTGCTTCAACGACGCGCCGGCTCGTGGCATCTATAACGAGTTCCTGCGTGGTGATCTGACTACCCATGGCAAAGTGTTCGAAGTTCTGGGCGCTAAGACCATGGTCGCTCCTACCTCTGAGCAGCTGTCCGGCGTAGGCTTCTCCGAAACCCAACCTCAGGTCGTGACCGTACGTGTTACTGGCCAGAAACTCAGCAAAACCTATAACGTTCAATTCTAA

Genome Context

Tertiary structure

PDB ID

7d83fb8566d7ea9b2619a8b15df7eaf6075aa1d8d6af76df03547a28fe1babe6

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,5432

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence