Protein

View in Explore

Genbank accession

XRM23127.1 [GenBank]

Protein name

receptor binding tail protein

RBP type

TSP

Evidence DepoScope

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,87

Protein sequence

MGFFAGKYSDGKTVLSLNTESGGDINRHYSPNANSIFHSDMPFVLVDGTYEAALGNAGNGFFVCQMPSDIINIKSNDPGRVILTAIEINGTHRAFLNGTQSQVGQFTAFFEDPPIGRAGAEVGLTSAFASGNSLAHGTYIYNSGLGHEESIARQGTGGTISQASGFNLYRPGGAYAGEAIGRAWTLAGFPAGASTVPIDGGNADYWHPNWQAPIGAAYRGHNWFYVCNSNIRGYVGKKGTVPANVNLLYQSPTYPDKVYICKGSTSNLAAQAAKKVYVQDWYNITPTKVIWYVLNLRYSNGNMGVSGNPFTGSDILITPSNFTIKGVSLPNTGYKFINQNAFGNLGYRPDMEYVGNNAAYTGVFGDTTARCEIVGSSNGSLWSPVDYGGAKSQISIYKFGAGKQWYVNSNNNTIGNEHGAVWSPSTVPLRLFPNNVASTYVGDDITPAYPGAGNYYTALATIGLGLPNANATVILTTEVIMGNINTAGGAIRTYGGAAWQVQGRRQHSYTEGDGIFHQILTLPPGYLVPYHSTTAYSYTQTWASRPDELTFRRNGYIYTIKNLGNGNAELGVVIHADEAAAIFLPRLRVTVQRLT

Physico‐chemical properties

protein length:	595 AA
molecular weight:	63821,35290 Da
isoelectric point:	8,12123
aromaticity:	0,12101
hydropathy:	-0,20168

Domains

Domains [InterPro]

IPR059609
RBD
1–595

IPR059609

XRM23127.1

1 595

Architecture

RBD

RBD 1-595

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
IPR059609	RBD	DC_0630	1	595	InterPro cluster	Receptor-binding protein pb5	Central	Medium	Text match	299 proteins / 301 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

XRM23127.1

1 595

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	10	10	0,1284
Central domain	11	209	200	0,6433
C-terminal	210	595	385	0,8533

Note: Constraints were applied during segmentation.
Fixed 4 C-terminal predictions appearing before Central domain

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-10

Central
11-209

C-terminal
210-595

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Salmonella phage SaI_NFG_5581 [NCBI]	3378340	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Salmonella enterica subsp. enterica serovar Infantis [NCBI]	595	Pseudomonadota > Gammaproteobacteria > Enterobacterales > Enterobacteriaceae > Salmonella > Salmonella enterica

Coding sequence (CDS)

Genbank protein accession

XRM23127.1 [NCBI]

Genbank nucleotide accession

PQ488695 [NCBI]

CDS location

range 99877 -> 101664
strand -

CDS

ATGGGTTTTTTCGCTGGAAAATATAGCGATGGTAAGACCGTACTATCTTTAAATACTGAATCTGGTGGTGACATTAATCGTCACTATAGTCCAAATGCTAATAGTATTTTTCATAGTGATATGCCATTTGTCCTAGTTGATGGTACTTACGAGGCTGCATTAGGCAATGCTGGAAATGGGTTTTTTGTATGTCAGATGCCTTCTGACATAATAAATATTAAATCCAACGACCCAGGTAGAGTTATACTAACTGCCATTGAGATTAATGGTACTCATAGGGCTTTTCTTAATGGTACTCAATCTCAGGTTGGTCAATTCACTGCATTTTTTGAAGACCCACCTATTGGTAGGGCGGGTGCCGAAGTAGGTCTTACGTCAGCTTTTGCATCAGGTAACAGCTTAGCACATGGCACCTATATCTATAACTCTGGTTTAGGCCATGAAGAGTCAATTGCTAGACAGGGTACAGGTGGTACCATATCTCAAGCTTCTGGGTTTAATTTATATAGGCCGGGAGGAGCATATGCTGGTGAGGCTATAGGTAGGGCATGGACTTTAGCAGGATTTCCAGCAGGAGCGTCTACAGTACCTATAGACGGTGGTAATGCTGACTACTGGCATCCTAACTGGCAAGCTCCTATAGGGGCCGCCTATAGAGGACATAATTGGTTTTACGTTTGTAACTCTAATATACGAGGTTACGTAGGTAAAAAGGGCACAGTACCCGCTAATGTTAACTTATTGTATCAATCTCCTACTTACCCTGATAAGGTTTATATATGTAAAGGTTCAACATCTAATCTAGCAGCACAGGCCGCTAAGAAAGTGTATGTGCAGGATTGGTATAACATAACTCCTACTAAGGTTATTTGGTATGTACTTAATTTGAGATATTCTAATGGTAATATGGGTGTATCTGGTAATCCATTTACTGGGTCAGATATACTTATAACTCCATCTAATTTTACTATAAAGGGGGTTAGTTTACCAAATACTGGATATAAGTTTATCAACCAAAATGCTTTTGGTAACTTAGGCTATAGGCCCGATATGGAATACGTCGGAAATAACGCAGCGTACACTGGAGTCTTCGGGGATACTACTGCTCGCTGTGAAATTGTAGGATCTAGTAATGGATCTTTATGGTCTCCTGTAGATTATGGAGGGGCTAAGTCTCAGATTAGTATTTACAAGTTCGGAGCTGGTAAGCAATGGTACGTAAACTCAAATAATAACACTATCGGTAATGAGCATGGAGCTGTGTGGAGTCCTAGTACTGTACCTTTAAGGCTATTTCCTAATAATGTTGCCAGTACCTACGTTGGTGATGATATAACCCCCGCATATCCTGGAGCAGGCAACTATTATACGGCTCTAGCTACTATAGGACTAGGATTACCTAATGCTAACGCAACAGTAATATTAACTACTGAAGTTATTATGGGTAATATTAATACGGCTGGAGGAGCCATACGCACATACGGTGGTGCTGCTTGGCAAGTACAAGGAAGAAGACAGCATAGTTACACGGAAGGTGATGGAATATTCCATCAAATATTAACCTTACCTCCTGGATACTTAGTTCCTTATCACTCCACTACTGCATACAGTTATACTCAAACTTGGGCAAGTAGACCTGATGAGTTAACATTTAGAAGAAACGGATATATTTATACTATTAAAAATCTAGGAAATGGTAATGCTGAGTTGGGCGTAGTTATTCATGCTGATGAGGCTGCAGCTATCTTCCTACCGAGATTAAGAGTAACAGTTCAACGCCTTACCTAA

Genome Context

Tertiary structure

PDB ID

c1c429f00ab7f6c8b1bab0f2f591482e2a5921dbdeb03abac274ec1dcad74543

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,2401

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence