Protein

View in Explore

Genbank accession

WYA83412.1 [GenBank]

Protein name

hypothetical protein

RBP type

TSP

Evidence DepoScope

Probability 1,00

Protein sequence

MAFYAKGGTNAFLHITKGTDARGGINDGTIFHSSMPHVFIEKSWEANFRPVKTDFSKAYWNYAIWYYGNQPGEGFNKPNSTFKDAWNSGRVASIPKDLQNELANKSNVIVIELVYELGGIEYSFLVNGLSIGNTSWLSPNRDQSSGYHNYAVSANSTNVNCIAGGIGITYGSFVNTNTNDDIFGMARLDSFGTSNINIVTQVRDSYLTGSDKWYHRDIINAWSTVMLYSNKWDPEITYHKTDLGKLVPTPISPYGHAHDTAFSTPVAPDMGYCRVMGPNHRIWRFMDAYSTPPMYDDYDNGGPSITIESGTPQNNWGFGTGRTVRGSLFDAGVDEKTSEKGAYVRYLIYKGTPKKVRWYKLNLSFSIDRGYNIRTNAFNTTNSKGVRIGSGKMEVNGVSFLGGSNKRFIFQTNPSGAATRQVQSLIFSNHSYTDAGRASTEKGYMLKQSGVSQSYKIADLGGTSSPSGNSVLSICDLSKGTGWGCNSTSIFNSNGELWGPNNIPLTIRENATVTKRFGGSKGPLDMKDKTAAISHGTLALGLSKSRDTTVIFNITSSDPVILFTSPGYYSLGMSESVDQHIQLVNDKGLSVSSPHGIVTLPIGKSVPIVANNGLSTNLFENYDRGSGRERLFSDCHHDSVVWLKNLGNGNVEIVSTHTQRRGRFADWGNLPVYAVPEFTLHVTKLS

Physico‐chemical properties

protein length:	686 AA
molecular weight:	75222,08830 Da
isoelectric point:	8,89556
aromaticity:	0,11079
hydropathy:	-0,39475

Domains

Domains [InterPro]

IPR059609
RBD
1–686

IPR059609

WYA83412.1

1 686

Architecture

RBD

RBD 1-686

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
IPR059609	RBD	DC_0630	1	686	InterPro cluster	Receptor-binding protein pb5	Central	Medium	Text match	299 proteins / 301 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

WYA83412.1

1 686

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	10	10	0,0014
Central domain	11	209	200	0,0308
C-terminal	210	686	476	0,9588

Note: Constraints were applied during segmentation.
Sequence started with non-N-terminal domain

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-10

Central
11-209

C-terminal
210-686

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Proteus phage vB_PMC-PL1 [NCBI]	3134911	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Proteus mirabilis [NCBI]	584	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales

Coding sequence (CDS)

Genbank protein accession

WYA83412.1 [NCBI]

Genbank nucleotide accession

PP502408 [NCBI]

CDS location

range 20249 -> 22309
strand -

CDS

ATGGCATTTTATGCAAAGGGAGGAACTAATGCGTTTCTCCACATAACTAAAGGTACAGATGCTAGAGGCGGAATTAATGATGGTACTATATTCCATTCTAGTATGCCCCATGTGTTCATTGAGAAAAGCTGGGAGGCTAATTTTAGGCCTGTGAAAACTGATTTCTCTAAGGCTTATTGGAACTATGCTATTTGGTATTATGGTAATCAGCCTGGTGAGGGATTTAATAAGCCAAACTCCACATTTAAGGATGCCTGGAACTCTGGTAGAGTAGCTAGTATACCAAAAGATTTACAGAATGAATTAGCTAATAAGTCCAATGTCATAGTAATAGAATTGGTGTATGAGCTAGGGGGTATAGAATATTCTTTCCTAGTGAATGGATTATCAATTGGAAATACCAGCTGGCTATCTCCCAATAGAGACCAGTCATCTGGTTACCATAATTACGCAGTATCTGCTAATTCTACTAACGTTAACTGCATTGCAGGTGGTATTGGTATAACCTACGGTAGTTTTGTAAACACCAATACTAATGATGATATCTTTGGTATGGCACGACTAGATTCGTTTGGTACTAGTAATATAAACATAGTTACCCAAGTTCGGGATTCCTACCTTACAGGCTCGGATAAGTGGTATCATAGGGATATTATAAATGCCTGGTCTACTGTTATGCTATACTCTAATAAGTGGGATCCTGAGATAACTTACCATAAGACGGATTTAGGTAAATTAGTCCCTACTCCAATCAGTCCTTACGGGCATGCTCATGATACTGCTTTCTCTACGCCAGTAGCTCCAGATATGGGGTACTGTAGAGTAATGGGGCCTAATCATAGGATATGGAGATTTATGGACGCGTACTCAACTCCCCCTATGTATGATGATTATGATAATGGTGGTCCGTCTATAACTATAGAAAGTGGTACTCCGCAAAATAATTGGGGGTTTGGTACAGGAAGGACAGTAAGAGGAAGTCTATTTGATGCTGGAGTAGATGAAAAGACATCAGAAAAGGGGGCTTATGTTAGATATTTAATATATAAAGGTACTCCCAAGAAGGTTCGGTGGTATAAGTTAAATTTATCCTTTTCTATAGACAGAGGATATAATATACGTACTAATGCGTTTAATACTACTAACTCTAAGGGTGTGCGAATAGGATCAGGAAAGATGGAAGTTAATGGAGTATCTTTTCTGGGTGGCAGCAATAAGAGATTTATATTTCAGACCAACCCGTCAGGTGCCGCCACTAGGCAGGTACAAAGTCTAATATTCTCAAACCATAGCTATACTGACGCAGGTAGGGCTAGTACAGAAAAAGGGTATATGCTTAAGCAATCGGGAGTATCCCAAAGCTATAAGATAGCAGATCTAGGGGGTACTAGTAGTCCAAGTGGTAATTCTGTACTATCTATATGTGACCTATCTAAAGGTACAGGATGGGGGTGTAATAGTACTTCTATATTTAATAGTAATGGTGAGTTATGGGGCCCTAATAACATTCCTCTTACTATACGTGAAAATGCAACAGTAACCAAAAGATTCGGAGGATCTAAAGGTCCTCTAGATATGAAAGATAAGACCGCTGCTATATCTCACGGTACGTTGGCTCTTGGACTAAGTAAGTCTAGAGATACTACTGTGATATTTAATATAACGTCTTCTGATCCTGTTATCTTGTTTACATCACCGGGGTACTATAGTTTAGGGATGTCAGAGAGTGTGGATCAACATATACAGTTAGTTAATGATAAAGGGCTATCAGTAAGCTCACCGCATGGGATAGTTACACTTCCTATAGGAAAATCTGTACCTATAGTAGCTAATAATGGGCTATCTACCAACCTATTTGAGAACTATGATAGGGGATCGGGCAGAGAACGCTTATTTTCTGATTGTCACCATGACTCAGTAGTATGGTTGAAGAACCTAGGTAATGGTAATGTAGAAATAGTATCTACTCATACTCAACGTAGGGGTAGATTTGCTGACTGGGGAAACTTGCCCGTATATGCTGTTCCTGAGTTTACATTACATGTAACTAAACTATCGTAA

Genome Context

Tertiary structure

PDB ID

684bff3cd954833af344805a50d41a4f0f548bb054b52e0f9da6abcc1a5554eb

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,2319

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence