Protein

View in Explore

Genbank accession

XPQ57331.1 [GenBank]

Protein name

hypothetical protein

RBP type

TSP

Evidence RBPdetect

Probability 0,81

Protein sequence

MAIPSFLNFLEESKQLDEAFNSAPYELTMGKKNAGDVFFTFIDEDEKEYRIQFYTPQGLGKNVRQVFIGQKRGSVYPDAIARFKNPMRVIASMIEATKQFLATPLGKTIDGYAVNFSKKALDRGMTLIPKIIRQSGLKQKLNVMDLTYAPVPDRGYVWLVRKGKDPAQVFDGPKMQGITWDDPDKVGDAPVQNSVDDVVGGTGQTIVVGVDFRSEMEDLDISVSGNDIAVMDGRKLVVSFTDPETARIISGMKTPSAAITNFMQKTNPGRYTGNIKVNSTSTRSGKKYEFIASDSSGKQLFNLNVEDSRKTNLGTGDGSSSSVDDSNGWKLTSNGDQPMLIWVGKERGRMVTANIAPHYDVPGMYVGAYMNEKSVRGQSADFIASQLKLPQVPIGVLNDFTKMASKFWSTQAGEVVNSKTLNIPKNALVFGETINGMSISWSGIDFPKSGKYADAIMTTNIIFDYINIKAKFTPMVNQKGRTLNKPISYEIRLKKDIVQSMIDEISSKMEYLSRNLQQLNSQAYNPNQVFLNDITITDKGEVIWNDYNLSDGKVTQIMLSMISAENRRLEKVTNKPDITLPKKQAEVVEFINRMIDIDLGPYLREPKKLDVVLFDSSELSINQLNNIERLGRETGKWSLQPNGGMGHALFLNVW

Physico‐chemical properties

protein length:	654 AA
molecular weight:	72853,31810 Da
isoelectric point:	8,64722
aromaticity:	0,08563
hydropathy:	-0,36911

Domains

Domains [InterPro]

DC_0099
STR
1–305

DC_0099 DC_0099 Coil

DC_0099
STR
409–619

DC_0099

XPQ57331.1

1 654

Architecture

STR

STR 1-619 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0099	STR	DC_0099	1	305	Novel HMM	DC_0099	Central	Low	Positional only	76 proteins / 76 hits
DC_0099	STR	DC_0099	305	415	Novel HMM	DC_0099	Central	Low	Positional only	76 proteins / 76 hits
DC_0099	STR	DC_0099	409	619	Novel HMM	DC_0099	Central	Low	Positional only	76 proteins / 76 hits
Coil	Unmapped	-	502	522	Coils	Coil	-	-	-	-

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

XPQ57331.1

1 654

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	217	217	0,8740
Central domain	218	643	427	0,3189
C-terminal	644	654	10	0,0930

Note: Constraints were applied during segmentation.
C-terminal too short, adjusted boundary

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-217

Central
218-643

C-terminal
644-654

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Yersinia phage CAU_YEP3 [NCBI]	3398731	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Yersinia enterocolitica [NCBI]	630	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales

Coding sequence (CDS)

Genbank protein accession

XPQ57331.1 [NCBI]

Genbank nucleotide accession

PQ863687 [NCBI]

CDS location

range 3790 -> 5754
strand -

CDS

ATGGCCATCCCATCTTTCTTAAATTTCCTCGAAGAGTCTAAACAATTAGACGAAGCGTTCAACTCCGCTCCGTATGAGCTGACCATGGGCAAGAAGAACGCAGGCGATGTGTTCTTCACCTTCATCGACGAAGATGAAAAAGAATACCGCATCCAGTTCTATACCCCACAGGGGTTGGGCAAGAATGTCCGCCAGGTCTTCATCGGCCAGAAGCGCGGCTCTGTCTACCCTGATGCCATCGCTCGTTTCAAGAACCCGATGCGCGTTATCGCCTCCATGATCGAAGCGACCAAGCAGTTTCTGGCGACCCCTCTGGGTAAGACCATCGACGGTTATGCTGTCAACTTCTCTAAGAAGGCGCTGGATCGCGGGATGACCCTGATTCCTAAGATCATCCGTCAGTCTGGCCTGAAACAGAAACTGAACGTCATGGACCTGACCTACGCGCCTGTCCCTGACCGTGGTTATGTGTGGCTGGTCCGTAAGGGTAAAGATCCTGCTCAGGTATTCGACGGTCCGAAGATGCAGGGGATCACCTGGGATGATCCAGACAAGGTCGGTGACGCCCCGGTTCAGAACAGCGTTGATGACGTTGTGGGTGGAACTGGTCAAACCATTGTTGTTGGTGTTGATTTCCGTTCTGAAATGGAAGACTTGGATATTTCGGTTTCTGGAAATGATATCGCAGTGATGGATGGGCGTAAACTCGTAGTGTCTTTCACTGATCCCGAGACAGCTAGAATCATTTCTGGGATGAAAACCCCTTCTGCTGCAATTACCAATTTCATGCAAAAAACGAATCCAGGAAGATACACTGGAAACATCAAAGTTAACAGCACGAGTACCCGCAGTGGCAAGAAATATGAATTTATTGCTTCCGACTCATCTGGGAAACAATTGTTCAATCTAAACGTAGAAGATTCCAGAAAAACAAACTTGGGAACCGGGGATGGTTCTTCATCTTCTGTTGATGATTCCAACGGATGGAAATTAACTTCAAACGGGGATCAGCCCATGTTGATATGGGTTGGTAAGGAGAGAGGCCGCATGGTCACGGCAAATATCGCTCCCCACTACGATGTGCCAGGCATGTATGTTGGTGCATACATGAATGAAAAATCTGTACGTGGACAAAGCGCCGATTTTATTGCTAGTCAATTGAAATTACCGCAAGTCCCTATCGGTGTCCTGAATGATTTCACGAAAATGGCAAGCAAATTCTGGAGTACCCAAGCCGGGGAAGTCGTAAACTCCAAAACCTTAAATATCCCAAAAAATGCTTTAGTCTTTGGTGAGACTATCAACGGTATGTCCATCAGTTGGAGTGGAATCGATTTCCCTAAAAGTGGGAAGTACGCTGATGCTATAATGACCACGAACATCATATTTGATTACATTAACATCAAGGCAAAGTTTACCCCTATGGTTAATCAAAAAGGGCGAACTTTAAACAAACCAATAAGTTATGAAATCCGTTTGAAGAAAGATATTGTTCAATCCATGATCGATGAAATCTCATCAAAAATGGAATATCTTTCCAGAAACCTCCAACAGTTGAATAGTCAGGCATACAACCCAAACCAGGTTTTCTTGAATGATATAACCATCACGGATAAAGGTGAAGTGATTTGGAACGATTACAACTTGTCTGACGGCAAAGTTACACAAATTATGCTGTCCATGATAAGCGCAGAAAATAGACGCTTGGAGAAAGTGACAAACAAGCCGGATATCACATTACCAAAGAAACAAGCCGAAGTAGTAGAATTTATAAACCGGATGATTGATATTGATCTCGGACCTTATTTGAGAGAACCCAAAAAACTTGATGTGGTATTATTTGACTCTTCTGAATTGTCGATAAACCAACTCAACAACATAGAACGCCTGGGAAGAGAAACAGGAAAATGGTCCCTTCAGCCAAACGGTGGTATGGGTCATGCACTATTTCTGAATGTTTGGTGA

Genome Context

Tertiary structure

PDB ID

7afeddddf1598275cbfb7d143b598a0855c55c919548745a013170d8b0156b91

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,4963

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence