Protein

View in Explore

Genbank accession

WXX17769.1 [GenBank]

Protein name

hypothetical protein

RBP type

TSP

Evidence RBPdetect

Probability 0,88

Protein sequence

MATAVFKPYRDYSTMAAQFHYRTVQDTAVPGRDYNHVEGDVTIPIGATSIEIPVEIVDKLPNRLPRSFFMEFSSKSQGVMIGTQRAKCTIVSDENLDRISWDTVEERMFHPRYWVTTTQQTESTCIVADDNCCINRLVSRTYGGMAGCIWETVDKYDHFGIGFDDHYEMRNTKLWFRMSITNASNFSTPEKMIMTVDLVDGTIIYVPLAQYAVSISEDKNVAEIHIDFEDCVGMDQNNNMMGVDPRQVRRILIPLMPKDWVSNSTDPRTENVECELRLDLLQPDTGWKMMQLNNIQVKEHDVGICTAYDDMWNVSPLRVLNNIKRLGYTGTINHYVGMSHYYDYTWSGTQWSINRTGALNAAAYKWHDDFMYNAKRHNFDVMQSVSFELYSDACPLEWTQRDWNDNYAKTGYTPCSYLLSPTIEEGMNFLTAVFKNFASAAMRNNLPVIMQVGEPWWWYNTDTRRPCIYDYPTKQAFYDETGEYALDIGTIDDPKTGGVYDKYVAFCRGKLGARIAAISKAIKAHAASAQMTALLFFPTIMETELTQKLNLADQYKKEAGALDFFCTECYDWVMQGGIEKAKESVNIPIVKLGWQPSEIQYLAGFVPSKELAPVYGYDPTRNYQEFLWRCICGNMATIEYRYPEVKQYVWAYPQVMSDSITVTARDSTVLHMGQVALKGYVEDVVPPDFS

Physico‐chemical properties

protein length:	690 AA
molecular weight:	79116,83460 Da
isoelectric point:	5,03573
aromaticity:	0,12319
hydropathy:	-0,33870

Domains

Domains [InterPro]

IPR038081
ATT
9–94

IPR038081 IPR057102 IPR057122 DC_0314

IPR038081
ATT
9–95

IPR038081 IPR057102

IPR038081
ATT
14–100

IPR038081

IPR003644
ATT
17–91

IPR003644

WXX17769.1

1 690

Architecture

ATT

TAS

RBD

ATT 9-100 | TAS 101-284 | TAS 299-658 | RBD 659-688 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
IPR038081	ATT	IPR038081	9	94	Merged direct domain	CalX-like domain superfamily	N-terminal	Low	Positional only	110 proteins / 110 hits
IPR038081	ATT	IPR038081	9	95	Merged direct domain	CalX-like domain superfamily	N-terminal	Low	Positional only	110 proteins / 110 hits
IPR038081	ATT	IPR038081	14	100	Merged direct domain	CalX-like domain superfamily	N-terminal	Low	Positional only	110 proteins / 110 hits
IPR003644	ATT	DC_0810	17	91	InterPro cluster	Na-Ca exchanger/integrin-beta4	N-terminal	Low	Positional only	48 proteins / 48 hits
IPR057102	TAS	DC_0337	95	284	InterPro cluster	Non-contractile tail sheath, N-terminal domain	N-terminal	High	Text match	103 proteins / 103 hits
IPR057102	TAS	DC_0337	108	284	InterPro cluster	Non-contractile tail sheath, N-terminal domain	N-terminal	High	Text match	103 proteins / 103 hits
IPR057122	TAS	DC_0860	299	658	InterPro cluster	Non-contractile tail sheath, TIM barrel	C-terminal	High	Text match	103 proteins / 103 hits
DC_0314	RBD	DC_0314	659	688	Novel HMM	DC_0314	C-terminal	Low	Positional only	95 proteins / 95 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

WXX17769.1

1 690

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	42	42	0,1960
Central domain	43	298	257	0,7862
C-terminal	299	690	391	0,3122

Note: Constraints were applied during segmentation.
Fixed 26 C-terminal predictions appearing before Central domain

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-42

Central
43-298

C-terminal
299-690

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Escherichia phage BP9 [NCBI]	3135305	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Escherichia coli [NCBI]	562	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales

Coding sequence (CDS)

Genbank protein accession

WXX17769.1 [NCBI]

Genbank nucleotide accession

PP488543 [NCBI]

CDS location

range 97741 -> 99813
strand +

CDS

ATGGCAACAGCTGTTTTTAAACCTTACCGTGATTACTCTACAATGGCTGCACAGTTTCATTACCGAACAGTTCAGGATACTGCCGTTCCTGGTAGGGATTATAATCATGTTGAGGGCGATGTAACTATCCCAATTGGGGCAACCAGTATTGAAATCCCAGTGGAAATTGTTGACAAATTACCCAACAGGTTACCAAGAAGCTTCTTTATGGAGTTTTCATCAAAATCTCAAGGGGTGATGATTGGGACACAAAGGGCAAAATGTACAATAGTTTCAGATGAGAATCTTGACAGGATATCTTGGGATACTGTTGAGGAGAGAATGTTTCACCCAAGATATTGGGTTACAACCACCCAGCAGACTGAAAGTACCTGTATTGTTGCAGATGACAACTGTTGTATTAACCGTTTAGTGTCAAGAACATATGGGGGTATGGCTGGGTGCATTTGGGAAACAGTTGACAAGTATGACCATTTCGGTATTGGGTTTGATGATCACTATGAGATGAGAAATACCAAGCTTTGGTTCAGAATGTCAATAACCAATGCCAGCAACTTCTCCACTCCTGAAAAGATGATTATGACTGTAGACCTTGTTGATGGCACAATCATCTATGTTCCTTTAGCTCAATATGCTGTCAGCATCTCAGAGGATAAGAATGTTGCAGAAATTCATATTGATTTTGAGGACTGCGTCGGGATGGACCAGAACAACAACATGATGGGTGTTGATCCTCGGCAGGTGAGAAGGATTTTAATACCGCTCATGCCTAAAGACTGGGTAAGTAATAGCACAGACCCGAGAACGGAAAATGTAGAGTGCGAGTTGCGCTTAGACCTGCTTCAGCCAGACACAGGTTGGAAAATGATGCAACTTAACAATATTCAGGTTAAAGAGCACGACGTTGGGATCTGCACTGCATATGACGATATGTGGAACGTATCCCCTTTAAGGGTGTTGAACAATATCAAGCGTCTGGGCTATACCGGAACCATAAACCATTATGTTGGTATGAGTCATTATTATGACTACACGTGGTCAGGAACCCAATGGTCTATAAACAGAACAGGGGCGCTAAACGCTGCAGCTTATAAATGGCATGATGATTTTATGTACAATGCCAAACGACATAACTTCGACGTTATGCAGTCTGTAAGTTTTGAGCTTTACAGCGATGCCTGCCCGTTGGAATGGACCCAAAGAGACTGGAACGATAACTACGCTAAAACAGGGTATACACCTTGTAGCTACCTCCTGTCTCCAACCATTGAAGAGGGTATGAATTTCCTTACTGCAGTATTTAAGAATTTTGCATCAGCCGCTATGAGAAACAACCTGCCAGTGATTATGCAGGTTGGTGAACCGTGGTGGTGGTACAATACCGATACTCGTAGACCTTGTATTTATGATTACCCTACAAAACAGGCGTTTTATGATGAGACAGGCGAGTATGCATTAGATATTGGGACTATTGACGATCCTAAAACTGGCGGTGTTTACGATAAGTATGTAGCATTTTGTCGTGGTAAGCTTGGCGCTCGTATTGCGGCTATTTCAAAGGCAATAAAGGCACACGCTGCATCAGCTCAGATGACAGCTCTGCTGTTTTTCCCAACCATTATGGAAACCGAGCTTACGCAAAAGCTTAACCTTGCTGACCAATATAAAAAGGAAGCAGGTGCTCTTGATTTCTTCTGCACCGAGTGCTACGATTGGGTGATGCAGGGAGGTATTGAAAAGGCAAAAGAGTCTGTAAACATACCTATCGTTAAGTTAGGTTGGCAACCGTCTGAAATACAATACCTTGCAGGGTTCGTTCCTAGCAAAGAGCTTGCTCCGGTATATGGCTACGACCCAACCAGGAATTACCAAGAATTCTTATGGAGATGTATCTGCGGAAACATGGCAACTATAGAGTATAGATACCCTGAGGTAAAACAGTATGTGTGGGCATACCCGCAAGTAATGTCTGACAGCATTACTGTTACCGCTAGAGATTCTACCGTGCTTCATATGGGGCAGGTTGCTCTGAAAGGGTATGTAGAGGATGTTGTCCCGCCAGACTTCTCATAA

Genome Context

Tertiary structure

PDB ID

31ee3a098f2f8c24d1dabda75d822b89908389836b0e01fee5e1698587b8d2c9

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,7136

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence