Protein

View in Explore

Genbank accession

WVX92833.1 [GenBank]

Protein name

hypothetical protein

RBP type

TSP

Evidence DepoScope

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,72

Evidence RBPdetect2

Probability 0,95

Protein sequence

MATLKQIQFKRSKTAGARPAASVLAEGELAINLKDRVLFTKDDQGNIIDLGFAKGGSIDGNVIHIGNYNQTGDYTLNGTFTQTGNFNLTGIARVTRDIIAAGQIMTEGGELITKSSGTSHVRFFDGNSRERGIIYAPANDGLTTQVLNIRVQDYAAGSESTYAFSGSGLFTSPEVSAWKSISSPQILTDKVITDGKKTGDYDISSLANNTPLAESETAINHLRVMRNAVGSGIFHEVKDNDGITWYAGDGLDAYLWSFTWSGGLKAGHSISVGTPGGSKGYSELGTASIALGDNDTGLKWHQDGYYFSVNNGTKTFLFSPSETTSLRKFVAGYSTNGTDLTTPPTENYALATVVTYHDNNAYGDGQTLLGYYQGGNYHHYFRGKGTTNINTHGGLLVTPGNIDVIGGSVNIDGRNNASTLMFRGNTTGSSSVDNMTISVWGNTFTNPSVGNRKNVMEISDATSWMSYIQRLTTGEVEMNVNGSFESSGVTAGNRGVHTTGEISSGAVNALRIWNADYGAIFRRSEGSLHIIPTAYGEGKYGDIGPLRPFSMALDTGKVTIPDLQSSYNTFAANGYIKFTGHGAGAGGYDIQYVQAAPIFQEIDDDAISKYYPIVKQKFLNGKAVWSLGTEINSGTFVIHHLKEDGSQGHTSRFNQDGTVNFPDNVQVGGGEATIARNGNIFSDIWKLFSSAGDITNLHDAIASRVAKEGDTMTGKLIVKRGSDAINIAADENDSGYLLGTSGGANSWYIGKGGADDTASFYNFKTTAGITLNSVGDIDFNVKNQATAASLNFYRLYLNGRQWTATQGHGYSNQWQTEAPFFVDFGESVPKDSYMPIIKGRSQIINEGYATKADFGIIRLGGDATWGNAVIRVGSAESGDSSHPNAIFVFQANGDFKAPAGLRAGVNLGVGTIPVWGGASIAIGDNDTGLVHGGDGRINMFANGQHIASWGVFHQEHPGLWSVGAALWTEVDKAIISHGHLIQANDNYSTFVRDVYVRSDIRVKKDLVKFENASEKLSKINGYTYMQKRGLDEEGNQKWEPNAGLIAQEVQAILPELVEGDPDGEALLRLNYNGVIGLNTAAINEHTAEIAELKSEIEELKALVKSLLK

Physico‐chemical properties

protein length:	1108 AA
molecular weight:	118771,09410 Da
isoelectric point:	5,48584
aromaticity:	0,09567
hydropathy:	-0,30316

Domains

Domains [InterPro]

DC_0538
STR
1–733

DC_0538 IPR030392 Coil

IPR048390
ATT
450–549

IPR048390 DC_0406

G3DSA:6.20.80.10
STR
722–780

G3DSA:6.20.80.10 IPR030392

WVX92833.1

1 1108

Architecture

STR

ATT

STR

STR 1-449 | ATT 450-549 | STR 550-1108

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0538	STR	DC_0538	1	733	Novel HMM	DC_0538	Central	Low	Positional only	380 proteins / 380 hits
IPR048390	ATT	DC_0836	450	549	InterPro cluster	Long-tail fiber proximal subunit, trimerization domain	C-terminal	Medium	Text match	656 proteins / 656 hits
DC_0406	STR	DC_0406	620	1108	Novel HMM	DC_0406	Central	Low	Positional only	13 proteins / 13 hits
G3DSA:6.20.80.10	STR	G3DSA:6.20.80.10	722	780	Merged direct domain	G3DSA:6.20.80.10	Central	Low	Positional only	37 proteins / 37 hits
IPR030392	CHP	DC_0088	998	1057	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits
IPR030392	CHP	DC_0088	998	1096	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits
Coil	Unmapped	-	1082	1102	Coils	Coil	-	-	-	-

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

WVX92833.1

1 1108

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	214	214	0,2327
Central domain	215	413	200	0,3027
C-terminal	414	1108	694	0,7828

Note: Constraints were applied during segmentation.
Fixed 164 C-terminal predictions appearing before Central domain

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-214

Central
215-413

C-terminal
414-1108

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Escherichia phage vB_EcoM_HZ_ZJUN4 [NCBI]	3119840	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Escherichia coli NDM-1 [NCBI]	1411081	Pseudomonadota > Gammaproteobacteria > Enterobacterales > Enterobacteriaceae > Escherichia > Escherichia coli

Coding sequence (CDS)

Genbank protein accession

WVX92833.1 [NCBI]

Genbank nucleotide accession

PP216085 [NCBI]

CDS location

range 157898 -> 161224
strand -

CDS

ATGGCTACTTTAAAACAAATACAATTTAAAAGAAGCAAAACTGCAGGAGCACGTCCTGCCGCTTCAGTATTAGCCGAAGGTGAATTGGCTATAAACTTAAAAGACCGCGTACTTTTTACTAAAGATGACCAAGGAAATATCATTGATCTGGGTTTTGCTAAGGGCGGTAGTATTGACGGGAATGTTATTCATATAGGAAATTATAATCAAACTGGTGATTATACTTTAAATGGCACCTTCACTCAGACAGGTAATTTTAATTTAACTGGTATTGCTCGAGTAACTCGCGATATTATTGCCGCCGGGCAAATTATGACTGAGGGCGGAGAACTTATTACAAAAAGTTCAGGTACATCACATGTTCGTTTTTTCGATGGCAATAGCCGCGAACGCGGAATCATTTATGCCCCGGCTAATGATGGATTAACTACACAAGTACTTAATATCAGGGTTCAAGATTATGCTGCAGGAAGCGAAAGCACCTATGCATTTTCAGGCAGTGGACTATTTACTTCACCTGAAGTATCAGCGTGGAAATCTATTTCGTCTCCACAAATTCTGACCGATAAAGTTATTACAGATGGGAAGAAGACGGGCGATTATGATATATCTTCATTAGCAAATAACACTCCATTGGCAGAAAGCGAAACGGCTATTAACCACCTCCGTGTTATGCGAAATGCCGTAGGATCTGGTATATTCCATGAAGTTAAAGATAACGACGGGATAACCTGGTACGCCGGTGACGGGTTAGATGCCTATCTTTGGTCGTTTACCTGGTCCGGTGGATTGAAAGCAGGCCATTCTATTTCTGTTGGTACTCCTGGTGGCTCTAAAGGATACTCTGAACTAGGGACTGCTTCAATTGCTCTTGGAGATAATGATACCGGGCTAAAATGGCATCAGGACGGATATTATTTCAGCGTTAATAATGGAACGAAAACATTTTTATTTAGTCCTAGCGAAACAACTAGCCTAAGAAAATTTGTAGCTGGATATTCTACTAATGGAACCGATTTAACGACTCCTCCAACTGAAAACTATGCATTAGCCACTGTTGTTACTTACCATGATAATAACGCGTATGGTGACGGTCAGACTCTTTTAGGATATTACCAAGGTGGTAATTATCATCATTATTTCCGCGGTAAGGGTACCACAAACATTAATACTCACGGCGGTTTGTTAGTCACTCCAGGTAATATTGACGTTATTGGTGGTTCTGTTAATATTGATGGTCGTAATAATGCTTCTACGCTGATGTTTAGAGGTAACACAACTGGTAGCAGTTCAGTTGATAATATGACAATTTCTGTATGGGGTAATACGTTTACTAATCCTAGCGTAGGTAATCGTAAAAATGTCATGGAAATTTCTGACGCAACTAGTTGGATGAGCTATATTCAAAGACTTACTACCGGCGAAGTAGAAATGAACGTCAATGGTTCATTTGAATCATCCGGTGTTACTGCTGGAAATAGAGGAGTTCACACAACAGGCGAAATTTCATCTGGAGCAGTGAATGCTCTTCGTATTTGGAACGCAGATTATGGAGCCATTTTTAGACGTTCAGAAGGAAGTCTTCATATTATTCCAACTGCTTACGGTGAAGGTAAATATGGTGATATCGGTCCACTTCGCCCGTTTAGTATGGCTTTAGATACTGGTAAAGTTACTATTCCAGATTTACAATCAAGTTACAATACGTTCGCAGCAAACGGCTATATTAAATTTACTGGTCATGGCGCAGGCGCTGGTGGTTATGACATTCAGTATGTTCAAGCAGCTCCTATTTTCCAGGAAATTGATGATGATGCTATAAGCAAATATTATCCTATTGTTAAACAGAAGTTTTTAAACGGCAAAGCTGTTTGGTCTTTAGGTACTGAAATTAATTCGGGTACATTCGTTATTCATCATCTGAAAGAAGATGGTTCACAAGGCCATACGTCTCGTTTTAATCAGGACGGTACAGTTAACTTCCCGGATAACGTACAGGTCGGTGGCGGCGAAGCTACTATTGCTCGAAATGGTAATATCTTCTCTGATATTTGGAAATTATTTAGCTCTGCTGGTGATATAACCAACCTTCATGATGCTATTGCCTCCCGTGTTGCTAAAGAAGGCGATACGATGACCGGCAAATTAATCGTTAAAAGAGGCTCTGACGCTATTAACATTGCTGCCGATGAAAATGATTCTGGTTATTTACTTGGAACATCAGGTGGAGCGAATTCATGGTACATCGGTAAAGGCGGGGCAGATGACACTGCTTCATTTTATAATTTTAAGACTACGGCAGGAATTACTCTTAATAGTGTAGGCGATATTGACTTTAATGTTAAAAATCAAGCTACTGCAGCTTCATTAAATTTTTATCGTTTATATTTAAACGGAAGACAATGGACAGCTACCCAAGGCCACGGATATAGTAATCAATGGCAAACAGAAGCCCCATTCTTCGTTGACTTTGGTGAATCTGTTCCGAAAGATAGTTATATGCCTATAATTAAAGGAAGAAGCCAAATCATTAACGAAGGATATGCAACAAAGGCAGATTTTGGTATTATTAGATTGGGCGGAGATGCTACTTGGGGAAATGCAGTAATTCGTGTTGGTTCTGCGGAAAGTGGAGATAGCAGTCATCCTAATGCAATATTTGTGTTTCAAGCTAATGGCGATTTTAAAGCTCCGGCTGGTCTTCGCGCTGGTGTTAACTTGGGTGTCGGTACAATTCCGGTATGGGGCGGAGCATCTATCGCCATCGGTGATAATGATACTGGTTTAGTCCATGGCGGTGATGGTCGTATTAACATGTTTGCTAACGGACAACATATTGCGTCATGGGGGGTTTTCCATCAAGAACACCCAGGATTGTGGTCTGTTGGTGCTGCTTTATGGACTGAAGTTGACAAAGCTATTATTTCACATGGTCATTTGATTCAGGCGAATGACAACTATTCAACATTTGTTCGTGACGTTTATGTCCGCTCTGATATTCGTGTTAAAAAAGACCTTGTTAAATTTGAAAATGCTTCTGAGAAGCTTTCTAAAATTAACGGTTACACTTATATGCAGAAGCGAGGCCTAGATGAAGAAGGCAATCAGAAATGGGAACCTAACGCCGGTTTGATAGCTCAAGAAGTTCAAGCTATTTTACCAGAATTAGTTGAAGGTGACCCTGATGGTGAAGCTTTACTTCGTTTGAACTATAACGGCGTAATTGGTTTAAATACAGCTGCAATCAATGAGCATACTGCAGAAATTGCGGAACTTAAATCAGAAATTGAAGAACTTAAAGCATTAGTTAAATCATTGTTAAAATAA

Genome Context

Tertiary structure

PDB ID

b413ce1b739a92567e4c7bba17c4791b252951bd09c33aab2d04766ad0b91442

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,2892

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence