Protein

View in Explore

Genbank accession

QOC67659.1 [GenBank]

Protein name

capsid and scaffold protein

RBP type

TSP

Evidence RBPdetect

Probability 0,88

Protein sequence

MATAVFKPYRDYSTMAARFHYRTVQDTAVPGRDYDHVEGDVTIPVGATSIEIPVEIVDKLPNRLPRSFFMEFSSNSQGVMIGTQRAKCTIVSDENLDRISWDTVEERMFHPRYWVTTTQQTESTCIVADNNCCINRLVSRTYGGMAGCIWETVDKYDHFGIGFDDHYEMRNTKLWFRMSITNASNFSTPEKMIMTVDLVDGTIIYVPLAQYAVSISEDKNVAEIHIDFEDCVGMDQNNNMMGVDPRQVRKILIPLMPKDWVSNSTDPRTENVECELRLDLLQPDTGWKMMQLNNIQVKEHDVGICTAYDDMWNVSPLRVLSNIKRLGYTGTINHYVGMSHYYDYTWSGTQWSINKTGALNAAAYKWHDDFMYNAKRHDFDVMQSVSFELYSDACPLEWTQRDWNDNYAKTGYTPCSYLLSPTIEEGMNFLTAVFKNFASAAMRNNLPVIMQVGEPWWWYNTDTRRPCIYDYPTKQAFYDETGEYALDIGTIDDPKTGGVYDKYVAFCRGKLGARIAAISKAIKAHAASAQMTALLFFPTIMETELTQKLNLADQYKKEAGALDFFCTECYDWVMQGGIEKAKESVNIPIVKLGWKPSEIQYLAGFVPSKELAPVYGYDPTRNYQEFLWRCICGNMATIEYRYPEVKQYVWAYPQVMSDSITVTARDSTVLHMGQVALKGYVEDVVPPDFS

Physico‐chemical properties

protein length:	690 AA
molecular weight:	79034,77060 Da
isoelectric point:	5,03920
aromaticity:	0,12319
hydropathy:	-0,33493

Domains

Domains [InterPro]

IPR038081
ATT
9–94

IPR038081 IPR057102 IPR057122 DC_0314

IPR038081
ATT
9–95

IPR038081 IPR057102

IPR038081
ATT
14–104

IPR038081

QOC67659.1

1 690

Architecture

ATT

TAS

RBD

ATT 9-104 | TAS 105-284 | TAS 299-658 | RBD 659-688 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
IPR038081	ATT	IPR038081	9	94	Merged direct domain	CalX-like domain superfamily	N-terminal	Low	Positional only	110 proteins / 110 hits
IPR038081	ATT	IPR038081	9	95	Merged direct domain	CalX-like domain superfamily	N-terminal	Low	Positional only	110 proteins / 110 hits
IPR038081	ATT	IPR038081	14	104	Merged direct domain	CalX-like domain superfamily	N-terminal	Low	Positional only	110 proteins / 110 hits
IPR057102	TAS	DC_0337	95	284	InterPro cluster	Non-contractile tail sheath, N-terminal domain	N-terminal	High	Text match	103 proteins / 103 hits
IPR057102	TAS	DC_0337	108	284	InterPro cluster	Non-contractile tail sheath, N-terminal domain	N-terminal	High	Text match	103 proteins / 103 hits
IPR057122	TAS	DC_0860	299	658	InterPro cluster	Non-contractile tail sheath, TIM barrel	C-terminal	High	Text match	103 proteins / 103 hits
DC_0314	RBD	DC_0314	659	688	Novel HMM	DC_0314	C-terminal	Low	Positional only	95 proteins / 95 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

QOC67659.1

1 690

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	43	43	0,2101
Central domain	44	299	257	0,7849
C-terminal	300	690	390	0,3134

Note: Constraints were applied during segmentation.
Fixed 21 C-terminal predictions appearing before Central domain|Sequence started with non-N-terminal domain

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-43

Central
44-299

C-terminal
300-690

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Escherichia phage JEP1 [NCBI]	2759218	Uroviricota > Caudoviricetes > Vequintavirinae > Vequintavirus JEP1 >
Host	Escherichia coli [NCBI]	562	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales

Coding sequence (CDS)

Genbank protein accession

QOC67659.1 [NCBI]

Genbank nucleotide accession

MT740314 [NCBI]

CDS location

range 34049 -> 36121
strand +

CDS

ATGGCAACAGCTGTTTTTAAACCTTACCGTGATTACTCTACGATGGCTGCACGGTTTCATTACCGCACAGTTCAGGATACTGCAGTTCCAGGTAGGGATTATGATCATGTTGAGGGAGATGTAACTATCCCGGTTGGAGCAACCAGTATTGAGATCCCTGTAGAAATTGTTGACAAATTGCCAAACAGGTTGCCAAGAAGCTTCTTTATGGAGTTTTCATCAAACTCCCAAGGGGTTATGATTGGAACACAAAGAGCGAAATGTACAATAGTTTCAGATGAGAATCTTGACAGAATATCTTGGGATACCGTTGAGGAGAGAATGTTTCACCCAAGATATTGGGTTACAACCACACAGCAGACTGAAAGCACCTGCATTGTTGCGGATAATAACTGCTGTATTAACCGTTTAGTGTCAAGAACATATGGAGGCATGGCTGGGTGCATTTGGGAAACAGTTGACAAGTATGACCATTTCGGCATTGGATTTGATGATCACTACGAGATGAGAAACACCAAGCTTTGGTTCAGAATGTCAATAACCAATGCCAGCAACTTCTCCACCCCTGAAAAGATGATTATGACTGTAGACCTTGTTGACGGCACAATCATCTATGTTCCTTTAGCTCAATATGCTGTCAGCATCTCAGAGGATAAGAATGTTGCAGAAATTCATATTGATTTCGAGGACTGCGTCGGGATGGACCAGAACAACAATATGATGGGTGTTGATCCTCGGCAGGTGAGAAAGATTTTAATACCGCTTATGCCTAAAGATTGGGTAAGTAATAGCACAGACCCAAGAACGGAAAATGTAGAGTGCGAGTTGCGTCTAGATCTGCTTCAGCCGGACACAGGCTGGAAAATGATGCAACTTAACAATATCCAGGTGAAAGAGCACGACGTCGGGATCTGCACAGCATATGACGATATGTGGAACGTATCCCCTTTAAGGGTGTTGAGCAATATCAAGCGTCTGGGCTATACCGGAACCATAAATCATTATGTTGGTATGAGTCATTATTATGACTACACATGGTCAGGAACCCAATGGTCTATAAACAAAACAGGGGCTCTAAACGCTGCAGCTTATAAATGGCATGATGATTTTATGTACAATGCCAAACGACATGACTTCGACGTTATGCAGTCTGTAAGCTTCGAGCTTTATAGCGATGCCTGTCCGTTGGAATGGACCCAGAGAGACTGGAACGATAACTACGCTAAAACAGGATATACACCTTGTAGCTACCTCCTGTCTCCAACCATTGAAGAGGGTATGAATTTCCTTACTGCAGTATTTAAGAATTTTGCATCAGCCGCTATGAGAAACAACCTGCCAGTGATTATGCAGGTTGGTGAACCGTGGTGGTGGTACAATACCGATACTCGTAGACCTTGTATTTATGATTACCCTACAAAGCAGGCGTTTTATGATGAGACAGGTGAGTATGCATTAGATATTGGGACTATTGACGATCCTAAAACTGGTGGTGTTTACGACAAGTATGTAGCATTTTGTCGTGGTAAGCTTGGCGCTCGTATTGCGGCTATTTCAAAGGCAATAAAAGCACACGCTGCATCGGCTCAGATGACAGCTTTACTGTTTTTCCCCACTATTATGGAAACCGAGCTTACGCAAAAACTGAACCTTGCTGACCAATATAAAAAGGAAGCAGGCGCTCTTGATTTCTTCTGCACTGAGTGCTACGATTGGGTGATGCAGGGAGGTATTGAAAAGGCAAAAGAGTCTGTAAACATACCTATCGTTAAGTTAGGTTGGAAACCGTCTGAAATACAATACCTTGCAGGGTTCGTTCCTAGCAAAGAGCTTGCTCCGGTATATGGCTACGACCCAACCAGGAATTACCAAGAATTTTTATGGAGATGTATTTGCGGAAACATGGCAACCATAGAGTATAGATACCCTGAGGTAAAACAGTATGTGTGGGCATACCCGCAAGTAATGTCTGACAGCATCACTGTTACCGCCAGAGATTCTACCGTGCTTCATATGGGACAGGTTGCTCTGAAAGGGTATGTAGAAGATGTTGTCCCGCCAGACTTCTCATAA

Genome Context

Tertiary structure

PDB ID

6d868398c0d7f514a8ff7c0ad9b9559718013594d33950da67cbf236fd8af5ca

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,7032

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence