Protein

View in Explore

Genbank accession

CAO2434039.1 [GenBank]

Protein name

hypothetical protein

RBP type

Evidence UniProt/TrEMBL

Probability 1,00

Evidence GenBank

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,88

Protein sequence

MATAVFKPYRDYSTMAAQFHYRTVQDTAVPGRDYDHVEGDVTIPVGATSIEIPVEIVDKLPNRLPRSFFMEFSSKSQGVMIGTQRAKCTIVSDENLDRISWDTVEERMFHPRYWVTTTQQTESTCIVADNNCCINRLVSRTYGGMAGCIWETVDKYDHFGIGFDDHYEMRNTKLWFRMSITNASNFSTPEKMIMTVDLVDGTIIYVPLAQYAVSISEDKNVAEIHIDFEDCVGMDQNNNMMGVDPRQVRRILIPLMPKDWVSNSTDPRTENVECELRLDLLQPDTGWKMMQLNNIQVREHDVGICTAYDDMWNVSPLRVLNNIKRLGYTGTINHYVGMSHYYDYTWSGTQWSINRTGALNAAAYKWHDDFMYNAKRHNFDVMQSVSFELFSDACPLEWTQRDWNDNYAKTGYTPCSYLLSPTIEEGMNFLTAVFKNFASAAMRNNLPVIMQVGEPWWWYNTDTRRPCIYDYPTKQAFYDETGEYALDIGTIDDPKTGGVYDKYVAFCRGKLGARIAAISKAIKAHAASAQMTALLFFPTIMETELTQKLNLADQYKKEAGALDFFCTECYDWVMQGGIEKAKESVNIPIVKLGWQPSEIQYLAGFVPSKELAPVYGYDPTRNYQEFLWRCICGNMATIEYRYPEVKQYVWAYPQVMSDSITVTARDSTVLHMGQVALKGYVEDVVPPDFS

Physico‐chemical properties

protein length:	690 AA
molecular weight:	79114,82200 Da
isoelectric point:	5,03573
aromaticity:	0,12319
hydropathy:	-0,33406

Domains

Domains [InterPro]

IPR038081
ATT
9–94

IPR038081 IPR057102 IPR057122 DC_0314

IPR038081
ATT
9–95

IPR038081 IPR057102

IPR038081
ATT
14–104

IPR038081

CAO2434039.1

1 690

Architecture

ATT

TAS

RBD

ATT 9-104 | TAS 105-284 | TAS 299-658 | RBD 659-688 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
IPR038081	ATT	IPR038081	9	94	Merged direct domain	CalX-like domain superfamily	N-terminal	Low	Positional only	110 proteins / 110 hits
IPR038081	ATT	IPR038081	9	95	Merged direct domain	CalX-like domain superfamily	N-terminal	Low	Positional only	110 proteins / 110 hits
IPR038081	ATT	IPR038081	14	104	Merged direct domain	CalX-like domain superfamily	N-terminal	Low	Positional only	110 proteins / 110 hits
IPR057102	TAS	DC_0337	95	284	InterPro cluster	Non-contractile tail sheath, N-terminal domain	N-terminal	High	Text match	103 proteins / 103 hits
IPR057102	TAS	DC_0337	108	284	InterPro cluster	Non-contractile tail sheath, N-terminal domain	N-terminal	High	Text match	103 proteins / 103 hits
IPR057122	TAS	DC_0860	299	658	InterPro cluster	Non-contractile tail sheath, TIM barrel	C-terminal	High	Text match	103 proteins / 103 hits
DC_0314	RBD	DC_0314	659	688	Novel HMM	DC_0314	C-terminal	Low	Positional only	95 proteins / 95 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

CAO2434039.1

1 690

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	43	43	0,2214
Central domain	44	299	257	0,8144
C-terminal	300	690	390	0,2984

Note: Constraints were applied during segmentation.
Fixed 23 C-terminal predictions appearing before Central domain

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-43

Central
44-299

C-terminal
300-690

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Escherichia phage KCP_009 [NCBI]	3465670	Viruses >
Host	No host information

Coding sequence (CDS)

Genbank protein accession

CAO2434039.1 [NCBI]

Genbank nucleotide accession

OZ346226 [NCBI]

CDS location

range 32353 -> 34425
strand +

CDS

ATGGCAACAGCTGTTTTTAAACCTTACCGTGATTACTCTACAATGGCTGCACAGTTTCATTACCGCACAGTTCAGGATACTGCCGTTCCTGGTAGAGATTATGATCATGTTGAGGGCGATGTAACTATCCCAGTTGGGGCAACCAGTATTGAGATCCCAGTGGAAATTGTTGACAAATTACCCAACAGGTTGCCAAGAAGCTTCTTTATGGAGTTTTCATCAAAATCTCAAGGAGTGATGATTGGAACACAAAGGGCGAAATGTACAATAGTTTCAGATGAGAATCTTGACAGGATATCTTGGGATACTGTTGAGGAGAGAATGTTTCACCCAAGATATTGGGTTACAACCACTCAGCAGACTGAAAGTACCTGTATTGTTGCAGATAACAACTGTTGTATTAACCGTTTAGTGTCAAGAACATATGGAGGTATGGCTGGGTGCATTTGGGAAACAGTTGACAAGTATGACCATTTCGGTATTGGGTTTGATGATCACTATGAGATGAGAAACACCAAGCTTTGGTTCAGAATGTCAATAACCAACGCCAGCAACTTCTCCACTCCTGAAAAGATGATTATGACTGTAGACCTTGTTGATGGCACAATCATCTATGTTCCTTTAGCTCAATATGCTGTCAGCATCTCAGAGGATAAAAATGTTGCAGAAATTCATATTGATTTTGAGGACTGCGTCGGGATGGACCAGAACAACAACATGATGGGTGTTGATCCTCGGCAGGTGAGAAGGATTTTAATACCACTTATGCCTAAAGACTGGGTAAGTAATAGCACAGATCCAAGAACGGAAAATGTAGAGTGTGAGTTGCGCCTAGATCTGCTTCAGCCAGACACAGGCTGGAAAATGATGCAACTTAATAATATCCAGGTGAGAGAGCACGACGTTGGGATCTGCACCGCATATGACGATATGTGGAACGTGTCCCCTTTAAGGGTGTTGAACAATATCAAGCGTCTGGGCTATACCGGAACCATAAACCATTATGTTGGTATGAGTCATTATTATGACTACACATGGTCAGGAACCCAATGGTCTATAAACAGAACAGGAGCGCTAAACGCTGCAGCTTATAAATGGCATGATGATTTTATGTACAATGCCAAACGACATAACTTCGACGTTATGCAATCTGTAAGTTTTGAGCTTTTCAGCGATGCCTGCCCGTTGGAATGGACCCAAAGAGACTGGAACGATAACTACGCTAAAACAGGGTATACACCTTGTAGCTACCTCCTGTCTCCAACCATTGAAGAGGGTATGAATTTCCTTACTGCAGTATTTAAGAATTTTGCATCAGCCGCTATGAGAAACAACCTGCCAGTGATTATGCAGGTTGGTGAACCGTGGTGGTGGTACAATACCGATACTCGTAGACCTTGTATTTATGATTACCCTACAAAGCAGGCGTTTTATGATGAGACAGGTGAGTATGCATTAGATATTGGGACTATTGACGATCCTAAAACTGGCGGTGTTTACGACAAGTATGTAGCATTTTGTCGTGGTAAGCTTGGCGCTCGTATTGCTGCTATTTCAAAGGCAATAAAGGCACACGCTGCATCAGCTCAGATGACAGCTCTGCTGTTTTTCCCAACCATTATGGAAACCGAGCTTACGCAAAAGCTTAACCTTGCTGACCAATATAAAAAGGAAGCAGGTGCTCTTGATTTCTTCTGCACCGAGTGCTACGATTGGGTGATGCAGGGAGGTATTGAAAAGGCAAAAGAGTCTGTAAACATACCTATCGTTAAGTTAGGTTGGCAACCGTCTGAAATACAATACCTTGCAGGGTTCGTTCCTAGTAAAGAGCTTGCTCCGGTATATGGTTACGACCCAACTAGGAATTACCAAGAATTTTTATGGAGATGTATTTGCGGAAACATGGCAACTATAGAGTATAGATACCCTGAGGTAAAACAGTATGTGTGGGCATACCCGCAAGTAATGTCTGACAGCATCACTGTTACCGCTAGAGATTCTACCGTGCTTCATATGGGGCAGGTTGCTCTGAAAGGGTATGTAGAAGATGTTGTCCCGCCAGACTTCTCATAA

Genome Context

Tertiary structure

PDB ID

802c27be0116f894afde57ed9c2aa30aa44557c193b66a2cc93c675828e3abd0

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,7049

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence