Protein

View in Explore

Genbank accession

CAH9011470.1 [GenBank]

Protein name

head-closure protein

RBP type

TSP

Evidence DepoScope

Probability 1,00

Protein sequence

MPVTKPIQTSFNMGVLSPEMMARTDIEQYYRGAKTIKNGVVLPQGGITKRNGFQYLATLDIKSDASYFNNAGGLVRVLPYLSNEETFLVVISATGRLSVMTEQGSIVQVSEPSVSTAANSIDISHRLFGDAIEDAQYKQITNDLVILTEYSEPFVVIKKSPDLFEVKDIPNLEVPKAEYLDKFDAGTSRWEQVLMTFEGVENGDVFTIGISTAAGTPTATTNFIYDVTTEPLDGSTTTAGENADAMANNLGAALGATAKAVYEVTPRQVIKESDGSLVNVNLRTFAGIELTRTTAVKHKPMFCVSKARHESRIKCKPIKQPKALSAAEEQPSWDANRGFPSVAGEFGGRFVLAGTSYQPETIWMSRIYQYYDFTPDATPVATSPIEVTLATEKVSRITGIIDSRRLTIFTNKTAYILGGAGEDVITPDTVRAQNINIQGSKLIRPESLDDAICYVQQSGAELNSTSYEFTRDAYITSQSSIYSAHLLKDVRQMSKTLSDKQFNAEYLTCLNVDGTMANFSSLKEQELRNWTEFTTQGEVVDLVGVRANNFALIRRGINGKEIITLEKMTTEASYCDQAQDYFSSVPFDKIGGFQHLIGETLVAIADGYDFDLVVDSNGYVTFPFKAHKATVGLPFDFEVEPMPVNVDFQSGSIVNTRKRINQARVSVLNSRDVTLEYAGRDYVIADRHVGFKLGEPPQPYTDVKTLRLTGWINQGSVKIKSNRPVGVTVLGLEMKIRAKG

Physico‐chemical properties

protein length:	740 AA
molecular weight:	81399,09040 Da
isoelectric point:	5,33271
aromaticity:	0,08784
hydropathy:	-0,21176

Domains

Domains [InterPro]

No domain annotations available.

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

No domain annotations available.

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

CAH9011470.1

1 740

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	224	224	0,8383
Central domain	225	433	210	0,3225
C-terminal	434	740	306	0,1036

Note: Constraints were applied during segmentation.
Fixed 28 C-terminal predictions appearing before Central domain

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-224

Central
225-433

C-terminal
434-740

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Vibrio phage 131E34-1 [NCBI]	2963166	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	No host information

Coding sequence (CDS)

Genbank protein accession

CAH9011470.1 [NCBI]

Genbank nucleotide accession

OX241432 [NCBI]

CDS location

range 6769 -> 8991
strand +

CDS

ATGCCAGTAACCAAGCCAATACAAACTAGTTTCAATATGGGCGTACTATCGCCAGAAATGATGGCGCGCACAGACATAGAACAATATTACAGAGGCGCAAAGACCATTAAGAATGGTGTTGTACTTCCTCAAGGTGGCATCACAAAGCGCAACGGCTTTCAGTACCTAGCAACGCTCGATATAAAATCAGACGCATCATATTTCAATAACGCTGGTGGATTGGTTCGCGTGCTGCCGTACCTAAGCAATGAAGAGACGTTTCTGGTTGTTATTTCTGCTACTGGTAGGCTGTCAGTGATGACAGAGCAAGGCTCAATAGTTCAAGTGAGCGAGCCAAGCGTATCCACTGCCGCCAACAGTATCGATATAAGCCATAGACTATTTGGTGATGCGATAGAGGATGCACAATACAAACAGATAACAAACGACTTGGTAATCTTAACCGAGTACAGCGAGCCGTTTGTTGTAATAAAGAAAAGCCCAGACCTGTTTGAGGTTAAAGACATTCCCAATCTGGAAGTGCCAAAGGCTGAGTATCTAGATAAGTTTGACGCCGGAACAAGTCGATGGGAACAGGTGCTAATGACTTTTGAGGGTGTCGAAAATGGTGATGTGTTTACGATTGGCATATCAACCGCAGCAGGGACGCCAACAGCCACAACGAACTTTATATATGACGTAACAACAGAGCCGCTAGACGGAAGCACAACAACCGCTGGCGAAAATGCCGATGCAATGGCAAACAATTTAGGCGCAGCGCTTGGTGCCACAGCAAAGGCGGTTTATGAGGTAACACCAAGGCAGGTGATAAAGGAATCTGACGGCTCGCTGGTAAATGTAAACCTACGTACGTTTGCGGGTATCGAGCTAACAAGAACAACCGCAGTAAAGCATAAGCCAATGTTTTGTGTATCGAAGGCTCGACACGAATCTCGCATAAAGTGCAAGCCAATTAAGCAACCTAAAGCATTATCGGCAGCAGAAGAGCAGCCAAGCTGGGATGCTAACAGGGGCTTTCCGTCAGTGGCGGGTGAGTTTGGGGGGAGGTTTGTTTTGGCTGGCACAAGCTACCAACCGGAAACAATTTGGATGAGTCGGATTTATCAGTATTACGATTTCACACCGGACGCAACTCCAGTGGCAACTAGTCCAATAGAGGTAACACTGGCAACTGAAAAGGTATCACGCATCACTGGGATTATTGATTCTAGACGACTAACCATATTCACAAACAAAACCGCATACATTCTTGGTGGTGCTGGTGAAGACGTAATAACACCAGATACGGTTCGAGCTCAGAATATCAACATTCAAGGCTCTAAGTTAATCCGCCCAGAATCGCTTGATGATGCAATTTGTTATGTGCAGCAATCAGGCGCAGAACTTAACAGTACAAGCTATGAGTTTACGCGTGATGCTTACATTACCTCTCAAAGTTCTATTTATTCCGCGCACTTGCTGAAAGATGTTAGGCAGATGAGTAAGACGCTGTCAGATAAACAATTCAACGCTGAGTATCTAACCTGTCTAAACGTAGACGGGACAATGGCGAACTTCTCAAGCCTGAAAGAGCAAGAGCTAAGAAACTGGACAGAGTTCACGACTCAGGGTGAAGTAGTTGATCTGGTAGGTGTTCGAGCGAATAACTTTGCTTTAATTCGCAGGGGTATTAATGGAAAGGAAATCATAACTCTTGAGAAGATGACGACAGAGGCAAGCTATTGTGATCAAGCGCAGGATTATTTCTCAAGCGTACCGTTCGATAAGATTGGCGGCTTTCAGCATTTGATTGGCGAAACGCTGGTGGCAATTGCTGACGGGTATGATTTTGATTTGGTTGTTGATTCTAACGGGTATGTGACATTCCCATTCAAGGCGCACAAAGCAACGGTTGGCTTACCATTTGATTTTGAAGTTGAACCAATGCCAGTGAACGTTGACTTTCAAAGCGGTTCGATTGTTAACACTCGCAAGCGAATAAATCAGGCAAGGGTTTCAGTGTTAAATAGTCGAGATGTAACGCTGGAGTATGCAGGGCGTGATTATGTAATCGCTGATCGTCATGTTGGCTTTAAGCTTGGTGAGCCGCCGCAACCATACACAGACGTTAAAACATTGCGTTTAACTGGATGGATTAATCAGGGTAGTGTTAAGATTAAATCAAACCGCCCAGTAGGTGTAACCGTGCTAGGGCTTGAAATGAAAATCAGAGCTAAGGGGTGA

Genome Context

Tertiary structure

PDB ID

6f8acafa49b58e48d7b40a4e0777b799c285a5d31147f9ac8d4bf2a89c3cafce

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,8019

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence