Protein

View in Explore

Genbank accession

CAH9011675.1 [GenBank]

Protein name

head-closure protein

RBP type

TSP

Evidence DepoScope

Probability 0,99

Protein sequence

MPVTKPIQTSFNMGVLSPEMMARTDIEQYYRGAKTIKNGVVLPQGGITKRNGFQYLATLGIKSTASYFNNAGGLVRVLPYLSNEETFLVVISATGRLSVMTDKGSIVQVSEPGISSAADSIDISHRLFGDAIEDAQYKQITNDLVILTEYSEPFVVIKKSPDLFEVKDIPNLEVPKAEYLDKFDAGTSRWEQVLITFEGVENGDVFTIGISTAANTLTSTTNFIYDVTTEPLDGSTTNAGENADAMANNLGSALGATAKAVYEVTPRQVIRESDGSLVSVSLRTFAGIELTRTTAVKHKPMFCVSKARHESRIKCKPIKQPKALSAAEEQPSWDTNRGFPSVAGEFGGRFVLAGTSYQPETIWMSRIYQYYDFTPDATPVATSPIEVTLATEKVSRITGIIDSRRLTIFTNKTAYILGGAGEDVITPDTVRAQNINIQGSKLIRPESLDDAICYVQQSGAELNSTSYEFTRDAYITSQSSIYSAHLLKDVRQMSKTLSDKQFNAEYLTCLNVDGTMANFSSLKEQELRNWTEFTTQGEVVDLVGVRANNFALIRRGIDGKEIITLEKMATEASYCDQAQDYFSSVPFDKIGGFQHLIGETLVAIADGYDFDLVVDSSGYVTFPFKASKATVGLPFDFEVEPMPVNVDFQSGSIVNTRKRINQARVSVLNSRDVTLEYAGRDYVIADRHVGFKLGEPPQPYTDVKTLRLTGWINQGSVKIKSNRPVGVTVLGLEMKTRAKG

Physico‐chemical properties

protein length:	740 AA
molecular weight:	81269,90550 Da
isoelectric point:	5,33959
aromaticity:	0,08784
hydropathy:	-0,20135

Domains

Domains [InterPro]

No domain annotations available.

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

No domain annotations available.

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

CAH9011675.1

1 740

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	280	280	0,7458
Central domain	281	479	200	0,1525
C-terminal	480	740	260	0,1005

Note: Constraints were applied during segmentation.
Fixed 26 C-terminal predictions appearing before Central domain

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-280

Central
281-479

C-terminal
480-740

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Vibrio phage 284E43-1 [NCBI]	2963187	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	No host information

Coding sequence (CDS)

Genbank protein accession

CAH9011675.1 [NCBI]

Genbank nucleotide accession

OX241448 [NCBI]

CDS location

range 6775 -> 8997
strand +

CDS

ATGCCAGTAACCAAGCCAATTCAAACCAGTTTCAATATGGGCGTGCTATCACCGGAAATGATGGCGCGTACAGACATAGAGCAATATTACAGAGGCGCAAAGACCATTAAGAATGGTGTTGTACTTCCTCAAGGTGGCATCACAAAGCGCAACGGCTTCCAGTACCTAGCGACACTTGGCATAAAATCAACCGCATCATATTTCAATAACGCTGGTGGATTGGTTCGCGTGCTGCCGTACCTAAGCAACGAAGAGACATTTCTGGTTGTTATTTCTGCTACTGGTAGGTTATCAGTGATGACGGACAAAGGCTCAATAGTTCAGGTGAGCGAGCCGGGCATATCCAGCGCGGCTGACAGTATCGACATAAGCCATAGGTTATTTGGTGATGCAATAGAGGACGCGCAATACAAGCAGATAACAAACGACTTGGTGATCTTAACTGAGTACAGCGAACCATTTGTCGTAATAAAGAAAAGCCCAGACCTATTTGAAGTTAAAGATATTCCCAATCTGGAAGTGCCAAAGGCTGAATATTTAGATAAGTTTGACGCCGGAACAAGTCGATGGGAGCAAGTACTAATAACTTTTGAAGGTGTCGAAAATGGTGACGTGTTTACGATTGGTATATCAACCGCAGCAAATACACTGACAAGTACCACAAACTTTATATATGACGTAACAACAGAACCACTGGACGGCAGTACAACAAATGCTGGTGAAAATGCTGATGCAATGGCAAACAATCTAGGCTCAGCGCTTGGTGCTACGGCAAAAGCGGTTTATGAAGTAACACCAAGGCAGGTGATCAGAGAATCTGACGGCTCACTGGTAAGTGTAAGCCTACGCACATTTGCGGGTATCGAGCTAACAAGAACAACCGCAGTGAAGCACAAACCAATGTTTTGTGTATCAAAGGCTCGACATGAATCCCGCATAAAGTGCAAGCCAATTAAGCAACCTAAAGCATTGTCGGCAGCAGAAGAGCAGCCAAGCTGGGATACTAACAGGGGCTTTCCGTCAGTGGCGGGTGAGTTTGGGGGAAGGTTTGTTTTGGCTGGTACAAGCTATCAACCGGAAACAATTTGGATGAGTCGGATTTATCAGTATTACGATTTCACACCGGACGCAACACCAGTAGCAACCAGCCCAATAGAGGTAACACTGGCAACTGAAAAGGTATCGCGCATCACTGGGATTATTGATTCTAGACGACTGACCATATTCACAAACAAAACCGCATACATTCTTGGCGGTGCTGGTGAAGACGTAATAACGCCAGATACGGTTCGGGCTCAGAATATCAACATTCAAGGCTCTAAACTAATTCGCCCAGAATCGCTTGATGATGCAATTTGTTATGTGCAGCAATCAGGCGCAGAGCTTAACAGTACAAGCTATGAGTTCACGCGTGACGCTTACATTACCTCTCAAAGTTCTATTTATTCCGCGCACTTACTGAAAGATGTTAGACAGATGAGTAAGACGCTGTCAGATAAGCAATTCAACGCTGAGTATCTAACCTGCCTAAACGTAGACGGAACAATGGCGAACTTCTCAAGCTTGAAAGAGCAAGAGCTAAGAAACTGGACGGAGTTTACAACTCAGGGCGAAGTGGTTGATCTGGTAGGTGTTCGAGCAAACAACTTTGCTTTAATTCGCAGGGGTATTGACGGGAAGGAAATCATAACTCTTGAGAAGATGGCGACAGAGGCGAGCTATTGCGATCAGGCGCAGGATTATTTCTCAAGCGTACCGTTCGATAAGATTGGCGGCTTTCAGCATTTGATTGGCGAAACGTTGGTGGCAATTGCTGACGGTTACGACTTTGATTTGGTTGTTGATTCTAGCGGGTATGTGACATTCCCATTCAAAGCGAGTAAAGCAACGGTTGGCTTACCATTTGATTTTGAAGTTGAACCAATGCCAGTGAACGTTGATTTTCAGAGCGGCTCGATTGTTAACACTCGCAAGCGAATAAATCAGGCAAGAGTTTCAGTACTAAATAGTCGAGACGTTACGCTGGAGTATGCAGGGCGTGATTATGTAATTGCCGACCGTCATGTTGGCTTTAAGCTTGGCGAACCACCGCAACCATATACAGACGTTAAAACATTGCGTTTAACTGGATGGATTAATCAGGGTAGTGTTAAGATTAAATCAAACCGCCCAGTAGGTGTAACCGTGCTAGGGCTTGAAATGAAAACCAGAGCTAAGGGGTGA

Genome Context

Tertiary structure

PDB ID

586081cccef8d1efa13a779340a21428a9bb4015a24f0a732ea5b6f1b8af85f3

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,7992

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence