Protein

View in Explore

Genbank accession

CAL9975126.1 [GenBank]

Protein name

tail protein

RBP type

TSP

Evidence DepoScope

Probability 1,00

Protein sequence

MPVTKPIQTSFNMGVLSPEMMARTDIEQYYRGAKTIKNGVVLPQGGITKRNGFQYLATLGTKSNASYFNNAGGLVRVLPYLSNEETFLVVISAAGRLSVMTEQGSIVQVSEPSVSGAADSIDISHRLFGDAIEDAQYKQITNDLVILTEYSEPFVVIKKSPTLFEVKDIPNLEVPKAEYLDKFDAGTSRWERVLITFEGVENGDVFTIGISTAAKTLTSTTNFIYDVTTEPLDGSTTNAGENADAMANNLGSALGATAKAVYEVTPRQVIKESDGSLVNVNLRTFAGIELTRTTTVKHKPMFCVSKARHESRIKCKPIKQPKTLSAVEEQPSWDANRGFPSVAGEFGGRFVLAGTSYQPETIWMSRIYQYYDFTPDATPVATSPIEVTLATEKVSRITGIIDSRRLTIFTNKTAYILGGAGEDVITPDTVRAQNINIQGSKLIRPESLDDAICYVQQSGAELNSTSYEFTRDAYITSQSSIYSAHLLKDVRQMSKTLSDKQFNAEYLTCLNVDGTMANFSSLKEQELRNWTEFTTQGEVVDLVGVRANNFALIRRGIDGKEIITLEKMTTEASYCDQAQDYFSSVPFDKIGGFQHLIGETLVAIADGYDFDLVVDSNGYVTFPFKASKATVGLPFDFEVEPMPVNVDFQSGSIVNTRKRINQARVSVLNSRDVTLEYAGRDYVIADRHVGFKLGEPPQPYTDVKTLRLTGWINQGSVKIKSNRPVGVTVLGLEMKIRAKG

Physico‐chemical properties

protein length:	740 AA
molecular weight:	81422,14540 Da
isoelectric point:	5,46913
aromaticity:	0,08784
hydropathy:	-0,21338

Domains

Domains [InterPro]

No domain annotations available.

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

No domain annotations available.

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

CAL9975126.1

1 740

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	207	207	0,9053
Central domain	208	406	200	0,3616
C-terminal	407	740	333	0,0919

Note: Constraints were applied during segmentation.
Fixed 5 C-terminal predictions appearing before Central domain

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-207

Central
208-406

C-terminal
407-740

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Vibrio phage D450 [NCBI]	3105217	Viruses > unclassified bacterial viruses >
Host	No host information

Coding sequence (CDS)

Genbank protein accession

CAL9975126.1 [NCBI]

Genbank nucleotide accession

OZ195901 [NCBI]

CDS location

range 6778 -> 9000
strand +

CDS

ATGCCAGTAACCAAGCCAATACAAACCAGTTTTAACATGGGCGTGCTATCACCGGAAATGATGGCGCGCACAGACATAGAGCAATATTACAGAGGCGCAAAGACAATCAAGAACGGTGTTGTGCTTCCTCAAGGTGGTATCACAAAGCGCAACGGCTTTCAGTACCTAGCAACGCTTGGCACAAAATCAAACGCATCATATTTCAATAACGCTGGTGGATTAGTTCGCGTGCTGCCGTACCTAAGCAATGAAGAGACGTTTCTGGTTGTTATTTCTGCCGCTGGTAGGTTGTCAGTGATGACGGAGCAAGGTTCAATAGTTCAAGTGAGCGAGCCAAGCGTATCCGGTGCTGCCGACAGTATCGATATAAGTCATAGGTTATTTGGTGATGCGATAGAGGATGCACAATACAAGCAGATAACAAACGACTTGGTGATCTTAACTGAGTACAGCGAGCCGTTTGTTGTAATAAAGAAAAGCCCAACCCTATTTGAAGTTAAAGACATCCCCAATCTGGAAGTGCCAAAGGCCGAATATCTAGATAAGTTTGACGCCGGAACAAGTCGGTGGGAGCGGGTGCTAATAACTTTTGAAGGTGTCGAAAATGGTGATGTGTTTACGATTGGCATATCAACCGCAGCAAAGACACTGACAAGTACCACAAATTTTATATATGACGTAACAACAGAGCCGCTGGACGGCAGTACAACAAATGCTGGTGAAAATGCTGATGCAATGGCAAACAACCTAGGCTCAGCGCTTGGCGCTACAGCAAAAGCGGTTTATGAAGTAACACCAAGACAGGTGATCAAAGAATCTGACGGCTCGCTGGTAAATGTAAACCTACGTACATTTGCGGGTATCGAGCTAACAAGAACAACTACAGTAAAGCACAAGCCAATGTTTTGCGTATCAAAGGCTCGCCATGAATCCCGCATAAAGTGTAAGCCAATTAAGCAGCCTAAAACATTATCGGCAGTAGAAGAGCAGCCAAGTTGGGATGCTAACAGAGGCTTTCCGTCAGTGGCGGGTGAGTTTGGGGGTAGGTTTGTTTTGGCTGGTACAAGCTACCAACCAGAGACAATCTGGATGAGTCGCATTTATCAGTATTACGACTTTACGCCAGACGCAACGCCAGTAGCAACTAGCCCAATAGAAGTGACACTGGCAACTGAAAAGGTATCACGCATCACTGGGATTATTGATTCTAGACGATTAACGATATTCACAAATAAGACCGCATACATTCTTGGTGGTGCTGGTGAAGACGTAATAACGCCAGATACGGTTCGAGCTCAGAATATCAACATTCAAGGCTCTAAATTAATCCGCCCAGAATCGCTTGATGATGCAATTTGTTATGTGCAGCAATCAGGCGCAGAGCTTAACAGTACAAGCTATGAGTTTACACGTGACGCTTACATTACCTCCCAAAGCTCTATCTATTCCGCGCACCTACTGAAAGATGTAAGGCAGATGAGTAAGACGCTATCAGATAAGCAATTCAACGCCGAGTACCTAACCTGTCTAAACGTAGATGGCACAATGGCGAACTTCTCAAGCCTGAAAGAGCAAGAGCTAAGAAACTGGACAGAATTTACAACTCAGGGTGAAGTGGTTGATCTGGTAGGTGTTCGAGCGAATAACTTTGCTTTAATTCGCAGGGGTATTGATGGAAAGGAAATTATAACTCTTGAGAAGATGACGACAGAGGCGAGCTATTGCGATCAGGCGCAGGATTATTTCTCAAGCGTGCCGTTCGATAAGATTGGCGGCTTTCAGCATTTGATTGGCGAAACGCTGGTGGCAATTGCTGATGGATACGACTTTGATTTAGTTGTTGATTCTAACGGGTATGTGACATTCCCATTCAAAGCGAGTAAAGCAACGGTTGGCTTGCCATTTGATTTTGAAGTTGAACCAATGCCAGTGAACGTTGATTTTCAAAGCGGTTCGATTGTTAACACTCGCAAGCGAATAAATCAGGCAAGAGTTTCAGTGCTAAATAGTCGAGACGTCACGCTGGAGTATGCGGGGCGCGATTATGTAATCGCTGATCGTCACGTTGGCTTTAAGCTTGGTGAGCCACCACAACCATATACAGACGTTAAAACATTGCGTTTAACTGGATGGATTAATCAGGGTAGTGTTAAGATTAAATCAAACCGCCCAGTAGGTGTAACCGTGCTAGGGCTTGAAATGAAAATCAGAGCTAAGGGGTAA

Genome Context

Tertiary structure

PDB ID

3d06342776bf1903688640bdb14dd587c4259572a64115dadf3e42b09f894f54

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,7964

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence