Protein

View in Explore

Genbank accession

QZI87535.1 [GenBank]

Protein name

hypothetical protein

RBP type

TSP

Evidence DepoScope

Probability 1,00

Protein sequence

MALLAWYPLHKDTNDWSGFENHAHGANSTSGNGVIGGNVLESTLHIDKNEQLDQVLSGDEATLCFWVQGDSDGSDWADIVSYQPSTGAATVRFERGNIDDDVNQYDYWCNWFNGATSGNGVVTTNYRVGPIADWHHVTIRRTPTRVSIYINAEFDRMFNVSNDISPPTGAVTLIAHTSARVRLQDVRFYDNAISDREMKDIALGTVAKWNMNGANEFLPRNSTRNPDFLPGAAYVNGTWDTELNKDAILCESWSSGYNGGVPDPEIGYHAKWVNIDGKAVMRHINDNQRFGYGDRWMGISCGHGNLVDYGLEVGDRITVSWTQRSTHTGATFNVGFYTRRADNSTKWESGKITHTQNVAGEWERKSYTTTVGSDTDVNRSITIYFYGHYSVEGATMEAKDIQFECHRDVANPYRKFSADDVIVSDMTGLENNALLEYDYAPSYVENDTERGSGHFHFPSSGRTGWNDIRRHIRTTANHMSRQVSVAFWARTTQGDNRNPFMKYDDGIYTEGSQVSGGAILLCLEGNRFRMHGWGSSDPICSTHTNDGEWHHYVWTFDYDTRLANMFVDGVREVANSLDSEGVIQPLENYVWTIGANMHPYSSTTGATFNGDITEVSIHGKALSVDEVSRLYNVKASVDNLGNAHAVEFQEGWDHDGENTLMIRSSSSGNTGTYLNGVKVGNIDSWRGINFCIFDQTMTLRAFGGLDTYSGTTAQYYEFDGEVIVASANDVPDSAQAAANHLKDAIDRMEDGWLMTAARCDASTTQDGTLREYFERYFGVTENHAIASRGTWGFIGIKNGELLTQFSDGRRYDASSGSISYYTKEYAATGGFHKPQVTKDGVMHAGEIVESYYRPGLLDYSTWTLETTGSQPGFDVYGSNAIIAVAKNPWGEDDVMWRGYKEDSTTQSGGFYAHDVNMNPAKHHRFTLWMRRSVSGNGNWYVGCNGSRTNNLSGSANTNPYFDYGTNYFDNEWVLLVAYVYANGTTDNDTYIDHGIYDVDGNRLSSINTNYAMGDGATENYMRAFMYQSSATDTEQFFYRPRIDVMDGSQPTLEELLSGSESMPLLPSYGEDVDYNGNVSFGANGDAMFNEFNEV

Physico‐chemical properties

protein length:	1094 AA
molecular weight:	121964,75220 Da
isoelectric point:	4,80360
aromaticity:	0,12157
hydropathy:	-0,56152

Domains

Domains [InterPro]

DC_2221
ATT
1–43

DC_2221 G3DSA:2.60.120.200 DC_0004 G3DSA:2.60.120.200

IPR013320
STR
54–207

IPR013320 IPR013320

PF13385
LEC
54–197

PF13385 PF13385

QZI87535.1

1 1094

Architecture

ATT

STR

ATT 1-43 | STR 44-229 | STR 285-650 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_2221	ATT	DC_2221	1	43	Novel HMM	DC_2221	N-terminal	Low	Positional only	3 proteins / 3 hits
G3DSA:2.60.120.200	STR	G3DSA:2.60.120.200	44	229	Merged direct domain	G3DSA:2.60.120.200	Central	Low	Positional only	153 proteins / 153 hits
IPR013320	STR	IPR013320	54	207	Merged direct domain	Concanavalin A-like lectin/glucanase domain superfamily	Central	Low	Positional only	237 proteins / 237 hits
PF13385	LEC	DC_0004	54	197	InterPro cluster	PF13385	C-terminal	Medium	Text match	334 proteins / 417 hits
DC_0004	STR	DC_0004	285	436	Novel HMM	DC_0004	Central	Low	Positional only	58 proteins / 58 hits
IPR013320	STR	IPR013320	413	632	Merged direct domain	Concanavalin A-like lectin/glucanase domain superfamily	Central	Low	Positional only	237 proteins / 237 hits
G3DSA:2.60.120.200	STR	G3DSA:2.60.120.200	454	650	Merged direct domain	G3DSA:2.60.120.200	Central	Low	Positional only	153 proteins / 153 hits
PF13385	LEC	DC_0004	472	628	InterPro cluster	PF13385	C-terminal	Medium	Text match	334 proteins / 417 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

QZI87535.1

1 1094

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	11	11	0,0007
Central domain	12	246	236	0,5264
C-terminal	247	1094	847	0,5545

Note: Constraints were applied during segmentation.
Fixed 32 C-terminal predictions appearing before Central domain

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-11

Central
12-246

C-terminal
247-1094

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Vibrio phage 6E35.1a [NCBI]	2859340	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Vibrio crassostreae [NCBI]	246167	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Vibrionales

Coding sequence (CDS)

Genbank protein accession

QZI87535.1 [NCBI]

Genbank nucleotide accession

MW824377 [NCBI]

CDS location

range 178164 -> 181448
strand +

CDS

ATGGCATTATTAGCATGGTACCCGCTCCACAAAGACACCAATGACTGGAGTGGGTTTGAGAATCACGCACATGGTGCAAATTCGACAAGCGGAAATGGTGTGATTGGGGGCAATGTACTTGAGAGTACATTGCACATCGATAAAAATGAACAACTTGATCAAGTTCTCTCAGGCGACGAGGCTACATTGTGTTTCTGGGTGCAAGGTGATTCTGATGGGTCTGATTGGGCTGACATTGTTAGCTATCAACCATCGACTGGCGCAGCAACGGTGCGTTTTGAGCGTGGTAATATTGATGATGATGTCAATCAATATGATTACTGGTGTAACTGGTTCAATGGCGCAACTAGTGGTAATGGGGTTGTTACAACCAATTATCGGGTCGGGCCTATTGCTGATTGGCATCACGTAACAATACGCAGAACTCCGACGAGAGTTAGCATATACATCAACGCAGAGTTTGATCGTATGTTTAACGTATCGAATGATATATCACCACCTACTGGGGCAGTGACATTGATTGCTCACACGAGTGCTCGTGTGCGATTGCAAGATGTTCGCTTTTACGACAACGCGATTTCAGATCGTGAAATGAAAGACATCGCACTTGGGACAGTTGCAAAGTGGAACATGAACGGGGCGAACGAGTTTCTACCGCGTAACAGCACGCGTAACCCTGATTTTCTACCGGGTGCTGCGTACGTCAACGGAACATGGGACACTGAACTGAACAAAGACGCGATCTTGTGTGAAAGTTGGTCAAGTGGCTACAATGGCGGCGTCCCTGATCCGGAAATTGGCTATCACGCGAAATGGGTGAATATTGACGGTAAAGCTGTAATGCGCCATATCAATGATAATCAGCGTTTTGGTTACGGGGATCGTTGGATGGGTATCTCATGCGGTCATGGGAATTTAGTTGATTATGGTCTTGAAGTTGGCGACCGAATCACAGTCTCATGGACGCAGCGTTCAACTCACACTGGCGCGACGTTCAACGTTGGATTTTACACGCGTCGAGCTGATAACTCTACAAAGTGGGAATCTGGTAAGATAACACACACGCAAAACGTTGCAGGTGAATGGGAACGCAAATCGTATACGACGACTGTTGGCTCTGACACTGATGTGAATCGTTCTATTACGATTTACTTCTATGGTCATTACTCAGTCGAGGGCGCGACGATGGAAGCGAAAGACATTCAATTTGAATGCCATCGTGACGTGGCAAACCCATATCGCAAATTCAGTGCTGACGATGTTATCGTCTCTGATATGACTGGTCTAGAGAACAATGCTCTTCTTGAATACGACTATGCGCCATCTTATGTTGAGAACGACACTGAACGCGGTTCTGGTCATTTTCACTTCCCGTCTTCGGGACGTACTGGTTGGAATGATATTCGAAGACATATTCGAACAACTGCGAATCACATGTCGCGTCAAGTATCAGTTGCATTCTGGGCTAGAACAACACAAGGTGATAATCGTAACCCATTCATGAAATACGATGATGGCATTTATACTGAGGGAAGTCAAGTCTCTGGTGGTGCTATTTTGCTGTGTCTTGAAGGCAATCGATTTAGAATGCACGGTTGGGGTTCAAGTGACCCGATTTGTTCGACGCATACTAATGATGGCGAATGGCATCACTATGTATGGACGTTTGATTACGATACGCGATTAGCTAACATGTTTGTCGATGGTGTGCGTGAAGTTGCAAACTCGCTTGATAGCGAAGGCGTGATTCAGCCGCTAGAAAACTACGTATGGACTATTGGCGCGAATATGCACCCTTATTCTAGTACGACTGGTGCTACGTTCAATGGCGATATTACTGAAGTTTCGATTCATGGTAAAGCACTGTCAGTCGATGAAGTTTCTCGTTTGTACAACGTGAAGGCGTCTGTTGATAATCTAGGCAATGCACATGCAGTAGAGTTTCAAGAGGGTTGGGACCATGACGGTGAAAATACGCTGATGATTCGAAGCAGCTCAAGCGGCAATACTGGCACGTATTTGAATGGTGTTAAGGTGGGTAATATTGACTCTTGGCGCGGTATTAACTTCTGTATATTCGATCAAACAATGACGCTTCGTGCGTTCGGTGGTCTTGATACGTATTCTGGAACAACGGCTCAATATTACGAGTTCGACGGTGAAGTGATTGTCGCTTCGGCAAACGATGTTCCTGATTCAGCACAAGCCGCTGCGAATCATCTAAAAGACGCGATTGATCGAATGGAAGATGGTTGGCTGATGACTGCTGCTCGATGTGATGCAAGTACGACGCAAGATGGTACACTGCGTGAATATTTCGAACGATACTTCGGGGTCACTGAGAATCATGCGATTGCGTCTCGCGGTACATGGGGTTTCATCGGCATCAAGAATGGCGAGTTGTTGACTCAGTTCTCTGATGGACGTCGTTATGATGCTTCAAGTGGTTCAATTTCGTACTACACGAAAGAATACGCTGCGACTGGTGGATTTCATAAGCCGCAAGTTACTAAAGATGGTGTTATGCACGCAGGTGAGATAGTCGAGAGCTATTATCGTCCGGGATTGCTTGACTATTCAACATGGACATTAGAAACCACAGGAAGTCAGCCGGGATTTGATGTGTATGGCTCTAATGCGATCATTGCAGTTGCGAAAAACCCATGGGGTGAAGACGACGTGATGTGGCGCGGTTATAAAGAAGATTCGACGACTCAATCAGGTGGATTTTATGCACATGACGTTAATATGAACCCTGCGAAGCATCATAGATTTACTCTGTGGATGCGACGTAGCGTGAGTGGTAACGGCAACTGGTATGTTGGGTGTAATGGGTCAAGGACAAATAACTTGAGTGGATCTGCAAACACGAATCCATACTTTGATTACGGTACAAATTACTTTGACAATGAATGGGTGCTTCTTGTTGCTTACGTATATGCAAACGGAACGACTGACAACGACACGTATATTGATCATGGCATATACGATGTTGACGGGAATCGTTTGAGTAGCATTAATACGAACTACGCAATGGGTGACGGTGCAACTGAAAACTACATGCGTGCGTTTATGTATCAAAGCTCTGCTACTGACACTGAACAGTTCTTTTATAGACCCCGAATCGACGTAATGGACGGCAGTCAACCGACACTAGAAGAGTTGCTTTCTGGCTCTGAGTCAATGCCCCTGCTTCCGAGTTACGGTGAAGATGTTGACTATAATGGGAATGTGAGCTTCGGTGCAAATGGTGACGCTATGTTCAATGAGTTCAATGAGGTATAA

Genome Context

Tertiary structure

PDB ID

9d5b2f275df4697cb3d9717748609feb83f7d598cbeb4016af77b5140642a480

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,2684

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence