Protein

View in Explore

Genbank accession

YP_007518382.1 [GenBank]

Protein name

tail fiber protein

RBP type

Evidence GenBank

Probability 1,00

Evidence Phold

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,87

Protein sequence

MANNLSMPRFKAFGQDGKPLAFGRVYLYYPRTSEKKPGYTDSTANVELQNPVILDANGEAAIFLDGAYKIILRDKNDVLQWTVDNYNTDYFSSTNVSITPQANKVPLAGSTGVITPGWIDGLIAVYNDVAVSKGDIVLLKQKDAEHDTNISVLQTVTGDNADGITQLSIDVQNLKGASASLVKGYATLAALNADLVPEDGTLADVTNDPDTNNNGRYRKSGATGTGSWVKTNYSEWSTLWLEMNRLNDFVYDLAIYNYNKTQEELEIVPIVMDEANKMALGFYSDTGELWAAGIERIEATGKAVQPVVVNENGDIAIGIESETGQTMMDPHYSTIMYGVKKVGIFPDEFNVKDGYVYAIVDEDKKIAFGIKDDGSLVGSGLTFQTAPVEKGDKQSIDMEHNHFIFSGQSLSVGATGKPVISTSQPYDNLTFDGGPRSDLDELTGFKPLVEDENSPAPDGGTNRGETCCSGAANFTTHLIESEDGIAYDQQGYAIVSSTVGHGGYRIDQLYKGSAWYDYYTAHVQAGFDLSQAQGKTYAVQALGWIQGENDQFDNSKARLAYKNDLIQYQADIEADAQAITGQTHRVPLLTYQLACYVRQGYRNVTLAQLDCHKESQDIYLVTPMYHVPYATDAVHLTNLGYLWLGHYFGKVYKKVVFDGIEWEPVRPKTITQQGAVVLIDFFVPDPPLQLDTSTLGLATDYGFAAYDDSGDIDVLSVELVGQTRVKLTLASAPGAGGGIRYGLDYIGTGLTHNNGGSGNLRDSAPEYFTYAGTDYPLYNWCVMFDELI

Physico‐chemical properties

protein length:	788 AA
molecular weight:	86129,79160 Da
isoelectric point:	4,51418
aromaticity:	0,10533
hydropathy:	-0,28680

Domains

Domains [InterPro]

DC_2149
ATT
85–230

DC_2149 DC_0547

SSF52266
STR
400–654

SSF52266

IPR036514
STR
402–660

IPR036514

IPR005181
ENZ
499–652

IPR005181

YP_007518382.1

1 788

Architecture

ATT

STR

ATT 85-230 | STR 270-776 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_2149	ATT	DC_2149	85	230	Novel HMM	DC_2149	N-terminal	Low	Positional only	15 proteins / 15 hits
DC_0547	STR	DC_0547	270	776	Novel HMM	DC_0547	Central	Low	Positional only	72 proteins / 72 hits
SSF52266	STR	SSF52266	400	654	Merged direct domain	SSF52266	Central	Low	Positional only	227 proteins / 227 hits
IPR036514	STR	IPR036514	402	660	Merged direct domain	SGNH hydrolase superfamily	Central	Low	Positional only	180 proteins / 180 hits
IPR005181	ENZ	DC_0247	499	652	InterPro cluster	Sialate O-acetylesterase domain	Central	High	Text match	78 proteins / 79 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

YP_007518382.1

1 788

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	698	698	0,7314
Central domain	699	777	80	0,3636
C-terminal	778	788	10	0,5428

Note: Constraints were applied during segmentation.
Fixed 173 C-terminal predictions appearing before Central domain|C-terminal too short, adjusted boundary

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-698

Central
699-777

C-terminal
778-788

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Vibrio phage VvAW1 [NCBI]	1168281	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Vibrio vulnificus [NCBI]	672	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Vibrionales

Coding sequence (CDS)

Genbank protein accession

YP_007518382.1 [NCBI]

Genbank nucleotide accession

NC_020488.1 [NCBI]

CDS location

range 36287 -> 38653
strand -

CDS

ATGGCTAACAATTTATCAATGCCTAGGTTTAAAGCGTTTGGTCAGGATGGTAAACCACTGGCCTTTGGTCGGGTGTACCTTTACTACCCAAGAACAAGCGAAAAGAAACCAGGTTACACAGACTCAACAGCTAATGTTGAGTTGCAAAATCCGGTGATCCTGGATGCGAATGGAGAGGCTGCAATATTCCTTGATGGCGCATACAAGATTATTCTTCGTGATAAAAACGATGTGCTTCAGTGGACGGTTGATAACTACAACACCGACTACTTTAGCTCGACAAATGTTTCAATCACGCCACAGGCAAACAAGGTTCCACTTGCAGGTTCAACTGGTGTTATTACACCTGGCTGGATAGATGGGCTTATCGCTGTTTACAACGATGTTGCAGTATCTAAAGGCGACATCGTTTTACTGAAACAAAAAGATGCTGAGCACGATACAAATATCAGTGTTTTGCAAACTGTAACCGGTGATAACGCGGATGGTATTACTCAGCTTTCCATTGATGTGCAAAATTTAAAAGGCGCCAGCGCCAGCTTGGTGAAAGGATATGCAACGCTTGCAGCCCTTAACGCTGATCTGGTTCCTGAAGATGGCACGCTTGCTGATGTAACGAATGATCCTGACACGAATAACAATGGCCGATACCGTAAATCAGGTGCCACTGGTACAGGTTCATGGGTTAAAACAAACTACAGCGAGTGGTCAACTCTATGGCTTGAAATGAACCGCCTGAATGACTTTGTTTATGATCTGGCTATCTACAATTACAACAAGACTCAAGAAGAACTTGAGATAGTGCCTATTGTTATGGATGAAGCAAATAAGATGGCGCTTGGGTTTTATTCTGACACTGGCGAGCTTTGGGCGGCAGGAATTGAGCGCATTGAGGCAACAGGAAAGGCGGTTCAGCCAGTTGTTGTCAATGAAAATGGTGATATTGCCATTGGCATTGAGTCAGAAACAGGCCAGACAATGATGGACCCGCATTACTCAACCATTATGTATGGTGTGAAAAAGGTCGGCATCTTCCCTGATGAGTTCAATGTTAAAGATGGTTATGTGTATGCCATTGTTGATGAGGATAAAAAAATAGCTTTTGGCATTAAGGATGATGGTTCGCTTGTTGGAAGTGGGCTCACATTCCAAACAGCGCCGGTTGAGAAAGGAGATAAGCAAAGCATTGATATGGAGCACAACCACTTTATTTTTAGTGGTCAATCTCTTTCGGTTGGCGCGACAGGTAAGCCGGTGATTAGCACTTCTCAGCCATACGACAACCTAACCTTTGATGGTGGACCAAGGTCTGATCTTGATGAGCTCACAGGATTCAAGCCGTTGGTGGAGGATGAAAATAGCCCGGCGCCAGATGGTGGTACAAACCGTGGTGAAACATGCTGTTCAGGTGCGGCAAACTTCACTACTCACCTTATCGAGTCTGAAGATGGTATTGCTTATGATCAGCAGGGTTATGCAATCGTTTCTTCCACAGTTGGTCATGGCGGGTACCGTATTGATCAGCTGTATAAGGGTAGTGCTTGGTATGACTACTACACGGCACACGTTCAGGCTGGTTTTGATTTATCACAGGCTCAAGGTAAAACCTATGCTGTCCAGGCGCTTGGGTGGATACAGGGCGAGAACGATCAGTTTGATAATTCAAAGGCAAGGCTGGCATACAAGAATGACTTAATTCAGTACCAAGCAGACATTGAGGCGGATGCGCAGGCGATCACCGGGCAAACTCACAGGGTTCCTTTGCTTACTTATCAGCTTGCCTGTTATGTTCGCCAGGGCTATAGAAATGTAACTCTTGCTCAGCTGGACTGTCATAAGGAAAGCCAGGACATTTACCTGGTTACGCCAATGTATCATGTGCCTTATGCTACTGATGCAGTTCACCTTACAAACCTTGGATACCTATGGCTTGGTCATTACTTTGGCAAGGTTTACAAAAAGGTAGTTTTTGATGGTATTGAGTGGGAGCCTGTAAGGCCAAAGACAATCACTCAACAGGGCGCAGTTGTTCTTATCGACTTCTTTGTTCCAGATCCACCATTGCAACTGGATACTTCAACGCTTGGCCTGGCCACCGATTATGGTTTTGCCGCTTATGACGATTCAGGTGATATTGATGTTTTGTCAGTGGAGCTTGTTGGGCAGACTCGCGTTAAGTTAACCCTGGCAAGTGCGCCAGGTGCAGGTGGCGGTATTCGATATGGTCTTGATTATATCGGTACCGGCTTAACTCACAATAACGGTGGCAGCGGAAACTTGCGTGACAGCGCACCAGAATACTTTACTTATGCAGGCACAGACTACCCATTGTATAACTGGTGTGTCATGTTTGATGAATTGATCTAA

Genome Context

Tertiary structure

PDB ID

d132f57725ff649fd44ea28a33429d329ce78116ba8026e8617230a6e1f50ac7

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,7750

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence