Protein

View in Explore

Genbank accession

YP_009784184.1 [GenBank]

Protein name

tail fiber protein

RBP type

Evidence UniProt/TrEMBL

Probability 1,00

Evidence GenBank

Probability 1,00

Evidence Phold

Probability 1,00

TSP

Evidence DepoScope

Probability 1,00

Protein sequence

MGFDTTLPTPIFGVSTIPPVARPDGYCTKQVNWRNDPQEKLTVRPSFKSGLQGYSDRPAWPGPVYSSKDFVTYRDGQRLEVAVGADHIDNKLYVMQRKGFAPFQEIKTVTTDPKWFNGMEADLGINDVDDLLFIWNKNKVMKSVVVNNQNPLKYTQAALFNVISALNYGESVSVQVKRNDVALMTATWTVPGLTGTNTADADAKRATTRVATELTNLINAYSGTYRLIAQNFGSNVYVRPNSSVGTAWGNNDTLTLMVASGRGDDSIVVKNYQTGNISGLPKYCVPDVIRKIQPDPTSQSGVYYLRSAPLDGTTASIMTEVIWVEAYNPAEETSFEAGSNFYTLNIDTNTLEAFNLERRAIGDNISNPPRDFIGKKVEHIDMFQDRLLILAGNKMNLSKTRDFKQFWRNSATNLLLTDPTDVGTSGNNSTLKHAVYHNKDLLVFAGDKQFKISGQQPITPQTAALPITTANECNLDVSPVLMGSYVYYAVNHGSSGGVRRFEIQVDTNMDTSVPISDHIIGMIPGRITLLVANPNQTMLIVRSNACKPNEFFVFEEQRWGDSRIMSWCTWRLRDGVTINNIDIANETITVRYNTWKYMHCSLKGGRTWPETEVRMDELSVLLRGTDGMVEVPKLYNIEHPDFRLVLGTKYSGNTPLRNTLTQLDWTLAGERNGNWLLDVGGTENANVYAGYKYEAVYEPTRPYERDREGNVRTTDRLRVAHYFLELSNTYEIRRRIISEHWDIPDDEFTSRNAATQQYIDEVKPFTGQWRTSVDMNADDCTVEFINDSPYAATIASISYRAQQYSTKRRR

Physico‐chemical properties

protein length:	810 AA
molecular weight:	91228,48270 Da
isoelectric point:	6,04201
aromaticity:	0,09877
hydropathy:	-0,44741

Domains

Domains [InterPro]

DC_0058
STR
1–810

DC_0058

IPR058003
TTP
5–809

IPR058003

YP_009784184.1

1 810

Architecture

STR

STR 1-810

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0058	STR	DC_0058	1	810	Novel HMM	DC_0058	Central	Low	Positional only	618 proteins / 618 hits
IPR058003	TTP	DC_0684	5	809	InterPro cluster	Tail tubular protein gp12	Central	High	Text match	1810 proteins / 1902 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

YP_009784184.1

1 810

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	624	624	0,7045
Central domain	625	799	176	0,2263
C-terminal	800	810	10	0,9694

Note: Constraints were applied during segmentation.
Fixed 22 C-terminal predictions appearing before Central domain|C-terminal too short, adjusted boundary

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-624

Central
625-799

C-terminal
800-810

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Vibrio phage JSF7 [NCBI]	1292086	Uroviricota > Caudoviricetes > Autographivirales > Tawavirus JSF7 >
Host	Vibrio cholerae [NCBI]	666	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Vibrionales

Coding sequence (CDS)

Genbank protein accession

YP_009784184.1 [NCBI]

Genbank nucleotide accession

NC_047741.1 [NCBI]

CDS location

range 32446 -> 34878
strand -

CDS

ATGGGATTCGATACTACCTTGCCCACGCCTATATTTGGCGTGAGCACTATACCGCCAGTTGCAAGACCTGATGGATACTGTACCAAACAAGTCAACTGGCGGAATGACCCACAAGAAAAGCTAACAGTAAGACCTAGCTTTAAGTCTGGGTTACAAGGCTATAGTGACAGACCAGCATGGCCTGGCCCAGTGTACAGCAGCAAAGACTTTGTTACATACAGAGACGGGCAGCGCCTAGAAGTAGCAGTAGGTGCTGACCACATAGACAACAAGCTGTACGTGATGCAAAGGAAAGGCTTTGCGCCTTTCCAAGAAATAAAGACAGTAACGACAGACCCTAAGTGGTTCAACGGTATGGAAGCTGACTTGGGCATCAATGACGTAGATGACCTGTTGTTCATTTGGAACAAGAACAAGGTGATGAAGTCAGTTGTAGTCAATAACCAAAACCCGCTGAAGTACACACAAGCTGCTCTATTCAACGTAATATCTGCACTAAACTACGGGGAATCGGTGTCAGTGCAAGTTAAGCGTAATGATGTGGCGCTTATGACAGCTACATGGACTGTGCCGGGTCTGACAGGTACTAACACAGCAGATGCTGACGCTAAGCGTGCGACAACAAGAGTGGCAACAGAGTTAACAAACTTGATTAACGCATACTCTGGGACTTATAGACTAATCGCACAGAACTTTGGCTCAAACGTGTATGTTAGACCAAATAGTAGCGTGGGTACAGCATGGGGCAACAATGACACACTAACACTAATGGTGGCCTCAGGAAGAGGCGACGACTCCATAGTAGTAAAGAACTACCAGACAGGTAACATATCTGGCTTGCCAAAATACTGTGTTCCAGATGTAATACGCAAGATACAGCCTGACCCAACAAGTCAGAGTGGCGTGTACTACTTGCGCAGTGCACCACTGGACGGAACAACAGCTAGTATAATGACAGAAGTGATATGGGTTGAGGCGTACAATCCAGCAGAAGAAACATCATTTGAAGCTGGTAGTAACTTCTACACACTTAACATAGATACTAACACGCTAGAAGCTTTCAACTTGGAACGCAGAGCTATAGGGGATAACATAAGCAATCCGCCTAGAGATTTCATAGGTAAAAAGGTGGAACATATCGACATGTTCCAAGACCGCCTGCTAATACTAGCAGGGAACAAGATGAATCTCAGCAAGACCAGAGACTTTAAGCAGTTCTGGCGTAACAGTGCTACAAACCTGTTGCTCACTGACCCTACTGACGTTGGTACGTCTGGTAACAACAGTACACTAAAACATGCTGTGTATCACAACAAAGACTTGCTAGTCTTCGCTGGAGACAAACAGTTCAAGATTAGCGGCCAACAGCCTATAACGCCACAGACAGCGGCGCTACCTATAACAACAGCTAACGAGTGCAACCTAGACGTGTCTCCAGTGTTGATGGGTAGCTACGTGTACTACGCAGTCAACCACGGCTCTAGTGGTGGTGTGAGACGCTTTGAGATTCAGGTGGACACTAACATGGACACCTCTGTGCCAATAAGCGACCACATCATTGGTATGATACCGGGGCGTATTACGCTGTTAGTCGCTAACCCGAACCAAACGATGCTCATAGTGCGCTCAAACGCCTGTAAGCCTAACGAGTTCTTTGTGTTTGAAGAGCAACGTTGGGGAGACTCGCGTATTATGTCTTGGTGTACATGGCGCTTGAGAGATGGTGTTACCATCAACAACATCGACATCGCCAACGAGACAATCACTGTACGCTATAACACGTGGAAGTACATGCACTGTTCATTGAAAGGTGGGCGCACATGGCCTGAGACGGAAGTGCGCATGGACGAATTGTCAGTGCTACTGCGTGGTACAGATGGAATGGTGGAAGTACCTAAGCTGTATAACATAGAGCACCCAGACTTTCGTCTGGTGCTCGGCACAAAGTACAGTGGTAACACTCCGCTACGTAACACGTTGACACAGTTGGACTGGACACTAGCAGGTGAGCGCAATGGTAATTGGTTGCTAGATGTGGGTGGTACTGAGAATGCTAACGTGTACGCTGGGTACAAGTACGAAGCTGTATACGAGCCTACTCGCCCGTACGAACGAGACAGAGAAGGTAACGTACGCACAACAGATAGACTGCGTGTAGCACATTACTTCTTGGAACTAAGCAACACGTACGAGATTCGCCGTCGCATTATCTCAGAGCACTGGGATATACCTGATGACGAGTTCACTAGCCGCAACGCAGCCACACAGCAATACATTGACGAAGTGAAGCCATTCACTGGTCAATGGCGCACCAGTGTGGACATGAACGCTGACGACTGTACTGTGGAGTTTATCAATGACTCTCCTTATGCAGCAACGATAGCTAGTATTAGTTATCGTGCTCAGCAATACTCAACTAAACGGAGACGCTAA

Genome Context

Tertiary structure

PDB ID

f552ecd3fa2dd79991b5fb5c1237d538ccf8744775db5d330513b149fef16fdd

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,8718

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence