Protein

View in Explore

Genbank accession

VFR12038.1 [GenBank]

Protein name

hypothetical protein

RBP type

TSP

Evidence RBPdetect

Probability 0,83

Protein sequence

MKTYPYDPIPPAAHPSKMMTFNPKNTSGMNSAMCNYSYSSFRPVDTGNGLNRARFFTGVVDAGSTINDTMPTKNRYYATFLDYAINYSGVGGLFSSDTEVRLTYANLNRPDYIDLTKLITDPSTPIYQLKYTLQSTGESWTEDLSTRLINIDSKTINFELTLTATTKTNPSVRFSHARTADGISFVGTAQVVIGLNGVTGSGHDWTALITTPGGVSTYAGIAVNYGRAHHSATFMHRISVLVARTAGRTWTPLTATADSVLETVIGC

Physico‐chemical properties

protein length:	267 AA
molecular weight:	29018,26560 Da
isoelectric point:	8,45401
aromaticity:	0,10112
hydropathy:	-0,19251

Domains

Domains [InterPro]

No domain annotations available.

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

No domain annotations available.

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

VFR12038.1

1 267

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	10	10	0,0064
Central domain	11	207	198	0,1783
C-terminal	208	267	59	0,9948

Note: Constraints were applied during segmentation.
Fixed 7 C-terminal predictions appearing before Central domain|N-terminal too short, forced to 10 residues

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-10

Central
11-207

C-terminal
208-267

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Salmonella phage SPFM9 [NCBI]	2528679	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	No host information

Coding sequence (CDS)

Genbank protein accession

VFR12038.1 [NCBI]

Genbank nucleotide accession

LR535907 [NCBI]

CDS location

range 86820 -> 87623
strand -

CDS

ATGAAAACGTATCCTTACGATCCAATTCCACCGGCGGCGCACCCATCCAAGATGATGACGTTCAATCCGAAAAACACGTCAGGGATGAACAGCGCGATGTGCAACTATTCATACAGTTCGTTCCGCCCAGTGGATACAGGTAACGGCTTAAACCGCGCAAGATTCTTTACTGGCGTGGTGGATGCAGGTTCAACGATTAATGACACGATGCCGACAAAGAATCGTTATTACGCCACGTTCCTTGACTATGCGATTAACTATTCCGGCGTGGGTGGTTTGTTTAGTTCCGACACAGAAGTGCGTTTGACTTACGCTAACCTGAACCGTCCTGACTATATCGACTTGACGAAACTGATTACCGATCCGAGTACGCCGATTTATCAGCTGAAATACACCTTGCAGTCGACCGGCGAGTCGTGGACTGAGGATTTGTCTACCCGTCTGATTAACATCGATTCTAAAACGATCAACTTTGAGCTGACGCTAACCGCGACAACAAAGACTAATCCATCGGTGCGTTTCAGCCACGCGCGAACAGCGGACGGTATTTCGTTCGTGGGAACTGCACAGGTTGTTATTGGCTTGAACGGCGTTACTGGTTCCGGCCATGACTGGACGGCACTTATTACCACTCCAGGCGGCGTGAGCACGTATGCGGGAATCGCGGTTAACTACGGACGTGCCCATCACTCGGCCACGTTCATGCACCGTATTTCTGTACTCGTCGCACGCACCGCAGGGCGAACGTGGACACCTTTAACCGCAACAGCGGACAGTGTGCTAGAAACGGTAATTGGGTGTTGA

Genome Context

Tertiary structure

PDB ID

f908e7401ee641b90963de442fd47f38e6a43e75094b976df73ac207c15485ea

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,2644

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence