Protein

View in Explore

Genbank accession

AUR91769.1 [GenBank]

Protein name

hypothetical protein

RBP type

TSP

Evidence DepoScope

Probability 1,00

Evidence RBPdetect

Probability 0,80

Protein sequence

MSSLNDLLAGATQQESGTGVAESGAVVIGSTTAGESTEIKTSAGDTVVTVTDDGGFQLSESQVVRQIVNAINTGDDDNDMKLPTVQAVMTFLAGAVTATIDFKELTSKAAFDTFISDGGFIPTIAFVTDTTPFDYTDNTGHTGTDLTWMFVVCVEEDSVITTSMINNSDISSLTGGEIASIIAATEDVNFVNDSDLSRIRNLPDNTTDALGGKVDSEAGKGLSQNNFTDSQRNKVDNSPSDTASELSTKADNSGQVFTGVVQATTLGTTSSNAAQAIAIGNGGVDDTGESGLGWRVGTSASARAGNYRAQMRMNYDNGRWELRTGNSSNVNNLGVAISVDSGQQVSVNGSPVLTEATGLTTTADSQLIDASLTISNPGTGDGYLELNNSTASADQRAYRLYATSADSLRIETVNNSGVSVNRYTFGHNGDLGLPGNMEVAGYISMFDGGGNEHRFEHGSDGIALRSLSNPADGESIFSIQSSGNSMRLNVPHIGDVTTSNNGIRVGTESDGSNGRVVLEEGNWALIQSAVGYSGTPFPTLSATDIVGWSGREVTFTGVGAVSFTMPTVVTGTPTGSQIKAGETMTLHNFNSGSSVTVNAAAGQKMVNGDSGNVSGTGGSITILAGDSVRMIASDESEVAAVDAICWLVRPFG

Physico‐chemical properties

protein length:	652 AA
molecular weight:	67251,49990 Da
isoelectric point:	4,21168
aromaticity:	0,05521
hydropathy:	-0,17975

Domains

Domains [InterPro]

DC_1067
STR
1–650

DC_1067

AUR91769.1

1 652

Architecture

STR

STR 1-650 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_1067	STR	DC_1067	1	650	Novel HMM	DC_1067	Central	Low	Positional only	6 proteins / 6 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

AUR91769.1

1 652

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	33	33	0,9750
Central domain	34	248	216	0,0352
C-terminal	249	652	403	0,9435

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-33

Central
34-248

C-terminal
249-652

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Vibrio phage 1.164.O._10N.261.51.A7 [NCBI]	1881409	No lineage information
Host	Vibrio sp. [NCBI]	678	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Vibrionales

Coding sequence (CDS)

Genbank protein accession

AUR91769.1 [NCBI]

Genbank nucleotide accession

MG592531 [NCBI]

CDS location

range 24852 -> 26810
strand +

CDS

ATGAGTAGCTTAAATGATTTGCTCGCGGGAGCAACACAGCAAGAGTCCGGCACCGGGGTTGCTGAGTCAGGGGCGGTAGTGATCGGTTCGACTACAGCCGGAGAGTCGACAGAGATTAAAACTAGTGCAGGTGATACGGTTGTTACTGTCACTGATGACGGTGGCTTTCAACTATCTGAATCTCAAGTTGTTCGCCAGATTGTTAACGCAATCAATACCGGCGATGATGACAACGACATGAAGCTTCCTACCGTACAGGCTGTGATGACATTCTTAGCTGGCGCGGTAACTGCAACTATTGATTTTAAAGAGCTAACAAGCAAGGCGGCATTTGATACATTTATCAGTGACGGTGGTTTCATTCCAACTATCGCATTTGTGACTGATACCACCCCGTTCGATTACACTGACAACACGGGTCATACAGGAACAGATTTAACATGGATGTTTGTCGTATGCGTTGAAGAAGATAGCGTAATTACAACCTCAATGATTAACAACAGTGACATTTCAAGCCTGACGGGCGGTGAGATTGCAAGCATCATTGCAGCAACTGAAGACGTGAACTTTGTTAATGACTCTGACTTATCTCGAATTAGAAACCTTCCAGATAACACGACCGACGCTTTGGGCGGCAAGGTTGACTCAGAAGCTGGTAAGGGGCTGTCACAGAATAACTTTACAGATTCGCAGCGCAATAAGGTTGATAATTCCCCGTCCGATACAGCTTCAGAATTATCAACAAAAGCTGATAATTCTGGCCAAGTGTTTACGGGCGTAGTTCAAGCTACCACTCTAGGCACTACCTCTTCCAATGCAGCGCAGGCGATTGCAATAGGTAACGGAGGAGTCGATGATACTGGAGAGAGCGGGCTCGGGTGGAGAGTTGGGACATCTGCGAGCGCTAGAGCTGGAAACTATCGTGCCCAGATGAGGATGAACTACGATAATGGTAGATGGGAACTTAGAACAGGGAATAGCTCCAATGTTAACAATCTTGGAGTTGCAATATCTGTAGACTCTGGACAGCAAGTTTCTGTGAATGGTAGTCCAGTGCTAACTGAAGCTACTGGTCTTACTACTACGGCAGATAGCCAACTTATAGACGCTAGTTTGACAATATCAAACCCGGGCACTGGCGACGGGTATTTAGAGCTTAATAACTCAACAGCAAGTGCCGACCAAAGAGCCTATAGATTATACGCAACATCCGCAGACTCATTAAGGATTGAGACCGTCAATAACTCCGGTGTATCAGTAAACCGCTACACCTTTGGGCATAATGGTGATTTGGGGCTACCGGGCAATATGGAGGTTGCAGGCTACATTAGCATGTTTGATGGAGGGGGTAATGAGCATAGATTCGAGCATGGCAGTGACGGCATAGCGCTAAGGTCGCTGTCTAATCCTGCCGATGGTGAGAGTATTTTCTCCATCCAATCGTCGGGCAACTCGATGCGGTTAAACGTTCCGCATATTGGGGATGTCACGACATCAAACAATGGGATTCGGGTTGGCACTGAATCCGACGGGTCTAATGGTCGCGTAGTTCTTGAAGAGGGTAACTGGGCGCTAATTCAATCAGCTGTTGGATACTCTGGCACACCATTCCCAACATTATCCGCTACTGACATAGTGGGTTGGTCGGGTAGGGAGGTTACTTTTACGGGTGTCGGTGCTGTATCGTTCACGATGCCAACAGTTGTCACTGGAACACCTACTGGGTCACAAATTAAAGCTGGCGAAACCATGACCCTGCATAACTTCAATAGCGGCTCTAGTGTAACTGTTAACGCTGCAGCAGGTCAGAAAATGGTAAACGGTGATAGTGGGAATGTGTCAGGTACAGGCGGGAGTATCACTATACTGGCAGGTGACAGTGTTCGCATGATTGCGTCAGATGAAAGCGAAGTTGCTGCTGTCGATGCTATTTGCTGGCTTGTAAGGCCTTTTGGTTAG

Genome Context

Tertiary structure

PDB ID

3be44aa7e523534b529d3de90532e0a798bd1f3d6b78a95a5f7c5b045647aa90

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,6284

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Literature

Title	Authors	Date	PMID	Source
A major lineage of nontailed dsDNA viruses as unrecognized killers of marine bacteria	Kauffman,K.M., Hussain,F.A., Yang,J., Arevalo,P., Brown,J.M., Chang,W.K., VanInsberghe,D., Elsherbini,J., Cutler,M.B., Kelly,L. and Polz,M.F.	2018-01-24	—	GenBank

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence

Literature