Protein

View in Explore

Genbank accession

YP_008058700.1 [GenBank]

Protein name

hypothetical protein

RBP type

Evidence RBPdetect

Probability 0,85

Protein sequence

MGNYSPRGGITQFSQQEVVQADPEIAISTGWNSIDKTNWDVTEQGSATVDPTTGGLYALNVTDADGDLAALQTVDRVEYVPSMAAFWGMAFLADSLITEDQEFRAGITNTETWDDAYQYRIIGTPAGEENDHYLVIRKTGSDSIVRHWDGWPSDPRQHGWDETVGMILRNEVGWYDLGEWKPEAQIPDLQTGDNTIIDLQENPDPSVRKMVVPLDYLSAVSETATDNINFRIRFELKNTGANASANRMQVGNPHYNILGQNEPNPRFKDVERNGGSIGSGNITTTQPYPLVAIRNNGQDVKMVLQSVVSTPVADSVEVTAYMMRKEDVTFSTGPDTDFGPAPGTDKRETFFEDTDWNGIASVTRFDAPGTGNNDPHVGTEGYPVGRKVAGRTVQGSDQNKVAGASNSLDANTQLTDLDYLVIFARATETDNISLQALDYEMAVDR

Physico‐chemical properties

protein length:	445 AA
molecular weight:	48850,98230 Da
isoelectric point:	4,32183
aromaticity:	0,08315
hydropathy:	-0,54404

Domains

Domains [InterPro]

No domain annotations available.

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

No domain annotations available.

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Haloarcula hispanica tailed virus 1 [NCBI]	1273750	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Haloarcula hispanica [NCBI]	51589	Archaea > Euryarchaeota > Halobacteria > Halobacteriales > Halobacteriaceae > Haloarcula

Coding sequence (CDS)

Genbank protein accession

YP_008058700.1 [NCBI]

Genbank nucleotide accession

NC_021322 [NCBI]

CDS location

range 4947 -> 6284
strand +

CDS

GTGGGAAACTATTCGCCCAGGGGCGGGATCACCCAGTTCAGCCAGCAGGAAGTGGTGCAGGCTGATCCAGAAATCGCCATCAGCACGGGCTGGAACAGCATCGATAAAACGAACTGGGATGTTACGGAACAGGGATCGGCCACCGTGGATCCCACCACTGGCGGGCTGTATGCCCTGAACGTAACTGATGCAGATGGGGATCTGGCTGCCCTTCAGACTGTGGATCGGGTGGAATACGTTCCCTCGATGGCAGCGTTCTGGGGGATGGCGTTCCTGGCCGATTCCCTGATCACCGAGGATCAGGAATTCCGTGCAGGGATCACGAACACGGAAACCTGGGATGATGCGTATCAGTATCGGATCATCGGAACGCCTGCTGGGGAAGAAAACGATCACTACCTGGTGATCCGAAAGACTGGATCGGATTCCATCGTAAGGCACTGGGATGGCTGGCCCAGTGATCCGAGGCAGCACGGGTGGGATGAAACGGTGGGGATGATCCTTCGAAATGAAGTGGGCTGGTATGATCTGGGCGAGTGGAAGCCGGAAGCCCAGATCCCGGATCTTCAGACTGGGGATAACACCATCATCGATCTTCAGGAAAACCCGGATCCCTCGGTGCGGAAGATGGTGGTTCCCCTGGATTACCTTTCTGCCGTTTCCGAGACAGCGACGGATAACATCAATTTCCGCATCAGGTTCGAACTGAAGAACACGGGTGCGAACGCTTCAGCGAACCGGATGCAGGTGGGGAACCCGCATTACAATATCCTGGGCCAGAACGAACCGAACCCGAGGTTCAAAGATGTGGAACGGAACGGTGGCAGCATCGGCAGCGGGAACATCACCACCACCCAGCCGTATCCCCTGGTGGCTATTCGGAATAACGGCCAGGATGTGAAGATGGTGCTTCAGTCGGTCGTATCCACGCCAGTGGCAGATTCCGTGGAAGTAACGGCGTATATGATGCGGAAGGAAGATGTGACTTTCAGCACTGGGCCAGATACAGATTTCGGGCCTGCACCTGGCACGGATAAGAGGGAAACGTTCTTCGAAGATACCGACTGGAACGGGATCGCCAGTGTAACCCGCTTCGATGCACCAGGCACCGGGAATAATGATCCCCACGTGGGAACCGAGGGATACCCAGTCGGTCGGAAGGTGGCTGGCCGAACGGTGCAGGGATCCGATCAGAATAAGGTGGCTGGTGCTTCGAACAGCCTCGATGCGAACACCCAGTTAACGGATCTGGATTACCTGGTGATCTTTGCCAGGGCCACCGAGACTGATAACATCAGCCTTCAGGCCCTGGATTATGAAATGGCGGTGGATCGGTGA

Genome Context

Tertiary structure

PDB ID

10c93db8b3402cd55fddcd2895cce042547b2205fd33b7152eff2a6cf90c780d

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,5258

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence