Protein

View in Explore

Genbank accession

AUR86846.1 [GenBank]

Protein name

hypothetical protein

RBP type

TSP

Evidence DepoScope

Probability 1,00

Protein sequence

MPQFNLMKGSKTTANARYLDSLPVNMVPTPHETQASSGYLRSFPGITHHYDCDGLSYGAEYNDLTQTEYRILGSQLFANGENVADITGGKLTSVCHSANSTAFVDNGKLKYFRDDKVTELKNWYEGENYVSYPDYKFTPGFNGSGYITIPPWKNEGGFVVNVSINFKFLPSTDVFIVGAKTKYDGDTKGERFVGMFYKASDKKVYYRPNNDLDPSSPDVDSWSDNDVFVGDAVVGDNFFYAVSDTKFEFNIEYIGAVSINGTVKNEFKGGQIESLTLYDTLDGSIFRSYEMVKSVERDSGDKPSAPTTKSITNTEDETGATNGRMVSLSWVDFHTQADPVKSPATDFDLDGVIDADRHEGRYVWINDRKFGCTALTIGASGDEDTSPEQRPDYIAPFYSPESDPDDNKAIKSWQGKYIAVFGRNTTQWFGLTGNAEQIYAPQKSMQTAAGIISTHAVCRYKDSFAAVGSIKGGTLQVMTIGPGSHQKISTTTIDSMINKYKESELQSVLVETVMMNNHDFLFIHLPKETLVFDGNQNAWFMMKSDIIGDKPYTGRHIIYNQEEGVTIGDSVANRVGKLDDSISSQYGELTEFLLYTPFVRVNNKRGKTPLFDLQFDSVYGHVNSFQSIFISQTLDGAMYGNEYRLRYNDPLEFNNKPMISSLGAVNDSIGYKLRVVSKDPVNLSGFSVRIGYVG

Physico‐chemical properties

protein length:	694 AA
molecular weight:	77216,00280 Da
isoelectric point:	5,02158
aromaticity:	0,12104
hydropathy:	-0,44741

Domains

Domains [InterPro]

IPR021098
STR
3–132

IPR021098 IPR021098

IPR021098
STR
3–120

IPR021098 DC_0866 IPR021098

AUR86846.1

1 694

Architecture

STR

STR 3-690 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
IPR021098	STR	DC_0434	3	132	InterPro cluster	Bacteriophage P22, Gp10, DNA-stabilising	Central	Low	Positional only	218 proteins / 228 hits
IPR021098	STR	DC_0434	3	120	InterPro cluster	Bacteriophage P22, Gp10, DNA-stabilising	Central	Low	Positional only	218 proteins / 228 hits
DC_0866	STR	DC_0866	120	350	Novel HMM	DC_0866	Central	Low	Positional only	9 proteins / 9 hits
IPR021098	STR	DC_0434	338	690	InterPro cluster	Bacteriophage P22, Gp10, DNA-stabilising	Central	Low	Positional only	218 proteins / 228 hits
IPR021098	STR	DC_0434	350	690	InterPro cluster	Bacteriophage P22, Gp10, DNA-stabilising	Central	Low	Positional only	218 proteins / 228 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

AUR86846.1

1 694

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	83	83	0,8396
Central domain	84	402	320	0,7773
C-terminal	403	694	291	0,4537

Note: Constraints were applied during segmentation.
Fixed 12 C-terminal predictions appearing before Central domain

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-83

Central
84-402

C-terminal
403-694

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Vibrio phage 1.090.B._10N.286.48.F1 [NCBI]	1881319	No lineage information
Host	Vibrio lentus [NCBI]	136468	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Vibrionales

Coding sequence (CDS)

Genbank protein accession

AUR86846.1 [NCBI]

Genbank nucleotide accession

MG592465 [NCBI]

CDS location

range 8763 -> 10847
strand +

CDS

ATGCCGCAATTCAATTTAATGAAAGGTTCCAAGACTACCGCTAACGCTAGGTATCTAGATTCGTTACCGGTTAACATGGTTCCAACACCACACGAAACCCAAGCCTCATCTGGGTATCTTCGATCATTCCCAGGCATTACTCATCACTACGATTGTGACGGGCTAAGCTATGGCGCTGAGTATAACGACCTAACCCAAACTGAATACAGAATCCTAGGCTCGCAACTGTTCGCTAATGGTGAAAATGTTGCTGACATCACCGGCGGTAAGCTGACTAGCGTTTGCCACTCTGCCAATTCAACAGCGTTCGTTGATAATGGGAAGTTAAAGTATTTCCGTGACGACAAAGTAACCGAGCTGAAAAACTGGTATGAGGGTGAAAATTATGTCTCATATCCTGACTACAAGTTCACACCAGGATTTAATGGTTCAGGCTACATCACCATTCCACCGTGGAAGAATGAGGGTGGATTTGTTGTTAATGTCTCTATCAACTTTAAATTCCTTCCATCTACTGACGTGTTCATTGTTGGCGCAAAGACTAAGTACGACGGCGATACGAAAGGCGAAAGGTTTGTTGGGATGTTCTACAAAGCATCTGACAAGAAGGTTTACTATCGACCTAATAACGACCTAGACCCATCAAGCCCAGACGTTGATTCTTGGAGTGATAATGACGTATTTGTTGGAGATGCAGTTGTAGGTGATAACTTTTTCTATGCAGTTTCCGACACTAAGTTTGAGTTCAATATTGAGTACATTGGTGCGGTTAGCATTAATGGAACCGTAAAGAATGAATTCAAAGGCGGTCAAATAGAAAGCCTAACCCTGTACGACACGCTTGATGGTTCTATATTTAGATCTTATGAAATGGTTAAAAGTGTCGAGCGTGATAGTGGTGACAAGCCGAGCGCACCAACCACAAAGTCAATCACAAACACTGAAGATGAAACTGGAGCGACCAATGGCCGAATGGTTAGCCTTTCTTGGGTTGACTTCCACACTCAAGCAGACCCAGTTAAGAGTCCAGCAACAGATTTTGATTTAGATGGCGTAATTGACGCTGACCGCCATGAGGGTAGGTACGTTTGGATTAATGACCGTAAATTTGGTTGTACCGCGCTAACTATTGGTGCGTCTGGTGATGAAGATACAAGTCCAGAGCAGCGACCTGATTACATTGCACCTTTCTACAGCCCAGAGTCAGACCCAGACGACAACAAGGCTATCAAGTCATGGCAAGGTAAGTACATTGCAGTATTTGGCAGAAACACCACTCAGTGGTTTGGCTTAACTGGTAATGCTGAGCAGATTTACGCACCCCAGAAGTCCATGCAGACAGCGGCGGGAATTATAAGTACTCACGCGGTTTGTCGGTACAAAGATAGCTTTGCAGCAGTTGGCAGCATTAAAGGCGGGACGCTTCAGGTTATGACAATTGGCCCAGGTAGCCATCAGAAGATATCAACCACAACCATTGATTCTATGATCAACAAATATAAAGAGTCGGAGCTGCAAAGTGTATTAGTTGAAACGGTGATGATGAATAACCACGACTTCCTGTTTATTCACCTGCCTAAAGAGACTCTAGTTTTTGATGGAAATCAAAATGCATGGTTCATGATGAAGTCGGACATCATTGGCGATAAGCCGTACACAGGCCGTCACATCATTTACAACCAAGAAGAAGGCGTAACAATAGGTGACAGTGTAGCAAATAGGGTTGGAAAGCTGGATGATTCAATATCCAGCCAGTACGGCGAGCTAACGGAGTTCTTGCTCTACACGCCATTTGTTCGAGTTAATAACAAGCGAGGTAAGACTCCACTGTTCGACCTTCAGTTCGATTCTGTTTATGGTCACGTTAACTCGTTTCAGTCTATCTTCATTAGTCAGACGTTAGACGGTGCCATGTACGGCAATGAATACCGGTTGAGATACAACGACCCGCTAGAGTTCAACAACAAGCCTATGATTAGCAGCCTAGGCGCGGTTAATGACTCAATAGGATATAAGCTTAGGGTTGTATCAAAAGACCCAGTAAACCTTTCAGGATTCAGCGTGAGGATTGGATATGTCGGTTAA

Genome Context

Tertiary structure

PDB ID

979ae0ad203154f414664d77f4aa0e332a7ab333287c7630afd203adbc222887

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,6386

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Literature

Title	Authors	Date	PMID	Source
A major lineage of nontailed dsDNA viruses as unrecognized killers of marine bacteria	Kauffman,K.M., Hussain,F.A., Yang,J., Arevalo,P., Brown,J.M., Chang,W.K., VanInsberghe,D., Elsherbini,J., Cutler,M.B., Kelly,L. and Polz,M.F.	2018-01-24	—	GenBank

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence

Literature