Protein

View in Explore

Genbank accession

ASR86567.1 [GenBank]

Protein name

minor tail protein

RBP type

TSP

Evidence DepoScope

Probability 0,91

Protein sequence

MPRQYDTRQLPVDRDPLRQLVPDPGKLPKLSPQDFYNGFIRAVKDLFGIDLSSPEALVTSILHVLQDAVGGVLDPSQLLGLVGKILGFVGTPTSVDELAAWASNALFGWIDPGRLPIIPVSQIGQFVASLLPNGLFGSAQSIVDPTGRWLVDAIEGAARTIADGTITDLLSTDLIGVIPGQVLNVVGKVKWSGLAASGSPIELGVTAYSDERGETPAERARIATPTGQTGTVGWKDLAGSYTVPEGVKAVRARVTVGAGATAGTVWFKGIDANKGNTLLPIALVENLSTRLASLLGVDVWQSFLNAAKGGPGGTVGDIINRILHLNLNGQFDASQLVNVPNMPTLPGTNVSGLPGGAGNILHDITNHIDNVVNKFLGMFGSGHTAEDAAAAMGTIYSQVRTSAQQLQDLISEQTGEAHSGRSFRVDFSSYPDGPLPDVFDVTYSGSGSGYAEVRGGKGTWHKVADGDRTVMGKFKADTLTDYQALGATVASPMDNGAQNWMFGRCNAAKTTYVYAFGYRNSLLDFRAELGCFVNGVKYVFATNVKANMNFNLGLKIGTSKGLRNFQVISGNEVIIDYTDTAGISQVGPNYRGWGFISSTANNGNNVPADAVYATCADADPSAAVGSGAKMARTSTANVGVSVGRFLLPQNFYQSVDLATPDIVADPVNGKFTVSLAGWYRVEIAFRVSTNVFASTWNLAPVLYKNGQVHRVGTDCYLFYYFGAGAGGRYAQTSFGVYLDAGDSVQSGYDASVAQSSLFTGEASGVETCFSISLLNRSRG

Physico‐chemical properties

protein length:	779 AA
molecular weight:	82119,41030 Da
isoelectric point:	5,51022
aromaticity:	0,09114
hydropathy:	0,01361

Domains

Domains [InterPro]

DC_0105
STR
66–779

DC_0105

G3DSA:2.60.120.260
STR
152–277

G3DSA:2.60.120.260 IPR055681

ASR86567.1

1 779

Architecture

STR

STR 66-779

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0105	STR	DC_0105	66	779	Novel HMM	DC_0105	Central	Low	Positional only	88 proteins / 88 hits
G3DSA:2.60.120.260	STR	G3DSA:2.60.120.260	152	277	Merged direct domain	G3DSA:2.60.120.260	Central	Low	Positional only	264 proteins / 264 hits
IPR055681	STR	DC_0791	403	620	InterPro cluster	Domain of unknown function DUF7257	C-terminal	Low	Positional only	97 proteins / 97 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

ASR86567.1

1 779

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	447	447	0,7134
Central domain	448	646	200	0,1810
C-terminal	647	779	132	0,9981

Note: Constraints were applied during segmentation.
Fixed 125 C-terminal predictions appearing before Central domain

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-447

Central
448-646

C-terminal
647-779

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Mycobacterium phage DismalFunk [NCBI]	2015880	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	No host information

Coding sequence (CDS)

Genbank protein accession

ASR86567.1 [NCBI]

Genbank nucleotide accession

MF140408 [NCBI]

CDS location

range 18661 -> 21000
strand +

CDS

GTGCCGAGGCAGTATGACACTCGGCAGCTCCCGGTCGACCGCGATCCGCTGCGGCAGCTCGTCCCTGACCCCGGCAAGCTGCCGAAGCTCAGCCCGCAGGACTTTTACAACGGGTTCATTCGCGCCGTAAAGGATCTGTTCGGGATTGACCTGTCGTCGCCCGAGGCGCTCGTGACGAGCATCCTGCACGTGCTGCAGGACGCCGTCGGCGGCGTGCTGGACCCGTCGCAGCTTCTCGGCCTCGTCGGCAAGATCCTCGGTTTCGTCGGCACCCCGACGAGCGTCGACGAGCTGGCGGCGTGGGCCAGTAACGCCCTGTTCGGGTGGATCGACCCCGGCCGCCTGCCGATCATCCCGGTGTCGCAGATCGGTCAGTTTGTCGCGAGCCTGTTGCCTAACGGTCTGTTTGGCAGCGCGCAGTCGATCGTCGACCCGACCGGGCGGTGGCTGGTCGACGCTATCGAGGGCGCGGCCCGCACGATCGCCGACGGCACGATCACCGACCTGCTGTCAACCGACTTGATCGGCGTGATACCCGGCCAGGTGCTCAACGTCGTGGGCAAGGTGAAGTGGAGCGGCCTGGCGGCCTCGGGCAGCCCGATCGAGCTTGGCGTGACGGCGTACAGCGACGAGCGCGGCGAGACACCGGCCGAGCGGGCTCGCATTGCCACGCCTACGGGTCAAACCGGCACCGTCGGGTGGAAGGACTTGGCGGGCTCTTACACCGTGCCAGAGGGCGTTAAGGCCGTGCGTGCGCGCGTCACTGTCGGCGCCGGGGCCACCGCGGGCACTGTGTGGTTCAAGGGAATTGACGCCAACAAGGGCAACACCCTGCTGCCGATCGCGCTCGTCGAGAACCTGTCGACCCGGCTCGCGAGCCTGCTCGGCGTCGACGTGTGGCAGTCATTCCTTAACGCCGCGAAGGGCGGGCCGGGCGGCACGGTCGGCGACATTATCAACCGCATTTTGCACCTGAACCTTAACGGGCAGTTCGATGCGTCGCAGCTCGTGAACGTGCCGAATATGCCAACGCTGCCGGGCACGAACGTCAGCGGCCTGCCCGGCGGCGCCGGAAATATCCTGCACGACATAACAAACCACATCGACAACGTGGTTAATAAGTTCCTGGGCATGTTCGGTTCCGGCCACACGGCCGAGGACGCCGCGGCGGCAATGGGCACGATCTACAGCCAGGTGCGCACCAGCGCGCAGCAGCTTCAAGACCTGATTTCCGAGCAGACGGGCGAGGCTCACTCGGGTAGGTCATTTCGGGTTGATTTCAGCTCGTACCCCGACGGGCCGCTGCCCGACGTGTTCGACGTGACGTACTCGGGCAGCGGCTCAGGGTACGCAGAGGTCCGCGGCGGCAAGGGCACCTGGCACAAGGTCGCAGACGGCGACCGCACGGTCATGGGCAAGTTCAAGGCCGACACGCTCACCGACTACCAGGCCCTCGGCGCCACCGTGGCCTCGCCAATGGACAACGGCGCGCAGAACTGGATGTTTGGGCGGTGCAACGCCGCTAAAACCACGTACGTCTATGCGTTCGGTTACCGCAACTCGCTGCTCGATTTCCGCGCCGAGCTGGGCTGCTTTGTAAACGGCGTCAAGTACGTGTTCGCAACGAACGTCAAGGCGAACATGAACTTTAACCTGGGCCTCAAGATCGGTACCAGCAAGGGGCTGCGCAACTTTCAGGTGATTTCCGGTAACGAAGTCATCATCGACTACACCGACACCGCGGGAATTAGCCAGGTGGGACCGAATTATCGGGGCTGGGGCTTTATCAGCTCGACCGCCAACAACGGCAACAATGTTCCCGCTGACGCGGTTTACGCCACCTGCGCCGACGCCGACCCGTCTGCGGCCGTCGGCTCGGGCGCGAAGATGGCACGCACCAGCACCGCGAATGTTGGTGTGTCAGTTGGCCGGTTCCTGCTGCCGCAGAACTTCTACCAGTCCGTTGACTTGGCGACGCCTGACATTGTGGCGGACCCGGTCAACGGGAAATTTACGGTGTCCCTGGCCGGTTGGTATCGCGTCGAGATTGCATTTCGGGTCAGCACCAACGTGTTCGCGAGTACGTGGAACCTGGCGCCGGTGCTCTACAAAAACGGGCAGGTGCATCGAGTCGGCACCGACTGCTATCTGTTCTATTACTTTGGTGCTGGCGCTGGCGGCCGTTATGCGCAAACGAGTTTCGGCGTCTATCTGGACGCTGGCGACTCGGTCCAGTCGGGTTATGACGCCTCGGTGGCGCAGTCGTCCCTATTCACCGGCGAAGCATCCGGTGTCGAAACGTGTTTCAGCATTTCCCTACTAAACAGGAGTCGCGGATAA

Genome Context

Tertiary structure

PDB ID

6a4b551c1bfb1428e66f1832f9753684107dcab180c7f01f921f33f8350dbf07

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,7265

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence