Protein

View in Explore

Genbank accession

AEN79877.1 [GenBank]

Protein name

minor tail protein

RBP type

TSP

Evidence DepoScope

Probability 0,73

Protein sequence

MATKRYPAGQITPHGWYHVTKGTRPMMWLESWDKTARFDLLGGLAAPFHDPTEPECVELVSLKGLIAPWKHIQQKGATQDGITHVDALLDPNEIEMVVNCVGRTPNHAVEVARDLIASIDAINTATVNFLTPDLGHWWSDIRWLNGAPTDPVNIVSQGKPLSLRLQGDAGLWRSYDHVSTFTFSYEDMTDTFTADNRSTQDLGDIPQYYTGSGGGYCTSNGDRMIWVDDPDDPFGTHSRRVINGPWPDFETATDNQVISQVHGTVQEWSTPKTSCNILGGRMGRDEDGAWDGSGVFVEYGIGYIRLFYTVDFEETTLRTEHLPMLIAPAPGEKFTLVCGYDGDPRMFKVLRNGNVILSHKETGTGSPLGPNNRGVGSGMFAAAALLTQATPAAIRKISAGDNASVTQSGWLDMVNIGDQKMYYDYTVFGPGTFRLYDGPGSNEYVEFGPILRNQIVFLRTDPRVNTTLVQDLTVTPPSPQDLNIFQEAVAKLLKATGVNGTAMENQIKSLFGIRTAQGNLYKYLKGRFSERAAIPPKPAGQPAPTYHVKVEIVGGDADSKIIAAGTPLRRYPL

Physico‐chemical properties

protein length:	573 AA
molecular weight:	62890,09160 Da
isoelectric point:	5,42604
aromaticity:	0,09424
hydropathy:	-0,32862

Domains

Domains [InterPro]

DC_0305
ATT
1–175

DC_0305 IPR055681 DC_0307

IPR055681
STR
164–404

IPR055681

AEN79877.1

1 573

Architecture

ATT

STR

RBD

ATT 1-175 | STR 176-404 | RBD 405-573

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0305	ATT	DC_0305	1	175	Novel HMM	DC_0305	N-terminal	Low	Positional only	28 proteins / 28 hits
IPR055681	STR	DC_0791	164	404	InterPro cluster	Domain of unknown function DUF7257	C-terminal	Low	Positional only	97 proteins / 97 hits
IPR055681	STR	DC_0791	175	404	InterPro cluster	Domain of unknown function DUF7257	C-terminal	Low	Positional only	97 proteins / 97 hits
DC_0307	RBD	DC_0307	404	573	Novel HMM	DC_0307	C-terminal	Low	Positional only	28 proteins / 28 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

AEN79877.1

1 573

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	174	174	0,6985
Central domain	175	373	200	0,2432
C-terminal	374	573	199	0,7809

Note: Constraints were applied during segmentation.
Fixed 29 C-terminal predictions appearing before Central domain

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-174

Central
175-373

C-terminal
374-573

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Mycobacterium phage Redi [NCBI]	1079894	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Mycobacterium smegmatis str. MC2 155 [NCBI]	246196	Bacteria > Actinobacteria > Actinobacteria > Corynebacteriales > Mycobacteriaceae > Mycobacterium

Coding sequence (CDS)

Genbank protein accession

AEN79877.1 [NCBI]

Genbank nucleotide accession

JN624851 [NCBI]

CDS location

range 13272 -> 14993
strand +

CDS

ATGGCGACCAAGCGTTACCCGGCCGGACAGATCACCCCTCACGGCTGGTACCACGTCACGAAGGGCACCCGCCCAATGATGTGGCTCGAATCATGGGACAAGACAGCACGATTCGACCTGCTCGGCGGTTTGGCCGCGCCGTTCCACGACCCGACCGAACCCGAGTGCGTGGAGCTTGTGAGCCTCAAAGGTCTGATCGCGCCGTGGAAGCATATTCAGCAGAAGGGCGCGACTCAGGACGGCATCACGCACGTCGACGCGCTGCTCGACCCCAACGAAATCGAGATGGTCGTCAACTGTGTTGGGCGCACGCCGAATCACGCCGTCGAGGTGGCCCGCGATCTCATCGCGTCCATTGATGCCATCAACACCGCCACGGTCAATTTCCTGACGCCCGACCTCGGGCATTGGTGGTCGGATATTCGGTGGCTCAACGGCGCACCAACCGATCCGGTCAACATCGTGTCGCAGGGCAAACCGCTGTCGCTGCGGCTGCAAGGCGATGCCGGTTTGTGGCGGTCGTACGACCACGTGTCAACGTTCACGTTCTCGTACGAGGACATGACCGACACATTCACCGCGGATAACCGATCCACCCAGGATCTCGGTGACATTCCGCAGTATTACACCGGCAGCGGCGGCGGCTACTGCACGTCGAACGGCGACCGCATGATCTGGGTCGACGACCCCGACGACCCGTTCGGCACGCACTCACGGCGCGTCATCAACGGCCCGTGGCCGGATTTCGAGACCGCCACCGACAACCAGGTCATCTCGCAGGTTCACGGCACCGTTCAAGAGTGGTCGACGCCGAAAACGTCGTGCAACATTCTCGGCGGCCGGATGGGGCGCGACGAAGACGGCGCGTGGGATGGGTCCGGTGTGTTCGTCGAGTACGGCATCGGTTATATCCGGCTGTTCTACACAGTGGATTTCGAGGAAACCACCCTGCGCACCGAGCATCTGCCGATGCTCATCGCCCCGGCCCCGGGCGAAAAGTTCACGCTGGTATGCGGATACGACGGCGACCCGCGCATGTTCAAGGTGCTACGCAACGGCAACGTGATCCTGTCGCACAAAGAAACGGGCACCGGGTCGCCGCTCGGCCCAAACAACCGCGGCGTCGGTAGCGGAATGTTCGCCGCCGCAGCTCTGCTCACGCAGGCCACCCCGGCGGCCATCCGCAAGATCTCGGCCGGCGACAACGCCTCGGTGACGCAGTCGGGATGGCTCGACATGGTCAACATCGGCGACCAGAAGATGTACTACGACTACACCGTGTTCGGGCCGGGAACGTTCCGGCTCTACGACGGCCCCGGCAGTAACGAGTACGTCGAGTTTGGGCCGATCCTGCGGAACCAGATCGTGTTTCTGCGCACCGATCCACGCGTGAACACCACCCTCGTGCAGGATCTCACGGTCACGCCGCCCTCGCCGCAGGACTTGAACATCTTCCAAGAGGCTGTTGCGAAGCTGCTCAAGGCAACCGGTGTGAACGGCACCGCGATGGAAAACCAGATCAAGTCGCTGTTCGGTATCCGCACCGCGCAGGGCAATCTCTACAAGTACCTCAAGGGCCGGTTCTCCGAGCGGGCCGCGATCCCGCCGAAACCCGCCGGCCAGCCGGCACCGACGTATCACGTCAAGGTCGAGATCGTCGGCGGCGACGCTGATTCCAAGATCATCGCCGCTGGCACACCACTGCGGAGGTATCCGCTCTGA

Genome Context

Tertiary structure

PDB ID

451112aa254c082696c6ff1d6de435e485c9c0fe5d8597db17a4b10c9b5d0cf4

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,7840

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence