Protein

View in Explore

Genbank accession

AZS12849.1 [GenBank]

Protein name

minor tail protein

RBP type

TSP

Evidence DepoScope

Probability 0,96

Evidence RBPdetect2

Probability 0,94

Protein sequence

MTTAIDLTGTVIVTSPGAPAITAAGPDASGRVDVSPGVPGPPGAGVQLDGAVATYANLPTGLGLADAGKAYIVQANGKLYVWSGTAWPTEPNGADFRGQTGLPGRGITAGGISVVGSKLRFAMSDSTIDEATVPAIQQAIDSAAAASGSATAANTARLAAEAAASTAGSAASTATTERTAAQTARTGAEAARDAAAVSATAADNSADAAATSETNAETAETNAAGSATAAAASAGQANSRATDADTARAAAVVARTAAETARTDATAAASNAQTSAADAEDSATAAAASAAEAADVVASGVPNATDTTKGGIVLAGDLAGTWDAPTVPALAAKADLVDGKVPTSQIPARALVVPHPVADTAGRLALTDVQPGDIAIQSGNPGRGTYMLMDDDPSDPGSWVLQVAPTDAVSSVNGYQGIVVLGKGDVGLGNVDNTSDANKPISGPQSDALATKVDKRTGMNVVYTNGADGNPSGQNFTSAATNFTIPIRNGAGQFLVGTPTDPAHPATKGYTDTALSGKAAAAHTHGAADIASGTLDVARLPVGTSGTTVAAGNDSRIVNAVPNTRTVTAGTGLSGGGTLDVNRTLSVLYGNTANTAAQGNDLRLSDTRTPTDNTVSTAKIQDGAVTLAKLATAVSVSIQQMIDVSVLAAQLVTINAQAGAYTLVATDANKAVEVTSASAVNITIPTDTVNFPIGTVIEVDQIGAGKVSIVGASGVTVQAAVTTPTTRAQFSALVLRKRAANLWLVTGDLA

Physico‐chemical properties

protein length:	750 AA
molecular weight:	73364,98530 Da
isoelectric point:	4,55646
aromaticity:	0,02800
hydropathy:	0,05453

Domains

Domains [InterPro]

DC_2298
STR
45–116

DC_2298 DC_0351

AZS12849.1

1 750

Architecture

STR

STR 45-718 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_2298	STR	DC_2298	45	116	Novel HMM	DC_2298	Central	Low	Positional only	339 proteins / 339 hits
DC_0351	STR	DC_0351	117	718	Novel HMM	DC_0351	Central	Low	Positional only	44 proteins / 44 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

AZS12849.1

1 750

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	611	611	0,9373
Central domain	612	739	129	0,0417
C-terminal	740	750	10	0,9952

Note: Constraints were applied during segmentation.
Fixed 25 C-terminal predictions appearing before Central domain|C-terminal too short, adjusted boundary

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-611

Central
612-739

C-terminal
740-750

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Gordonia phage Savage [NCBI]	2499027	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	No host information

Coding sequence (CDS)

Genbank protein accession

AZS12849.1 [NCBI]

Genbank nucleotide accession

MK279912 [NCBI]

CDS location

range 22596 -> 24848
strand +

CDS

ATGACCACCGCCATCGACCTCACCGGAACCGTCATCGTCACGTCGCCCGGCGCACCGGCCATCACGGCCGCGGGCCCCGACGCATCCGGCCGAGTCGATGTGTCTCCCGGCGTCCCCGGCCCGCCCGGCGCCGGCGTGCAACTCGACGGGGCCGTCGCGACCTACGCCAACCTGCCGACCGGCCTCGGGCTGGCCGACGCCGGCAAGGCCTACATCGTGCAGGCCAACGGAAAACTGTACGTGTGGTCCGGCACCGCGTGGCCGACCGAGCCGAACGGTGCCGACTTCCGCGGCCAGACTGGCCTCCCGGGCCGCGGGATCACCGCGGGAGGCATCAGTGTCGTCGGCAGCAAACTGCGGTTCGCCATGTCCGACAGCACCATCGACGAAGCCACCGTCCCGGCGATCCAGCAGGCCATCGACTCCGCAGCGGCCGCTTCCGGGTCCGCGACCGCGGCGAACACCGCGCGACTCGCGGCCGAAGCTGCGGCATCGACCGCGGGCTCGGCCGCGTCGACGGCCACCACGGAACGGACGGCGGCGCAGACCGCCCGGACCGGTGCCGAGGCCGCGCGCGACGCCGCAGCAGTCTCAGCGACGGCCGCCGACAACAGTGCCGACGCGGCCGCGACATCGGAGACCAACGCGGAGACCGCCGAGACGAACGCGGCGGGCTCGGCAACCGCTGCGGCCGCATCCGCCGGCCAGGCGAACTCCCGCGCGACCGACGCCGACACCGCGCGTGCGGCAGCCGTCGTCGCGCGAACCGCAGCCGAGACCGCCCGCACTGATGCCACCGCGGCCGCCAGCAATGCGCAGACGTCGGCCGCCGATGCCGAGGACTCGGCGACCGCAGCAGCGGCGAGCGCAGCCGAGGCCGCCGACGTCGTGGCCTCCGGCGTCCCGAACGCCACCGACACCACGAAGGGCGGCATCGTCCTCGCCGGTGATCTCGCAGGCACCTGGGACGCGCCGACCGTGCCGGCGCTCGCCGCGAAGGCCGACCTCGTCGACGGGAAGGTGCCGACCTCGCAGATCCCGGCGCGCGCGCTCGTCGTGCCGCACCCGGTCGCCGACACCGCGGGCCGTCTCGCGCTCACCGACGTCCAGCCAGGCGACATCGCGATCCAGTCCGGAAACCCCGGCCGCGGCACCTACATGCTGATGGACGACGACCCGTCAGACCCGGGGTCGTGGGTGCTGCAGGTCGCACCGACCGACGCCGTGTCGAGCGTGAACGGCTACCAGGGCATCGTCGTCCTGGGGAAGGGCGACGTCGGGCTCGGCAACGTCGACAACACCAGCGACGCGAACAAACCGATCAGCGGACCCCAGTCCGACGCGCTGGCCACGAAGGTCGACAAGCGCACCGGCATGAACGTCGTCTACACCAACGGCGCCGACGGCAACCCGAGCGGACAGAACTTCACCTCCGCCGCAACGAACTTCACGATCCCCATCCGCAACGGCGCTGGGCAGTTCCTCGTCGGCACGCCGACAGACCCGGCGCATCCGGCCACGAAGGGATACACCGACACCGCGCTATCCGGGAAAGCCGCAGCCGCGCATACGCACGGCGCCGCCGACATCGCCTCCGGCACGCTCGACGTGGCAAGGCTCCCCGTCGGCACCTCGGGCACGACCGTCGCCGCGGGCAACGACTCCCGCATCGTCAACGCCGTGCCCAACACCCGCACCGTCACCGCGGGCACCGGTCTCTCCGGCGGCGGGACGCTGGACGTGAACCGCACCCTGTCGGTGCTGTACGGCAACACCGCCAACACCGCGGCGCAGGGCAACGACCTTCGTCTGTCCGACACCCGCACCCCGACCGACAACACCGTCTCCACGGCGAAGATCCAGGACGGGGCGGTCACGCTCGCGAAGCTCGCCACCGCGGTGTCGGTGTCGATTCAGCAGATGATCGACGTCTCAGTGCTGGCGGCGCAGCTCGTCACTATCAACGCCCAGGCCGGCGCGTACACACTCGTCGCGACGGATGCGAACAAGGCCGTCGAGGTCACCTCCGCGTCCGCGGTGAACATCACCATCCCGACCGACACAGTGAACTTCCCGATCGGCACAGTAATCGAGGTCGACCAGATCGGCGCAGGAAAGGTATCGATCGTCGGCGCGTCCGGAGTGACAGTGCAGGCCGCGGTCACCACTCCGACGACGCGCGCCCAGTTCTCGGCGCTCGTACTGCGCAAGCGTGCCGCCAACCTGTGGCTCGTCACCGGCGACCTGGCGTAG

Genome Context

Tertiary structure

PDB ID

ce6a1dadbd94303997eb2326a5f88ab569bada202bebb5f23b7c27268a4bbeae

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,6450

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence