Protein

View in Explore

Genbank accession

AHB80521.1 [GenBank]

Protein name

tail sheath monomer

RBP type

TSP

Evidence DepoScope

Probability 1,00

Protein sequence

MASQVSPGVIIKERDLSNAVIVGDVAVTAAFSSTFKKGPIGQIVNISSERELIDTFGGPGEDNAADWLVASEYLGYGGRLAVVRTSTGVLNAAVSGSGVLIATKEDFDGGATSEVLAARYAGKEGNYYRVVIVDRGADEIATVAGHGLTVGATYNDGSNDHEVYTVIDANTIAIINTDGVKASTNGISTTPWYNNTSIAGTGLKLSAIGPRPGTSAFAAENHLSYDEVHVAIVDERSNAVVEKFVYASKLSDAVTPEGASNYWRNRVNLESGYIYSGAEQSANLQSTGNAWGSTAASYAATAATPELMKVILPSGSGNAFDGYLLSGGTDDYAYTAGEISDAYNLFQDTEATEIDFVLGGGSMANEADSKTKAGAVIGVATSRQDCVAFISPHVGNQVASSGGALSSTQQRDNTVGFFETLSSTSFAVFDSGIKYVYDRFNDKYRYIGCNGDIAGLCVRTSATVDDWISPAGLNRGGLRNVVKLAYNPNKADRDELYQGRINPVVAFPGSGPVLFGDKTALASPSAFDRINVRRLFLNIQKRAAGLGKQVLFEQNDEITRGGFASSMTSYLSSIQARRGLVDYLVVCDTSNNTPTVIDSNEFVAELYLKPTRSINFVTVTLTATRTGVSFSEVIGR

Physico‐chemical properties

protein length:	636 AA
molecular weight:	67108,59480 Da
isoelectric point:	4,86158
aromaticity:	0,08805
hydropathy:	-0,08679

Domains

Domains [InterPro]

IPR052042
Unmapped
1–627

IPR052042

G3DSA:3.40.50.11780
STR
26–194

G3DSA:3.40.50.11780 G3DSA:3.40.50.11780 IPR020287

DC_1098
STR
85–300

DC_1098

AHB80521.1

1 636

Architecture

STR

TAS

STR 26-300 | STR 315-488 | TAS 523-623 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
IPR052042	Unmapped	-	1	627	InterPro	Tail sheath structural protein	-	-	-	-
G3DSA:3.40.50.11780	STR	G3DSA:3.40.50.11780	26	194	Merged direct domain	G3DSA:3.40.50.11780	Central	Low	Positional only	39 proteins / 39 hits
DC_1098	STR	DC_1098	85	300	Novel HMM	DC_1098	Central	Low	Positional only	21 proteins / 21 hits
G3DSA:3.40.50.11780	STR	G3DSA:3.40.50.11780	315	488	Merged direct domain	G3DSA:3.40.50.11780	Central	Low	Positional only	39 proteins / 39 hits
IPR020287	TAS	DC_0666	523	623	InterPro cluster	Tail sheath protein, C-terminal domain	C-terminal	High	Text match	43 proteins / 43 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

AHB80521.1

1 636

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	91	91	0,9572
Central domain	92	290	200	0,5268
C-terminal	291	636	345	0,2176

Note: Constraints were applied during segmentation.
Fixed 28 C-terminal predictions appearing before Central domain

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-91

Central
92-290

C-terminal
291-636

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Synechococcus phage ACG-2014h [NCBI]	1340810	Uroviricota > Caudoviricetes > Pantevenvirales > Sedonavirus > Sedonavirus tusconh
Host	Synechococcus sp. [NCBI]	1131	cellular organisms > Bacteria > Bacillati > Cyanobacteriota/Melainabacteria group > Cyanobacteriota > Cyanophyceae
Host	Synechococcus sp. WH 7803 [NCBI]	32051	Bacteria > Cyanobacteria > Oscillatoriophycideae > Chroococcales > Synechococcus >

Coding sequence (CDS)

Genbank protein accession

AHB80521.1 [NCBI]

Genbank nucleotide accession

KF156338 [NCBI]

CDS location

range 107043 -> 108953
strand +

CDS

ATGGCAAGTCAAGTCTCGCCTGGTGTTATCATTAAAGAACGTGACCTTTCTAATGCTGTTATCGTTGGTGATGTAGCTGTAACCGCTGCATTTTCATCAACATTCAAGAAAGGACCCATTGGTCAGATCGTAAACATTTCTTCTGAAAGAGAATTGATCGACACCTTTGGCGGTCCTGGAGAAGATAACGCTGCTGATTGGTTGGTAGCATCGGAATACTTAGGATACGGTGGCAGACTTGCCGTCGTAAGAACATCTACAGGAGTCCTAAACGCAGCTGTCTCTGGCAGTGGTGTTCTAATCGCAACAAAAGAAGATTTTGATGGCGGTGCAACTTCTGAAGTATTAGCAGCACGCTATGCTGGTAAAGAAGGCAACTACTATCGTGTAGTTATTGTTGACCGTGGTGCTGACGAGATCGCAACCGTTGCAGGTCACGGTCTAACAGTTGGCGCAACATATAATGACGGTAGCAATGACCACGAAGTCTATACTGTCATCGATGCTAACACAATTGCAATCATTAACACTGATGGTGTTAAAGCATCTACAAATGGTATTAGTACCACTCCTTGGTACAACAATACTTCAATCGCAGGTACTGGTCTAAAACTCAGTGCAATCGGTCCTCGTCCAGGTACATCTGCATTTGCTGCAGAAAATCACTTGAGCTATGACGAAGTACACGTTGCAATTGTCGATGAGAGAAGCAACGCTGTAGTTGAGAAGTTCGTTTATGCTTCAAAACTAAGCGACGCTGTAACTCCAGAAGGTGCATCCAACTACTGGAGAAATAGAGTTAACCTAGAGTCTGGTTATATCTACTCTGGTGCTGAGCAAAGTGCAAACCTACAAAGTACAGGTAATGCATGGGGAAGCACTGCTGCTTCTTACGCAGCAACCGCTGCTACTCCAGAACTAATGAAAGTTATTCTTCCTTCTGGTTCTGGTAACGCTTTCGATGGATACCTCCTTTCTGGTGGTACTGACGACTATGCGTATACCGCTGGTGAGATCAGCGATGCTTACAACCTTTTCCAAGATACCGAGGCAACTGAAATTGACTTCGTACTTGGCGGTGGTTCGATGGCAAACGAAGCTGACTCTAAGACAAAGGCAGGAGCAGTTATCGGTGTTGCAACTTCAAGACAAGATTGCGTTGCATTTATCTCTCCTCATGTCGGAAATCAAGTTGCTTCTTCTGGTGGAGCACTAAGTTCTACTCAGCAAAGAGATAATACAGTAGGGTTCTTTGAAACTCTATCGTCAACTTCTTTCGCTGTATTTGATAGCGGAATCAAGTATGTCTATGACCGCTTCAATGATAAGTACCGCTACATTGGTTGTAACGGTGATATCGCTGGTCTTTGTGTAAGAACATCTGCAACTGTAGATGACTGGATTTCTCCTGCTGGTCTAAACCGTGGCGGTCTTCGCAACGTTGTAAAACTAGCATACAATCCTAACAAGGCAGACAGAGACGAACTATACCAAGGCAGAATCAACCCTGTTGTTGCATTCCCTGGTTCTGGTCCTGTACTATTCGGTGATAAGACCGCACTTGCATCTCCTTCTGCATTCGATCGTATTAATGTTCGCCGCCTCTTCCTCAATATTCAGAAGAGAGCAGCAGGTCTCGGAAAGCAAGTCTTGTTCGAGCAAAATGATGAAATCACAAGAGGCGGTTTTGCTTCTTCGATGACATCTTACCTCTCCTCCATTCAGGCACGTAGAGGTCTAGTTGACTATCTCGTTGTTTGTGATACGTCCAATAACACACCTACCGTTATTGACTCTAATGAGTTTGTTGCTGAGTTGTACCTCAAGCCAACACGCTCCATTAACTTTGTGACTGTTACTCTAACAGCGACGAGAACTGGAGTATCCTTCAGTGAAGTCATTGGTAGATAA

Genome Context

Tertiary structure

PDB ID

5dd177a876f5a8c6176b517c5ef54aae2b4500df04642ed3642b56c2dc2a2f1c

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,7669

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence