Protein

View in Explore

Genbank accession

XKC18923.1 [GenBank]

Protein name

minor tail protein

RBP type

TSP

Evidence RBPdetect

Probability 0,87

Protein sequence

MALLPSDIPTGLVTGEFHFVNEDSVDFDTDPDLLVVTGTVTFTASVPKLTHATKAATIIPMAFDAEFNSNGLLVPKGRLTEPGIELPATNSSLLSPLNYTWKVEFNLKEAATGFSVVIPSFDISVPWGGTVDLTTASPVDTSPGVLTVQGPQGIQGPAGPAGPSGDAAYVQQIPRIASYLKREEKLQDYQTKLANAENVQCNIVAMGDSITEGTGASNVVNRWQTVMQTELRYRHGALTGATFPWIPTWPRTSAPGMPVTRSGNVTVDINRGIGWKAGIINTDGAVTFSFTGTSFKLIVLKGSTTGVMDVSIDGGAVQSYNTNSITGGGSDAAYKWDSGPLTRGEHTARVTWNASSPTNYGIYLFGCLTYDGDETNGIRVLDGGYHGSNSSLYTSAQLTQLGANINSIGNVGLVISAVGTNDYGQSTPIATFKERLELFVSTLRGVGYTGSIAFCGVYKGLTSGVARDDALWTSYLDQMRQVAATDSKVAFFDWRLRMPDVPEPYNASASLGLYADGLHPSDAGHKYIAGFMTDYLSDRYI

Physico‐chemical properties

protein length:	541 AA
molecular weight:	57568,77270 Da
isoelectric point:	4,90193
aromaticity:	0,09427
hydropathy:	-0,08651

Domains

Domains [InterPro]

DC_1109
ATT
1–242

DC_1109 G3DSA:2.60.120.260 IPR036514

G3DSA:1.20.5.320
STR
142–193

G3DSA:1.20.5.320 G3DSA:2.60.120.260 IPR013830

Coil
Unmapped
179–199

Coil cd00229

SSF52266
STR
183–246

SSF52266 SSF52266

IPR051532
Unmapped
380–539

IPR051532

XKC18923.1

1 541

Architecture

ATT

STR

ATT 1-246 | STR 280-539 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_1109	ATT	DC_1109	1	242	Novel HMM	DC_1109	N-terminal	Low	Positional only	79 proteins / 79 hits
G3DSA:1.20.5.320	STR	G3DSA:1.20.5.320	142	193	Merged direct domain	G3DSA:1.20.5.320	Central	Low	Positional only	67 proteins / 67 hits
Coil	Unmapped	-	179	199	Coils	Coil	-	-	-	-
SSF52266	STR	SSF52266	183	246	Merged direct domain	SSF52266	Central	Low	Positional only	227 proteins / 227 hits
G3DSA:2.60.120.260	STR	G3DSA:2.60.120.260	280	363	Merged direct domain	G3DSA:2.60.120.260	Central	Low	Positional only	264 proteins / 264 hits
G3DSA:2.60.120.260	STR	G3DSA:2.60.120.260	285	363	Merged direct domain	G3DSA:2.60.120.260	Central	Low	Positional only	264 proteins / 264 hits
cd00229	ENZ	DC_0001	352	535	InterPro cluster	cd00229	C-terminal	High	Text match	480 proteins / 783 hits
SSF52266	STR	SSF52266	354	538	Merged direct domain	SSF52266	Central	Low	Positional only	227 proteins / 227 hits
IPR036514	STR	IPR036514	373	539	Merged direct domain	SGNH hydrolase superfamily	Central	Low	Positional only	180 proteins / 180 hits
IPR013830	ENZ	DC_0001	379	526	InterPro cluster	SGNH hydrolase-type esterase domain	C-terminal	High	Text match	480 proteins / 783 hits
IPR051532	Unmapped	-	380	539	InterPro	Diverse Ester Hydrolysis Enzymes	-	-	-	-

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

XKC18923.1

1 541

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	222	222	0,8047
Central domain	223	421	200	0,3281
C-terminal	422	541	119	0,4268

Note: Constraints were applied during segmentation.
Fixed 24 C-terminal predictions appearing before Central domain

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-222

Central
223-421

C-terminal
422-541

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Arthrobacter phage Amavida [NCBI]	3367555	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	No host information

Coding sequence (CDS)

Genbank protein accession

XKC18923.1 [NCBI]

Genbank nucleotide accession

PQ244017 [NCBI]

CDS location

range 5088 -> 6713
strand +

CDS

ATGGCACTTTTGCCTTCTGATATTCCTACCGGGCTTGTGACAGGTGAGTTCCACTTTGTCAATGAGGATTCGGTGGATTTTGACACCGATCCGGACCTGCTTGTAGTTACTGGCACAGTGACATTCACTGCCTCGGTGCCTAAGCTGACACACGCTACAAAGGCCGCTACAATCATTCCGATGGCCTTTGATGCCGAGTTCAACTCAAATGGCCTGTTGGTACCCAAGGGGCGCTTGACTGAACCGGGTATTGAGCTTCCAGCTACGAACTCTTCGCTGCTGTCGCCGCTAAACTATACGTGGAAAGTAGAGTTCAACCTCAAAGAGGCTGCTACCGGCTTTAGCGTAGTAATCCCGAGCTTCGATATAAGCGTCCCATGGGGCGGTACCGTAGACCTCACGACGGCCTCCCCTGTGGATACCTCCCCCGGTGTGCTGACTGTTCAGGGGCCTCAGGGTATCCAAGGCCCTGCCGGTCCTGCTGGCCCTTCTGGGGACGCGGCCTACGTCCAGCAGATTCCGCGCATAGCAAGCTACTTGAAGCGGGAAGAGAAGCTACAGGACTACCAGACGAAGCTCGCGAATGCGGAAAATGTACAGTGCAACATCGTGGCTATGGGAGACTCCATCACCGAGGGTACTGGGGCTAGTAATGTCGTCAACAGGTGGCAGACGGTCATGCAGACCGAGCTCCGCTATCGCCACGGTGCGCTGACAGGGGCTACGTTCCCTTGGATTCCTACTTGGCCTCGCACAAGCGCTCCCGGTATGCCTGTAACCCGCTCTGGCAACGTGACAGTGGATATCAACCGTGGCATCGGTTGGAAGGCCGGGATTATCAACACTGACGGTGCTGTGACGTTCTCCTTTACCGGCACCAGCTTCAAGCTGATTGTGCTGAAAGGCTCCACAACTGGTGTTATGGATGTGTCCATAGATGGTGGGGCGGTGCAGAGCTACAACACAAACAGCATTACAGGTGGTGGCTCTGATGCCGCGTACAAGTGGGACTCTGGTCCGCTGACTCGTGGGGAGCACACCGCTCGCGTTACATGGAATGCCAGTTCCCCAACCAACTACGGAATCTACCTGTTCGGATGCCTTACATACGACGGTGACGAGACAAACGGAATCCGTGTGCTGGATGGTGGATACCATGGCTCCAACTCAAGCCTATACACGTCAGCACAGTTGACTCAGCTTGGGGCCAACATCAATTCCATTGGAAATGTTGGTCTGGTCATCTCTGCGGTGGGTACAAACGACTACGGCCAGTCAACTCCCATAGCGACGTTCAAGGAACGTTTGGAATTGTTTGTGTCTACGTTGCGTGGAGTAGGTTACACCGGCTCAATAGCATTCTGTGGTGTCTACAAGGGGCTTACCAGTGGTGTCGCTAGGGACGATGCCCTGTGGACCTCTTACCTTGACCAGATGCGTCAGGTAGCGGCTACAGACAGCAAGGTAGCCTTCTTCGACTGGCGTCTGAGAATGCCCGATGTTCCTGAGCCTTACAACGCTTCTGCGAGTCTGGGCCTGTACGCTGACGGGCTGCATCCTAGTGATGCGGGGCACAAGTACATTGCGGGATTCATGACAGACTATTTATCTGACCGCTATATCTAA

Genome Context

Tertiary structure

PDB ID

f4f524f8a90d179f43e6810907894a799f04dd45c9a88d4dc57194058e1bba8f

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,8185

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence