Protein

View in Explore

Genbank accession

QXN68366.1 [GenBank]

Protein name

virion structural protein

RBP type

TSP

Evidence DepoScope

Probability 1,00

Protein sequence

MRIELTDYNSDPSTTIKIYRHYYPFDVDNLPPVLVELPGDASSYTDETLILNTMVYYRISVVHNGNEVVGPLYTTMKRYYTGPQINKDRPDQILRGDNYIGRYGTLPLDTVLSLNVAKQLVPSCTVIDGIVPETIEVEKCSYHGNVLFISTVPVFHGSPEDLYNDGALLSHGDGSGILSSALYDSIATKVNQGKPITYNNYSFKFRLMTTSEYAELYVKLYPESQMGLACERVISNCNTHPFKSPVVNIGSQGETFKTVGLDGSSIDTNWTTKGPLYMVVELMNRGDMGWPNPEVSVTLADPTDRMMFCQSEIVNGRAHFFGGIYSKFNSYSSAINKHISVNLDGTDRQVHADMPVGVYNACTWVHGNKIYCLGGAKKIGSGEYTYSELYNDIQVWEDNGTQEGIWTTITNSLPFYYGASVTTYQDMKSDKKRLLYIGGYNDVVPSGKNNFATADLDTFDGTFTVYDRATFYSGGGGGPVTQYEDYFLWVGPETRTNNYTNATFSFTIPENVDDFIYTSGIKQQGTELPTTKGGKIHVWRDTIFMFSEASIDQKQGELYLYQFVPSESRWLKITVPIPGLSEDTRASISGAFHEGKLVLMLNQPWTNASYVSSFYSISLIDPIDAPIVPVTDVVVGNSRIFTTYAEVSI

Physico‐chemical properties

protein length:	649 AA
molecular weight:	72343,31930 Da
isoelectric point:	4,90170
aromaticity:	0,12173
hydropathy:	-0,25362

Domains

Domains [InterPro]

DC_1242
ATT
1–212

DC_1242 IPR015915

IPR015915
STR
280–574

IPR015915

IPR015915
STR
291–508

IPR015915 DC_2226

QXN68366.1

1 649

Architecture

ATT

STR

RBD

ATT 1-212 | STR 270-574 | RBD 575-649

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_1242	ATT	DC_1242	1	212	Novel HMM	DC_1242	N-terminal	Low	Positional only	6 proteins / 6 hits
IPR015915	STR	IPR015915	270	574	Merged direct domain	Kelch-type beta-propeller	Central	Low	Positional only	52 proteins / 52 hits
IPR015915	STR	IPR015915	280	574	Merged direct domain	Kelch-type beta-propeller	Central	Low	Positional only	52 proteins / 52 hits
IPR015915	STR	IPR015915	291	508	Merged direct domain	Kelch-type beta-propeller	Central	Low	Positional only	52 proteins / 52 hits
DC_2226	RBD	DC_2226	564	649	Novel HMM	DC_2226	C-terminal	Low	Positional only	6 proteins / 6 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

QXN68366.1

1 649

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	417	417	0,2833
Central domain	418	638	222	0,4319
C-terminal	639	649	10	0,7203

Note: Constraints were applied during segmentation.
Fixed 6 C-terminal predictions appearing before Central domain|C-terminal too short, adjusted boundary

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-417

Central
418-638

C-terminal
639-649

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Pseudomonas phage PA7 [NCBI]	347330	Uroviricota > Caudoviricetes > Chimalliviridae > Phikzvirus PA7 >
Host	Pseudomonas aeruginosa [NCBI]	287	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Pseudomonadales

Coding sequence (CDS)

Genbank protein accession

QXN68366.1 [NCBI]

Genbank nucleotide accession

MZ444140 [NCBI]

CDS location

range 1993 -> 3942
strand +

CDS

GTGAGAATTGAATTGACTGACTATAATTCAGATCCATCTACAACTATAAAGATTTATAGGCATTATTATCCATTTGACGTAGATAATTTGCCGCCCGTACTAGTTGAATTACCTGGTGATGCAAGTAGCTATACTGATGAGACTCTTATCCTCAATACCATGGTTTATTACAGGATATCAGTTGTACATAATGGCAATGAGGTAGTTGGTCCTTTGTACACCACAATGAAGCGGTACTACACTGGACCACAGATAAACAAAGATAGACCTGACCAGATTCTTCGTGGAGACAACTATATTGGTCGTTATGGAACCCTTCCCTTAGACACAGTGTTATCGCTGAATGTAGCGAAACAGCTAGTACCGTCATGTACAGTTATCGATGGGATCGTCCCTGAGACGATTGAGGTAGAGAAATGTAGTTATCACGGGAACGTGTTGTTCATTTCTACCGTCCCAGTTTTCCATGGTAGTCCAGAAGATCTATATAACGACGGAGCATTGTTGTCACATGGGGACGGTTCCGGTATTTTGAGTTCGGCGTTATATGATTCCATCGCAACTAAAGTCAACCAGGGTAAACCAATAACCTATAATAACTACTCATTCAAGTTTAGGCTGATGACGACTAGTGAGTATGCCGAACTCTATGTCAAGTTATATCCTGAATCACAAATGGGTCTAGCCTGTGAACGGGTTATCAGTAATTGTAACACGCATCCATTCAAATCACCGGTTGTTAATATCGGTTCTCAGGGTGAAACATTTAAGACTGTAGGTTTGGACGGCAGTTCTATAGATACTAACTGGACGACTAAAGGACCTTTATACATGGTCGTCGAGCTAATGAATCGCGGTGATATGGGCTGGCCTAATCCAGAGGTTAGTGTCACTCTTGCAGATCCGACTGATCGGATGATGTTTTGCCAATCAGAGATCGTCAATGGACGTGCCCACTTCTTTGGCGGTATCTATAGTAAGTTTAATAGTTACTCATCCGCCATTAATAAACATATTAGTGTGAATCTAGATGGAACAGATCGACAGGTACATGCCGATATGCCAGTTGGAGTGTATAACGCTTGCACCTGGGTACATGGTAATAAGATCTACTGTTTAGGTGGTGCTAAGAAGATAGGTAGTGGCGAATATACATATTCTGAACTGTATAATGACATTCAGGTATGGGAAGATAATGGTACCCAAGAAGGTATATGGACAACGATAACTAATAGTCTACCATTTTATTATGGCGCAAGCGTCACCACATACCAAGATATGAAATCAGATAAGAAACGTCTCTTGTATATTGGCGGGTATAACGATGTAGTACCATCTGGTAAAAATAACTTCGCTACGGCTGATTTGGATACATTCGATGGTACGTTCACCGTTTATGATAGGGCGACCTTCTATAGCGGTGGTGGTGGTGGACCTGTAACGCAATATGAAGATTATTTTCTTTGGGTCGGTCCAGAAACTAGAACAAATAACTATACGAATGCGACATTTAGTTTCACGATTCCCGAGAACGTAGACGACTTTATCTATACAAGTGGGATTAAACAACAAGGGACTGAATTACCCACAACCAAAGGTGGTAAGATACATGTTTGGCGTGATACGATCTTTATGTTCAGCGAGGCGTCGATTGATCAAAAGCAAGGTGAGTTATATCTATATCAATTCGTACCAAGCGAAAGCAGGTGGCTAAAAATAACTGTACCTATACCTGGATTAAGTGAAGATACCCGCGCATCTATCAGTGGTGCATTCCATGAAGGTAAGTTAGTCCTTATGTTAAATCAACCGTGGACTAATGCTTCATATGTTTCAAGTTTCTATTCCATTAGTCTAATTGATCCAATCGATGCTCCGATTGTTCCAGTAACTGATGTTGTAGTCGGTAATAGTCGAATATTCACAACATACGCCGAGGTTTCGATATGA

Genome Context

Tertiary structure

PDB ID

a3d5d8dfd3bac4ca9cc621f8c744854104dcc7072298d8a118474fa6d9485673

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,7064

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence