Protein

View in Explore

Genbank accession

YP_008433591.2 [GenBank]

Protein name

putative adhesin

RBP type

TSP

Evidence RBPdetect

Probability 0,81

Protein sequence

MLSLIPRLAPWPLPRASSEVSDLWVQYRFLGTEAIDEVTDAVATLYGTATLADGKLVTNPASPANYAAMNNIIFDANEDFNISLNVNMPFSNSRPYNTILGVYTSTAGPRAWALGRIGNDTNPSKLHFAMVSGGVKYDFYGPVLNADTDYHIEVSRTQNVLYIFVNGNLELATPFALGNDQASLPRMRTDVILAEGQTATLTHHGGGYKWGLQIFKGKGGHTSNFTPEAPVEYSRPYYTADVAQDIKLQLGMRRGTKACEASGAQLALNGTATVGKNARLSLTNVTTSYASIPVAAFGEADFTIEFMCNLSAVHSTYGNHFGHMFSSVSASEDNRWIVWVSPSGRLGFSMSLSANANDTVGTGSVEGAFKFNRDNHIVVQRKDGVIKLYLNKQEVAQMAQAAPIRGGAGVFRTQSLNGATSCAGQLWNIRIADRALYSEQVKTKPTFPQFTKEYDPTLFMQYTFSYDEAINEVTETFAALSGNAAVSNGRLSTGSSASDNMSTPATLIEPNEDFTLEVMFNCTTHNVNMPILGIVGGSNTGVSKNAWYLHYDVPAAAFRFMVYDGTGASDMVQFARPNIFNTDTHIAIARKGGVMTLFIAGQPVASTPSIKGNVPTSVQMGTTFSSTYMNGTRTNFRLVRGRALYDSAFEPPVTLPVVGRPTYTQQEAAATKAQIDLRRDSARNDANGRSVQVYSSARHVRGRILHAAATSSFYYAPCEPFGAGDFTIELDFNLTSINGTYGGALAGQWVRGNVASEDNCWLIYVGPTRLIQFAWARSAAANDFDFIASAAGVFDFSADYRLVVERIGTTLTIYLNNVQVAQGTCAIPLRTNAPHYVRSNSSANLYAFGGSVWNLRISDRAVYNGNVTRVPLFPKMPKAAEYTDQSLLNDIVVQCDMNEGNARNAKTGEVITFSGTGAAIRERLVTTLANTSRWYIPCGPFSAGDFTIEFDLNLLSSTGASSRPIFGQFRGDVGPNSWVFYTTSSGNLAFQCLGVDASSLSIDSLNGPIEKRTLTAGKEHHVVVERKAGVVTMYIDGVVIGSGAFTAQLVDMSAYPYITNLYDLSTAKYCASEIGNVRIAKRALYNGVITKARLPLVPNQKPSLTANIGSAIGTLSGACQNLYYGGVQSSLGAFSHTLFRDIRDPQNVKTVRLVALALDRTYTVLAWREVDMPPTADMPQFTNSLKIGNAAPLLISNSSGASVANGVTGRYWSGNPFGPLTHGTAIPFEFV

Physico‐chemical properties

protein length:	1231 AA
molecular weight:	132947,13720 Da
isoelectric point:	7,26990
aromaticity:	0,10154
hydropathy:	-0,08798

Domains

Domains [InterPro]

IPR013320
STR
21–172

IPR013320 G3DSA:2.60.120.200 IPR013320 G3DSA:2.60.120.200 G3DSA:2.60.120.200

IPR013320
STR
280–444

IPR013320 G3DSA:2.60.120.200 IPR013320 IPR013320

PF13385
LEC
286–441

PF13385 PF13385 PF13385

DC_2085
STR
625–859

DC_2085

YP_008433591.2

1 1231

Architecture

STR

STR 21-172 | STR 250-444 | STR 480-870 | STR 879-1091 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
IPR013320	STR	IPR013320	21	172	Merged direct domain	Concanavalin A-like lectin/glucanase domain superfamily	Central	Low	Positional only	237 proteins / 237 hits
G3DSA:2.60.120.200	STR	G3DSA:2.60.120.200	250	444	Merged direct domain	G3DSA:2.60.120.200	Central	Low	Positional only	153 proteins / 153 hits
IPR013320	STR	IPR013320	280	444	Merged direct domain	Concanavalin A-like lectin/glucanase domain superfamily	Central	Low	Positional only	237 proteins / 237 hits
PF13385	LEC	DC_0004	286	441	InterPro cluster	PF13385	C-terminal	Medium	Text match	334 proteins / 417 hits
IPR013320	STR	IPR013320	480	638	Merged direct domain	Concanavalin A-like lectin/glucanase domain superfamily	Central	Low	Positional only	237 proteins / 237 hits
G3DSA:2.60.120.200	STR	G3DSA:2.60.120.200	491	642	Merged direct domain	G3DSA:2.60.120.200	Central	Low	Positional only	153 proteins / 153 hits
PF13385	LEC	DC_0004	497	635	InterPro cluster	PF13385	C-terminal	Medium	Text match	334 proteins / 417 hits
DC_2085	STR	DC_2085	625	859	Novel HMM	DC_2085	Central	Low	Positional only	118 proteins / 118 hits
G3DSA:2.60.120.200	STR	G3DSA:2.60.120.200	669	870	Merged direct domain	G3DSA:2.60.120.200	Central	Low	Positional only	153 proteins / 153 hits
IPR013320	STR	IPR013320	715	868	Merged direct domain	Concanavalin A-like lectin/glucanase domain superfamily	Central	Low	Positional only	237 proteins / 237 hits
G3DSA:2.60.120.200	STR	G3DSA:2.60.120.200	879	1091	Merged direct domain	G3DSA:2.60.120.200	Central	Low	Positional only	153 proteins / 153 hits
IPR013320	STR	IPR013320	905	1086	Merged direct domain	Concanavalin A-like lectin/glucanase domain superfamily	Central	Low	Positional only	237 proteins / 237 hits
PF13385	LEC	DC_0004	933	1084	InterPro cluster	PF13385	C-terminal	Medium	Text match	334 proteins / 417 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

YP_008433591.2

1 1231

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	20	20	0,9632
Central domain	21	334	315	0,7923
C-terminal	335	1231	896	0,1793

Note: Constraints were applied during segmentation.
Fixed 11 C-terminal predictions appearing before Central domain

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-20

Central
21-334

C-terminal
335-1231

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Pseudomonas phage PaBG [NCBI]	1335230	Uroviricota > Caudoviricetes > Baikalvirus >
Host	Pseudomonas aeruginosa PAO1 [NCBI]	208964	Bacteria > Proteobacteria > Gammaproteobacteria > Pseudomonadales > Pseudomonadaceae > Pseudomonas

Coding sequence (CDS)

Genbank protein accession

YP_008433591.2 [NCBI]

Genbank nucleotide accession

NC_022096 [NCBI]

CDS location

range 227065 -> 230760
strand +

CDS

ATGCTGAGTCTGATTCCGAGACTAGCACCTTGGCCTTTGCCGAGGGCATCCTCAGAGGTAAGTGACCTTTGGGTGCAATATCGATTTCTTGGCACTGAAGCCATTGATGAAGTTACGGATGCTGTAGCCACGCTCTACGGAACCGCCACTTTGGCTGACGGTAAACTCGTGACTAACCCAGCGAGTCCTGCCAACTACGCGGCCATGAACAACATCATCTTCGACGCCAACGAAGATTTCAACATAAGCCTGAACGTGAATATGCCGTTCAGCAACAGCCGTCCATACAACACTATTCTTGGTGTGTACACTTCGACCGCAGGTCCACGTGCTTGGGCTCTGGGTCGCATCGGTAACGACACTAACCCGTCGAAGCTCCACTTCGCCATGGTCTCAGGAGGTGTCAAATACGACTTCTACGGTCCCGTGCTGAACGCCGACACTGATTACCACATCGAAGTGTCGCGCACTCAGAACGTGCTGTACATCTTCGTAAACGGCAACTTGGAGCTGGCTACGCCTTTTGCCTTGGGCAACGATCAGGCTTCTTTGCCCAGGATGCGTACCGACGTTATCCTCGCCGAGGGCCAGACGGCGACGCTCACGCACCACGGCGGCGGCTATAAGTGGGGCCTTCAGATTTTCAAAGGTAAGGGCGGTCATACGTCCAACTTTACGCCCGAAGCACCTGTCGAATACTCGCGCCCGTACTACACGGCAGACGTAGCACAAGACATCAAGCTGCAACTTGGCATGCGCCGCGGTACTAAGGCGTGCGAAGCCTCTGGTGCCCAGTTAGCCTTGAACGGCACAGCGACCGTAGGTAAGAACGCTCGCTTATCTTTGACGAACGTAACGACCTCTTACGCGAGTATCCCGGTTGCCGCATTTGGAGAAGCCGACTTTACCATTGAGTTCATGTGTAACCTGAGCGCTGTGCATTCGACATATGGTAACCATTTCGGGCACATGTTTAGCTCGGTGAGCGCCAGCGAGGATAACCGCTGGATCGTTTGGGTGTCGCCTTCGGGTCGTCTGGGCTTTTCGATGAGCTTATCCGCGAACGCGAATGACACTGTAGGCACAGGTTCCGTAGAGGGTGCCTTCAAGTTCAACCGTGACAATCACATTGTTGTCCAGCGTAAGGATGGCGTCATCAAGCTCTACTTGAACAAACAAGAAGTGGCACAAATGGCACAAGCTGCACCCATCAGGGGCGGCGCTGGTGTGTTCCGCACACAGTCGCTCAACGGTGCAACCTCGTGTGCCGGCCAGCTGTGGAACATTCGGATTGCTGACCGGGCACTCTACTCGGAACAGGTCAAGACCAAGCCAACATTCCCGCAGTTCACCAAAGAATACGACCCCACGCTGTTCATGCAGTACACGTTCAGCTACGACGAAGCGATCAACGAAGTTACGGAGACGTTCGCGGCTCTCTCCGGCAACGCGGCCGTATCAAATGGCAGGTTGTCCACTGGGTCTTCGGCGAGCGACAACATGTCTACGCCTGCCACGTTGATCGAACCGAACGAAGACTTCACGTTGGAGGTGATGTTCAACTGCACCACGCATAACGTGAACATGCCGATTCTCGGTATCGTGGGTGGGAGTAACACAGGCGTATCCAAGAACGCATGGTACTTGCACTACGACGTTCCTGCTGCGGCATTTCGCTTCATGGTGTATGACGGTACTGGCGCCAGTGACATGGTGCAGTTCGCACGCCCCAACATCTTCAATACTGACACGCACATCGCAATAGCCCGTAAAGGCGGTGTGATGACGCTGTTCATCGCGGGTCAGCCAGTTGCCAGCACACCAAGCATCAAAGGTAACGTGCCGACTTCTGTGCAGATGGGCACCACGTTCTCCTCAACGTACATGAACGGGACGCGAACAAACTTCCGTCTGGTGCGCGGACGCGCGCTGTACGATTCCGCGTTCGAGCCTCCGGTAACGCTGCCTGTTGTAGGTCGTCCGACGTACACCCAGCAAGAAGCCGCTGCGACCAAAGCGCAGATCGATCTGCGCCGAGACAGTGCGCGAAACGATGCCAACGGACGCTCCGTTCAAGTTTATAGCTCGGCACGTCACGTTAGGGGCCGCATTCTTCATGCTGCCGCAACGTCGTCGTTCTACTACGCACCATGCGAGCCATTCGGAGCTGGTGATTTCACCATAGAGCTGGACTTTAACCTGACATCGATCAACGGCACGTACGGAGGTGCACTGGCCGGACAGTGGGTGCGAGGCAACGTAGCCTCAGAAGATAACTGCTGGCTGATCTATGTAGGACCAACCAGACTCATCCAGTTCGCCTGGGCCCGCAGTGCCGCAGCGAACGATTTCGACTTCATCGCGTCTGCGGCAGGCGTGTTTGATTTCAGCGCTGACTACCGTTTGGTTGTGGAGCGTATCGGGACCACGCTGACGATCTACCTGAACAATGTCCAGGTTGCACAGGGTACGTGCGCGATCCCGTTGAGAACAAACGCTCCCCATTACGTGCGCAGTAACAGCTCGGCAAACCTATATGCGTTCGGCGGTTCTGTGTGGAATCTGCGCATTTCGGATCGTGCAGTGTACAACGGCAATGTAACGCGAGTCCCACTGTTCCCGAAAATGCCGAAAGCCGCCGAGTACACGGACCAGAGTCTGTTGAACGACATTGTTGTGCAGTGCGATATGAACGAAGGGAACGCACGCAACGCCAAGACAGGTGAAGTCATTACGTTCTCAGGTACGGGTGCGGCTATTCGTGAGCGCTTGGTGACGACACTTGCCAACACTTCGCGCTGGTATATCCCGTGCGGTCCGTTCAGTGCTGGCGATTTCACAATCGAGTTCGATTTGAACCTGCTGAGTTCCACTGGGGCTTCGTCTCGTCCGATCTTCGGTCAGTTCAGAGGTGACGTAGGACCAAACTCGTGGGTTTTCTACACCACGTCATCTGGTAACTTGGCGTTCCAGTGTTTGGGTGTAGATGCGTCATCGCTGAGTATCGACTCTCTCAATGGGCCTATCGAGAAGCGCACGCTGACAGCAGGTAAAGAACATCACGTGGTTGTCGAGCGCAAGGCTGGCGTTGTGACCATGTACATCGATGGTGTTGTCATCGGCAGCGGAGCTTTCACTGCACAGCTTGTGGACATGTCGGCGTATCCGTACATCACGAACCTGTACGATCTGTCCACGGCGAAGTATTGTGCCAGTGAGATTGGCAACGTGCGTATTGCCAAGCGTGCCCTGTACAATGGTGTGATCACCAAAGCAAGGCTGCCGCTCGTCCCGAACCAGAAGCCTTCGTTGACTGCGAACATCGGTTCGGCGATTGGTACTCTGTCTGGTGCGTGCCAGAACTTGTATTACGGTGGCGTGCAAAGCTCGTTGGGTGCATTCAGCCATACGCTGTTCCGTGACATCCGCGATCCGCAGAACGTCAAGACTGTTCGCCTTGTTGCGCTCGCTCTCGACAGGACGTACACCGTGCTGGCGTGGCGAGAAGTGGATATGCCGCCGACCGCGGATATGCCGCAGTTCACCAACTCGTTGAAGATCGGGAACGCCGCACCTCTGCTGATCTCCAATTCGTCCGGCGCTAGTGTTGCAAATGGCGTCACGGGGCGGTATTGGTCTGGCAACCCGTTTGGTCCGTTGACACACGGAACTGCCATTCCATTCGAGTTTGTGTAG

Genome Context

Tertiary structure

PDB ID

fac419fc98765a9944b35d90f3831733534da0395f28dc30229ac2bebea3f1a0

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,2747

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence