Protein

View in Explore

Genbank accession

YP_007236480.1 [GenBank]

Protein name

tail fiber protein

RBP type

Evidence GenBank

Probability 1,00

Evidence Phold

Probability 1,00

TSP

Evidence DepoScope

Probability 1,00

Evidence RBPdetect

Probability 0,90

Evidence RBPdetect2

Probability 0,86

Protein sequence

MADYSQLPIENIWSTGGDMVAPTPAQQQGGWGIQSVPRQWWNWKWNLHDTNLAYLLQKGIPEWTSTQEYIANKSFCTRGGFVYKAVRTHTGSDPATANPNWARAFADFTTSSSALGSLTPRDGGIPFFISATGASVFDSTAYGRGMLNVANAAAARNYISAQESSVVLSNLSTVTRAANTVPYFNTDTSMATFNITAFGRGLVNAANAENARGFLGLANSAIITADPANRAHTLVYRDAAGNFNAGVITATLSGNATTANKLRAPVTINGVAFDGSQNIVLPGLDTSYAGTVARLHINGANLSSADKTTQLALRNKSDTDWISLAVVDDNILQFVFRSATNPVVQIGNEVILHTGNQFSLGPTLTDARSRLGLDRLTQGSSDTQVFPSTLNNGPYLTVQPTAIGGFNGSTNGWLFRFDANGNMTHGTVPAARITGLSNSAQIPATTTAQANSLVQRDADGGFSAIAINAYGTIVGYGSNIFSRASGTGNAHIGFQRANGTELGLIWGAQSNNSMNFRVAGGSTAVSITGLDMTVTGRVNATTLNASGNVNATGNVNAGSATLNTAGNITGAAYGAYGSLTNWVDSVYAKKGEIPNDIARAGAAWDAVGQYILAGDQSGGSGGPGTIRAGNQLRPYSTISYTAGSLPAGSYRCMGAFAAGGNQITLWQRIS

Physico‐chemical properties

protein length:	670 AA
molecular weight:	69780,41320 Da
isoelectric point:	8,90897
aromaticity:	0,08657
hydropathy:	-0,11507

Domains

Domains [InterPro]

No domain annotations available.

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

No domain annotations available.

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

YP_007236480.1

1 670

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	312	312	0,6007
Central domain	313	511	200	0,2595
C-terminal	512	670	158	0,8574

Note: Constraints were applied during segmentation.
Fixed 132 C-terminal predictions appearing before Central domain

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-312

Central
313-511

C-terminal
512-670

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Pseudomonas phage PaP1 [NCBI]	685892	Uroviricota > Caudoviricetes > Vandenendeviridae > Pakpunavirus > Pakpunavirus PaP1
Host	Pseudomonas aeruginosa PA1 [NCBI]	1279007	Bacteria > Proteobacteria > Gammaproteobacteria > Pseudomonadales > Pseudomonadaceae > Pseudomonas

Coding sequence (CDS)

Genbank protein accession

YP_007236480.1 [NCBI]

Genbank nucleotide accession

NC_019913.1 [NCBI]

CDS location

range 42636 -> 44648
strand +

CDS

ATGGCTGATTACAGTCAACTACCTATTGAAAATATTTGGTCCACAGGCGGGGATATGGTAGCCCCGACCCCTGCGCAGCAGCAAGGCGGATGGGGTATTCAGTCGGTTCCTCGCCAATGGTGGAACTGGAAGTGGAACCTTCACGATACTAACCTAGCGTATTTGCTACAGAAGGGCATCCCAGAGTGGACTAGTACACAAGAGTACATTGCTAACAAATCGTTCTGCACTAGAGGTGGATTTGTTTACAAGGCTGTTCGTACCCATACAGGTAGCGACCCGGCCACCGCTAACCCCAACTGGGCCCGAGCTTTCGCAGACTTTACCACATCTAGCTCTGCACTTGGAAGCCTGACACCAAGAGACGGTGGAATCCCGTTCTTCATTAGTGCCACAGGAGCTAGCGTGTTTGACTCTACGGCTTATGGTCGTGGAATGTTGAATGTAGCTAACGCCGCAGCAGCCAGAAACTATATTTCGGCTCAAGAAAGTTCTGTTGTACTGTCTAACCTGTCCACTGTGACTAGGGCTGCCAACACAGTTCCGTACTTCAATACGGATACCTCCATGGCTACCTTCAACATCACAGCGTTCGGAAGAGGACTTGTCAACGCGGCTAATGCTGAAAACGCAAGAGGTTTCCTAGGCCTAGCTAACTCTGCTATCATCACAGCCGATCCAGCTAACAGAGCCCACACTCTGGTCTATAGAGACGCTGCTGGTAACTTCAACGCTGGTGTGATTACGGCCACCCTGTCTGGAAACGCAACCACAGCTAACAAGCTAAGGGCTCCAGTTACAATCAACGGTGTAGCATTCGACGGAAGCCAGAACATTGTTCTTCCGGGCCTAGATACAAGTTATGCTGGAACGGTTGCACGCCTCCACATCAACGGAGCAAACCTTTCGAGTGCAGACAAGACGACTCAGCTAGCATTGAGGAATAAGTCTGACACTGACTGGATTAGCCTCGCTGTAGTAGATGACAACATTCTGCAATTCGTGTTCAGAAGCGCTACAAACCCAGTTGTCCAGATTGGTAACGAAGTTATCCTTCACACAGGAAACCAGTTCTCTCTGGGCCCGACTCTTACAGACGCTAGGTCTCGTCTGGGTCTCGACAGACTCACTCAAGGTAGCTCTGATACTCAAGTCTTCCCCAGCACCTTGAACAATGGCCCCTACTTGACCGTACAACCTACGGCTATCGGAGGATTCAACGGTAGCACTAACGGATGGCTGTTCCGATTCGACGCTAATGGTAACATGACTCATGGTACAGTTCCTGCCGCTAGAATCACTGGTCTGTCCAACTCGGCTCAGATTCCAGCCACAACTACGGCGCAGGCTAACTCTCTTGTTCAGAGAGACGCAGACGGAGGATTCAGCGCTATTGCGATTAATGCGTATGGCACTATCGTCGGGTACGGCTCTAACATCTTCAGTAGAGCATCGGGCACTGGCAACGCCCACATCGGGTTCCAGAGAGCGAACGGAACAGAACTCGGTCTTATCTGGGGGGCCCAGTCTAACAACTCGATGAACTTCCGGGTAGCTGGTGGCTCCACCGCAGTGTCGATTACCGGTCTGGACATGACTGTTACTGGAAGAGTCAATGCTACCACACTAAACGCCTCTGGAAACGTGAATGCGACAGGCAACGTTAACGCCGGGAGCGCTACGCTCAATACAGCAGGGAATATCACAGGAGCCGCTTACGGAGCCTATGGTTCTCTGACCAACTGGGTTGATTCGGTATATGCCAAGAAGGGAGAAATTCCTAACGATATCGCAAGAGCCGGAGCCGCTTGGGACGCTGTAGGTCAGTATATTCTGGCGGGAGATCAATCTGGAGGCTCTGGCGGCCCGGGTACAATTAGAGCCGGGAACCAGTTGAGACCTTACTCTACGATCAGCTATACAGCCGGTAGCCTGCCCGCTGGCTCTTACAGATGCATGGGCGCGTTCGCTGCTGGCGGAAACCAGATCACTCTCTGGCAGCGCATTTCTTAA

Genome Context

Tertiary structure

PDB ID

4829d243fd8a4db29b426ddc441b38cc334274c996fa520935969167fb6a1bf2

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,6430

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence