Phage RBP Database

UniProt accession

A0A1D8KPP9 [UniProt]

Protein name

Tail fiber protein

RBP type

TSP

Evidence DepoScope

Probability 1,00

TF

Evidence GenBank

Probability 1,00

TF

Evidence Phold

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,91

TSP

Evidence RBPdetect2

Probability 0,92

TF

Evidence UniProt/TrEMBL

Probability 1,00

Protein sequence

MASNIRFKRSSVAGKVPTSVQLPIGEIAMNTNDGVLWMQEEAGRILNVRAGAALTEGKFIYVSTFGDDNDDGSSPTKAKRSIKAALGIATAGDTVEVAAGTFVEDNPLTVPPLVAVQGEDLRSTTVSPQNTDEDFFLVNNGVFLGNMSFVGSATTHAIVAFDPTRVGVVTQSPYVRNCTNFIPNSIGMRIDGDLRMGNNGVNGSMVVDSYTQYNQNGVGVSITNKAYAQLVSIFTINSGTSIFCGDGGQCDITNSNSSFGEYGLIGDGVSQLQYVGFTTTSSGIASDRVQIQLGNVKGFEIVGFDYDPKTGYSTVTTSEAHNLQVGYAATLSGIGFTCPVSYGATHAVSAFEYDTITGLATVTTATNHGLVAGGNYKLSGLEFTCTGSPGITTTIFPDGTQGYMFKVESLVDSTSFTSNVGAAGFDHTYVSGGIVRAGINTDIFPDPNIEPGKSGFVFDVKGVESSTKFNIYAGISSIPHTFVQAGIRTVTNFLYDNDSGISTVTVSKPHFLKVGDNVKLDGIEFSCSGSTGVTVNISNVEYDNTVGIATITTSSGHGVTLHKTVQLADIEFSCTSGGPPFTNIFPTALYDSNAAYGHDVFRVSSVNNSTEFEVNVGVSTIAHTYVSGGTATAGVTTTIFPDGSSNYGSVFEVTGITSTTFSIDVGIATFGHTYVSGGTARRAAVSKLYANRPYDGQVLFLDTLYKQLDKIDITSPGQGYLSTPTVTISDPEGPNGTTATAEATLENGKIKEITVTNNGSQYINNPTVTLTGGTPTVSAGTTTGMRPLYYTIQEATQSDPYTGISTVVFDQVLNNAIGVGTTAFFYQVSLVLASSHSFEWIGSGGDLAGSRPRLGGVGIQSAEVVKRDGGLVVYTSTDQSGNFRIGDDVNINQVTGTISGRAFNQSLLNTVTPLIIALED

Physico‐chemical properties

protein length:	920 AA
molecular weight:	96305,59960 Da
isoelectric point:	4,69163
aromaticity:	0,08913
hydropathy:	-0,00500

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0066	STR	DC_0066	2	917	Novel HMM	DC_0066	Central	Low	Positional only	99 proteins / 99 hits
IPR012334	STR	IPR012334	47	400	Merged direct domain	Pectin lyase fold	Central	Low	Positional only	867 proteins / 867 hits
IPR011050	STR	IPR011050	52	335	Merged direct domain	Pectin lyase fold/virulence factor	Central	Low	Positional only	572 proteins / 572 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

A0A1D8KPP9

1 920

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	113	113	0,9687
Central domain	114	592	480	0,7987
C-terminal	593	920	327	0,0803

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-113

Central
114-592

C-terminal
593-920

	Name	Taxonomy ID	Lineage
Phage	Synechococcus phage S-CAM9 [NCBI]	1883369	Uroviricota > Caudoviricetes > Pantevenvirales > Kanaloavirus > Kanaloavirus scam9
Host	Synechococcus sp. [NCBI]	1131	cellular organisms > Bacteria > Bacillati > Cyanobacteriota/Melainabacteria group > Cyanobacteriota > Cyanophyceae

Coding sequence (CDS)

Genbank protein accession

AOV60172.1 [NCBI]

Genbank nucleotide accession

KU686204 [NCBI]

CDS location

range 24281 -> 27043
strand +

CDS

ATGGCATCCAACATTCGGTTTAAGAGATCTTCTGTAGCTGGGAAGGTTCCAACTTCTGTTCAGTTGCCTATCGGCGAAATAGCGATGAACACCAATGATGGTGTTCTTTGGATGCAGGAAGAGGCAGGAAGGATTCTGAACGTTCGTGCTGGTGCAGCACTAACTGAAGGTAAATTCATTTATGTCTCTACCTTTGGAGATGACAATGACGATGGTAGTAGTCCCACCAAGGCAAAAAGGTCAATTAAGGCCGCCCTTGGAATTGCCACTGCAGGAGACACTGTAGAAGTAGCTGCAGGGACATTTGTTGAAGATAATCCACTTACAGTTCCTCCTCTTGTTGCTGTGCAAGGGGAGGATTTACGTTCTACGACAGTATCTCCTCAGAATACAGATGAAGATTTTTTCTTAGTCAACAACGGTGTTTTTCTTGGGAATATGAGTTTTGTTGGCTCTGCCACAACTCATGCTATTGTTGCTTTTGATCCAACTCGTGTCGGTGTTGTAACTCAGTCTCCATACGTCCGTAACTGCACCAATTTCATTCCCAACAGTATTGGGATGAGAATTGATGGTGATCTGAGAATGGGTAATAATGGTGTCAATGGCTCGATGGTTGTTGACTCTTACACCCAATATAATCAAAATGGTGTTGGTGTATCGATTACCAATAAAGCATATGCACAGTTGGTTTCGATCTTTACAATTAACTCTGGTACAAGTATTTTCTGTGGTGATGGTGGTCAATGTGACATCACCAACTCCAACTCTTCTTTTGGTGAATATGGACTGATTGGTGATGGTGTAAGTCAACTTCAATATGTTGGATTTACAACTACTTCATCTGGTATTGCAAGTGATAGAGTTCAAATTCAACTAGGTAACGTAAAGGGTTTTGAAATTGTTGGATTTGATTACGATCCTAAAACAGGATATTCGACGGTAACAACGAGTGAAGCTCATAATCTTCAAGTTGGTTATGCTGCCACTCTGAGTGGTATTGGATTCACATGTCCAGTAAGTTATGGTGCAACACATGCTGTGAGTGCATTTGAATATGACACCATAACTGGTTTAGCCACCGTAACTACCGCAACAAATCATGGATTGGTTGCCGGAGGCAATTATAAATTATCTGGTCTTGAATTTACATGTACAGGTTCTCCTGGAATTACTACAACTATCTTCCCTGATGGAACTCAGGGATATATGTTTAAAGTAGAGAGTTTAGTAGATTCTACTTCGTTTACATCTAATGTAGGTGCAGCTGGATTTGATCACACCTATGTTTCTGGTGGTATTGTTCGTGCTGGTATTAATACGGATATTTTCCCAGATCCAAATATTGAACCAGGAAAGTCTGGATTTGTTTTTGATGTAAAGGGTGTTGAGAGTTCTACCAAGTTTAATATTTACGCTGGCATTTCCAGTATTCCACATACATTTGTTCAGGCAGGAATTAGAACTGTTACTAATTTCTTGTATGACAATGACTCTGGTATTTCTACGGTTACTGTTAGTAAGCCTCACTTCCTCAAAGTTGGTGACAATGTAAAGTTAGATGGTATTGAATTTAGTTGTTCTGGATCCACAGGTGTTACAGTAAACATCTCAAATGTTGAATATGATAATACTGTAGGTATCGCAACTATTACAACTTCATCGGGACATGGGGTTACATTACATAAAACTGTTCAACTTGCTGACATTGAATTCAGTTGTACCTCTGGTGGTCCGCCATTTACCAATATTTTCCCAACTGCATTATATGATTCAAATGCAGCTTATGGTCATGACGTATTCCGTGTCAGTTCTGTAAATAATTCAACAGAATTTGAAGTAAATGTTGGTGTTTCGACAATTGCTCACACATATGTTTCTGGTGGTACCGCTACTGCTGGTGTAACAACTACTATTTTCCCTGATGGTAGTTCTAATTATGGAAGTGTTTTTGAAGTCACTGGTATTACTAGTACTACTTTTAGTATTGATGTCGGTATTGCTACATTTGGTCATACATATGTGAGTGGTGGTACAGCAAGACGTGCTGCAGTTTCTAAACTATATGCAAATCGTCCTTATGATGGTCAAGTATTATTCCTTGACACTTTGTATAAACAGTTAGATAAAATTGATATTACCAGTCCTGGTCAGGGATATCTTTCTACTCCAACAGTTACAATTTCTGATCCAGAAGGACCAAATGGCACTACAGCAACTGCTGAAGCTACATTAGAGAATGGTAAAATCAAAGAGATTACCGTTACTAATAATGGTTCTCAATATATTAACAATCCAACGGTTACTCTTACTGGTGGCACTCCAACAGTTTCTGCTGGAACAACCACTGGCATGAGACCATTATATTACACTATTCAAGAAGCCACACAATCAGATCCATATACTGGTATCTCTACAGTTGTGTTTGATCAGGTTCTTAATAATGCAATTGGTGTAGGAACAACTGCTTTCTTCTATCAAGTAAGTTTGGTTCTTGCTTCTTCACATTCTTTTGAGTGGATTGGATCTGGTGGTGACCTTGCTGGATCTCGTCCTAGATTGGGTGGTGTTGGTATTCAATCTGCTGAAGTTGTTAAACGAGATGGTGGATTGGTGGTTTATACATCAACGGATCAATCGGGTAACTTTAGAATTGGTGATGATGTAAACATTAACCAGGTCACAGGAACCATCTCTGGTCGAGCTTTCAATCAGAGTCTCCTAAATACAGTAACACCTCTAATCATCGCTCTGGAAGATTAA

Genbank protein accession

AOV60400.1 [NCBI]

Genbank nucleotide accession

KU686205 [NCBI]

CDS location

range 24281 -> 27043
strand +

CDS

ATGGCATCCAACATTCGGTTTAAGAGATCTTCTGTAGCTGGGAAGGTTCCAACTTCTGTTCAGTTGCCTATCGGCGAAATAGCGATGAACACCAATGATGGTGTTCTTTGGATGCAGGAAGAGGCAGGAAGGATTCTGAACGTTCGTGCTGGTGCAGCACTAACTGAAGGTAAATTCATTTATGTCTCTACCTTTGGAGATGACAATGACGATGGTAGTAGTCCCACCAAGGCAAAAAGGTCAATTAAGGCCGCCCTTGGAATTGCCACTGCAGGAGACACTGTAGAAGTAGCTGCAGGGACATTTGTTGAAGATAATCCACTTACAGTTCCTCCTCTTGTTGCTGTGCAAGGGGAGGATTTACGTTCTACGACAGTATCTCCTCAGAATACAGATGAAGATTTTTTCTTAGTCAACAACGGTGTTTTTCTTGGGAATATGAGTTTTGTTGGCTCTGCCACAACTCATGCTATTGTTGCTTTTGATCCAACTCGTGTCGGTGTTGTAACTCAGTCTCCATACGTCCGTAACTGCACCAATTTCATTCCCAACAGTATTGGGATGAGAATTGATGGTGATCTGAGAATGGGTAATAATGGTGTCAATGGCTCGATGGTTGTTGACTCTTACACCCAATATAATCAAAATGGTGTTGGTGTATCGATTACCAATAAAGCATATGCACAGTTGGTTTCGATCTTTACAATTAACTCTGGTACAAGTATTTTCTGTGGTGATGGTGGTCAATGTGACATCACCAACTCCAACTCTTCTTTTGGTGAATATGGACTGATTGGTGATGGTGTAAGTCAACTTCAATATGTTGGATTTACAACTACTTCATCTGGTATTGCAAGTGATAGAGTTCAAATTCAACTAGGTAACGTAAAGGGTTTTGAAATTGTTGGATTTGATTACGATCCTAAAACAGGATATTCGACGGTAACAACGAGTGAAGCTCATAATCTTCAAGTTGGTTATGCTGCCACTCTGAGTGGTATTGGATTCACATGTCCAGTAAGTTATGGTGCAACACATGCTGTGAGTGCATTTGAATATGACACCATAACTGGTTTAGCCACCGTAACTACCGCAACAAATCATGGATTGGTTGCCGGAGGCAATTATAAATTATCTGGTCTTGAATTTACATGTACAGGTTCTCCTGGAATTACTACAACTATCTTCCCTGATGGAACTCAGGGATATATGTTTAAAGTAGAGAGTTTAGTAGATTCTACTTCGTTTACATCTAATGTAGGTGCAGCTGGATTTGATCACACCTATGTTTCTGGTGGTATTGTTCGTGCTGGTATTAATACGGATATTTTCCCAGATCCAAATATTGAACCAGGAAAGTCTGGATTTGTTTTTGATGTAAAGGGTGTTGAGAGTTCTACCAAGTTTAATATTTACGCTGGCATTTCCAGTATTCCACATACATTTGTTCAGGCAGGAATTAGAACTGTTACTAATTTCTTGTATGACAATGACTCTGGTATTTCTACGGTTACTGTTAGTAAGCCTCACTTCCTCAAAGTTGGTGACAATGTAAAGTTAGATGGTATTGAATTTAGTTGTTCTGGATCCACAGGTGTTACAGTAAACATCTCAAATGTTGAATATGATAATACTGTAGGTATCGCAACTATTACAACTTCATCGGGACATGGGGTTACATTACATAAAACTGTTCAACTTGCTGACATTGAATTCAGTTGTACCTCTGGTGGTCCGCCATTTACCAATATTTTCCCAACTGCATTATATGATTCAAATGCAGCTTATGGTCATGACGTATTCCGTGTCAGTTCTGTAAATAATTCAACAGAATTTGAAGTAAATGTTGGTGTTTCGACAATTGCTCACACATATGTTTCTGGTGGTACCGCTACTGCTGGTGTAACAACTACTATTTTCCCTGATGGTAGTTCTAATTATGGAAGTGTTTTTGAAGTCACTGGTATTACTAGTACTACTTTTAGTATTGATGTCGGTATTGCTACATTTGGTCATACATATGTGAGTGGTGGTACAGCAAGACGTGCTGCAGTTTCTAAACTATATGCAAATCGTCCTTATGATGGTCAAGTATTATTCCTTGACACTTTGTATAAACAGTTAGATAAAATTGATATTACCAGTCCTGGTCAGGGATATCTTTCTACTCCAACAGTTACAATTTCTGATCCAGAAGGACCAAATGGCACTACAGCAACTGCTGAAGCTACATTAGAGAATGGTAAAATCAAAGAGATTACCGTTACTAATAATGGTTCTCAATATATTAACAATCCAACGGTTACTCTTACTGGTGGCACTCCAACAGTTTCTGCTGGAACAACCACTGGCATGAGACCATTATATTACACTATTCAAGAAGCCACACAATCAGATCCATATACTGGTATCTCTACAGTTGTGTTTGATCAGGTTCTTAATAATGCAATTGGTGTAGGAACAACTGCTTTCTTCTATCAAGTAAGTTTGGTTCTTGCTTCTTCACATTCTTTTGAGTGGATTGGATCTGGTGGTGACCTTGCTGGATCTCGTCCTAGATTGGGTGGTGTTGGTATTCAATCTGCTGAAGTTGTTAAACGAGATGGTGGATTGGTGGTTTATACATCAACGGATCAATCGGGTAACTTTAGAATTGGTGATGATGTAAACATTAACCAGGTCACAGGAACCATCTCTGGTCGAGCTTTCAATCAGAGTCTCCTAAATACAGTAACACCTCTAATCATCGCTCTGGAAGATTAA

Genbank protein accession

AOV60628.1 [NCBI]

Genbank nucleotide accession

KU686206 [NCBI]

CDS location

range 24281 -> 27043
strand +

CDS

ATGGCATCCAACATTCGGTTTAAGAGATCTTCTGTAGCTGGGAAGGTTCCAACTTCTGTTCAGTTGCCTATCGGCGAAATAGCGATGAACACCAATGATGGTGTTCTTTGGATGCAGGAAGAGGCAGGAAGGATTCTGAACGTTCGTGCTGGTGCAGCACTAACTGAAGGTAAATTCATTTATGTCTCTACCTTTGGAGATGACAATGACGATGGTAGTAGTCCCACCAAGGCAAAAAGGTCAATTAAGGCCGCCCTTGGAATTGCCACTGCAGGAGACACTGTAGAAGTAGCTGCAGGGACATTTGTTGAAGATAATCCACTTACAGTTCCTCCTCTTGTTGCTGTGCAAGGGGAGGATTTACGTTCTACGACAGTATCTCCTCAGAATACAGATGAAGATTTTTTCTTAGTCAACAACGGTGTTTTTCTTGGGAATATGAGTTTTGTTGGCTCTGCCACAACTCATGCTATTGTTGCTTTTGATCCAACTCGTGTCGGTGTTGTAACTCAGTCTCCATACGTCCGTAACTGCACCAATTTCATTCCCAACAGTATTGGGATGAGAATTGATGGTGATCTGAGAATGGGTAATAATGGTGTCAATGGCTCGATGGTTGTTGACTCTTACACCCAATATAATCAAAATGGTGTTGGTGTATCGATTACCAATAAAGCATATGCACAGTTGGTTTCGATCTTTACAATTAACTCTGGTACAAGTATTTTCTGTGGTGATGGTGGTCAATGTGACATCACCAACTCCAACTCTTCTTTTGGTGAATATGGACTGATTGGTGATGGTGTAAGTCAACTTCAATATGTTGGATTTACAACTACTTCATCTGGTATTGCAAGTGATAGAGTTCAAATTCAACTAGGTAACGTAAAGGGTTTTGAAATTGTTGGATTTGATTACGATCCTAAAACAGGATATTCGACGGTAACAACGAGTGAAGCTCATAATCTTCAAGTTGGTTATGCTGCCACTCTGAGTGGTATTGGATTCACATGTCCAGTAAGTTATGGTGCAACACATGCTGTGAGTGCATTTGAATATGACACCATAACTGGTTTAGCCACCGTAACTACCGCAACAAATCATGGATTGGTTGCCGGAGGCAATTATAAATTATCTGGTCTTGAATTTACATGTACAGGTTCTCCTGGAATTACTACAACTATCTTCCCTGATGGAACTCAGGGATATATGTTTAAAGTAGAGAGTTTAGTAGATTCTACTTCGTTTACATCTAATGTAGGTGCAGCTGGATTTGATCACACCTATGTTTCTGGTGGTATTGTTCGTGCTGGTATTAATACGGATATTTTCCCAGATCCAAATATTGAACCAGGAAAGTCTGGATTTGTTTTTGATGTAAAGGGTGTTGAGAGTTCTACCAAGTTTAATATTTACGCTGGCATTTCCAGTATTCCACATACATTTGTTCAGGCAGGAATTAGAACTGTTACTAATTTCTTGTATGACAATGACTCTGGTATTTCTACGGTTACTGTTAGTAAGCCTCACTTCCTCAAAGTTGGTGACAATGTAAAGTTAGATGGTATTGAATTTAGTTGTTCTGGATCCACAGGTGTTACAGTAAACATCTCAAATGTTGAATATGATAATACTGTAGGTATCGCAACTATTACAACTTCATCGGGACATGGGGTTACATTACATAAAACTGTTCAACTTGCTGACATTGAATTCAGTTGTACCTCTGGTGGTCCGCCATTTACCAATATTTTCCCAACTGCATTATATGATTCAAATGCAGCTTATGGTCATGACGTATTCCGTGTCAGTTCTGTAAATAATTCAACAGAATTTGAAGTAAATGTTGGTGTTTCGACAATTGCTCACACATATGTTTCTGGTGGTACCGCTACTGCTGGTGTAACAACTACTATTTTCCCTGATGGTAGTTCTAATTATGGAAGTGTTTTTGAAGTCACTGGTATTACTAGTACTACTTTTAGTATTGATGTCGGTATTGCTACATTTGGTCATACATATGTGAGTGGTGGTACAGCAAGACGTGCTGCAGTTTCTAAACTATATGCAAATCGTCCTTATGATGGTCAAGTATTATTCCTTGACACTTTGTATAAACAGTTAGATAAAATTGATATTACCAGTCCTGGTCAGGGATATCTTTCTACTCCAACAGTTACAATTTCTGATCCAGAAGGACCAAATGGCACTACAGCAACTGCTGAAGCTACATTAGAGAATGGTAAAATCAAAGAGATTACCGTTACTAATAATGGTTCTCAATATATTAACAATCCAACGGTTACTCTTACTGGTGGCACTCCAACAGTTTCTGCTGGAACAACCACTGGCATGAGACCATTATATTACACTATTCAAGAAGCCACACAATCAGATCCATATACTGGTATCTCTACAGTTGTGTTTGATCAGGTTCTTAATAATGCAATTGGTGTAGGAACAACTGCTTTCTTCTATCAAGTAAGTTTGGTTCTTGCTTCTTCACATTCTTTTGAGTGGATTGGATCTGGTGGTGACCTTGCTGGATCTCGTCCTAGATTGGGTGGTGTTGGTATTCAATCTGCTGAAGTTGTTAAACGAGATGGTGGATTGGTGGTTTATACATCAACGGATCAATCGGGTAACTTTAGAATTGGTGATGATGTAAACATTAACCAGGTCACAGGAACCATCTCTGGTCGAGCTTTCAATCAGAGTCTCCTAAATACAGTAACACCTCTAATCATCGCTCTGGAAGATTAA

Genome Context

	Description	Category	Evidence (source)
GO:0044423	virion component	Cellular Component	IEA:UniProtKB-KW (UniProt)
GO:0051701	biological process involved in interaction with host	Biological Process	IEA:UniProtKB-ARBA (UniProt)
GO:0019058	viral life cycle	Biological Process	IEA:UniProtKB-ARBA (UniProt)

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Gene Ontology

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence