Phage RBP Database

Genbank accession

ADO98719.1 [GenBank]

Protein name

baseplate wedge initiator

RBP type

TSP

Evidence DepoScope

Probability 1,00

TF

Evidence RBPdetect2

Probability 0,91

Protein sequence

MATRIKLKRSTVAATVPTTSNLVDGEIALNIADKKLYARNGSNIIEVANQKPNTGEVVTTMLSTDITNGQGNTFYVASVGSNNDTLANGGDNGKHPDTPFLTITKALATATSGDTIIVAPGEYQEAFPMTVPDGITLRGTNLRSTSVKPTSITNDNNAFILSGDCHVSDLTIKDFYYNSGADEGYAFVVVSNMNSTKSPYVERVTVNTKGSVTSGSDPYGYAQGDAGRGAKLDGANLAGASLQSSVLFNECTFITPNQVGLKLTNGIRVEWLNCFNYFASIGIEGVQGATGRAGSGNTRLKFGGTSGTFSTSEVAYQLEDSFQSGTYARSGSTITLTRTAHGLVSNDYIYADHISGAGTDNFYQVTKVDNDTVTYTDSSASGTTSGNVTYKKAVARGVVSSNDGTYVFITGKGSGEFVTVTKSPKTLSRFGDSQLDTAQKKFGTASILLDGTEDNVKVPTSEDFGFGTANWCIEAFIRPGSVTGTQRIFDLRDGSATDTAPTMYLNGTALHYAVGNTSQINGGTLSTNTWYHVAVARSGGTTKLFLDGTELGTYTDSNDYGSTTPVVIGSDYQASPTEAFNGHVDEVRISKGAARFTAGFTPTTSEYSADNNTVLLLHANGTDGSTTFTDVSGGTSDIRSSGGDSATSVITADYSAFGAELRSVASACVYGQKGVQADGSGVKLILTAHNFGYVGSGQDFTNDPSLAVQNNEVVELNSGKVLYSSTDQDGDFRVGDAFSVDQETGNVSFQATSTAQAAANITLSDATGTTNIFPAYIETGNLRFAGNSMTSTTGQVIVDPSGEEDFVVNAETIVKEAVYFDVNKSISFGSVVQGALKIAGFGGSTVFGSSEASNFSTRSFVVLKNGLGGVNLTGAGTGYVGGQQPIEVSTNPFQGATATATLGSTGTLKAFTLSNRGSGYTVNPQVVLSGAGGGEATTQLGGAGDIRGVLIDQGGSGYTASVSAAIDAPPQNIFTGGGTYTDSNNASQPIVDTTANTIYIPDHTFETGMIATYDGTTGGGTVVGGLTHNTQYYIIRVDKDFIKVALNLTNANNGTAISFSGEGTETQFFIGATATMNVSQTGGVIDTVSVATAGSGYGSSAPAVTITDSSGTGASISAVVGYSVNTVDVGIVGSYTSAPSVSFTLGAGDTTGSGAAASATLGFAIASVTLDTQGLGYRNKPTLAIDGTPTNPAVIDVTLNEQEGRVGSLTVTDGGVGYETTPNLTFTGGGGENAQLTADIQSVIGSITSSGSGYTPGVYNQIAFTGGSPTNVATATFTIPGLTGAITAGSGYVDGTYTDVGLRSTPTATYTVTQATRDKLGISSVTGTFAVGNTVTGSVSNAQGTVTYVASDNTFLYITTNSGTFQDGGAENVTNGSGASATLDTVNTGSFRYFIDLGSGAQEAPSFTLLDDNTYRFDTSDSSNTGHPLEFGSAQNLFQRQYGTPGQAGSYYEVTLGAVSATTTSITYQCQTHGGGMAEDATVTIAAGAAGQGGNGMLATIVVASGAVTSVTVTTQGAGYAIGDTLLLDNADVGGSGSGFAYLLNANNTGVASVTNISLVGDGYNIGDVLSVDDSTVGGGGGSGFQYTVSNVGFCTAIAVTQEGNAFEQSDTLVLGPVGGPNVVQGSGLTVTIASINATKQLEMTQLGVLTLGPTGGTQLALQPDGQIQATIGAATTYSISASGNALFTTISGTTGTFSGVLSAQSTSTFTGLATFNGGITTAGATTLVQTTVKLADGAAGTPSLAFDNSTTTGLFLSSNNVIGVSIAGNAKFTLDDTLGLDAPQLQVDSTLGSSTPFFKVDPTNNNVLVGPSTNQLSLDNANTLKSVGSNVEIPLNFETKGGGDFVFKGGADKSFNITDGTSNVVSVDTATGTAQFSGNLDAGLLRVRQNVVANNSQTAARSFGQILAVSVTGSGSGYTDGTYTATATTSNGIGTGCTVTVTVSGGDFSAVTVVAKGQNYKVGDSILITAAGGGTGKSVTVTDIDGQGVVIKPTAGASVLCDTTGSLVIPAGTTNQRPVAEDRITGAIRFNSTQLQFEGFNGTDFVSLGGVRDVDQDTYILTEASPGSDEDTFEFYAAGVNNLSLNNTTLTFRQNMTATKYDGSMTATIDGGYTLNGTTFGINPYTVSNLGSSVFLVRSKNDIEVTGGLRLRNVPSQGVASSIDAATIVQTATAYTASQTFTAIATIAQIEGVGLTVDVTTNGAGTITSIAINAGGTGYENGETIQIAGTSLGGQTPANDVTFKLDAITSGSAAITRLDVLQQEYVTQLDAKPLINLDATGSEAGWKINRGWAAGTSSYLTVFDSTATFMELDDCRVEGGQLASFPSTASIVAFDKSQFKGSKTLVTIESDDNKVHMLEVTVVCASNGTTAHATVTNSLTSDNDLMDATVSVVGSNVTISLNKSSAATSSSNFTGRFTTTKVKA

Physico‐chemical properties

protein length:	2425 AA
molecular weight:	246960,53000 Da
isoelectric point:	4,39527
aromaticity:	0,07464
hydropathy:	-0,04524

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0763	STR	DC_0763	3	793	Novel HMM	DC_0763	Central	Low	Positional only	71 proteins / 71 hits
IPR011050	STR	IPR011050	96	386	Merged direct domain	Pectin lyase fold/virulence factor	Central	Low	Positional only	572 proteins / 572 hits
G3DSA:2.60.120.200	STR	G3DSA:2.60.120.200	424	593	Merged direct domain	G3DSA:2.60.120.200	Central	Low	Positional only	153 proteins / 153 hits
IPR013320	STR	IPR013320	443	593	Merged direct domain	Concanavalin A-like lectin/glucanase domain superfamily	Central	Low	Positional only	237 proteins / 237 hits
PF13385	LEC	DC_0004	450	593	InterPro cluster	PF13385	C-terminal	Medium	Text match	334 proteins / 417 hits
DC_0115	STR	DC_0115	970	1163	Novel HMM	DC_0115	Central	Low	Positional only	18 proteins / 18 hits
DC_0155	STR	DC_0155	1148	1480	Novel HMM	DC_0155	Central	Low	Positional only	112 proteins / 112 hits
DC_0692	RBD	DC_0692	1715	2261	Novel HMM	DC_0692	C-terminal	Low	Positional only	9 proteins / 9 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

ADO98719.1

1 2425

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	132	132	0,7363
Central domain	133	431	300	0,9379
C-terminal	432	2425	1993	0,2087

Note: Constraints were applied during segmentation.
Fixed 18 C-terminal predictions appearing before Central domain

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-132

Central
133-431

C-terminal
432-2425

	Name	Taxonomy ID	Lineage
Phage	Eurybiavirus PHM1 [NCBI]	3428631	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	No host information

Coding sequence (CDS)

Genbank protein accession

ADO98719.1 [NCBI]

Genbank nucleotide accession

GU071101 [NCBI]

CDS location

range 70324 -> 77601
strand +

CDS

ATGGCAACGAGAATCAAGCTAAAGAGATCGACAGTAGCAGCGACAGTCCCGACGACTTCTAATTTAGTAGACGGTGAAATAGCTCTTAATATAGCGGATAAGAAATTATACGCTAGAAACGGATCAAATATAATAGAGGTCGCCAACCAGAAACCTAATACTGGTGAGGTGGTGACTACCATGCTGTCTACGGACATCACGAATGGTCAAGGAAATACTTTTTACGTTGCTTCAGTTGGTTCAAATAATGATACTCTTGCTAATGGTGGTGATAATGGTAAACATCCAGATACACCATTTCTAACAATTACAAAGGCACTGGCGACTGCTACATCAGGTGATACAATCATAGTTGCACCTGGCGAATATCAGGAAGCATTCCCAATGACAGTTCCTGATGGTATTACATTACGTGGAACTAATTTAAGATCTACATCTGTAAAACCAACATCTATTACAAACGATAATAACGCATTTATATTATCTGGAGACTGTCACGTTTCCGATTTAACAATTAAAGATTTTTACTACAACAGTGGTGCTGACGAAGGATATGCATTTGTTGTAGTCTCAAATATGAACTCTACAAAGAGTCCATATGTCGAAAGAGTTACAGTCAATACAAAAGGTAGTGTTACATCTGGTTCAGATCCATATGGATATGCACAAGGAGACGCAGGACGTGGTGCTAAGTTAGATGGTGCTAATCTTGCAGGAGCATCCTTACAGTCTTCTGTATTATTCAATGAGTGCACATTCATTACACCTAATCAGGTTGGTCTAAAACTTACCAATGGTATACGTGTAGAGTGGTTAAATTGCTTCAATTATTTTGCATCTATTGGTATAGAAGGTGTTCAAGGTGCTACTGGTAGAGCTGGATCGGGTAATACAAGATTAAAATTTGGTGGAACATCAGGAACATTCTCTACATCAGAGGTTGCATATCAATTAGAGGATAGTTTCCAGTCAGGAACTTATGCTAGATCTGGTTCTACAATAACTCTGACAAGAACTGCACATGGTTTAGTATCTAACGACTACATCTATGCAGATCATATTAGTGGTGCAGGAACTGATAATTTTTATCAGGTCACAAAGGTAGACAATGACACAGTTACATACACTGATAGTTCTGCATCTGGAACCACATCTGGTAATGTTACTTACAAAAAGGCAGTTGCACGTGGTGTAGTCTCAAGTAATGATGGAACATATGTATTCATTACTGGTAAAGGAAGTGGTGAGTTCGTAACTGTAACTAAATCTCCTAAGACTTTAAGTAGATTTGGTGACTCGCAGTTAGATACAGCACAAAAGAAATTTGGAACAGCATCTATATTATTAGACGGAACAGAAGATAACGTAAAGGTTCCTACATCCGAAGACTTTGGATTTGGTACAGCAAACTGGTGTATAGAAGCATTCATAAGACCTGGTAGTGTAACAGGCACACAAAGAATCTTTGACCTTAGAGATGGTTCTGCTACAGATACAGCACCTACAATGTATCTTAATGGAACTGCATTACATTACGCAGTAGGAAATACATCACAGATAAACGGTGGAACATTATCAACTAACACTTGGTATCACGTTGCAGTAGCAAGAAGTGGAGGAACCACAAAATTATTCTTGGACGGAACTGAGTTAGGAACATATACAGATAGTAATGACTATGGATCTACAACTCCTGTTGTTATAGGTTCTGACTATCAGGCATCTCCAACAGAGGCATTTAATGGACATGTTGATGAAGTAAGAATTAGTAAAGGTGCTGCTCGTTTTACTGCAGGATTTACCCCTACAACAAGCGAATACTCAGCAGATAACAATACAGTGCTATTACTCCATGCGAATGGCACAGACGGTTCTACGACCTTTACAGACGTCTCTGGTGGAACATCTGATATTAGATCTAGCGGTGGTGATTCTGCTACATCTGTTATCACTGCTGACTACTCAGCGTTTGGTGCTGAATTACGTTCTGTGGCATCTGCATGTGTATACGGACAGAAAGGTGTTCAAGCAGATGGTTCTGGTGTAAAACTTATACTTACTGCACACAACTTTGGTTATGTTGGATCTGGTCAAGACTTTACTAATGACCCATCTCTTGCTGTTCAAAATAATGAGGTAGTAGAACTCAATAGTGGTAAGGTATTATATTCTTCTACAGACCAAGATGGTGATTTTAGAGTTGGTGATGCATTTTCTGTAGACCAAGAGACTGGTAACGTATCTTTCCAAGCAACATCAACAGCTCAGGCAGCAGCAAACATTACATTGAGCGATGCTACTGGAACAACTAATATTTTCCCTGCATACATTGAAACAGGTAACTTAAGATTTGCGGGTAACAGCATGACCTCTACCACAGGTCAGGTAATCGTTGACCCCTCTGGTGAAGAAGACTTTGTTGTTAACGCTGAAACAATCGTTAAAGAAGCAGTTTATTTTGATGTCAATAAGTCAATATCATTTGGTAGTGTTGTTCAAGGTGCTCTAAAAATTGCAGGATTTGGTGGATCTACAGTATTTGGATCATCAGAAGCATCTAACTTCTCTACAAGATCATTTGTTGTTCTTAAAAATGGTTTAGGAGGTGTCAATTTAACTGGTGCAGGAACAGGATATGTTGGTGGACAGCAACCAATAGAAGTTTCAACAAACCCATTCCAAGGTGCAACTGCGACTGCAACTCTTGGTTCAACTGGAACGTTAAAAGCATTTACATTATCAAACAGAGGAAGTGGTTATACTGTAAACCCACAAGTAGTTCTTAGTGGAGCTGGTGGTGGTGAAGCAACAACTCAGTTAGGTGGTGCAGGAGATATACGTGGTGTTCTAATTGATCAAGGTGGATCAGGATATACAGCATCTGTTTCAGCAGCTATAGATGCACCTCCTCAGAATATTTTTACTGGTGGTGGCACATACACAGACTCCAATAACGCTTCTCAACCTATTGTTGATACAACTGCAAACACAATTTACATTCCAGATCATACCTTTGAGACAGGAATGATAGCAACTTATGATGGAACAACTGGCGGTGGAACAGTCGTCGGTGGTCTTACTCATAACACTCAGTATTATATAATTCGTGTTGATAAAGATTTTATTAAAGTTGCATTAAACTTAACTAATGCTAATAATGGAACAGCAATATCATTCTCAGGAGAAGGAACTGAAACACAATTTTTCATAGGTGCAACAGCAACAATGAACGTTTCTCAAACTGGTGGTGTTATTGATACTGTTTCAGTTGCTACCGCAGGATCTGGATATGGTTCAAGTGCACCCGCAGTTACTATTACTGACTCTTCGGGAACTGGTGCAAGCATATCAGCTGTGGTTGGATATTCAGTTAACACTGTTGATGTAGGTATTGTAGGATCATATACATCTGCACCTAGTGTGTCATTTACTCTTGGAGCTGGAGATACAACTGGATCAGGTGCTGCTGCAAGTGCAACTCTTGGATTTGCTATTGCATCTGTTACTTTAGACACTCAAGGTTTAGGTTATAGAAACAAACCAACATTAGCTATTGATGGAACTCCAACAAACCCTGCTGTTATTGACGTAACATTAAATGAGCAAGAAGGTAGAGTAGGATCATTAACAGTTACTGACGGTGGAGTGGGATATGAGACAACTCCAAACCTAACATTTACAGGTGGTGGTGGTGAAAATGCCCAACTTACAGCAGATATACAATCTGTTATAGGTAGTATTACATCAAGTGGATCTGGATATACACCTGGCGTATATAATCAAATTGCATTTACAGGTGGATCTCCAACAAACGTTGCTACTGCTACGTTTACAATTCCTGGTCTTACTGGTGCGATTACTGCAGGATCTGGTTATGTAGACGGAACTTACACTGACGTTGGACTTAGAAGCACTCCAACTGCAACATATACTGTAACACAAGCAACAAGAGATAAATTAGGAATTTCTAGTGTCACTGGAACATTTGCAGTAGGTAATACTGTTACTGGTTCTGTTTCTAATGCACAGGGAACAGTTACTTATGTTGCAAGTGATAATACATTTTTATACATCACTACTAACTCTGGAACATTCCAAGATGGTGGAGCAGAAAATGTAACAAATGGTTCTGGTGCATCTGCTACCCTAGACACTGTAAATACAGGATCATTCAGATATTTCATTGATCTAGGATCTGGTGCTCAAGAAGCACCTAGTTTTACATTACTAGACGATAACACATATAGATTTGATACTAGTGACTCTAGTAACACTGGTCACCCCTTAGAATTTGGATCAGCTCAAAATTTATTTCAGAGACAATATGGAACACCTGGTCAAGCAGGATCTTATTATGAAGTAACTCTTGGTGCAGTATCTGCTACTACCACATCTATTACATACCAATGCCAAACACACGGTGGCGGTATGGCAGAAGACGCTACTGTCACGATTGCTGCAGGAGCTGCAGGACAAGGTGGTAATGGAATGTTGGCAACGATTGTTGTAGCAAGTGGAGCAGTTACCAGTGTAACAGTTACCACACAGGGAGCTGGATATGCTATTGGTGATACATTACTATTAGATAATGCTGACGTTGGTGGATCTGGATCTGGTTTTGCATATCTACTAAACGCTAACAACACAGGTGTCGCCTCTGTTACAAACATATCTCTAGTGGGAGATGGTTATAATATTGGTGATGTTCTTTCTGTAGACGACTCTACAGTTGGTGGTGGAGGTGGATCTGGTTTCCAATATACAGTATCTAACGTAGGTTTCTGTACAGCGATAGCGGTAACTCAAGAAGGTAATGCATTTGAACAATCAGATACTTTAGTATTAGGACCTGTCGGAGGTCCTAACGTTGTTCAAGGAAGTGGTTTAACAGTAACCATTGCGTCTATCAATGCTACTAAACAGTTAGAGATGACTCAGTTAGGTGTTCTAACTTTAGGACCTACTGGAGGAACTCAACTAGCATTACAACCTGATGGACAAATTCAAGCAACAATTGGTGCTGCAACAACATACTCCATCTCTGCAAGTGGAAATGCTCTATTTACAACTATATCTGGAACAACAGGAACATTTTCTGGTGTATTATCAGCACAATCTACATCCACATTCACTGGATTAGCAACATTTAATGGTGGTATCACAACTGCGGGAGCAACAACTCTTGTTCAAACCACTGTTAAATTAGCAGATGGTGCTGCGGGAACTCCATCACTTGCGTTTGATAATTCAACCACAACTGGTTTATTCTTATCTTCCAATAATGTAATTGGTGTATCTATTGCAGGAAATGCTAAATTTACTTTAGATGATACTCTTGGACTTGATGCACCTCAACTACAAGTAGATAGCACATTAGGAAGCTCAACCCCATTCTTCAAGGTTGACCCAACAAATAATAATGTATTAGTAGGTCCTTCAACTAATCAATTATCTTTAGATAATGCAAATACACTTAAATCTGTAGGATCAAATGTTGAGATTCCACTAAACTTTGAGACTAAGGGTGGTGGAGATTTTGTATTCAAAGGTGGAGCTGATAAGTCATTTAATATTACTGATGGAACAAGTAATGTCGTTTCTGTTGATACTGCTACAGGAACTGCACAATTTAGTGGCAATTTAGATGCGGGTCTGTTACGTGTTAGACAGAACGTAGTAGCAAACAATAGTCAAACTGCAGCAAGGTCATTTGGTCAAATTCTTGCAGTATCAGTTACTGGAAGCGGTAGTGGATATACTGATGGAACATATACTGCAACAGCAACAACAAGTAATGGAATTGGAACTGGATGCACTGTTACAGTCACAGTTTCTGGTGGAGATTTCTCAGCAGTAACTGTAGTTGCTAAGGGTCAAAATTATAAAGTTGGTGACAGCATTCTCATAACAGCAGCGGGTGGTGGAACTGGTAAATCAGTTACAGTTACAGATATAGACGGTCAAGGTGTTGTAATAAAACCAACTGCAGGAGCAAGTGTATTATGTGATACAACTGGTTCTCTTGTAATTCCTGCAGGAACTACAAACCAACGTCCTGTTGCTGAAGATCGCATTACAGGTGCTATCAGATTTAACTCTACACAGTTACAGTTTGAGGGTTTCAATGGAACTGATTTTGTATCTCTTGGTGGTGTTCGTGACGTTGACCAAGATACTTACATATTAACTGAGGCATCACCTGGTTCTGACGAAGACACATTTGAGTTCTATGCAGCTGGTGTTAATAATCTTTCTCTTAATAATACCACATTAACGTTTAGGCAGAACATGACTGCCACAAAATATGATGGATCTATGACTGCCACAATTGATGGTGGTTATACTTTGAATGGAACTACATTTGGTATTAATCCATATACAGTTTCTAATCTTGGATCTAGTGTATTCTTAGTTAGAAGTAAGAATGATATTGAAGTTACTGGTGGTTTAAGACTTCGTAATGTTCCTTCTCAGGGTGTTGCATCTAGTATTGACGCAGCAACTATTGTACAAACTGCTACTGCTTATACTGCATCTCAGACATTTACTGCTATTGCAACTATTGCACAGATTGAGGGTGTAGGATTAACTGTTGATGTTACAACTAACGGTGCAGGAACAATTACATCTATTGCAATCAATGCGGGTGGAACAGGATATGAGAACGGAGAAACAATACAGATTGCAGGAACCTCATTAGGTGGTCAAACTCCTGCGAATGATGTTACATTTAAACTTGATGCTATTACTAGTGGATCTGCAGCGATTACTAGATTGGATGTTCTACAGCAAGAATACGTAACACAATTAGATGCAAAACCACTTATTAATTTAGATGCAACTGGTTCAGAGGCAGGATGGAAAATAAACAGAGGATGGGCAGCAGGAACATCATCATACTTGACAGTATTTGATTCTACTGCGACATTCATGGAACTAGATGACTGTCGTGTAGAAGGTGGTCAACTAGCATCATTCCCATCTACTGCAAGTATAGTTGCATTTGATAAATCACAATTTAAAGGATCAAAAACACTTGTAACTATTGAGAGTGATGACAATAAAGTTCATATGCTTGAGGTTACAGTGGTATGTGCCTCAAATGGAACTACTGCACATGCAACAGTCACAAACTCATTGACTTCTGACAATGATTTGATGGATGCAACCGTCAGTGTTGTCGGTAGCAATGTGACTATATCACTAAACAAATCTAGTGCTGCTACATCATCATCAAACTTCACTGGTAGATTCACAACTACCAAAGTTAAAGCATAA

Genome Context

Title	Authors	Date	PMID	Source
The Genome Sequence of Cyanophage M4-247	Henn,M.R., Sullivan,M.S., Osburne,M.S., Levin,J., Malboeuf,C., Casali,M., Russ,C., Lennon,N., Erlich,R., Young,S.K., Koehrsen,M., Yandava,C., Zeng,Q., Alvarado,L., Anderson,S., Berlin,A., Borenstein,D., Chen,Z., Engels,R., Freedman,E., Gellesch,M., Goldberg,J., Green,L., Griggs,A., Gujja,S., Heiman,D., Hepburn,T., Howarth,C., Jen,D., Larson,L., Lewis,B., Mehta,T., Park,D., Pearson,M., Roberts,A., Ryan,E., Saif,S., Shea,T., Shenoy,N., Sisk,P., Stolte,C., Sykes,S., Walk,T., White,J., Yu,Q., Coleman,M.L., Huang,K.H., Weigele,P.R., DeFrancesco,A.S., Kern,S.E., Thompson,L.R., Fu,R., Hombeck,B., Chisholm,S.W., Haas,B., Nusbaum,C., Galagan,J. and Birren,B.	2011-09-23	—	GenBank

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence

Literature