Phage RBP Database

Genbank accession

YP_004322456.1 [GenBank]

Protein name

tail fiber protein

RBP type

TF

Evidence GenBank

Probability 1,00

TF

Evidence Phold

Probability 1,00

TSP

Evidence DepoScope

Probability 0,90

TSP

Evidence RBPdetect

Probability 0,77

TSP

Evidence RBPdetect2

Probability 0,58

Protein sequence

MALTRLKNVFTSKTGRCLYVNSDDFDASDSFDNRGNSPNRPFKSIQRALIEAARFSYKSGQFNDTFESFSIVLYPGDYVIDNRPGTNTSGQAFIPADIAELSASSDVDLVDDSGNINPNNVLYRFNSTEGGVIVPRGTSIVGMDLRKTKLRPLYVPDPTSGSIPGSAIFRVTGGCYFWQFSFFDGITSGVYKDPAQPSASSPPTFSHHKLTCFEYADGKNILSSTNGTDGNALSVSDLQLYYQKVAKAWEDIPDSTSVISADELQARVEENRIVGPNTAGPKTISSIVTDFVSTNVFTTTAEVTTSDAHGFSVGTPVLLEGVTGTDASRFNGSFFISAIPTPTTFRYIIKNPSTGAPSGNPTAGGSTVKVEVDNVDSSSPYIFNISLRSTWGMQGMHADGSKATGFKSMVVAQFTGVSLQKDDNAFIKWDGSAYIAGSHVDGDSIYKATYRNFHVKASNDSVIQAVSVFAVGFADHFVAESGGDQSITNSNSNFGSCALRAKGFKTAPFTQDKAGTITHVIPPQKLARTYAVVSGTTFTTTFDSVSVPATNNTHGIVAGDYVRFETADNIESYLVTTVNGTSGELTLNRGYRNLHGATAGSGKAAYKGTISEIPVGYVALDVQKIQDNASQGNSQWAVNQSGIQVGDSTINGGNAYLATAVAGAGATAAAGGGPVHTSGVVVDNQVTWAYIGAVNTRLYLYGYTSVATKPPYKLQGFSIGARKQDKIYVSLIDGSTQSTFAALVSPDGSASPTDASYTNVTGQGFTPGDTNHPLQYDTYHQNWYLRVTAATSGDSTVNGTTGYEGIHYHLGNETFYANSLFTGSSYTQRIADNRSSRDRTYRIRYTVDNSASLSREPINGYVFQVRNSVTNYNNVYYIYDIEVAQELKKSVQDGIYYVTVLKGSISPTNGNLSQFSFAQNINNLYPTLDKDNPTEDPNAATSVASNITVGLVETTNGSGIEDLSLSITKEAVNTYIEEGNNSYTNSGGSGNPAQTNYITLEARDGEASEVDKTLRMVQVNNTGGTATELRRPSILRSGNHTFEYVGFGPGNYSTGLPSVQNRVLTEAETLLAQSQKEDGGIAFYSGLNSNGDLFIGNTRISAVTGEEASLDTPSLSIVGETANLRPVFDEIIVRDKITVENTQLTSVFKGSVEVNEDVTITKGLEAADMTIKGEAANNQATKKFDVTVGTPGTTNAANTGDISWIGNIGNGSYLGWYWTGAAWAKFGLTDTGNLAITGGSASGSTWTDGAGDLQLKNGLGLDIQSTGTLNVNSGATTLGGNLTVSGTSEFNGTVDVDANFAVRSGTTDKFTVASSTGNVQTDGTLTVAGETTLQGNVNIGNGSGDNITINGRIDSNLDPDANDTYDVGTSGRKWKDGYFAGTVTAPTFSGNVDVSTGTSTFNNVTVNGTLSAGNLTGNADTATDLAINATQQLVIQTGNNATSTLSSGTNNYILTSNGSGSAPSWQQNFNGNAETATEVYVTEYTNDSTDRPLVFAYTSNTANSANRGLGKDHSHLVWNGNDNKLKCPNADFSGTITAGTFGTSSQNAYGTRTVGTGNPSGGSNGDIHYKI

Physico‐chemical properties

protein length:	1571 AA
molecular weight:	165915,19980 Da
isoelectric point:	4,87118
aromaticity:	0,09039
hydropathy:	-0,32998

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0066	STR	DC_0066	1	1568	Novel HMM	DC_0066	Central	Low	Positional only	99 proteins / 99 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

YP_004322456.1

1 1571

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	66	66	0,8929
Central domain	67	303	238	0,9597
C-terminal	304	1571	1267	0,5350

Note: Constraints were applied during segmentation.
Fixed 3 C-terminal predictions appearing before Central domain

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-66

Central
67-303

C-terminal
304-1571

	Name	Taxonomy ID	Lineage
Phage	Prochlorococcus phage P-HM1 [NCBI]	445700	Uroviricota > Caudoviricetes > Eurybiavirus >
Host	Prochlorococcus marinus subsp. pastoris str. CCMP1986 [NCBI]	59919	Bacteria > Cyanobacteria > Prochlorales > Prochlorococcaceae > Prochlorococcus > Prochlorococcus marinus

Coding sequence (CDS)

Genbank protein accession

YP_004322456.1 [NCBI]

Genbank nucleotide accession

NC_015280.1 [NCBI]

CDS location

range 22109 -> 26824
strand +

CDS

ATGGCACTTACTAGACTAAAAAACGTCTTTACATCAAAAACAGGACGTTGCTTATACGTCAACTCTGATGACTTCGATGCATCAGATAGTTTTGACAATAGAGGTAACTCTCCTAACCGTCCTTTTAAGAGTATACAAAGGGCGTTAATTGAAGCAGCGAGATTTTCATATAAAAGTGGACAGTTTAACGATACGTTTGAGTCATTTAGTATCGTATTATATCCTGGCGACTATGTTATTGATAATAGACCAGGCACAAATACATCTGGACAAGCATTCATCCCTGCTGATATCGCTGAATTAAGTGCATCTAGCGATGTTGATCTAGTAGATGATAGTGGTAATATAAATCCAAACAACGTATTATACAGATTTAACTCAACAGAAGGTGGTGTAATAGTTCCTAGAGGAACATCTATCGTAGGTATGGACTTACGTAAGACTAAACTACGTCCATTATATGTTCCCGATCCTACATCTGGATCAATACCTGGCAGTGCTATCTTCCGTGTTACAGGTGGTTGTTATTTCTGGCAGTTCTCATTCTTTGATGGTATAACATCTGGTGTATATAAAGACCCTGCACAACCAAGTGCATCTTCACCTCCAACATTCTCACACCATAAACTTACATGTTTTGAGTATGCTGACGGTAAAAATATATTAAGCAGTACAAATGGCACAGATGGTAATGCACTATCAGTTAGTGACTTACAATTATACTATCAAAAGGTAGCAAAAGCATGGGAAGATATTCCTGATAGCACAAGTGTTATATCTGCTGACGAATTACAGGCACGTGTCGAAGAAAACAGGATCGTAGGTCCTAACACAGCAGGTCCTAAAACAATCAGTAGTATTGTTACTGACTTTGTTAGCACAAACGTATTCACAACAACAGCAGAGGTCACAACATCTGATGCTCACGGGTTCTCAGTTGGAACTCCCGTATTACTTGAGGGTGTCACAGGAACTGACGCATCAAGATTTAATGGATCGTTCTTTATCAGTGCGATACCAACACCAACAACATTTAGATATATTATTAAAAATCCTAGCACAGGTGCACCATCTGGTAACCCAACTGCGGGTGGATCAACGGTGAAAGTTGAAGTTGACAACGTTGACAGTTCATCACCATACATCTTTAATATATCTCTACGTTCTACATGGGGTATGCAAGGTATGCATGCTGATGGTAGTAAAGCAACTGGATTCAAATCCATGGTTGTTGCTCAGTTTACTGGTGTATCACTGCAGAAAGACGACAATGCATTCATTAAGTGGGACGGATCTGCATATATTGCAGGATCACACGTTGATGGGGATAGTATATACAAAGCAACATATAGAAACTTCCATGTGAAGGCATCTAACGACTCTGTTATACAGGCAGTGTCAGTGTTTGCTGTTGGATTTGCTGATCACTTTGTTGCTGAGTCTGGTGGTGACCAGTCAATTACTAACTCTAACAGTAACTTTGGTTCATGTGCATTAAGAGCAAAAGGATTTAAGACTGCACCATTTACACAGGATAAGGCAGGAACTATCACACACGTGATACCTCCACAGAAACTAGCAAGAACTTATGCAGTCGTAAGTGGAACTACATTTACTACTACGTTTGATAGTGTCAGTGTACCTGCTACTAATAATACCCATGGTATCGTAGCTGGTGATTATGTAAGATTTGAGACTGCTGATAATATAGAATCATATCTAGTCACTACAGTCAATGGAACAAGTGGCGAATTAACATTAAACAGAGGATATAGAAACTTACATGGTGCAACAGCTGGTTCTGGTAAGGCAGCATACAAAGGAACTATCAGTGAAATACCTGTTGGTTATGTTGCACTTGATGTTCAAAAAATACAAGACAACGCATCACAAGGTAACAGTCAGTGGGCAGTCAACCAATCTGGTATACAAGTTGGTGACTCAACAATTAATGGTGGTAATGCATATCTAGCAACCGCAGTTGCAGGAGCAGGAGCTACAGCAGCAGCAGGAGGAGGTCCTGTTCATACATCTGGAGTCGTTGTTGATAACCAAGTTACATGGGCATATATTGGTGCAGTCAACACAAGATTATATCTCTATGGTTATACATCTGTTGCAACTAAACCTCCATATAAACTACAAGGTTTCAGTATTGGTGCACGTAAACAGGACAAGATATATGTGTCATTGATTGATGGATCAACACAATCAACCTTTGCAGCATTAGTATCTCCTGATGGTAGTGCATCACCTACAGATGCATCATATACTAACGTAACTGGGCAAGGATTTACACCTGGCGATACAAATCATCCACTACAATATGACACATATCATCAAAACTGGTATTTAAGAGTAACAGCAGCAACATCTGGTGATTCAACTGTCAATGGAACTACTGGATACGAGGGTATTCACTATCATCTAGGTAATGAGACATTCTATGCCAACTCATTATTTACTGGATCATCATATACACAACGTATTGCTGATAACAGATCATCTAGAGATAGGACATATAGAATACGTTACACTGTAGATAACTCTGCAAGTCTATCAAGAGAACCTATCAATGGTTACGTATTCCAAGTAAGAAATAGTGTCACAAACTATAATAATGTTTACTACATCTATGATATAGAAGTAGCACAAGAACTTAAAAAGTCAGTGCAAGATGGTATTTACTACGTTACAGTATTAAAAGGTAGTATATCACCTACAAATGGTAACTTAAGTCAGTTCTCATTTGCACAGAACATTAATAACTTATATCCTACCCTAGATAAGGACAACCCAACTGAAGATCCAAACGCAGCAACATCTGTTGCAAGTAATATTACTGTTGGTTTAGTTGAGACTACTAATGGATCTGGAATAGAGGATCTATCTTTATCCATCACTAAAGAAGCGGTAAACACATATATTGAGGAAGGCAACAACTCATATACAAACTCTGGTGGATCTGGAAACCCTGCACAAACAAACTATATCACTCTTGAAGCAAGAGATGGTGAAGCATCTGAAGTCGATAAGACTTTACGTATGGTACAGGTTAATAATACAGGTGGTACAGCAACTGAACTTAGACGACCTAGTATTCTAAGATCTGGTAACCACACATTTGAATACGTTGGTTTCGGACCTGGTAACTATTCAACTGGTTTACCTTCAGTTCAGAACAGAGTTCTTACCGAAGCTGAGACATTATTGGCACAGTCACAGAAGGAAGACGGTGGTATCGCATTCTACTCTGGTCTTAACAGTAATGGTGACTTGTTTATTGGTAACACTAGAATCTCTGCTGTTACTGGTGAAGAAGCATCACTTGATACTCCATCACTATCAATCGTTGGTGAGACTGCAAACTTACGTCCTGTATTTGATGAGATCATCGTCAGAGATAAGATTACAGTTGAGAACACACAGTTGACCAGTGTATTCAAAGGTAGTGTTGAAGTTAACGAAGACGTAACAATAACTAAAGGTTTAGAAGCTGCTGATATGACAATCAAAGGCGAAGCAGCAAATAACCAAGCAACCAAAAAGTTTGACGTTACAGTAGGAACACCTGGCACAACTAACGCAGCAAACACAGGAGATATATCATGGATAGGAAATATTGGTAATGGTAGTTACCTTGGATGGTATTGGACTGGTGCAGCATGGGCAAAGTTTGGACTAACCGATACTGGTAACTTAGCAATTACAGGTGGTAGTGCATCTGGTTCTACATGGACTGATGGTGCAGGAGACTTACAACTTAAAAACGGACTAGGACTTGATATACAATCAACTGGAACACTTAATGTTAACAGTGGTGCTACTACACTTGGTGGTAATCTGACAGTCTCAGGTACATCTGAGTTTAATGGCACAGTAGATGTTGATGCAAACTTTGCAGTCAGATCTGGCACGACTGATAAATTTACAGTCGCATCAAGCACAGGTAATGTTCAGACTGATGGAACATTAACAGTTGCAGGAGAGACTACTTTACAAGGTAATGTTAATATAGGTAATGGATCAGGTGACAATATAACAATTAATGGTAGAATAGATTCAAACCTAGATCCAGATGCCAACGATACTTATGATGTAGGAACTAGTGGACGTAAATGGAAAGACGGTTACTTCGCAGGAACAGTTACTGCACCAACATTCTCTGGTAACGTAGATGTATCTACTGGAACTTCTACATTTAATAACGTAACAGTCAACGGAACGTTATCTGCAGGAAACTTAACTGGTAATGCTGATACAGCAACTGATCTTGCTATCAATGCAACACAGCAACTTGTTATTCAAACAGGTAACAATGCAACATCTACATTATCATCTGGAACTAACAACTATATCCTAACATCTAACGGATCAGGATCAGCACCATCATGGCAGCAAAACTTTAATGGTAATGCTGAGACTGCAACAGAGGTATATGTTACTGAATACACTAACGATTCTACTGATAGACCACTTGTATTCGCATACACTAGCAACACTGCTAACTCTGCAAACAGAGGTTTAGGAAAAGATCATTCACATCTAGTGTGGAATGGTAATGACAACAAACTAAAATGTCCTAATGCTGATTTTTCTGGAACTATTACAGCAGGAACGTTTGGAACATCATCACAAAACGCATATGGTACAAGAACTGTAGGCACAGGTAACCCCTCTGGTGGAAGCAATGGAGATATCCACTATAAAATTTAA

Genome Context

Title	Authors	Date	PMID	Source
The Genome Sequence of Cyanophage M4-247	Henn,M.R., Sullivan,M.S., Osburne,M.S., Levin,J., Malboeuf,C., Casali,M., Russ,C., Lennon,N., Erlich,R., Young,S.K., Koehrsen,M., Yandava,C., Zeng,Q., Alvarado,L., Anderson,S., Berlin,A., Borenstein,D., Chen,Z., Engels,R., Freedman,E., Gellesch,M., Goldberg,J., Green,L., Griggs,A., Gujja,S., Heiman,D., Hepburn,T., Howarth,C., Jen,D., Larson,L., Lewis,B., Mehta,T., Park,D., Pearson,M., Roberts,A., Ryan,E., Saif,S., Shea,T., Shenoy,N., Sisk,P., Stolte,C., Sykes,S., Walk,T., White,J., Yu,Q., Coleman,M.L., Huang,K.H., Weigele,P.R., DeFrancesco,A.S., Kern,S.E., Thompson,L.R., Fu,R., Hombeck,B., Chisholm,S.W., Haas,B., Nusbaum,C., Galagan,J. and Birren,B.	2011-09-23	—	GenBank

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence

Literature