Phage RBP Database

Genbank accession

WDS60878.1 [GenBank]

Protein name

tail fiber protein

RBP type

TF

Evidence Phold

Probability 1,00

Protein sequence

MAQNTNLNVTPYYDDFDKDKNFYRVLFRPGFPIQARELTTMQSILQNQVENVGSHLFKDGAMVIPGQVGYDLNVDAVMLQESFLGADVEEYRTQLDGKIIEGLTTGVKAKVLYSISSTESDKGYITLYVKYIESGGDNATQQTFQNNEQLITDDEITFGTTLIEVGSPFAQLLPTSALQVGSVAYVQSGVYFIRGFFVDVDYQYILLDQYGSNPSYRIGLDIQESIVTPEDDLSLNDNAAGTSNYAAPGSHRFRITTRLIKKLLTDDADKNFIELLRINASKVEKLVDRSAYEELEKSLALRTYEESGNYVVRDFAIKLRENLDDGFNNGVYAKGATTSGGNTADEAKYSVEFGAGVAYVKGYRVSRLAPSFIDVDKPRATKAAQNVIIPFEMGNFCNVENVYGFPNITGSTLSNAYQTIELRDTFSASQGSAAGDLIGFARVTSLQHVSDPDTTFGNADDRYKMNIMDVQMFGVLELTSAQTVSAGSLVVGASSGARAYLVNAITNSDRFDIYQIEGNFLENEMLTVDGENLDTIDSLHIYQFSDSRQVVARDETNSAIEFTADIVLEDAQIVEGSTFTYDATGGAEDITGLQSNFALDLRPGDEIYFNSTDFVVVDKVDPDDVANSDIGTIFNYSDQVVNVTPGSSAPTAGTYNTLVRYRAKLFDIQNADLLSEMPKKYVKSISDESMVVRRTFDAQTVASNSVSITLPENEQFQAISNENYTITVLAGTNSTHPVGDQITIDTSTPGNLGYTSFTSADRTTIQIDNLTNITSVKVTATISKNVTVRKTKSGNQMFVLKVNKTTKNLDKQNYNLAYSNLYGTRIQDKELSLGLTDCYRMHAVYESNDDNDPVIPSVTLVEPTFFATGSIVTGRTSKARAKVVDFASGSLKLSLIYLSGAFVPGETIDGFDSNDDAINAIINDSDGSVVAGSKVVTDNYFLEVNQTGFIYNISKLVRKKGVAAPIRKLKIVLDYYTHSATGDYFGGQSYLDTTYDDIPFFGFKFLADYLDFRPGVKNLYSGTGSVSSPAFVNCSTFDFKSRVFNVSGTPNATIFDVPKLDSNFRCDFDWYLPRIDKVFVTPDGEFQVIKGKSEEAPQPPDEITEGMLLATISHKPYGFDPETDAVITRSDNKRYTMRDIGALERRLDQVEYYTSLNLLEANTYNTQILDAGGKNRLKNGFIVDDFSDHGKSDTAHEDFAAALDFQYGECQASHYTTNVPLVINTSLSTNYQQTGPLITLPYTEQKLIEQPYASRVENINPFNVFTYIGRITLTPGSDDWLDTTRIPAQVTQIEGDFEQVSSELNVDQNGFAPIQWRAWETTWTGERVIGSSIQRNSHWLAEDVGRSPRPDVWGGRGMRRVNRVTTIEATGTQTREGVRTRVIPRIDRQSLGDSVVASTAIPWIRSRNIEVDVARLKPRTRFYSFFDGRGTIDYQIPKMIEVIKDPAVDNRTNSTPFSIGETVTGLTSGCKFKVAAPNDFYRFNPYDDSELPTAYASTTAYLNIDTSELAKQAQGDFYGNFQVQEVLEGTSGARAVIKDRRLISDRFGKLKTSFFIPSPAVDTNPRWATGTRTLRLSTDENDSRLAGAVASAAETNYEASGTLNTVQENVLAVRNAEIVRDTVTQEQTVRSTRTEIRQVGWYDPLAQSFIVDENGGAFITSVDVYFFKKDTNIPVSMQIRTMENGYPTTTILPFSDVSIEPDDVQLSETAAVATRFTFDAPVFIPQSIEHCFVLLSDSNSYQIWISRMGDQDITGDRTISEQPYAGVLFKSQNASTWTADQYEDLKFVVNRAEFDTTVNSKLVLNNTALARGNGGELNLRRDGIQTFTPELVLNLNSTTLPYTVGARIYQKTTNAEGTITKREVTTAGVLLTINDISGNWQQGSLNNNIVTNGIVSSKTQASITVTSSSRTGATYSAGDTVTGATSGATAEVVSDDGGDTGTIVFRYVSKAFTAGETLEGDGTAGNVAFSAVTYSGDAVESNTISNAFPDATPTYSTSQRKIKVLHSNHCMHSTANNVKITGAISEVADTSLTASISATDTSVSVSDAAAFHKTINGTSISSSNVGYIKIGDEIMSYSAISNDNKTITINERGLDGTTAVSHADESVVECYNLDGIPLIEINKTHTGIMNPTLDSYELTTSSIARLGILGGGTKMYATQNIQYNLLAPQVERMLLPKTDVTARINTISGTSINDGNTLSQASFANDGVFNDVILGTDNYLDTPQLICSTINESNELSGAKSFRMDLTLTSSEKNVTPVIDTDRLSATLVASRINSPSDPNTAKLAVGDGHDAVYITRIADLTNPSGSIKVYFEGYRPPNSQIKVLYRVRPVGTTTPIEELGFDFFPTEDAKIPATTERQLFREYEYEVSGLNFDQYQIKVVFVSPNQAYSPIIKDIRAIALAV

Physico‐chemical properties

protein length:	2403 AA
molecular weight:	263568,69880 Da
isoelectric point:	4,69720
aromaticity:	0,09238
hydropathy:	-0,28543

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
IPR032096	STR	DC_0487	12	69	InterPro cluster	Domain of unknown function DUF4815	Central	Low	Positional only	116 proteins / 218 hits
DC_0414	STR	DC_0414	80	1295	Novel HMM	DC_0414	Central	Low	Positional only	88 proteins / 88 hits
IPR032096	STR	DC_0487	183	393	InterPro cluster	Domain of unknown function DUF4815	Central	Low	Positional only	116 proteins / 218 hits
IPR032096	STR	DC_0487	1044	1286	InterPro cluster	Domain of unknown function DUF4815	Central	Low	Positional only	116 proteins / 218 hits
DC_0082	RBD	DC_0082	1284	2403	Novel HMM	DC_0082	C-terminal	Low	Positional only	104 proteins / 104 hits

	Name	Taxonomy ID	Lineage
Phage	Synechococcus phage S-BM1 [NCBI]	3021412	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Synechococcus sp. WH 7803 [NCBI]	32051	Bacteria > Cyanobacteria > Oscillatoriophycideae > Chroococcales > Synechococcus >

Coding sequence (CDS)

Genbank protein accession

WDS60878.1 [NCBI]

Genbank nucleotide accession

OQ319120.1 [NCBI]

CDS location

range 13304 -> 20515
strand +

CDS

ATGGCACAAAATACCAATCTCAACGTCACACCTTATTACGACGACTTCGATAAGGATAAGAATTTTTATCGAGTGCTGTTCCGTCCTGGATTTCCCATTCAGGCGAGGGAACTTACTACGATGCAGAGTATTCTGCAGAATCAGGTAGAAAACGTCGGTTCTCACTTGTTCAAAGATGGCGCAATGGTCATCCCAGGTCAGGTAGGTTATGACCTGAATGTTGATGCCGTCATGCTTCAGGAGTCGTTCCTTGGTGCTGATGTTGAGGAATATAGAACTCAGTTGGACGGTAAGATTATTGAAGGTCTTACAACAGGTGTTAAGGCAAAGGTCCTTTACAGTATTTCTTCTACAGAGTCCGACAAAGGATACATCACTCTCTACGTTAAGTATATTGAGTCTGGTGGTGACAATGCTACTCAGCAGACATTCCAGAACAACGAACAGTTGATTACCGATGACGAGATTACGTTCGGTACAACTCTGATTGAGGTTGGTTCTCCCTTCGCTCAGTTACTTCCTACCTCTGCTCTGCAAGTTGGTTCTGTTGCATATGTCCAAAGTGGTGTTTATTTCATTCGCGGTTTCTTCGTTGATGTAGATTATCAGTACATCCTCCTCGACCAGTATGGAAGTAACCCCTCCTATCGTATCGGTCTCGATATTCAAGAATCGATTGTTACGCCAGAGGACGACCTTAGCCTCAACGATAACGCTGCTGGAACATCTAACTATGCTGCACCTGGTTCTCATAGATTTAGAATCACGACCAGACTTATCAAAAAACTGCTGACCGATGATGCTGACAAGAACTTCATCGAACTGTTGCGTATTAACGCATCTAAGGTAGAAAAACTCGTTGATAGAAGTGCTTACGAAGAACTTGAAAAGAGTCTTGCACTGAGAACTTATGAAGAGTCTGGCAACTATGTTGTTAGAGATTTTGCAATCAAACTCAGAGAAAATCTTGATGATGGTTTCAATAATGGTGTATATGCAAAGGGTGCAACTACATCTGGTGGCAATACTGCAGATGAAGCAAAGTATTCTGTAGAGTTTGGTGCTGGTGTTGCATATGTTAAGGGTTATAGAGTCAGCAGACTTGCACCTTCCTTTATTGACGTTGATAAACCTCGTGCTACAAAAGCTGCACAGAACGTCATCATCCCATTCGAGATGGGCAACTTCTGTAACGTTGAAAATGTTTATGGATTCCCCAACATTACTGGTTCTACTCTGAGTAATGCTTACCAAACAATCGAACTGCGTGACACATTCTCTGCTTCTCAAGGCAGTGCTGCTGGCGACCTGATTGGTTTTGCTCGTGTTACATCACTACAGCATGTTAGCGATCCAGACACAACCTTTGGTAATGCTGATGACAGATATAAGATGAACATCATGGATGTTCAAATGTTTGGCGTCCTGGAACTGACAAGTGCTCAAACTGTATCTGCAGGTTCTTTGGTTGTTGGTGCATCTTCTGGTGCAAGAGCATATCTGGTAAATGCTATCACCAACTCTGATAGATTTGATATTTATCAGATTGAAGGTAACTTCCTTGAAAATGAGATGCTCACCGTTGATGGTGAAAATCTTGATACTATTGATTCTCTACACATCTATCAGTTCTCTGATTCTCGTCAGGTTGTTGCAAGAGATGAAACAAACTCTGCAATCGAGTTTACTGCCGACATCGTTCTGGAAGATGCTCAGATTGTTGAAGGTAGCACATTTACATATGACGCAACAGGTGGTGCTGAAGATATTACTGGTCTTCAGTCCAACTTCGCTTTGGATCTGAGACCTGGAGATGAAATCTATTTCAACAGCACAGATTTTGTTGTCGTAGATAAAGTCGATCCTGATGATGTTGCTAATAGTGATATTGGTACAATCTTCAACTATTCGGATCAAGTTGTTAATGTAACTCCTGGTTCTTCTGCTCCCACTGCAGGAACCTATAACACTCTGGTCCGTTACAGAGCAAAACTGTTTGATATTCAGAATGCTGACCTCTTGAGCGAAATGCCCAAGAAGTATGTCAAGAGCATCTCTGACGAATCGATGGTTGTCAGAAGAACATTTGATGCTCAGACTGTTGCATCAAACTCTGTATCTATCACCCTGCCTGAGAACGAGCAGTTCCAAGCAATCTCTAACGAGAACTATACAATCACAGTTCTTGCTGGTACTAACAGCACTCACCCTGTCGGTGACCAAATCACTATTGATACTTCTACACCTGGCAACCTTGGTTATACTTCGTTCACATCTGCTGATAGAACGACCATTCAGATTGATAACCTGACAAATATTACTTCTGTAAAAGTTACTGCAACTATTTCCAAGAACGTAACTGTCAGAAAAACTAAGTCTGGCAACCAGATGTTTGTTCTTAAGGTCAATAAGACCACTAAGAATCTTGACAAGCAGAACTATAACCTGGCATACTCCAATCTTTATGGTACAAGGATTCAAGACAAAGAACTGTCTTTGGGTCTGACAGATTGTTATCGTATGCACGCTGTGTACGAATCTAATGATGATAACGATCCTGTAATCCCTTCTGTAACTCTGGTTGAACCTACATTCTTTGCTACAGGTAGCATCGTAACTGGTAGAACTTCCAAAGCAAGAGCAAAAGTTGTTGACTTTGCTTCTGGTTCTCTGAAACTGAGTCTTATATATCTCAGTGGTGCGTTTGTTCCTGGTGAAACTATTGATGGTTTTGACAGTAACGACGATGCAATCAATGCTATCATTAATGATAGTGATGGTTCTGTTGTTGCAGGTTCTAAGGTTGTTACCGACAACTACTTCCTGGAAGTAAACCAAACAGGATTCATTTACAATATTTCCAAACTCGTTCGTAAGAAAGGTGTTGCCGCACCTATTAGAAAACTGAAGATCGTTCTCGATTACTATACACACTCTGCAACAGGTGATTATTTTGGCGGTCAATCCTATCTGGATACCACCTATGATGATATTCCTTTCTTTGGATTTAAGTTCCTTGCAGATTATTTGGACTTCCGTCCTGGTGTTAAGAACCTCTACAGTGGAACTGGTAGTGTATCATCTCCTGCATTCGTTAACTGCTCCACATTTGACTTCAAGTCAAGAGTATTCAATGTATCTGGTACACCTAACGCTACTATCTTTGACGTTCCTAAGTTAGATAGCAACTTCCGTTGTGACTTTGATTGGTATCTGCCTAGAATCGATAAAGTATTCGTTACTCCCGATGGCGAGTTCCAAGTCATCAAAGGTAAGTCTGAAGAAGCACCTCAACCTCCTGATGAAATCACAGAAGGTATGCTTCTGGCAACTATCAGTCATAAACCCTATGGTTTTGACCCAGAAACAGATGCAGTTATCACACGTTCCGATAACAAGCGTTACACGATGCGTGACATCGGTGCGTTGGAGCGTCGTCTTGATCAAGTTGAGTATTATACCTCTCTAAATCTTCTGGAAGCAAATACTTATAATACTCAGATTCTTGATGCTGGTGGTAAGAATAGACTGAAGAACGGTTTCATCGTTGATGACTTCAGCGATCATGGTAAGTCTGATACTGCACATGAAGACTTTGCAGCAGCACTTGATTTCCAGTATGGTGAGTGTCAAGCATCTCACTATACAACTAACGTTCCTCTTGTTATTAACACGAGTCTTTCTACTAACTATCAGCAAACAGGTCCTCTAATCACTCTGCCTTACACAGAGCAGAAACTGATTGAGCAACCCTATGCTTCTAGAGTTGAAAACATCAACCCCTTCAACGTCTTTACCTATATTGGTCGTATTACACTGACACCTGGTTCTGATGATTGGTTGGATACAACCAGAATCCCTGCTCAGGTTACACAGATTGAAGGTGACTTTGAGCAAGTTTCTTCTGAGTTGAATGTTGACCAGAATGGTTTTGCTCCTATTCAATGGAGAGCATGGGAAACTACCTGGACTGGTGAAAGGGTAATCGGTTCTAGTATTCAACGCAACTCTCACTGGTTGGCAGAAGACGTTGGCAGATCTCCTAGACCTGATGTTTGGGGTGGTCGTGGTATGCGTCGTGTCAACCGAGTCACTACGATTGAAGCAACGGGTACTCAAACTAGAGAAGGTGTCAGAACTCGTGTCATTCCTAGAATCGATCGTCAGTCTTTGGGTGATAGTGTTGTTGCTAGCACTGCTATTCCTTGGATTCGTTCCAGAAACATCGAAGTTGACGTTGCACGTCTGAAGCCTAGAACTCGTTTCTATTCCTTCTTTGATGGTAGAGGTACTATTGATTATCAGATTCCTAAGATGATTGAAGTTATCAAGGACCCTGCAGTTGATAACAGAACAAACTCTACACCTTTCTCTATTGGTGAAACTGTAACAGGTCTGACTAGTGGATGTAAGTTCAAAGTCGCTGCTCCTAATGACTTCTATAGATTCAATCCATATGATGACAGTGAACTGCCTACAGCGTATGCATCCACTACAGCATATCTGAACATTGATACATCCGAACTTGCTAAGCAAGCACAGGGTGATTTCTATGGCAACTTCCAAGTTCAGGAAGTTCTTGAGGGAACATCTGGTGCTCGTGCCGTTATCAAAGATCGTCGTCTTATCTCTGACCGTTTCGGTAAACTGAAGACTTCTTTCTTCATTCCATCTCCTGCTGTTGATACCAATCCTCGCTGGGCAACTGGTACAAGAACTCTGAGACTGTCTACTGACGAAAATGATTCTCGTCTGGCAGGTGCAGTAGCATCTGCTGCTGAAACTAACTACGAAGCAAGTGGCACCCTGAATACTGTTCAGGAAAACGTCCTGGCAGTTCGTAACGCTGAAATCGTTCGTGATACAGTAACTCAAGAACAGACTGTTCGTTCTACTAGAACTGAGATTCGTCAGGTTGGTTGGTATGACCCTCTGGCACAATCCTTTATTGTTGATGAAAACGGTGGTGCATTTATTACCTCTGTCGATGTTTACTTCTTCAAGAAAGATACAAACATCCCCGTTTCCATGCAAATCAGAACCATGGAAAATGGTTATCCCACGACAACCATTCTTCCTTTCTCTGATGTGAGTATTGAACCTGATGATGTTCAGTTGTCGGAGACTGCTGCAGTTGCAACCAGATTTACATTTGATGCTCCTGTCTTTATTCCTCAGTCTATTGAACACTGCTTTGTTCTTCTGTCCGACTCCAACTCTTATCAGATTTGGATCTCTAGAATGGGTGACCAGGACATTACTGGCGACAGAACAATCTCTGAGCAACCTTATGCAGGTGTTCTGTTCAAATCACAGAACGCATCTACCTGGACTGCTGACCAGTACGAAGACCTTAAGTTTGTTGTAAACAGAGCAGAGTTTGATACTACTGTCAACTCTAAGTTGGTTCTGAACAACACCGCACTCGCAAGAGGTAATGGTGGTGAACTGAACCTCCGTAGAGATGGTATTCAGACATTCACACCTGAACTGGTTCTGAATCTGAACTCCACGACTCTCCCCTACACCGTTGGCGCTCGTATCTATCAGAAGACTACTAACGCAGAAGGTACTATCACTAAGAGAGAAGTAACTACTGCAGGTGTTCTGCTGACAATCAACGATATCTCTGGAAACTGGCAGCAAGGTAGTTTGAACAATAATATCGTTACTAATGGTATTGTTTCTTCCAAGACACAAGCATCTATCACAGTTACCTCTTCTTCTAGAACTGGTGCTACCTACAGTGCAGGTGATACTGTTACTGGTGCTACATCTGGTGCAACTGCTGAAGTTGTAAGTGATGATGGTGGCGATACTGGAACAATCGTATTCCGTTATGTTTCTAAGGCGTTTACTGCTGGTGAAACTCTGGAAGGTGATGGAACTGCTGGTAACGTTGCATTCAGCGCAGTTACCTATTCTGGTGATGCTGTCGAATCCAACACAATCAGCAACGCATTCCCTGACGCAACACCTACTTACTCAACCAGTCAAAGAAAGATCAAGGTTCTTCACAGCAACCACTGTATGCATAGCACCGCTAATAATGTTAAGATTACTGGTGCAATCTCTGAAGTAGCAGATACCTCGCTTACAGCATCTATCTCTGCTACTGATACCTCAGTTTCTGTTTCTGATGCAGCAGCGTTCCACAAGACTATTAATGGTACTTCCATCAGTTCTAGTAACGTTGGTTATATCAAGATTGGTGATGAGATTATGTCTTACTCTGCTATCAGTAATGATAATAAGACAATAACCATTAATGAAAGAGGTCTTGATGGTACAACCGCAGTATCTCATGCAGATGAATCTGTTGTTGAGTGCTATAACCTTGACGGCATTCCTCTTATCGAGATTAACAAGACTCACACGGGAATCATGAACCCAACTCTTGATTCTTATGAACTGACTACCTCTTCTATTGCTAGACTTGGTATTCTGGGTGGTGGCACTAAGATGTACGCAACTCAGAACATCCAGTACAACCTGCTGGCACCTCAAGTTGAGAGAATGCTTCTTCCCAAGACAGATGTTACGGCAAGAATCAATACAATCTCTGGCACATCTATTAATGATGGCAACACCCTGTCGCAGGCATCCTTCGCTAATGACGGCGTATTTAACGATGTCATTCTTGGAACTGACAACTATCTTGATACTCCTCAACTGATTTGTTCTACTATTAACGAATCTAATGAACTCAGCGGTGCTAAGTCCTTCAGAATGGACTTGACTCTCACCAGTAGTGAGAAGAATGTTACTCCTGTTATTGATACTGATAGATTGTCGGCAACTCTTGTTGCTAGCAGAATCAATAGTCCTTCCGATCCTAATACTGCAAAACTTGCAGTTGGTGATGGTCACGATGCAGTATACATTACTCGTATTGCAGACTTGACTAATCCTTCTGGTTCTATCAAGGTCTACTTTGAGGGATACCGTCCACCCAACAGTCAGATTAAGGTACTATATAGAGTGCGTCCCGTTGGTACGACAACACCCATTGAAGAACTCGGTTTTGATTTCTTCCCAACCGAAGATGCTAAGATTCCTGCTACAACAGAACGTCAACTGTTCCGTGAGTATGAATATGAAGTATCTGGTCTGAACTTCGATCAGTATCAGATCAAGGTTGTATTTGTTTCACCCAACCAGGCGTATAGTCCCATCATCAAAGATATCAGAGCAATCGCCCTCGCTGTATAA

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence