Phage RBP Database

Genbank accession

WVQ00135.1 [GenBank]

Protein name

tail fiber protein

RBP type

TF

Evidence Phold

Probability 1,00

Protein sequence

MPIQKNLNVAPYYDDFDPNKNFYKVLYKPGHPVQARELTTQQTITADQIEQLASRFLKEGDNIIPGEVTYLAPQSYVRLSSFTQGVSAQDFVGYNLTGVTSGVVAEVVFAVEATEDDDATLYVSYSGSGGDGATSTFLEGEVLESTNPNNLTATVGVNTISKPITSNPLGQGALYKVSEGSFYVDGMMVRNTEQTIVVGKFTHRPTAEVGFLVTEEVVTSSEDASLLDNSQGSSNFAAPGADRLKITLTLVAREQNAVDPNFIRLSTITQGNILSTPSETVKWDWLYEILARRTYDESGDYIVTEFPVTTMEYWNSDGEEKGLYDADAQTGLYPAVPGDADQTGLTYNQANDVYVLNVSPGKAYVKGFEVEYKQPNFMYGDKARSTAFRADALTQFTEGYNLNITNLYGTPDFTNITGEGTSVAFDDIIIYRNFIDGFVGEAEDGNGRPLNIGNAPWKTFHIIADGDIGSNPTGYVEVYKEGNTCVVNASVDLVRGDAIGDATILAATAIEAIPAGVMRPRYLTPDGTVDLGDGFYGYNSTYNMGVMTSVYFTELDVVGINNPTVPWTVGELVRGEDSGALGTVESGSTTTNLLVSNVVGSFLPGEEVIQTQSATVTKVSRILRPGEVSEFVFTNKGAGGSTIDLSSQTAVTLSALGSTKTLTAAAGDIVVSSSGISITETGRSKLTNFPLPTLEQNLGITYELSTVPSAVTGYAVSRGSNLTNTLQLAKSFYSPLADTNDFSADISIQNASDSEITDVANGSGFSAAAGSNTLLCDVFSGDPSQQLIPGDLITFVDDSGNTINRIVQYATKPVGYGTKRSRARIFLTTTVPNTVSSNTVQRIRVRTKGTPTETLLYTLPQQVVATLETNPDATEISYQVKKEFIVNVPSGSSTITLTTGKNNETFIASDSQTTIAIAENISNATDPTNLEGRVLVPSNIDVTQDDGRKVIYTIPNPLAYSVKMKVIAPIFVANAISKRKILRSNQTITVSAADAAKALISLGKADATAVHSITQSGKDISDNYTFDNGQRDNIYDIARVVLKTGRPPATGEVQIVFDYFEHSGEGDFFSVDSYTADDTFNYANIPTYTPTFVVGKKGVFEKNKNQQKIQLRDAIDFRPVVSASTSVIASVTDGTDSQSSTNYRDSSNGGDGFVPRIPIAESLFRCDMEYYLARYDSLFLSSNGSMALVAGEDSIDPEPVPDLANSIRLYDVFLPAYTFTLDDIYIRKFNYKRYQMKDIAVIDRRVERLEEVVTLSLLEQAALNTSVRDAVTGLDRFKNGIVVDSFRDHARGEVGTDQYRCSIDSENDQLRAPYFIDQAELEEKAQTEDARFNANYVIKDGIATLTHENEFYLNQPHATRWINLQPYMVFTYDGELELNPPIDTFADQNRLPTLVIEDNAVFDATSGLANAMNRGGMGTVWGRWNTNGNTRTRTQTTTTINTRTARRERTSYGDRVTDVQLAETMRSIAVEFRGTNLKPETRYYAFFDEIEVSNWISPDTIQTNFDDGLGRYQGAPNRNRGGFGLPIMSDSVGTIQGIFIVPNGRAPVEGSRYNGRMRDLQYRSSGTSRSFNTGTKVLRFTDNPDNPEDLDLVGGICEADFTSSGVISDVQQTVVSTRLPAFATRTRVTDRETLQIPRPVINNITNVTNNVTNVTNVTNRTTVVNNNITRVERPQRTGGGDPVAQSFYISFPDDIPPAEGIFITELDLYFRTKDPVHGVTAYLVPTEAGQRPTDQIIPHGSVTKKPNTTLRVVCTSLDGNTTQLATGTEVRGSTSGAVGTLRSSTTFRSPSNNATENVNNFVYTLIIDQYDGDFVAGEELIPLVTPRLADKFFVASDEVEVTRVDLQTFGENYTEATVTFSEPELPGGTAASASVTIADGKIYQIQLEDPGSGYTKTPTISITGDGTGATAGVRSKDSIPAVEMGITTSDDATLKTTFKFPAPVFLKADTYYAFVAYAPASLNYTIWTAKLGENLVGTETRMTTQPLLGSMFKSQNQGLWTEDQTQDVKFDLRRAKFDTSRPGVVTLQNAPLGLRGLEIDPIETNTLGSNDDSDVFGDNPKIVRIYHHMHGLAVGDLVAIDGVVNNPGGIPNEEFNTLHTVLAADFETFTIKTTTAATESVKDGGHLVACSYNRPYEVINTYTGAMVMTGTSLDAYTRSVQAAGITNYNVANAYRKNSYGATKLSESFYYGDAQQVAGYLNEVNNTLKLGGERSLEEAIVLSSSTDYLSPVIDVTRTNANLIRNLIDNPSVDGDIYGVTSRTVTFSGDVSPTTLTVGDLAEFTQGALTSNLTVREIDTSANKITFTGQYVGSLTTSSTFSDATLSGLTIVKVSTGTSGSFYPETTNAGSTWAKWVSKLFVFENPCDGLELKLSAIFYDTSSIKVYYRPRNIGFDGELANVNWIPFNGTGLPNQVEKIEPRSSEDVNPTLIPDEDYQSLTFNIQDVPKFDGVAIKIVMTANNPAQAPLIDDLQLITTE

Physico‐chemical properties

protein length:	2477 AA
molecular weight:	269052,44670 Da
isoelectric point:	4,60159
aromaticity:	0,08801
hydropathy:	-0,26605

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0414	STR	DC_0414	75	1400	Novel HMM	DC_0414	Central	Low	Positional only	88 proteins / 88 hits
IPR032096	STR	DC_0487	175	312	InterPro cluster	Domain of unknown function DUF4815	Central	Low	Positional only	116 proteins / 218 hits
IPR032096	STR	DC_0487	1140	1389	InterPro cluster	Domain of unknown function DUF4815	Central	Low	Positional only	116 proteins / 218 hits
DC_0082	RBD	DC_0082	1389	1762	Novel HMM	DC_0082	C-terminal	Low	Positional only	104 proteins / 104 hits
DC_0082	RBD	DC_0082	1897	2477	Novel HMM	DC_0082	C-terminal	Low	Positional only	104 proteins / 104 hits
IPR023366	STR	IPR023366	2057	2133	Merged direct domain	ATP synthase subunit alpha, N-terminal domain-like superfamily	Central	Low	Positional only	44 proteins / 44 hits

	Name	Taxonomy ID	Lineage
Phage	Synechococcus phage MA10 [NCBI]	3117465	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Synechococcus sp. MW02 [NCBI]	1620844	Cyanobacteriota > Cyanophyceae > Synechococcales > Synechococcaceae > Synechococcus >

Coding sequence (CDS)

Genbank protein accession

WVQ00135.1 [NCBI]

Genbank nucleotide accession

PP110483.1 [NCBI]

CDS location

range 140428 -> 147861
strand -

CDS

ATGCCAATCCAGAAGAACTTGAACGTCGCTCCTTACTATGACGACTTCGACCCAAACAAGAACTTTTACAAAGTTCTTTATAAGCCAGGTCACCCAGTCCAAGCAAGGGAACTGACGACGCAGCAGACTATCACTGCTGACCAAATTGAGCAGCTTGCTTCTCGCTTCCTGAAAGAAGGTGATAATATCATTCCTGGTGAGGTTACCTACCTCGCACCGCAGTCTTACGTCCGTCTGTCCTCCTTTACCCAAGGCGTAAGTGCTCAAGACTTTGTCGGTTACAACCTGACCGGCGTTACTTCTGGTGTCGTTGCTGAAGTCGTCTTTGCTGTTGAAGCAACCGAAGACGACGACGCTACTTTGTATGTGTCCTACAGTGGTTCCGGTGGCGACGGTGCTACTTCCACCTTCCTGGAAGGTGAAGTTCTGGAGTCCACCAACCCCAACAACCTGACCGCTACTGTTGGTGTCAACACCATCAGTAAGCCCATCACCTCCAACCCTTTGGGTCAAGGTGCCCTCTACAAGGTTTCTGAGGGTTCCTTCTATGTTGACGGCATGATGGTCCGCAACACAGAGCAGACTATCGTTGTTGGTAAGTTCACCCACCGCCCTACCGCCGAGGTTGGTTTCCTTGTAACCGAGGAAGTCGTTACTTCTTCCGAAGACGCTTCACTTCTGGACAACTCCCAGGGTTCCAGCAACTTCGCTGCTCCCGGTGCTGACCGTCTGAAGATCACACTGACCCTGGTCGCCCGTGAGCAAAACGCTGTTGACCCTAACTTCATTCGTCTGAGCACGATTACTCAGGGCAACATCCTCTCCACCCCCTCCGAGACTGTCAAGTGGGACTGGCTCTATGAAATTCTTGCTCGTCGTACCTATGACGAGTCCGGTGACTACATCGTCACCGAGTTCCCTGTAACTACTATGGAGTACTGGAACTCCGACGGAGAAGAGAAAGGTCTCTATGACGCCGACGCACAAACTGGCCTCTACCCTGCTGTTCCTGGTGACGCAGACCAGACGGGTCTAACCTACAACCAAGCGAACGACGTTTATGTACTGAACGTATCCCCCGGTAAGGCATATGTAAAAGGTTTCGAAGTTGAGTATAAGCAACCCAACTTTATGTACGGCGACAAGGCAAGGAGTACCGCCTTCCGTGCTGACGCTCTTACCCAGTTCACCGAGGGTTACAACCTCAACATCACCAACCTGTACGGCACCCCCGACTTCACCAACATCACCGGTGAAGGTACTTCGGTTGCGTTCGATGACATCATTATCTACCGTAACTTTATTGACGGTTTCGTAGGTGAAGCGGAAGACGGCAACGGTCGTCCCCTGAACATCGGTAACGCTCCCTGGAAAACTTTCCACATTATTGCTGACGGAGATATCGGTTCCAACCCAACCGGTTATGTTGAGGTCTATAAGGAAGGTAACACCTGTGTTGTTAATGCTTCTGTTGACCTGGTCCGTGGTGATGCCATCGGTGACGCAACTATTCTCGCAGCCACCGCTATTGAAGCGATCCCTGCTGGTGTTATGCGCCCTCGCTACCTGACCCCCGACGGTACTGTTGATCTGGGTGACGGTTTCTACGGTTATAACTCCACCTATAACATGGGTGTTATGACCTCGGTCTATTTCACTGAACTGGACGTTGTTGGCATCAACAACCCAACCGTTCCTTGGACTGTCGGTGAGTTGGTTCGTGGTGAAGACTCCGGTGCTCTTGGTACTGTTGAGTCTGGCTCTACCACCACCAACCTGCTCGTATCCAACGTTGTCGGTTCTTTCCTCCCCGGTGAGGAAGTTATCCAAACCCAGTCTGCAACAGTAACCAAGGTTTCGCGCATCCTCCGTCCCGGTGAGGTTTCTGAATTCGTATTCACCAACAAGGGTGCTGGTGGATCCACCATTGACCTTTCTTCCCAGACTGCTGTAACCCTATCTGCCCTGGGTTCCACTAAGACCCTGACTGCCGCCGCCGGTGACATCGTCGTTTCTTCTAGCGGAATTAGCATTACCGAGACCGGTCGCTCTAAACTGACCAACTTCCCTCTGCCTACTCTTGAGCAGAACCTGGGTATTACCTACGAACTCAGCACCGTTCCTTCTGCTGTTACCGGTTATGCCGTATCCCGTGGATCTAACCTGACCAACACTCTGCAGCTCGCTAAGTCTTTCTACTCACCTCTGGCCGATACGAACGACTTCTCTGCTGACATCTCTATCCAGAATGCCTCTGACTCTGAGATTACCGACGTCGCTAACGGTTCCGGTTTCAGTGCCGCCGCTGGCAGCAACACCCTTCTGTGCGACGTGTTCTCTGGCGACCCCAGCCAGCAGCTAATCCCAGGTGACCTGATCACCTTCGTCGATGACAGCGGCAACACTATCAACCGTATTGTTCAGTACGCCACCAAGCCCGTTGGTTATGGTACTAAGCGTAGCCGTGCTCGTATCTTCCTGACCACCACTGTTCCTAACACGGTCAGCAGCAACACCGTTCAACGTATCCGCGTTCGCACCAAGGGCACCCCTACCGAGACCCTCCTGTATACTCTCCCCCAACAGGTTGTTGCTACTCTGGAAACCAACCCTGACGCCACTGAGATCAGCTACCAGGTTAAGAAGGAGTTCATCGTTAACGTCCCTTCAGGTTCTTCCACCATCACCCTGACGACAGGTAAGAACAACGAGACCTTTATTGCTAGCGACAGCCAGACCACTATTGCTATTGCCGAGAACATCTCTAACGCAACTGACCCCACCAACTTGGAAGGTCGTGTTCTGGTTCCTAGTAACATCGACGTAACTCAGGACGACGGTCGTAAGGTTATCTACACAATTCCTAACCCCCTGGCCTATTCGGTCAAGATGAAGGTTATTGCACCTATCTTCGTCGCTAACGCTATCTCCAAGCGTAAGATCCTCCGTTCCAACCAGACTATCACTGTTTCTGCTGCTGACGCAGCTAAGGCTCTGATCTCCCTGGGTAAGGCTGACGCCACTGCCGTTCACTCTATCACCCAGAGCGGTAAGGACATTAGCGACAACTATACCTTTGATAATGGTCAGCGCGATAACATCTATGATATTGCTCGTGTTGTTCTGAAGACCGGTCGTCCTCCTGCTACCGGCGAAGTCCAAATCGTCTTTGACTACTTTGAGCACTCCGGTGAAGGTGACTTCTTCTCTGTTGACTCCTACACCGCTGACGACACCTTCAACTACGCCAACATCCCCACCTACACTCCTACTTTCGTTGTAGGTAAGAAGGGCGTCTTTGAGAAGAACAAGAATCAGCAGAAGATCCAACTGCGCGACGCTATTGACTTCCGTCCTGTTGTAAGTGCCAGCACTTCTGTTATTGCCTCCGTAACTGACGGAACTGACTCCCAGAGCTCCACCAACTATCGCGACAGCTCCAACGGTGGTGACGGCTTCGTTCCCCGTATTCCTATCGCCGAGAGTCTGTTCCGCTGCGACATGGAGTATTACCTCGCCCGTTACGACTCACTGTTCCTGAGCTCCAACGGCTCCATGGCTCTTGTTGCAGGTGAAGACTCTATCGATCCAGAACCCGTACCCGACCTGGCGAACTCTATCCGTCTGTATGACGTCTTCCTGCCCGCTTACACCTTCACGCTGGACGACATCTACATCCGTAAGTTCAACTACAAGCGCTACCAGATGAAGGACATCGCGGTTATTGACCGCCGTGTTGAGCGTCTGGAAGAAGTTGTAACCCTGTCTCTGCTGGAGCAGGCAGCACTCAATACTTCTGTTCGTGACGCTGTAACTGGACTCGATCGCTTCAAGAACGGTATCGTTGTTGATTCCTTCCGCGACCATGCGCGTGGTGAGGTCGGAACCGACCAGTATCGTTGTTCCATTGACTCTGAGAACGACCAACTCCGTGCTCCTTACTTCATCGACCAGGCTGAACTGGAAGAGAAGGCACAGACCGAAGACGCCCGCTTCAACGCCAACTATGTCATTAAGGACGGTATCGCTACTCTGACTCACGAGAATGAGTTCTACCTGAACCAGCCTCACGCTACCCGTTGGATCAACCTCCAGCCTTACATGGTCTTCACCTATGACGGTGAGTTGGAACTGAATCCTCCTATTGATACTTTTGCCGACCAGAACCGTCTACCCACTCTGGTTATTGAAGACAACGCTGTATTTGACGCAACTAGTGGTCTAGCCAATGCTATGAACCGTGGCGGTATGGGAACAGTATGGGGCCGCTGGAACACCAACGGTAATACCCGTACCCGTACCCAGACCACTACCACAATCAACACCAGGACTGCTCGTCGCGAGCGCACCTCTTACGGTGACCGCGTAACCGACGTCCAGTTGGCTGAAACTATGCGTTCTATCGCGGTCGAGTTCCGCGGCACGAACCTGAAGCCCGAGACCCGTTACTACGCTTTCTTTGACGAGATTGAGGTTTCTAACTGGATCTCCCCCGACACCATCCAGACCAACTTCGACGACGGTCTCGGACGCTACCAGGGTGCCCCTAACCGTAACCGTGGCGGATTCGGTCTGCCTATTATGAGTGATAGTGTTGGTACTATTCAGGGTATCTTCATTGTCCCTAACGGCCGAGCTCCTGTTGAGGGTTCTAGGTACAACGGAAGGATGCGTGACCTCCAGTATCGTTCCTCCGGCACTTCCCGCTCGTTCAACACCGGAACCAAGGTTCTGCGTTTCACCGACAACCCCGACAACCCAGAAGATCTGGATCTGGTTGGTGGCATCTGTGAGGCGGACTTCACTTCCTCTGGTGTTATCTCCGACGTTCAGCAGACTGTCGTTTCTACTCGTCTCCCCGCTTTCGCTACTCGCACCCGAGTAACTGACCGCGAGACTCTGCAGATCCCACGTCCCGTTATCAACAACATCACGAACGTTACCAATAACGTAACGAACGTAACGAACGTAACGAACCGCACCACGGTTGTTAATAACAACATCACCCGTGTAGAGAGACCCCAACGAACTGGTGGTGGCGACCCTGTTGCACAGTCGTTCTACATCTCCTTCCCAGACGACATTCCACCCGCAGAAGGTATCTTCATCACAGAACTGGATCTTTACTTCCGAACGAAGGATCCCGTCCATGGCGTCACTGCCTATCTGGTTCCCACCGAAGCAGGTCAGCGACCTACCGACCAGATCATCCCCCACGGTTCTGTAACCAAGAAACCAAACACCACTCTACGTGTTGTTTGTACCAGCCTTGACGGAAACACCACCCAGCTCGCTACCGGCACTGAGGTTCGTGGTTCTACTTCCGGTGCTGTCGGTACGCTAAGGTCTTCTACGACTTTCCGCTCACCTTCAAACAACGCCACCGAGAACGTCAACAACTTTGTCTACACTCTGATTATCGATCAGTATGACGGTGACTTCGTTGCTGGTGAGGAACTGATTCCTCTCGTAACTCCTCGCCTGGCGGACAAGTTCTTCGTTGCCTCCGACGAAGTTGAAGTAACCCGAGTAGATCTTCAGACCTTCGGTGAGAACTACACGGAAGCAACCGTTACTTTCTCCGAACCCGAACTGCCCGGTGGTACTGCTGCTTCCGCTAGCGTAACTATCGCTGACGGTAAGATCTACCAGATCCAACTTGAGGACCCAGGTTCAGGTTACACCAAGACCCCAACCATCTCTATCACTGGTGACGGCACGGGCGCAACCGCAGGCGTAAGGTCCAAGGATTCTATCCCCGCCGTTGAGATGGGTATTACCACCTCCGACGACGCAACTCTGAAGACCACCTTCAAGTTCCCCGCTCCTGTATTCCTAAAAGCAGACACTTACTACGCTTTCGTTGCTTACGCTCCCGCTTCGCTGAACTACACGATCTGGACCGCTAAACTGGGTGAGAACCTGGTTGGCACTGAGACCAGGATGACTACCCAGCCACTCCTCGGTTCTATGTTCAAGTCGCAGAACCAGGGTCTCTGGACCGAAGACCAGACGCAAGACGTTAAGTTTGACCTCCGCAGGGCCAAGTTTGACACCTCCCGTCCTGGTGTTGTTACTCTCCAAAACGCACCTCTTGGTCTCAGGGGTCTGGAGATCGATCCTATTGAAACCAATACCCTCGGCTCTAACGACGACAGCGACGTCTTCGGCGACAACCCCAAGATCGTCCGTATCTACCACCACATGCACGGTCTGGCGGTCGGTGACCTGGTTGCTATCGACGGTGTTGTCAACAACCCAGGTGGAATTCCCAACGAAGAGTTCAACACACTTCACACCGTTCTGGCTGCTGACTTCGAGACCTTCACTATCAAGACGACGACGGCTGCGACCGAAAGCGTCAAAGACGGTGGTCACCTGGTCGCTTGTTCCTACAACCGCCCCTACGAAGTTATCAACACTTACACGGGAGCGATGGTTATGACCGGAACTTCACTGGACGCCTACACCCGAAGCGTCCAGGCTGCTGGTATTACCAACTACAACGTCGCTAACGCCTACCGCAAGAACAGCTACGGTGCCACTAAACTCAGTGAGTCCTTCTACTACGGTGACGCACAGCAAGTCGCTGGTTACCTGAACGAGGTCAATAACACCCTCAAGCTCGGCGGAGAAAGGTCACTGGAAGAGGCTATTGTTCTCAGTTCCTCTACCGACTACCTCTCACCTGTCATCGACGTAACGCGAACCAACGCTAACCTGATCCGTAACCTGATCGACAACCCCTCTGTTGACGGTGACATCTACGGCGTAACCAGCAGGACCGTTACTTTCTCCGGTGACGTTTCTCCAACTACCTTGACTGTCGGCGACCTGGCTGAGTTCACACAAGGCGCTCTGACCTCCAACCTGACGGTTCGTGAGATCGACACCAGTGCGAACAAGATCACCTTCACCGGCCAATACGTCGGAAGTCTCACCACAAGCTCCACCTTCTCGGACGCAACGCTGAGCGGTCTGACTATCGTCAAGGTCAGCACCGGAACCTCTGGAAGCTTCTACCCAGAGACCACCAACGCAGGCTCAACCTGGGCGAAGTGGGTATCCAAACTGTTTGTCTTCGAGAACCCTTGTGACGGTCTGGAACTGAAACTGTCGGCTATCTTCTACGACACCTCAAGTATCAAGGTTTACTACCGACCCAGGAACATCGGCTTCGACGGCGAACTGGCAAACGTCAACTGGATCCCCTTCAACGGAACCGGACTTCCCAACCAAGTCGAGAAGATCGAACCTCGTTCCTCGGAAGACGTCAACCCAACGCTTATCCCCGACGAAGACTATCAGTCACTGACCTTCAATATTCAGGACGTGCCCAAGTTCGACGGAGTAGCTATCAAGATCGTCATGACGGCGAACAACCCAGCACAAGCTCCACTAATCGACGACCTACAACTTATCACCACCGAGTGA

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence