Phage RBP Database

Genbank accession

CAM0066652.1 [GenBank]

Protein name

tail fiber protein

RBP type

TF

Evidence Phold

Probability 1,00

Protein sequence

MTIRLLGVLPDPFGAPCPKAIIRFTALTSEGSVLKGTDAEHTTTKKGEYDFPLEQGRYLLEIQYSDELMESGSVLVDEFTPSSLTLVELIRYTTPHTPPLVDPNPTDWSVLFQEVIDNDEWDRQSEQQVRDEDVLVNEDKTIHKDEESYLSKETLTNTTGSSTTVQQTLNYKDATGREAGYNRREISTDLAKAHSSEEVYSDVDNYESKQSSLLEGAESASSQERSVTDTSVTETNKSTLGDQQITSERSLTDSGSEVTEEVAVSGAKVTSRKYIDANALVTALLEQGVVVENVEAFDRLSVSSTGSQRDIQVDRFNVGETLKVDTEQEIVTIAGQLKLTNGDDYKGPVGDSQYLEYAYATTEGKETGDWHIDNPDDPYDLPEGTVWRKHRTVYVKDGETTYSQWSNPYLLTGEDGASGDTLYWKYKYNTVSVISDPEATNPVGWDDELKDGHLYRIERLVSNGVYQGLWSEPAKIAGTDGDNGELVFEEYMYSPYGVSTPATSPEHWHTNFSNGDYFRSSRVIKYAAGTPIPIPDGTEPVMVTNWTTPALITPRKGYEYSDGLSQIVVHMYIRSTTSPALPTNTLTYNFNTLTLSGDTQGWSTEVPEGIGNLWITIATASSNTGSDAIAPNEWTDPQLSSTQAYNQASLSLYKRTSAGTVPDAPSTTLSYDFTTGALTGDLEGWSNGTIPAGTDDLYIATAEVRSQTTTADVLPNYWGVGVLTSTAFRQQTVNIYKRGDNAPPSADVTYNFTDGSITGLSGGWSLTIPSGDQDVFIGVAVASAAGVSDVIHPSDWSVGPLGTSGHQAQVINLYQTAQDVPAKPQSDIVYDFTQGKVTSNVSPWSTTVPQNTQGKIYVTTATANASALADSDIVPKEEWTSPQVIVESGINAVPVTLFRKHSLDSAPEKHTNTLTYSFDNAVLLNQPNNGWSATPMSVDLGEAVWSMVATAQGLATDATDDIAPTEFSAPVIYTATGSEVFTVYQYAEASTGPWYDEFTAERVWRIQATSINGVVSDWSEPVKLTGEDGATGDTIYVEYNYSEDLSNWHPVLVEGDIWRRERIVTNDVADEWSSPARLKGNEQYIEYQYSASLDLGEAGWHTNFSSGDYYRRERTVINGTYGEWSEGVQMVPLKDVDYSDGAGGDTIYEVYQYSVDGVTDWVYDFTDEHIYRRTAVVINGALGPWSEPAKLSGVDGADGDTIYMEYEYSVDGVNWHADMEDGDIWRHEREHTVGVTVPSDPWGNRTRIRGIDGAYYEYLYNEDADNYPTEPEDAFGTWHANFSEGDYYRIERLVQEASTGNWTTPTKLKPKKGEDYSDGIQGPKGEDGVTTYTWIKYADDASGSGMSESPVDKPYMGIAYNKTTDQESNDPNDYAWSKVEGDQGIQGENGYMWVQYSNYPNGMNGTAPNMHQDPVDPSTGRPYLYIGISYNNTSPTEGNDPTAYTWSKYVGDEIYYEYSYSPDQISWDMELDANDVWRRERRVENGQYGDWSDAIRIVGTEGPQGIPGNDGNDGNDGDSLYTWVKYADSDTGSGLSNNPEGKGYIGFAYNKTTPVESNDRNDYVWSLVKGTDGTDGKDGENGSDGAQGIPGPIGPDGKTLYTWIKYSPNANGYPLTEAPDENTKYLGISTNQQEQTESTDPDDYVWSPYTGADGQYYEDEFSVNGDPVDWETWHYPAQSTDKFKRTRLIDSKGEPVVDDTTDSAGWVYTQIAPIKDVDYGDGNSGDTIYEVYQYSVDGVMNWEDDFRDEHVFRRTAVVINGSQSAWSDAARISGKDGLQSNVITLYQVKSEQYSWKAEELIQTDETYLILTGSFVGYDPQDGINGWTLSVPAVLTAGEALYQVRVAALSEAGQLEVPIPADDWAYPVQVSASGISGEDGKHGSGSYILNWEDSYNSGQGYKDLNTGIGGQPTEGDVEYWFRELSTRESQAGDILTIQQKEVESAAPKQWLRDTGAWTEFVLSVDGNAIVNGTLGAEALKSGTTLTDVLYVSNDEDSHEMTLSGSGEWEDVTGTIQKDDDYRIWLGNRDPKKAPFSVTRQGSANVYGHLTATSLELMDNADIPAEMDNERRYETYNIVRDNGEFMVSEETYGDSGHGWTTDPTNLVPAAYAHPTSATSYDYHDCYVETRYFADGAPYMFMNSASENDTPRFYTSNVYNNYNITVDPRSSIVVKFKAKFSKFGNTQAAKPKVKMTFLYDDVNVSDPATWKGREHEWDSGLDWDTYYNFEYTLDLNLEPQSNNPTNPGTLRFEIAPHSQMIIFGVEVLQRVYKPYVPEYTFHEEPIYGVEEGDVLSLGVEYVGSETDLTWGLRSFNSKGQVIWERGHKVSDINTSLWELDIQEDITVDTIGDGGLFLFLTKNSAPFNWGNSLHSTVHVRNFQVVHGDSYKEHYVPVSDPNAYPDQEAGTYPQITGGGWTGPESESGWGVLSNGDAYFNNLTVTNGTLSSGTIIGADIYAGNTYHKIDYNTNNSSDTVYYKKYPNTVPLYASTSFSGRDYGTRTAVGLNGPLTDVYVRPWDVVSCLETRGEVNTRRFRWGKVRAGALSCKVQLPSTYVTSLGVDVYIIDDNGWERGVSGYPVISQGRYYEGTMSLGPMIFDVVINNTGSTYYVEIKNRQCQQFGEIDNDLYNGKFYVKVRAGIDNNKRVDATYDLQYTVDNDTFPG

Physico‐chemical properties

protein length:	2662 AA
molecular weight:	294809,92600 Da
isoelectric point:	4,31319
aromaticity:	0,11307
hydropathy:	-0,61732

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_1333	STR	DC_1333	110	1077	Novel HMM	DC_1333	Central	Low	Positional only	26 proteins / 26 hits
DC_0392	STR	DC_0392	1056	1223	Novel HMM	DC_0392	Central	Low	Positional only	58 proteins / 58 hits
DC_1971	STR	DC_1971	1270	1422	Novel HMM	DC_1971	Central	Low	Positional only	95 proteins / 95 hits
PTHR24637	Unmapped	-	1309	1655	PANTHER	COLLAGEN	-	-	-	-
DC_0321	STR	DC_0321	1454	1588	Novel HMM	DC_0321	Central	Low	Positional only	15 proteins / 15 hits
DC_1191	STR	DC_1191	1596	2210	Novel HMM	DC_1191	Central	Low	Positional only	75 proteins / 75 hits

	Name	Taxonomy ID	Lineage
Phage	Vibrio phage D444 [NCBI]	3105210	Viruses >
Host	No host information

Coding sequence (CDS)

Genbank protein accession

CAM0066652.1 [NCBI]

Genbank nucleotide accession

OZ196551.1 [NCBI]

CDS location

range 9898 -> 17886
strand +

CDS

ATGACAATCAGACTACTTGGGGTTTTACCAGATCCGTTTGGAGCCCCATGTCCTAAAGCTATTATTCGGTTTACTGCCCTCACTTCAGAGGGTAGCGTGCTTAAAGGTACAGATGCCGAACACACCACGACCAAAAAAGGTGAATACGATTTTCCTCTAGAGCAAGGCCGATACCTTTTAGAGATTCAGTACTCTGATGAACTAATGGAATCTGGTTCAGTTTTAGTGGATGAGTTTACTCCTTCATCTCTTACCCTTGTCGAATTAATTCGTTACACGACTCCCCATACACCTCCTTTGGTGGATCCGAATCCTACGGACTGGTCGGTACTATTCCAAGAAGTCATCGACAATGATGAGTGGGATCGCCAGAGCGAACAGCAGGTGCGTGACGAAGATGTTCTAGTCAACGAAGATAAGACCATCCATAAAGACGAAGAAAGCTACCTCAGCAAGGAGACCCTTACTAATACCACTGGTTCAAGTACGACAGTACAGCAGACACTGAACTACAAGGACGCTACTGGACGAGAGGCAGGGTACAACAGACGAGAGATCTCCACAGACCTAGCTAAGGCGCACTCTAGTGAAGAAGTATATTCGGACGTTGATAACTATGAGTCTAAGCAGTCTTCCCTCCTAGAAGGCGCTGAAAGCGCCTCTAGCCAAGAACGAAGCGTAACAGACACATCGGTAACAGAGACCAACAAGTCTACTTTAGGGGATCAGCAGATCACCTCAGAACGCAGCCTTACTGATTCTGGTTCAGAGGTAACTGAAGAAGTAGCTGTGTCTGGTGCCAAGGTAACCTCTCGTAAATACATTGACGCTAATGCTCTAGTTACTGCCCTATTGGAACAAGGTGTGGTGGTTGAGAATGTGGAAGCATTTGATCGCCTATCAGTAAGCTCTACTGGTTCACAGCGAGATATTCAGGTTGACCGTTTCAACGTAGGTGAGACGCTTAAAGTCGACACTGAACAAGAGATAGTGACTATTGCAGGACAACTGAAGTTGACCAATGGCGATGACTATAAAGGTCCTGTAGGCGACTCTCAGTACCTTGAGTACGCTTATGCGACTACCGAAGGCAAAGAGACAGGGGATTGGCATATCGACAACCCTGATGACCCTTATGACTTGCCTGAAGGGACTGTATGGCGTAAACACAGAACTGTTTACGTGAAAGATGGTGAGACGACTTACAGTCAATGGTCTAATCCTTACCTATTAACAGGCGAAGACGGGGCATCAGGCGATACTTTGTACTGGAAATATAAGTACAACACAGTGTCTGTGATCTCTGATCCAGAAGCGACTAACCCTGTAGGATGGGATGACGAATTAAAAGATGGACATTTATACCGAATTGAACGTTTGGTCAGCAACGGAGTTTATCAAGGACTTTGGTCGGAACCGGCTAAGATTGCAGGTACTGACGGTGACAACGGTGAATTAGTTTTTGAGGAGTACATGTATTCTCCTTATGGGGTAAGTACACCTGCTACCAGTCCTGAACATTGGCACACCAACTTCTCTAACGGGGACTACTTCCGATCGTCACGAGTAATTAAGTACGCTGCCGGTACTCCTATCCCTATCCCTGATGGGACTGAACCAGTAATGGTAACTAACTGGACTACTCCTGCGCTCATTACACCAAGAAAAGGCTATGAGTATTCGGATGGTTTATCGCAGATAGTGGTTCATATGTACATTCGTAGTACGACATCTCCTGCATTACCGACGAATACCCTAACGTACAACTTCAATACGCTGACCTTGTCTGGCGATACCCAGGGTTGGTCTACTGAAGTTCCTGAAGGCATAGGTAACTTATGGATCACCATCGCCACAGCATCTTCTAATACTGGTTCAGATGCTATTGCGCCCAATGAATGGACAGATCCCCAGTTAAGTTCAACTCAGGCGTATAACCAAGCGTCATTGAGCCTCTATAAGCGTACCTCAGCAGGCACAGTGCCAGATGCTCCTAGTACTACTCTGAGCTACGACTTTACGACAGGTGCTCTTACAGGCGACCTAGAAGGGTGGTCTAACGGTACTATCCCTGCAGGTACAGACGACCTGTATATTGCTACGGCAGAAGTACGAAGCCAGACCACTACAGCGGACGTACTGCCTAACTATTGGGGTGTAGGCGTTCTTACCTCTACTGCTTTCCGTCAGCAGACGGTGAACATCTATAAGCGAGGAGACAATGCCCCTCCAAGTGCAGACGTGACGTATAACTTCACCGATGGTTCAATTACCGGTTTATCTGGTGGGTGGAGCCTGACTATTCCGTCTGGGGATCAGGATGTGTTTATTGGCGTAGCGGTAGCATCGGCAGCAGGTGTTAGCGATGTTATTCACCCTTCAGATTGGTCAGTAGGTCCACTGGGAACCAGTGGACATCAAGCTCAGGTAATTAACCTGTACCAGACTGCCCAAGATGTACCGGCTAAGCCTCAGTCAGATATCGTGTATGACTTTACTCAGGGTAAGGTTACTTCGAATGTAAGCCCTTGGAGCACAACAGTACCTCAAAATACACAAGGTAAAATCTACGTTACTACGGCTACTGCGAATGCTTCTGCTCTGGCAGATTCAGACATCGTGCCTAAAGAAGAGTGGACATCCCCTCAGGTGATCGTAGAAAGCGGTATTAACGCAGTACCGGTAACTCTGTTCCGTAAGCACTCTTTAGATAGCGCTCCTGAGAAACATACGAATACCCTGACTTACTCTTTCGATAATGCAGTACTACTGAACCAACCTAATAATGGATGGTCAGCTACGCCTATGTCGGTAGATCTAGGTGAAGCAGTTTGGAGCATGGTAGCAACAGCACAAGGCTTAGCTACTGACGCTACTGATGACATTGCACCTACTGAGTTCTCAGCACCGGTTATCTACACTGCTACCGGTTCAGAAGTGTTTACTGTTTACCAGTACGCAGAAGCATCTACTGGCCCATGGTATGACGAGTTCACTGCTGAACGTGTTTGGCGTATTCAAGCCACCTCTATCAATGGGGTAGTTAGTGATTGGTCTGAACCAGTTAAGCTTACCGGTGAAGACGGTGCTACCGGTGATACGATTTACGTAGAGTATAACTATTCAGAAGACCTGAGTAATTGGCATCCTGTACTAGTGGAAGGGGATATTTGGCGAAGAGAACGCATCGTCACTAATGACGTAGCTGACGAATGGTCATCTCCTGCACGACTGAAAGGCAACGAGCAGTACATTGAATACCAATACTCAGCCTCTCTGGATCTAGGCGAAGCAGGTTGGCACACTAACTTCAGTTCTGGCGACTACTACCGTAGAGAACGCACGGTGATCAATGGCACTTACGGAGAATGGTCTGAAGGTGTTCAGATGGTTCCTCTAAAAGACGTGGATTACTCCGATGGAGCTGGGGGAGACACGATCTACGAAGTGTATCAATATTCAGTAGATGGCGTTACAGACTGGGTATATGACTTCACGGATGAACACATCTACCGTAGAACGGCAGTGGTAATCAACGGTGCTCTGGGGCCATGGTCTGAGCCTGCTAAATTATCAGGTGTTGATGGTGCAGATGGCGATACAATCTACATGGAGTACGAGTACTCAGTGGATGGTGTTAACTGGCATGCTGATATGGAAGATGGAGACATCTGGAGACATGAACGTGAGCATACCGTAGGTGTTACTGTACCTAGTGACCCTTGGGGAAACCGTACACGAATCCGTGGTATTGATGGTGCTTACTACGAGTACCTATACAATGAAGATGCGGATAATTATCCAACTGAACCAGAAGACGCTTTCGGTACTTGGCATGCTAACTTCTCCGAAGGTGACTATTACCGTATTGAGAGACTGGTTCAAGAAGCTTCTACAGGTAACTGGACTACCCCCACTAAGCTAAAGCCTAAGAAAGGTGAAGACTACAGTGACGGTATCCAAGGTCCTAAAGGCGAAGATGGTGTTACTACGTACACTTGGATTAAGTACGCTGATGATGCTTCTGGTTCGGGAATGTCTGAAAGTCCTGTTGATAAACCATACATGGGTATTGCCTATAACAAGACTACAGATCAAGAGTCAAATGATCCTAATGATTATGCTTGGTCTAAGGTCGAAGGTGATCAAGGTATCCAAGGCGAAAACGGGTACATGTGGGTACAATACTCTAACTACCCTAATGGTATGAACGGCACTGCCCCTAACATGCACCAAGACCCTGTTGACCCGTCTACAGGCCGTCCTTACCTATATATCGGCATCTCCTACAATAATACCTCTCCTACTGAAGGGAACGACCCTACAGCCTACACATGGTCTAAGTATGTGGGTGATGAGATCTACTACGAGTACAGCTACTCTCCTGATCAGATCTCTTGGGACATGGAGTTGGATGCGAACGATGTATGGCGTAGAGAAAGACGTGTTGAGAATGGACAATATGGAGATTGGTCAGACGCTATTCGTATTGTAGGAACTGAAGGCCCTCAAGGTATCCCGGGCAACGACGGTAATGACGGTAACGATGGAGACTCTCTGTACACATGGGTGAAGTACGCTGATTCAGATACTGGTTCAGGGCTAAGTAATAATCCAGAAGGTAAGGGCTACATCGGTTTTGCGTACAACAAAACTACGCCAGTGGAATCGAACGATCGTAATGACTATGTCTGGTCGTTGGTTAAGGGTACTGACGGTACCGATGGTAAGGACGGGGAGAACGGATCAGACGGTGCACAAGGTATCCCGGGACCTATTGGCCCAGATGGTAAGACGCTGTATACATGGATCAAGTATTCGCCTAATGCTAACGGATACCCTCTTACTGAAGCCCCTGACGAGAATACTAAATATCTGGGTATTTCTACGAATCAACAGGAACAGACTGAGTCTACGGATCCTGATGATTATGTATGGTCTCCTTACACAGGTGCAGACGGCCAATACTACGAAGATGAGTTCTCTGTAAACGGTGACCCTGTTGATTGGGAAACTTGGCACTATCCTGCACAGTCTACGGATAAATTTAAACGTACTCGTTTAATCGATTCTAAAGGCGAACCAGTAGTGGATGACACGACTGATAGTGCAGGGTGGGTGTACACTCAGATTGCTCCTATCAAAGACGTAGACTACGGAGATGGCAATTCAGGAGATACTATTTACGAGGTATATCAATACTCGGTAGACGGTGTCATGAATTGGGAAGATGATTTTCGAGACGAGCACGTATTCAGACGTACTGCCGTAGTAATTAATGGTTCACAAAGTGCATGGTCTGATGCAGCGAGAATCTCCGGCAAGGACGGTCTGCAATCTAACGTGATCACCTTGTATCAAGTTAAGAGTGAGCAGTACTCTTGGAAGGCGGAAGAGTTGATCCAGACAGACGAAACTTACCTGATTCTTACTGGTTCATTTGTAGGGTATGACCCTCAAGATGGCATCAATGGGTGGACGTTAAGTGTTCCTGCTGTACTCACCGCAGGTGAGGCGCTGTACCAAGTTCGTGTTGCAGCATTGTCTGAGGCAGGACAACTAGAAGTACCTATTCCTGCAGACGACTGGGCCTATCCTGTGCAGGTATCTGCAAGCGGTATCTCAGGGGAAGATGGTAAACATGGCTCAGGCAGCTACATCTTAAACTGGGAAGATTCGTATAACTCAGGCCAAGGGTACAAAGACCTGAACACTGGAATAGGAGGGCAGCCTACCGAAGGGGATGTTGAGTACTGGTTCAGAGAACTATCTACGAGAGAATCTCAGGCAGGGGACATTTTAACTATTCAACAGAAAGAAGTGGAATCTGCGGCGCCTAAACAGTGGTTAAGGGACACCGGAGCATGGACAGAGTTTGTATTGTCTGTAGATGGTAACGCTATTGTAAACGGTACATTGGGTGCTGAAGCACTTAAATCAGGCACTACGCTTACGGATGTGCTGTATGTGTCCAATGACGAAGATAGTCATGAGATGACTCTCTCTGGTTCAGGGGAATGGGAAGACGTTACTGGTACTATTCAAAAGGACGACGATTACCGTATCTGGTTAGGTAATAGAGATCCTAAGAAAGCGCCTTTCTCTGTTACTCGACAGGGTAGCGCTAATGTCTATGGGCATCTAACGGCAACTAGCCTAGAGCTTATGGATAATGCAGATATCCCTGCTGAGATGGACAATGAACGCCGGTACGAAACGTATAATATCGTAAGAGATAATGGGGAGTTCATGGTCTCTGAGGAGACGTATGGGGATTCAGGGCATGGTTGGACAACAGACCCAACTAACCTAGTACCTGCCGCATACGCTCACCCTACTTCGGCTACTTCGTATGATTATCATGACTGTTATGTGGAAACCCGCTACTTTGCAGACGGTGCTCCGTACATGTTTATGAACTCAGCAAGTGAGAACGATACACCAAGATTTTATACCTCTAATGTGTATAACAACTACAACATTACTGTAGATCCCCGTAGTTCTATTGTTGTTAAGTTTAAAGCTAAGTTTTCTAAGTTCGGTAATACGCAAGCAGCTAAACCGAAAGTGAAGATGACTTTCCTTTACGATGATGTGAACGTATCGGACCCTGCTACTTGGAAAGGCAGAGAACATGAATGGGATTCAGGGCTCGATTGGGATACTTACTATAATTTTGAGTACACGTTGGACCTCAATTTAGAGCCGCAATCTAATAACCCTACTAACCCCGGAACTTTAAGGTTTGAGATTGCACCTCATTCTCAGATGATCATCTTTGGGGTTGAAGTGCTACAGCGTGTGTATAAGCCTTATGTGCCTGAGTATACTTTCCATGAAGAGCCTATCTACGGAGTAGAAGAGGGAGACGTGCTGAGCTTAGGGGTTGAGTATGTTGGTTCAGAAACAGACCTTACTTGGGGCTTACGTAGCTTTAACTCTAAAGGTCAAGTCATATGGGAAAGAGGACATAAAGTCTCTGACATTAATACCAGTCTTTGGGAGTTAGATATTCAGGAAGACATTACGGTAGATACGATCGGAGATGGAGGCTTGTTCTTGTTCCTGACGAAGAACTCTGCACCTTTTAACTGGGGAAATTCATTACACAGTACTGTTCATGTACGTAACTTCCAAGTGGTTCACGGAGATTCGTATAAGGAGCACTATGTTCCTGTAAGTGACCCGAATGCATATCCTGACCAAGAAGCAGGGACTTACCCTCAAATTACCGGTGGTGGTTGGACTGGTCCAGAATCAGAGTCAGGATGGGGTGTGCTCTCTAATGGTGATGCGTACTTTAATAACTTGACCGTGACCAATGGTACTCTCTCAAGCGGTACGATCATTGGAGCTGATATCTACGCAGGTAACACGTACCACAAGATTGACTACAACACGAACAATAGCAGCGATACGGTGTATTATAAGAAGTACCCTAATACAGTACCTCTGTATGCTTCTACAAGCTTCTCTGGCAGAGATTACGGCACAAGGACTGCCGTTGGTTTGAATGGCCCACTGACAGACGTGTACGTCAGACCTTGGGATGTTGTGAGCTGTCTGGAGACACGAGGAGAAGTGAATACTCGTAGATTCCGTTGGGGTAAAGTAAGAGCAGGAGCGCTGAGTTGTAAGGTACAATTGCCAAGCACCTACGTAACTTCTCTAGGCGTTGATGTCTATATTATCGATGACAACGGGTGGGAACGAGGAGTATCAGGATACCCTGTTATTTCTCAAGGGCGATACTACGAAGGCACTATGTCTTTGGGTCCTATGATTTTTGATGTAGTTATTAATAACACCGGCTCTACTTACTATGTCGAAATCAAAAATAGACAATGTCAGCAATTTGGGGAGATAGATAATGATCTCTACAATGGCAAGTTCTATGTGAAGGTACGTGCAGGTATTGACAACAACAAACGTGTTGACGCTACTTATGACTTACAATACACAGTAGATAACGACACTTTCCCGGGATAA

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence