Phage RBP Database

Genbank accession

XTK86828.1 [GenBank]

Protein name

tail fiber protein

RBP type

TF

Evidence GenBank

Probability 1,00

Protein sequence

MAGGRRFQAGLGSEHKRLYKEGQQINTLLLAQVIQVNYKYNTVDLLALQHKEVFQNSYANEGRFSARLPMEFGGRNLAGQPYGQVNPIAVGTVVLVGFINSDKDMPIVISVYNNNDVNKQLSRTRFANADPTDMALAGQMYQKFSLYPSLTYDSIDGDGNRVVTFSGKSFIAFDTKDMQNSPMTDASYGSRYEDLGTSYYNDGELIEPMKGRAPNVLFKHQGILDDDNKPDTHNFMIHINPDGTYRTSMMDTEQDWRTMFEMTPEGKIRLRRQGDTVRLNDGFEIGELGINEEGIVYLRNGDMDLEVREDGIYSQGKLITENINLDDIYEKLANVTFEINKTNESLQILTEKSELQDGKIVNLETEITIVAGKVESKVSATEVQDMIDSSIVDMTDAIKKAQEDADRANQVISDMASDNRLAPSEKLDLLKEWDIIKNEYPTYLAQAELYEVDSTTYTAKYKALETFVTPLLEDMEATSVVDGSIMRKTFSAYYTERINLLNAITKGLKDGLEEAMKKASQASVDATQALADSAQAQIDANNAKQLIADIASDGKLTASEKYQLKKEWDVIVKEYPTTIAQATKYKVNTDNYTAKYKALETFVTPLFANMDETSVVNGEQLRAVFSDYYAVKITLLKEITDIARDELTDYGNRITVAETKITQTSEAITLMASRVETVENNVKTNTAQLKVQADLISQKVTASEVKDAIDNAIDNMSIGGSNLFVIKTQTAGLLNENNGTVGTAVDKSVVSNYIKVTAKMPYVASLYGNTGTNSIIIAWYDTSKTFISGQAVADSGDFHKTYVAPENAVYARLSYKKADTVKMKFEVGTKPTDYSPSWDDIKGDQTALEEYIKQVEEQAKQAQQEAENAKNEAENANSAIADMSNDNMLTANEKQQILLQWEEIKTEYPINLDQATKFGVSATQYTTAYNALKTYLDPLLADMTTTSVIVGSTMRSTFNTYYDRRTTLLNRVAELAKQVADQAKDTADKVDDDLNNIGGYNYIGFSSGDHMYPRLMIKNIGYYYVPSMGSAEFVDDMVCLKPKTTEKKVQYEIGSSSANISGVGLANYRMKEVKTGQWLTASANLKVVGTGKAYITIFTLENGSWQFSLSDMVTASQGVTRVVAQRKVTDQTQGVFIRISGDIIDEVHFGNTQLEVGIRSTPWKKSDIDIQEDINNVADDIKDYIGARSDNLITNGFGELGNNTNIGGIFDGADRIVGKGSFRQEEGNKSLLFSEHIVIDNKKVYNFDYYMHTLKGVGRSYAMIAPYDVDGKRITFPSLGGRNYNSVTPVKFTKLAKPLKVGDTEVFVEDASLWNGQAPQDYQRSIIMWGYKNSFGYTYPDGTYSQLMQMKTYDIGAVDTIANKITLNKPWAVANPNSSDGIFPVGHTLSPTSDGSTYLYLNGHVNIQVPTTYTKYSHLISGSSEFANTTLIPVETGSIQLGFLLNRDTTGEKSWLNGLRLRDYTDTYKLNDDVRETQENVDKAQADADKANQSIADLSNDNLVTPNEKLDLKKEWEIIVAEKPKNDAQADKFGVSKVAYGTAYTALDTYLKPILASTTTNSAIVGQTMRDTFKAYYTARTDLLNAIASKAKELADNAQDTADNIAVGTRNLLIGTQDFSKGKYPGNANVTITDEKLFGNAVMKNDYTTGTGYSDMYQMTTSIIPTGTQYTLSFYAKADLEGTKMSCYFYNPNTTTSSVNSQGGKLSSSDGRTVFVLSTEWTKYWVTWTQTQADKPKSVIIGRKTGGEEPNSAFYMSSPMMVEGNKPQTWMKAPEDIETAINGKEGAWVYSPTAPTNPAVGLVWVDSSKTPNQPKRWVGGETGWVALTPEEVKDLPWGEDGSSLADWVAQAEQKISSDAIISTVLGSEDFTGIFDSKANTEDLNNLASYDDLDAMQAEYERLLKEGIAGIDFSPYVTNTELEQLKDSFTFSVQQAGGVNMLKNSLGFSGTDFWQASSGIDTTQNEQLSKLGFGSGFMINRVQNATLAQTIELPEAKQGLQYALSFYMNVATFGDVTDFQCGAHIYEEGVLKYTVGVTDATQEIPSDYHLYKLVFEPESPNTVIELFVTNGAQATVIISGVMYNIGNIALKWQPYPSEIYNTNVKIDINGITVKNNQTDGYTMITPQEFSGYARVNGEMERIFTLNGQVTEVKMLQAEKRITMEPISVFAMNSKETNTIGWAFVASGEVAHSAIASRTQ

Physico‐chemical properties

protein length:	2198 AA
molecular weight:	243252,23450 Da
isoelectric point:	4,79166
aromaticity:	0,09190
hydropathy:	-0,41656

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_1874	ATT	DC_1874	71	511	Novel HMM	DC_1874	N-terminal	Low	Positional only	55 proteins / 55 hits
Coil	Unmapped	-	391	418	Coils	Coil	-	-	-	-
DC_0293	STR	DC_0293	556	1297	Novel HMM	DC_0293	Central	Low	Positional only	26 proteins / 26 hits
Coil	Unmapped	-	845	886	Coils	Coil	-	-	-	-
DC_0015	STR	DC_0015	1217	2198	Novel HMM	DC_0015	Central	Low	Positional only	187 proteins / 187 hits
Coil	Unmapped	-	1474	1501	Coils	Coil	-	-	-	-

	Name	Taxonomy ID	Lineage
Phage	Enterococcus phage ZJGS2 [NCBI]	3417017	Viruses >
Host	Enterococcus mundtii [NCBI]	53346	cellular organisms > Bacteria > Bacillati > Bacillota > Bacilli > Lactobacillales

Coding sequence (CDS)

Genbank protein accession

XTK86828.1 [NCBI]

Genbank nucleotide accession

PV523735.1 [NCBI]

CDS location

range 1 -> 6597
strand +

CDS

TTGGCAGGAGGACGTAGATTTCAGGCAGGGTTAGGTTCCGAACATAAAAGATTATACAAAGAAGGACAACAAATTAATACTTTGTTACTAGCCCAAGTTATCCAAGTTAATTATAAATACAATACAGTTGATTTACTAGCATTACAGCATAAAGAAGTTTTCCAAAACTCCTATGCCAATGAAGGTAGATTTTCTGCTCGTTTACCAATGGAATTTGGTGGACGAAACCTTGCAGGACAACCATATGGTCAAGTAAACCCTATTGCCGTTGGTACTGTTGTCCTAGTAGGTTTTATTAACTCTGATAAAGACATGCCGATTGTTATTAGTGTATACAATAACAACGATGTAAATAAACAATTATCCCGTACACGTTTTGCTAATGCAGACCCTACAGATATGGCTTTAGCGGGACAAATGTATCAAAAATTTAGTTTGTACCCATCTTTAACTTACGATAGTATTGATGGGGATGGTAACCGAGTAGTTACATTCTCTGGTAAATCATTTATTGCATTCGATACAAAAGACATGCAAAACTCTCCAATGACAGATGCTAGTTACGGTTCTCGTTATGAAGACTTAGGAACATCTTACTATAACGATGGAGAACTAATTGAACCGATGAAAGGTCGAGCACCTAATGTGTTGTTCAAGCACCAAGGTATTCTTGACGATGATAATAAACCCGATACACATAATTTCATGATTCACATTAACCCAGATGGAACATACCGTACATCTATGATGGATACGGAACAAGACTGGCGGACAATGTTTGAGATGACACCGGAGGGTAAAATCCGTTTACGTAGACAAGGGGATACTGTACGTCTAAACGATGGTTTTGAAATTGGTGAACTAGGTATTAATGAAGAAGGTATCGTTTACTTACGTAATGGGGACATGGACTTAGAAGTTCGTGAAGATGGTATCTACTCCCAAGGTAAACTAATCACAGAAAATATCAATCTTGATGATATTTATGAAAAATTAGCTAATGTTACTTTTGAAATTAATAAGACAAATGAGTCCTTACAAATTTTAACTGAGAAATCAGAACTACAAGATGGTAAGATTGTAAATCTAGAAACAGAGATTACAATTGTAGCCGGAAAAGTAGAATCTAAAGTAAGTGCAACAGAAGTACAAGACATGATTGATAGCTCTATTGTAGACATGACGGATGCTATTAAAAAAGCCCAAGAAGATGCAGATAGAGCAAATCAAGTTATTTCTGATATGGCTAGTGATAATCGCTTGGCTCCTAGTGAGAAGCTAGACTTACTAAAAGAGTGGGACATCATCAAGAATGAGTATCCAACTTATTTAGCACAAGCTGAACTATACGAAGTAGATAGTACAACTTATACTGCTAAGTATAAAGCTTTAGAAACATTTGTTACTCCTTTATTGGAAGACATGGAAGCTACTAGTGTAGTAGATGGTTCTATTATGCGTAAAACATTTAGTGCATATTACACAGAACGAATCAATTTACTAAATGCAATCACTAAAGGGTTAAAAGATGGTTTAGAAGAGGCAATGAAGAAAGCTTCTCAGGCTTCTGTAGATGCTACACAAGCTTTAGCTGATTCTGCACAGGCACAAATTGATGCAAACAATGCAAAACAATTGATTGCAGATATTGCTAGTGACGGTAAGCTGACTGCTTCTGAAAAGTACCAATTGAAAAAAGAATGGGATGTTATTGTTAAGGAGTATCCTACAACAATTGCCCAAGCAACAAAGTACAAAGTAAATACAGATAACTATACTGCTAAGTATAAAGCTTTAGAAACATTTGTCACTCCTTTGTTTGCGAATATGGATGAAACAAGCGTAGTTAACGGGGAACAACTACGTGCAGTATTTTCTGATTACTATGCTGTAAAGATTACTTTATTAAAAGAAATCACAGATATTGCTCGTGATGAATTGACTGATTATGGTAACCGTATTACTGTAGCAGAAACAAAAATCACACAAACATCCGAAGCTATTACGTTAATGGCTTCCCGAGTGGAAACTGTTGAAAATAATGTTAAAACAAACACAGCTCAATTGAAAGTACAAGCAGACCTAATTAGTCAGAAAGTAACTGCTAGTGAAGTAAAAGATGCTATTGATAATGCAATTGATAACATGTCTATTGGTGGTTCTAACTTATTTGTAATCAAAACGCAAACAGCAGGACTATTGAATGAAAATAATGGTACTGTAGGAACAGCCGTAGATAAATCTGTAGTATCTAACTATATCAAGGTAACAGCTAAAATGCCTTATGTAGCTTCTTTATATGGAAACACAGGGACAAACAGTATTATCATTGCATGGTATGACACAAGCAAAACGTTTATCTCTGGTCAAGCTGTAGCTGATTCTGGTGATTTCCATAAAACTTATGTTGCACCAGAAAACGCAGTATATGCTCGTTTAAGCTATAAAAAAGCTGATACTGTTAAAATGAAATTTGAAGTAGGTACGAAGCCAACTGATTACAGCCCGTCATGGGATGATATTAAAGGTGACCAGACTGCTTTAGAGGAATACATTAAACAGGTAGAGGAACAAGCTAAACAAGCACAACAAGAAGCAGAAAACGCCAAGAATGAAGCAGAAAATGCAAATAGTGCTATTGCTGATATGTCTAATGACAATATGTTAACAGCAAATGAGAAACAACAAATTTTACTACAATGGGAAGAAATTAAAACGGAATATCCAATTAATTTAGACCAAGCAACTAAATTTGGTGTTTCTGCTACGCAGTATACAACAGCGTACAATGCTCTAAAAACATATTTAGACCCATTATTAGCAGATATGACAACAACTTCTGTAATTGTTGGTTCTACTATGCGCAGTACATTTAATACGTACTACGACCGTAGAACAACATTGCTTAATCGTGTAGCTGAACTAGCTAAACAAGTAGCTGACCAAGCTAAGGATACAGCAGACAAAGTAGACGATGACTTAAACAACATTGGTGGGTACAACTACATCGGATTCTCTTCCGGAGACCATATGTATCCTCGTTTAATGATTAAGAACATTGGTTACTACTATGTACCTTCTATGGGGAGTGCAGAATTTGTAGATGACATGGTATGTTTAAAGCCAAAAACAACAGAAAAGAAAGTTCAGTATGAAATTGGCTCCTCATCAGCTAACATATCCGGTGTTGGTTTAGCAAATTATCGGATGAAAGAAGTTAAAACAGGTCAATGGTTGACTGCTTCTGCAAACTTAAAAGTTGTTGGTACTGGTAAAGCATATATTACTATCTTTACTTTAGAGAACGGCTCTTGGCAATTTTCACTAAGTGATATGGTTACAGCAAGTCAAGGAGTAACTCGTGTAGTAGCTCAAAGAAAAGTGACAGACCAAACACAAGGTGTATTCATACGCATCAGTGGAGATATTATTGATGAAGTTCATTTTGGTAATACACAACTTGAAGTTGGTATTCGCTCTACCCCTTGGAAGAAATCAGATATTGACATTCAAGAAGACATCAACAATGTTGCGGACGATATTAAAGACTATATTGGTGCTCGTTCTGATAACTTAATCACAAATGGTTTTGGTGAATTGGGGAACAATACGAACATTGGTGGTATCTTTGATGGTGCTGATAGGATTGTAGGTAAAGGTTCCTTCCGTCAAGAAGAAGGAAACAAATCACTATTATTCAGTGAACACATTGTTATTGACAATAAGAAAGTTTATAACTTTGATTACTACATGCACACATTAAAAGGTGTTGGTAGAAGTTACGCAATGATTGCCCCGTATGACGTAGACGGGAAACGTATCACATTTCCTTCTCTCGGGGGACGAAACTACAACTCTGTTACCCCTGTTAAATTTACAAAACTAGCAAAACCACTTAAAGTCGGAGATACAGAGGTTTTTGTAGAAGATGCTAGTCTATGGAACGGACAGGCACCGCAAGACTACCAACGTAGTATTATCATGTGGGGTTATAAAAACTCGTTCGGCTATACTTATCCCGATGGAACGTATAGTCAGCTAATGCAGATGAAGACATATGATATTGGTGCAGTTGACACCATAGCTAACAAGATTACGTTAAACAAGCCATGGGCAGTTGCAAACCCAAATAGTTCAGATGGGATTTTCCCAGTAGGGCATACACTTAGCCCAACTTCTGACGGTTCCACATATCTATATTTGAATGGTCACGTAAATATACAAGTACCTACTACGTACACCAAGTACAGCCATTTGATTAGTGGCTCTTCTGAGTTTGCTAATACAACGCTTATCCCAGTAGAAACAGGTTCTATCCAACTTGGATTCTTGTTGAACCGTGATACAACAGGTGAAAAATCTTGGCTAAACGGTTTACGTCTACGTGATTATACAGATACGTATAAGCTAAACGATGACGTTAGAGAAACACAAGAAAATGTGGATAAAGCCCAAGCAGATGCAGATAAAGCTAACCAGTCAATTGCTGATTTATCTAATGATAATCTAGTTACTCCTAACGAGAAACTAGATTTGAAAAAAGAGTGGGAAATCATTGTTGCTGAAAAACCTAAGAATGATGCTCAGGCAGATAAATTCGGAGTAAGTAAAGTAGCTTACGGTACTGCGTATACTGCTCTAGATACGTATTTAAAACCCATCTTAGCAAGCACAACAACGAACTCTGCGATTGTTGGACAAACTATGCGGGATACGTTTAAGGCGTATTACACGGCTCGTACAGACCTGTTAAACGCTATTGCATCTAAAGCTAAAGAATTGGCTGATAATGCACAAGATACCGCAGATAATATAGCTGTCGGTACTCGTAACCTTTTAATCGGAACACAGGACTTTTCCAAAGGTAAATATCCGGGTAATGCTAACGTTACCATTACAGATGAAAAGCTATTTGGAAATGCAGTAATGAAGAACGATTACACTACAGGTACTGGATATTCAGATATGTACCAAATGACGACCTCAATTATTCCAACAGGAACCCAGTATACACTATCGTTTTATGCAAAGGCAGACCTAGAAGGAACTAAAATGTCTTGTTACTTCTACAACCCAAATACTACGACAAGTAGTGTAAACAGTCAAGGTGGCAAACTTAGTTCTAGTGACGGTCGTACTGTATTTGTTTTAAGTACAGAATGGACTAAATACTGGGTAACTTGGACACAGACACAGGCAGACAAGCCTAAGTCAGTAATTATTGGTCGTAAGACTGGTGGGGAAGAACCTAACTCTGCTTTCTATATGTCTTCTCCTATGATGGTAGAGGGGAACAAACCACAAACGTGGATGAAAGCCCCAGAAGACATTGAAACAGCTATAAACGGTAAAGAAGGTGCATGGGTTTACTCCCCAACAGCACCAACAAATCCGGCTGTTGGTTTAGTCTGGGTAGACTCTTCTAAAACTCCGAACCAACCAAAACGTTGGGTTGGTGGAGAAACTGGATGGGTTGCCTTAACCCCAGAAGAAGTAAAAGATTTACCTTGGGGTGAAGATGGTTCTAGTCTTGCTGACTGGGTAGCACAAGCAGAGCAAAAGATTTCTTCTGATGCAATCATTAGTACTGTACTAGGTTCTGAGGACTTTACCGGTATTTTTGACTCCAAAGCAAATACAGAAGACTTAAATAACCTTGCTTCTTACGATGACTTAGATGCTATGCAAGCTGAGTATGAACGTCTGTTAAAAGAAGGGATTGCAGGAATTGACTTCTCACCATATGTAACTAACACAGAGCTAGAACAATTGAAAGATAGCTTCACTTTCTCTGTTCAACAAGCCGGTGGGGTTAATATGTTGAAAAACTCTCTAGGATTCTCTGGGACAGACTTCTGGCAAGCCTCTTCTGGTATAGATACTACTCAGAATGAGCAGTTGTCTAAATTAGGATTTGGTTCCGGATTTATGATAAACCGAGTTCAAAATGCAACACTAGCTCAGACAATCGAATTACCAGAAGCAAAACAAGGTTTGCAGTATGCTTTATCCTTCTACATGAACGTAGCTACTTTTGGAGATGTCACTGATTTCCAATGTGGGGCACATATCTACGAAGAAGGTGTGTTGAAGTATACTGTTGGGGTAACAGATGCTACACAAGAAATCCCAAGTGACTATCACTTGTATAAACTTGTATTTGAACCAGAGTCTCCGAATACTGTCATTGAATTATTTGTTACAAATGGTGCACAGGCAACTGTAATCATTTCAGGGGTTATGTACAATATTGGTAACATTGCGTTGAAATGGCAACCATACCCAAGTGAAATCTATAACACGAACGTTAAGATTGATATTAATGGTATTACTGTTAAAAACAATCAGACAGATGGTTATACAATGATTACTCCGCAAGAGTTTTCAGGTTACGCAAGGGTTAACGGAGAGATGGAACGTATCTTTACCCTAAATGGTCAGGTAACAGAGGTTAAGATGTTACAAGCAGAGAAGCGTATTACAATGGAACCTATTTCCGTGTTTGCGATGAACTCTAAAGAAACCAATACAATTGGTTGGGCGTTTGTTGCTTCCGGAGAGGTTGCACATTCTGCCATAGCATCTCGTACACAATAG

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence