Genbank accession
QJT70400.1 [GenBank]
Protein name
tail fiber protein
RBP type
TF
Evidence GenBank
Probability 1,00
TF
Evidence RBPdetect2
Probability 0,86
Protein sequence
MQGRLGKTVRHPQMKVMVDFNEVGYTQLNQWVDITDEVLDISGSKEKSGKSLGSVTSDIATFTVDNTKKLFSKDNINSPYYGKIKSNLKFRLLTGFQGETLVPYASGFIEAFTPSWKDKKILIKTTDYFKLFKGTDVPTESYQDISWDALVNILCDHVGLPSFIVRNIPKTEFYYNYFKFEEENCFEALKSLMEVAVGEAYFEQEQFYVKTKLALDYQLDTTVDHDITVDDLFDFEENVDGQNIINSLTISSDYKTIAPLEVVFETPENVVKVENEQHTYDGSNHVYVDTNNLPLINNDENPIALKNITQGRTIYINGIDINTGRITIHPDSLANVVTGDILTVSYSYQQLALLAGKTRKFTCSLNGEVDSLNALDIVVWDKDGNQQRTYTEIPDTPNTVSKQTLTFDQKNNTVTLTLKNNYADPITISTLQFRGYPIKVISPIEVFVRDLPSQEEFGKKEHTIQNNYINNIRLAEKVGQYIVDNNKVDRKRVNIEIAGYSEFSLDDISKVTEMSSGTNHKFTNERIDYTFNTDSGWNVKASLLELDSAPWVYESFKGESWEKTNSGAPDSDFLKDISANLIKNGGAELYSGNADLKDTGAVGGEHIVPDYWQFTRRTGDATARVRDGGNLVLHGLRSFEITTSNSGSGYFQQMVSGIKGSQTYILSFVTALTACSGKATLHQYTDGTLVKTDSIDFSSDGTVELVTSSLATTNAILVEIEKKSGTTGPESLVFDKVKLENSRERTIYIENEETNAVQVGQRYANSVVIGNNYGIEVLDDQENTRIILGQYEPDKYGLVVYGGSIKIVGGLPSNQVNVGPDSTFEDGYDPSAKVEFYYGDNEPTDKNVIWVDTSGENDVWKRWDATTSSWKEGATGQNAITGVLSNDSHVIPTDKDGNNGVFTGAASTMYIYVGSTDDSANWNVTVALTNVAGTLSGKTFTASGLSADTGYVDFTAARSGYPSITKRFTLTKSKQGATGSTGGTGSAGQNATAYWLVPSVAVIQKNTTNVFTPASISIDMRSQTGTSAPAFYGGRLVIAELAADGTTWTDKYGITSPTNETASKSYTPSVNTIKAVRVRMYQAGVTPNGTTNMIDEQIIPVVSDGETGAAGANAIMAVLSNETHSIPTDKDGNNGNYNGAATTMSIYNGTTDDSANWTVAVSGTPSNVTGTLSGKTYTVTALSADTGYVDLIASRTGYASITKRFTLAKNKQGSTGATGSTGSAGQNATAYWLVNSVPAIQKNISGVYTPATITVTGKSQTGTGSPVNYSGRFIISESTDGTSFTAKYTSSANEATKTHTPTAGIKAIKVQFYLAGGTSTLLDEQIIPIVSDGATGTQGIQGPKGADGSSLFTWVKYATDANGSNMSDTPDGKTYIGLAYNKTTSTESSTASDYTWSLIQGPAGSQGPAGTTTYTWVKYADDANGTNMSDSPTGKRFLGLAYNKTTSTESATASDYSWSPLYDNVVVGGVNLALDTDYYASVTNASTSAISKTFTVPEEYYDYITGKTLTYSMIIYANGTKVNIGTDSLAGRFGGHASAIWTLADGTTSQTTYPLNMTGTFVTKATGERYSVTEKIGAPATGATLKQFNVNVQINAKPQSTTDTWYISKPKLEIGNVATDWTAAPQDTKSYVDDQLSELTTKYSSEIENTEKAITLEVDRKVTNLDGSLREFVASTITQTEENVELKFTEMKTVTDGHAGELQTIQSYFDFSSSGLNIGKTDSPLNINISNSQMDFMNAGKIVAYINGQKMYIDSLEVLTNLIVGNHKIEKYNTNITLIKWVGG
Physico‐chemical
properties
protein length:1784 AA
molecular weight: 193439,81410 Da
isoelectric point:4,83776
aromaticity:0,09361
hydropathy:-0,36592

Domains

Domains [InterPro]

No domain annotations available.

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Taxonomy

  Name Taxonomy ID Lineage
Phage Microcystis phage MaeS
[NCBI]
2736190 Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host Microcystis aeruginosa FACHB-942
[NCBI]
267875 Cyanobacteriota > Cyanophyceae > Chroococcales > Microcystaceae > Microcystis > Microcystis aeruginosa

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
QJT70400.1 [NCBI]
Genbank nucleotide accession
MT362618.1 [NCBI]
CDS location
range 25818 -> 31172
strand -
CDS
ATGCAAGGACGTTTAGGCAAAACAGTTAGGCATCCACAAATGAAGGTAATGGTAGATTTCAATGAGGTTGGTTATACTCAATTGAATCAATGGGTTGATATCACTGATGAGGTATTAGATATTAGTGGATCAAAGGAAAAGTCAGGTAAGAGTTTAGGTAGCGTAACCTCCGATATCGCTACATTCACTGTAGATAACACAAAGAAATTATTTTCTAAGGATAACATTAACAGTCCTTATTACGGAAAAATTAAATCAAATTTGAAATTCCGTTTGTTAACAGGATTCCAAGGCGAGACGTTAGTTCCTTATGCTAGTGGATTTATCGAAGCATTCACTCCTTCTTGGAAAGATAAGAAGATTTTGATTAAAACAACTGATTACTTCAAATTGTTCAAAGGTACTGATGTACCTACGGAATCCTATCAAGATATCTCTTGGGATGCTTTAGTGAATATTCTTTGTGATCACGTAGGATTACCAAGCTTCATCGTAAGAAACATTCCTAAAACAGAGTTCTATTACAATTACTTCAAGTTCGAAGAAGAAAATTGTTTCGAGGCCCTGAAATCATTAATGGAAGTTGCTGTTGGAGAAGCTTATTTTGAGCAAGAACAATTTTATGTGAAAACAAAGTTAGCATTAGATTATCAATTAGATACAACGGTAGATCATGATATTACTGTTGATGATCTTTTTGATTTCGAGGAAAACGTTGATGGACAAAATATCATCAACTCCTTAACTATTAGCAGCGATTACAAAACGATAGCTCCGTTAGAAGTGGTGTTCGAAACTCCTGAAAATGTAGTCAAAGTAGAAAACGAACAACACACTTACGATGGAAGTAATCATGTATATGTTGATACTAACAACTTACCATTAATCAATAACGATGAAAATCCGATTGCTTTGAAGAATATCACTCAAGGAAGAACGATTTATATCAACGGTATTGACATTAATACAGGGCGTATCACGATTCATCCAGATAGTTTAGCCAACGTCGTTACAGGCGATATCTTAACAGTATCCTATTCTTATCAACAATTAGCTCTACTAGCCGGAAAGACTCGTAAATTCACTTGCTCATTGAATGGTGAAGTTGATTCGTTAAATGCTTTAGATATTGTTGTATGGGATAAAGATGGTAATCAACAAAGAACATACACTGAAATACCTGATACTCCTAATACTGTATCGAAACAAACGTTAACTTTCGATCAAAAGAATAATACAGTTACTCTAACTTTAAAGAATAACTATGCTGATCCGATTACAATCTCCACTCTTCAATTTAGAGGGTATCCTATTAAGGTTATTTCTCCGATTGAAGTGTTCGTTCGAGATCTCCCTTCTCAAGAAGAGTTCGGAAAGAAAGAGCATACCATTCAGAACAATTACATCAACAATATTCGTTTGGCTGAGAAGGTTGGACAGTATATCGTTGATAACAATAAAGTTGATCGTAAGCGCGTTAACATTGAGATAGCCGGATATTCCGAATTCTCTTTAGATGATATCTCGAAAGTTACTGAAATGAGTAGCGGTACTAATCACAAGTTCACTAACGAACGCATCGATTACACCTTTAATACAGATAGCGGCTGGAACGTCAAAGCGAGCCTCCTAGAGCTCGATAGTGCTCCTTGGGTGTATGAGTCATTCAAAGGCGAATCGTGGGAGAAAACGAATTCTGGAGCTCCTGACAGTGACTTCCTGAAGGACATAAGCGCTAACCTTATTAAAAACGGTGGAGCAGAACTTTATTCCGGTAATGCTGATCTTAAAGATACCGGAGCTGTAGGTGGCGAACACATTGTTCCTGACTACTGGCAATTCACTCGCCGTACAGGTGATGCAACAGCTAGAGTCCGTGATGGTGGAAACTTAGTGCTTCATGGCCTTCGTAGTTTTGAGATCACCACTTCGAATTCTGGATCAGGTTATTTTCAGCAAATGGTATCAGGAATCAAAGGATCGCAAACATACATCCTATCCTTTGTCACTGCTTTAACGGCTTGTTCTGGAAAGGCTACATTACACCAGTATACGGACGGAACTTTAGTTAAAACTGACTCAATCGACTTTTCTTCTGATGGTACAGTAGAATTGGTAACGAGTAGCCTAGCCACAACAAACGCTATATTAGTAGAGATTGAAAAGAAGTCCGGTACTACTGGCCCTGAATCACTTGTTTTCGATAAAGTTAAATTAGAGAACTCAAGAGAGCGAACTATTTACATCGAGAACGAAGAAACAAACGCGGTTCAAGTTGGACAACGTTACGCGAATTCGGTAGTCATTGGTAACAATTACGGTATCGAAGTGTTAGATGATCAAGAAAACACTCGAATCATCCTTGGTCAATACGAGCCTGACAAATACGGTTTAGTGGTATATGGAGGTTCTATAAAGATCGTCGGAGGACTACCTTCTAACCAAGTTAACGTAGGCCCTGATAGCACATTTGAAGATGGTTACGATCCTAGTGCGAAAGTTGAATTTTATTACGGAGACAACGAACCAACCGACAAGAATGTTATTTGGGTAGACACTTCAGGTGAAAATGATGTTTGGAAACGTTGGGATGCAACAACTTCTTCTTGGAAGGAAGGAGCGACAGGCCAGAACGCTATTACGGGTGTTCTTTCTAATGACTCGCATGTTATTCCAACTGATAAAGACGGTAACAATGGAGTATTCACTGGTGCTGCTTCAACAATGTACATTTACGTCGGTTCTACGGACGATTCAGCAAATTGGAATGTTACCGTAGCTTTAACTAACGTAGCTGGTACTTTATCAGGGAAAACTTTTACAGCTTCAGGTTTAAGTGCTGATACAGGGTATGTAGACTTCACGGCTGCAAGATCCGGTTATCCGAGTATCACTAAGCGTTTCACTCTAACTAAGAGTAAACAAGGAGCTACAGGTTCTACAGGTGGAACAGGATCAGCTGGTCAGAACGCTACAGCTTATTGGTTAGTTCCTAGTGTTGCTGTAATTCAAAAAAATACCACAAATGTATTCACTCCAGCTAGTATCTCAATTGATATGAGATCGCAAACAGGAACTAGCGCGCCAGCTTTCTATGGAGGAAGATTAGTTATCGCTGAATTAGCAGCTGATGGCACAACTTGGACAGATAAGTACGGTATCACTTCTCCAACAAACGAAACGGCTTCAAAGTCTTACACGCCTTCAGTTAACACGATTAAAGCTGTTCGAGTGAGAATGTATCAAGCCGGAGTTACACCAAACGGAACAACTAACATGATCGATGAACAAATCATTCCTGTTGTTTCTGACGGGGAAACCGGAGCAGCTGGAGCTAACGCAATAATGGCTGTACTGAGTAATGAAACTCATTCGATTCCTACTGATAAAGACGGAAATAACGGCAACTATAATGGCGCTGCAACTACGATGAGCATTTACAACGGTACGACTGACGATAGCGCAAATTGGACTGTAGCGGTATCAGGTACTCCTTCGAATGTTACTGGTACTTTAAGTGGTAAAACATACACTGTAACAGCTTTGTCGGCTGATACTGGTTATGTAGATCTTATCGCAAGCAGAACTGGTTACGCTTCTATCACAAAGAGATTTACTTTAGCAAAGAATAAGCAAGGTTCAACTGGAGCGACAGGAAGTACAGGTAGCGCTGGACAAAATGCGACAGCTTATTGGTTGGTAAATAGTGTACCAGCTATTCAGAAAAATATCTCTGGAGTGTACACACCAGCTACAATAACCGTTACAGGTAAGTCACAAACCGGAACAGGTTCGCCAGTCAATTATTCCGGACGGTTTATCATTTCTGAAAGTACAGATGGAACAAGTTTCACAGCGAAATATACTAGCTCTGCAAACGAGGCAACGAAGACTCACACGCCTACAGCTGGAATTAAAGCTATTAAAGTTCAATTTTATTTAGCTGGTGGAACATCGACGTTGCTAGATGAACAAATTATACCAATTGTAAGTGATGGAGCAACTGGAACTCAAGGTATCCAAGGGCCAAAAGGAGCCGACGGATCATCGCTTTTTACGTGGGTTAAGTATGCGACTGATGCGAACGGCTCAAATATGTCCGACACTCCTGATGGAAAAACTTACATCGGTTTAGCTTATAATAAAACGACAAGTACCGAAAGTTCGACAGCATCAGATTACACTTGGTCGTTGATACAAGGGCCAGCGGGATCTCAAGGGCCAGCTGGAACCACAACCTACACTTGGGTCAAGTACGCCGATGATGCAAATGGAACAAATATGAGCGACTCCCCAACAGGTAAACGGTTCTTAGGTTTGGCGTATAACAAAACAACAAGTACAGAGAGCGCAACAGCGAGCGATTATTCTTGGAGTCCGTTGTATGATAACGTTGTTGTTGGTGGAGTAAACCTTGCGTTAGATACCGATTATTACGCAAGTGTTACAAACGCTTCTACTTCTGCTATAAGTAAAACATTCACTGTTCCAGAAGAATATTACGATTATATAACGGGTAAAACGTTGACTTACTCGATGATCATCTACGCTAATGGTACAAAAGTCAATATCGGTACAGACAGTTTAGCTGGTAGATTTGGAGGTCATGCTTCTGCTATATGGACATTAGCAGACGGAACGACTTCACAAACGACTTATCCTTTGAATATGACAGGAACGTTCGTTACAAAAGCAACCGGAGAGAGGTATTCAGTTACTGAAAAGATCGGAGCTCCAGCAACAGGTGCGACACTGAAACAATTTAATGTAAATGTGCAAATAAACGCAAAACCTCAATCAACAACTGATACTTGGTATATCTCAAAACCGAAGTTAGAGATAGGGAACGTCGCTACAGATTGGACAGCTGCCCCTCAAGATACAAAAAGTTACGTTGACGATCAACTTTCGGAACTAACAACCAAGTACAGTTCGGAAATTGAAAATACAGAAAAAGCTATCACTTTAGAAGTTGATAGAAAAGTAACTAATCTCGACGGATCTCTAAGGGAATTTGTTGCATCTACGATTACACAAACGGAAGAAAATGTTGAGCTCAAATTCACTGAAATGAAAACCGTAACTGATGGACACGCAGGAGAACTCCAAACCATTCAGTCATATTTCGATTTTTCTTCTAGTGGTTTGAATATCGGCAAAACAGATAGTCCTTTGAATATCAACATAAGCAACAGTCAAATGGATTTCATGAACGCCGGAAAAATCGTCGCGTATATAAATGGTCAAAAAATGTACATCGACAGCTTAGAAGTTCTGACAAACCTCATAGTTGGGAATCATAAGATTGAGAAGTACAACACTAATATAACTTTGATTAAATGGGTAGGTGGTTGA

Genome Context

Genome Context

Tertiary structure

PDB ID
43aba72851e5e5fe161be1efc83794b032176e25fd350d4911af5cf6a1e37b6d
ColabFold
Source ColabFold
Method ColabFold
Resolution 0,7210
Oligomeric State monomer
Model Confidence
Very high
pLDDT > 90
High
90 > pLDDT > 70
Low
70 > pLDDT > 50
Very low
pLDDT < 50