UniProt accession
A0AAE8YU45 [UniProt]
Protein name
Tail fiber protein
RBP type
TF
Evidence UniProt/TrEMBL
Probability 1,00
TF
Evidence GenBank
Probability 1,00
Protein sequence
MKYGNKRVLRLCKTLSLDKRTIGVINMPNTIGVGQLTLTDLNDVIASATPPSNPVEGALWWNTEESKLYVYTIKNGVGEWKFSSDGMVFGGVNLLRNSTFGATVQGTTNLKSWNSSIANTVVSTNVIPNDFLGSSSLPLRRTDWVTGGRAQFAQTLLLIPFTQKGYQYTFSAWVYVDSSVSMTGTGNDIAVRVTKVAGGTRDFVLADFTSIEKNKWVYITKSLTLQEDINKIEMMFSLNQNGLIKVSRPQLETGNIASNWSPAPEDGEESIAEIQKTLNNLADDNVLDYNERQIIRDKVADIIGSLYIGHTGSMPDDNTLMTNTTNGQKGAYYNVRKQAQQMGILTTDTKYTSVATTYEALRVYLNAMSPKPWDTSTANMNQIIEINKAPINSNKDDFRAKWMNYYNSVNDLATYTVQKAKEAQESTDAIVNSGINHVSNGDFRLDITKSLWKSNYVGDTKSIVDISAEAPPHQFAYHVKTTSAKNGGIFTPVLWDGRIAEAMINRDVTVSFWLKYSGIVQGAQASYAGRFGELVIEGVKANGTVAPTKTVRFANPTTINESGYITGTNTTWTKYSATVKITPHTDATKITRVSFKHGIEACVGEFWTTGIKVELGNKETPWSESPVDIYDRIGKAELAVKPESIVATVTGSSQYKTDIADTKAYAKDEAKAQFDKILTTKNLILDSHADFDTVDYLINDYTTAENLIAGQKYTIVVKGTLPAGQKFGIWMNRSSSKVGELDPTVSANTLYSGVYYLTFTAIAPTAGNERSLRLYNYPNNTTRGTVDWVALYKGEKPMDWTPAPEEVYRGISGRNLVLDSEFKLMTNWIANYGRTQIENSIVSENMNNAMTRVEATSGTELYQDFTQYIPVEPNTTYTFSFVGGGTFQTFLWEKKADKTSTTVYKDNVKTYTNTPFDMTSSRSNFVQTITTQPDTRLIQMIFRVKNNSTTGSTSGRFGLPQLEKGSIATDWSPNPLDYNLNDRGEVPTGKNLIDNSLFASSAGFRENWGVATGTRTLVNNTDNIIASSQFNYGLKLDSTSSGEFGYAKDGVKLIQGAQYVLSAWAYIVTEGGIAKVQEGIQAVGWTSTKVTTVGKWVRIVHRFTAKSDSLSIYFGQDSLSPPMTMYITGVKLEKGIYATQWSLSDNDAKSGGRNLLRNSNFSSTKIDTSLAWDKTLNGTLVPDGWWSNGYNTGTTDPTYGYHAHLNVEKFGYPVIEFIDRNSTIVIPNTDPERKVVAHRWLGFSNTILLNDPFAVALEVGKAFTVSMDVMSDTLGMHVRTGLHHFEKGNGTQGFYGYEQNLEPCKAVNVWERKTHTFVINDKWDMAKAFSFYVYGQYSSVEGTMWVRNIKVEEGYNATDYSPAQEDFYDKINNIQISGRNLLRNTGYIHLNSTTNNPDNWNISGGSSVSVENEPTALSGKAMKVNVTGNTTGGTHNPPVMDLVVGERYTWTVYLKATRNMKIKVGSEMNGQISCDVTTTWQKFTHSFIARSAQYKSFTFYYEQDGGANASFYIHSAQLEKGDRNSALWSCAPEDYDKQLSAIAERVDKAELKITDSAIVATVTKSTEFKGKADANTVYTKDELASMSTAQLLNNTEFTVDTSEWYLQTPSSGETIALDTSKQFEGVNSIKIDLGTRASNVWWGAQCNYLPARPNQDFTASVYVNTDNMAGITHDATMEICFYDVNNTKLGTAGTSIKPTANNTWQRFSFTRTAPANTAKVKIWMFVIRTGRIWLAKPMLQYGTKMGAWTPSIGELGTDYKSKISQTAGRIDMVVSADKTIKAEQIASAISLTPSAITLISNNINLTGKVTFSALSSSLQSDMSNYDSTRSKLETMTNGTTYINGGYIRSGVISGVTINVDTNIQVGKEINLGNESDFSMKMIRFNKSANIHTVGGGEDISISANTLYINDGSVSLGNTLNTDIYRVYLKGGVDVTGVTKWYGGVPAVFG
Physico‐chemical
properties
protein length:1949 AA
molecular weight: 215011,45970 Da
isoelectric point:6,47188
aromaticity:0,10159
hydropathy:-0,35670

Domains

Domains [InterPro]
IPR008979
STR
147–237
A0AAE8YU45
1 1949
Architecture
STR
STR
STR 14-1209 | STR 1275-1948 |
Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Taxonomy

  Name Taxonomy ID Lineage
Phage Bacillus phage vB_BanS_Sophrita
[NCBI]
2894790 Uroviricota > Caudoviricetes > Joanripponvirinae > Sophritavirus sophrita >
Host No host information

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
UGO50795.1 [NCBI]
Genbank nucleotide accession
OK499991 [NCBI]
CDS location
range 106556 -> 112405
strand -
CDS
TTGAAATATGGAAATAAGAGGGTCTTACGATTATGTAAGACTCTTTCTTTGGATAAAAGGACAATAGGAGTGATTAATATGCCAAATACTATTGGCGTGGGTCAATTAACTTTGACAGATTTAAATGATGTAATAGCTTCTGCTACACCACCATCCAATCCTGTTGAGGGTGCTTTATGGTGGAATACAGAAGAAAGTAAATTATATGTTTACACTATCAAAAATGGTGTTGGAGAATGGAAATTCTCAAGTGATGGAATGGTCTTTGGTGGAGTAAACTTATTAAGAAATAGTACGTTTGGTGCTACAGTTCAAGGAACTACTAACCTTAAAAGTTGGAATAGTAGCATAGCGAATACAGTTGTTTCTACAAATGTAATCCCTAACGATTTTTTAGGTTCATCTTCTTTACCATTAAGAAGAACAGATTGGGTCACAGGAGGGAGAGCACAATTTGCTCAAACACTACTACTTATTCCATTTACTCAAAAAGGCTATCAATATACTTTTAGTGCATGGGTTTACGTTGACAGTAGTGTCTCAATGACAGGAACAGGCAATGATATTGCTGTTCGTGTTACAAAAGTGGCAGGTGGTACTAGAGATTTTGTACTTGCTGATTTCACTTCGATTGAAAAGAATAAATGGGTTTATATTACTAAATCCCTAACTTTACAGGAAGATATCAACAAAATAGAAATGATGTTTTCTTTAAATCAAAACGGTTTAATTAAAGTTTCTAGACCTCAATTAGAAACGGGGAACATTGCGAGTAACTGGTCTCCTGCTCCAGAAGATGGAGAAGAGTCAATTGCAGAAATTCAAAAAACTTTAAATAATTTAGCAGATGACAATGTTCTTGATTATAATGAGCGTCAAATTATCAGAGACAAAGTAGCAGATATAATTGGTTCTCTTTATATTGGTCATACAGGAAGTATGCCAGACGATAATACATTAATGACAAATACTACAAATGGTCAAAAAGGTGCATACTATAATGTTCGTAAGCAAGCACAGCAAATGGGTATTCTTACTACAGATACAAAATACACATCAGTTGCTACGACATATGAAGCATTAAGAGTTTATCTAAATGCTATGAGTCCTAAACCTTGGGACACTAGTACCGCTAATATGAATCAAATAATCGAAATCAATAAAGCTCCAATTAATTCTAATAAAGATGATTTCAGAGCAAAATGGATGAACTATTATAACTCTGTAAATGACCTTGCAACATACACAGTTCAAAAAGCAAAAGAAGCTCAAGAAAGCACAGATGCAATTGTTAACAGTGGAATCAACCACGTAAGTAATGGTGATTTTAGATTAGACATCACAAAGAGTTTGTGGAAATCAAACTATGTTGGAGATACAAAATCAATTGTTGATATCTCAGCAGAAGCACCACCTCATCAATTTGCATATCATGTTAAAACAACAAGTGCAAAAAATGGAGGTATTTTCACTCCTGTTCTTTGGGATGGTAGAATTGCAGAAGCTATGATTAACAGAGATGTTACTGTCTCATTCTGGTTAAAGTATAGTGGAATTGTACAAGGAGCACAAGCGTCTTATGCAGGTCGATTTGGAGAGTTAGTAATTGAAGGTGTTAAAGCAAATGGAACAGTCGCTCCAACAAAAACTGTTAGATTTGCAAACCCAACTACTATCAATGAGTCAGGATATATTACAGGGACAAATACTACTTGGACAAAGTATTCTGCTACAGTAAAAATTACTCCACATACGGATGCAACGAAGATTACTAGAGTTTCATTTAAACATGGTATTGAAGCATGTGTTGGGGAGTTTTGGACAACTGGTATTAAAGTAGAACTTGGAAACAAAGAAACACCTTGGTCTGAAAGTCCAGTAGATATCTATGATAGAATTGGTAAAGCAGAATTAGCTGTTAAACCAGAATCAATTGTTGCGACAGTTACAGGTAGTTCACAATATAAAACTGATATTGCGGATACTAAAGCGTATGCTAAAGATGAAGCAAAAGCACAGTTTGATAAAATTCTAACAACAAAAAACCTTATTCTAGATTCTCATGCAGATTTTGATACGGTTGATTATTTAATTAATGATTATACTACCGCAGAAAATCTAATTGCAGGTCAGAAGTATACAATCGTTGTTAAAGGGACATTGCCAGCAGGACAAAAGTTTGGAATATGGATGAATCGTTCTTCTAGTAAAGTGGGAGAATTAGACCCTACGGTATCAGCAAATACACTTTATAGTGGAGTATATTATTTAACCTTTACTGCAATAGCTCCAACAGCAGGAAATGAAAGAAGTCTACGTTTATATAATTACCCAAACAACACAACAAGAGGAACAGTAGATTGGGTTGCTTTATACAAAGGTGAAAAGCCTATGGATTGGACACCTGCTCCAGAAGAAGTATATAGAGGTATCTCTGGTAGAAACTTGGTTTTGGATTCTGAATTTAAACTAATGACAAACTGGATTGCAAACTATGGAAGAACACAAATTGAAAATAGTATTGTTTCAGAAAATATGAACAATGCCATGACTAGAGTTGAAGCAACAAGTGGAACAGAGCTGTATCAAGATTTCACACAGTACATTCCAGTTGAGCCAAATACAACATATACATTCTCCTTTGTTGGTGGCGGAACATTTCAAACTTTCTTATGGGAAAAAAAGGCTGATAAAACTTCAACAACAGTTTATAAAGATAATGTTAAAACATATACAAACACTCCTTTTGACATGACTAGTTCAAGAAGTAATTTTGTACAAACAATTACAACACAACCAGACACAAGATTAATTCAAATGATATTCCGAGTTAAAAACAATAGTACAACTGGTTCTACTAGTGGTAGATTCGGACTACCTCAATTAGAAAAAGGAAGTATTGCAACTGATTGGTCTCCAAATCCATTAGACTACAACCTAAATGATAGAGGGGAAGTACCAACTGGTAAAAACTTAATTGACAATTCTCTATTTGCTTCATCAGCAGGATTTAGAGAGAATTGGGGAGTTGCTACAGGAACTAGAACATTAGTTAATAATACCGATAACATTATTGCATCTAGTCAGTTCAACTATGGATTAAAACTTGATTCAACATCTAGTGGTGAGTTTGGATATGCAAAAGACGGTGTTAAACTTATTCAAGGAGCACAATATGTTTTATCTGCATGGGCATATATCGTAACAGAAGGTGGTATTGCAAAAGTCCAAGAAGGTATTCAAGCAGTTGGTTGGACATCCACAAAGGTAACAACTGTTGGCAAGTGGGTTAGAATCGTTCATAGATTCACAGCTAAAAGTGATAGTTTAAGTATTTACTTTGGTCAAGATTCTTTAAGTCCTCCAATGACAATGTACATTACAGGTGTAAAACTTGAAAAAGGAATCTATGCTACTCAATGGAGTTTATCAGATAACGATGCAAAAAGCGGTGGAAGAAATCTATTAAGAAATTCAAATTTCTCATCTACTAAAATTGACACATCATTAGCTTGGGATAAAACATTGAACGGAACACTTGTTCCTGACGGATGGTGGAGCAACGGTTATAACACTGGAACAACAGACCCTACTTATGGGTATCATGCTCATCTGAATGTTGAAAAATTTGGATATCCAGTTATAGAGTTTATCGACAGAAATAGCACTATTGTTATCCCTAATACAGACCCAGAAAGAAAAGTTGTTGCACATAGATGGCTAGGATTTTCAAACACAATCTTGCTTAATGACCCATTTGCAGTAGCTCTTGAGGTAGGTAAGGCATTCACAGTAAGTATGGATGTTATGTCTGATACATTAGGTATGCATGTGAGAACAGGATTGCACCACTTTGAAAAAGGCAATGGGACACAAGGATTCTATGGATATGAACAGAATTTAGAACCTTGTAAGGCGGTTAATGTTTGGGAAAGAAAGACACATACATTTGTCATTAATGATAAATGGGACATGGCAAAAGCATTCTCGTTTTATGTATATGGTCAATACAGTTCTGTAGAAGGTACTATGTGGGTACGAAATATCAAAGTTGAAGAAGGATATAATGCAACTGATTATAGTCCTGCACAAGAAGATTTCTATGATAAAATTAATAACATTCAAATCAGTGGAAGAAACTTGTTAAGAAATACTGGATACATTCACTTAAATTCAACAACAAACAATCCTGACAATTGGAATATTTCTGGTGGTTCATCAGTTTCAGTAGAGAATGAGCCAACTGCTTTAAGTGGCAAAGCAATGAAAGTTAACGTGACAGGGAATACAACAGGTGGAACACATAACCCTCCTGTAATGGATTTAGTAGTTGGAGAAAGATATACATGGACAGTATATTTAAAAGCTACAAGAAACATGAAGATTAAAGTCGGCTCAGAAATGAACGGTCAAATTTCATGTGATGTAACAACTACATGGCAAAAATTTACACATTCATTCATAGCAAGAAGTGCTCAATATAAATCATTTACGTTCTATTATGAACAAGATGGCGGAGCAAACGCAAGCTTCTATATTCATTCTGCTCAACTTGAGAAGGGTGATAGAAACTCTGCTTTATGGTCATGTGCTCCAGAAGATTATGATAAACAGCTTAGTGCGATTGCGGAAAGAGTAGACAAGGCAGAGCTTAAAATCACAGATAGTGCTATTGTGGCGACAGTAACAAAGTCTACTGAATTTAAAGGTAAAGCAGATGCGAACACGGTTTATACTAAAGATGAACTAGCAAGTATGAGTACAGCACAGTTGTTGAACAACACTGAATTTACTGTTGATACTTCTGAATGGTACTTACAAACACCATCATCAGGAGAAACCATTGCTTTAGATACAAGTAAGCAATTTGAAGGAGTAAATTCCATTAAAATTGATTTAGGTACAAGAGCAAGCAATGTATGGTGGGGTGCTCAATGTAATTATTTACCTGCAAGACCAAATCAAGATTTTACTGCTTCTGTTTATGTTAACACAGATAACATGGCAGGAATCACACATGATGCAACAATGGAGATTTGTTTTTATGATGTTAATAATACAAAACTTGGAACAGCAGGAACATCAATCAAACCAACTGCAAACAATACATGGCAAAGATTTTCATTTACTAGAACTGCTCCTGCTAACACTGCAAAAGTAAAGATTTGGATGTTCGTTATTAGAACAGGTAGAATTTGGTTGGCAAAACCAATGTTGCAATACGGAACTAAAATGGGTGCATGGACACCAAGTATTGGAGAGCTTGGTACTGACTACAAATCTAAAATTTCACAAACAGCAGGTCGTATTGACATGGTGGTTAGTGCAGATAAGACAATTAAAGCAGAACAAATTGCTAGTGCAATTAGTTTAACTCCAAGTGCTATAACATTAATCAGTAACAATATTAACCTTACAGGGAAAGTGACATTCAGTGCATTAAGTTCATCCTTACAAAGTGATATGAGTAATTATGATTCAACTCGTAGCAAGCTAGAGACTATGACAAATGGTACAACATATATCAATGGAGGGTATATCCGAAGCGGTGTAATCAGTGGGGTTACAATCAATGTTGATACTAATATACAAGTTGGTAAAGAAATCAACTTAGGTAATGAGAGTGATTTCTCTATGAAGATGATTAGGTTTAACAAGTCAGCAAACATTCATACAGTAGGTGGAGGGGAAGATATTTCTATATCTGCCAATACCTTATATATCAATGACGGTAGCGTTTCTCTTGGTAACACACTTAACACAGATATATACAGAGTATATCTTAAAGGTGGAGTAGATGTTACAGGTGTAACAAAATGGTATGGTGGAGTTCCTGCCGTATTCGGTTAA

Genome Context

Genome Context

Tertiary structure

PDB ID
5b0cea61c309d5b9b5a47b7e31f6b6c97c6c4ed7f8f3e51c6e8ae5a6699bb7e3
ColabFold
Source ColabFold
Method ColabFold
Resolution 0,7322
Oligomeric State monomer
Model Confidence
Very high
pLDDT > 90
High
90 > pLDDT > 70
Low
70 > pLDDT > 50
Very low
pLDDT < 50