UniProt accession
A0A8S5V5W8 [UniProt]
Protein name
Tail protein
RBP type
TF
Evidence RBPdetect2
Probability 0,85
Protein sequence
MITFLDERDVEHGALATIKVTNAVNGERSLTGEIESGDYVLTNIERGWRLRFDDEFYVVTYAKPIDDGKGTHVTFDAVHQFFWDFDKSSVHEQLNDGSHTFLTYLDFIFTGSDYTYTIDPLLKVYAFEKQSFGYKSRLKLFNDVITSSGVEFQVNGKVVRILEKTGTDLSTVVRKNFNMNELGIEKNIGDFVTYQKGFGAWIDENDHSKGRLVTEYTSPLASVYGKLEAEPLVDERYTQADNMVAALKANVDNSYSISITLDMEDLTRAGYDYTQPRAGDYIMAINETLDFQEKIRIVSFTSEYDVSGQLVKHEVTCNDIGVVKKLSASYNLTKEQAQNASDSVGKAVEMANKALVSADGKSTVYFGNEFPKNEPKGTLHKGDSLYLTVGDTTKMYYWTGADWEELPIVNDVEAFKEQIADELKDVPNREEFEATITEKLATSKAEIKTQIDTAKTQAESNAKAYADEINQATAGVAEQANTAVNSLKSDLAKVKTDLTTTTSTANAAKTSASEAKQQLTAVANDLSKAKTDLQNAVSEVDTKATNLKSDLSKAKQDLTSQAQQLQAQANAQSELTKRVSSVEKTANGTKTTVSELSKTVDSNTKNISSVTARTKTVEDDLTSTKTTLSQVKTTADSTSQKTATLETGLNGLSAKFDNLKIGGHNYLRGTSDQYQTLTSNNYILGYTGNKNISFLDLLEPLKGETVTIRSYIKNDTDSPVRIQIWFTGGGINGNPVPAHEEGYSVATGKILENFASCNVAFVQVGGGTKNGGTIQHKEDKLEKGNIATDYSPNDADLEQKVAEYKQNADQNYASLQTTVQNLDGTVQANKTTAEQTAAGFKTRIESLETYKSGESTRANQYFESAKTETARQLTAERTAIAKDYVAKSTYTSDVTGLRNDLTATTTTANTIKTNLANYQASNDKAVANLQSNLQTANGNISSLKTKVEAVPGQITSAVSAVEGKIPKSVGAVNLFKGSRDFSGTNWINNSGVYAEDYQGVKIVKTQAMWGGRSQYFEAKTGEEYVFSAYVKSSAKTDRVTFYLVHSSKQPQAGGVVSFDSADGRDAVSFDLTDEYQRIAVKIKITKDGWIMPRLERYNNDAYLFFGGYKLERGNIATDWSPAPEDTVSQISSLSSQIQQTADGMTLLATKTELNSAKTELQSGISTATSKAGNAQSTANSNAQTISTHTTQISALNTGLKAKVSQTDFNMLSGRVTTAENNITAKANELSSKITSVEGKIPTSSGGRNLAQGTSKDWSKPFTGFSGIKNTCPNLYKVITDGLVVGDTFKTRIVLKYTDIKPASGKTAEIWIQGSGNVTVWNSGAYPSGGGGRRSLSGSGETVFELTDKINADHLKNDYWSWAFRTDWIASGSLQWKLAKVERGMFFTDWSSAPEDYDSKLASAQSEIKQTTDSIKASVSSLDKSTVKSASLTINTDGIVMKAGKSTTDVANAIGSYFAVNQNAINLFSDKINVKGSMIVDGAITSNKIASKSINTAHLNGKIITADVIATGAITANAIKAGAVTTDKMTANSINGDRITAGTLDAAKIKAGSITASQIASGTITSAQIKTGTISAANIAAGAITTDKIAANSINSSKIVSSGITANVIKGGKLQSLSNATNFELDTGKLFYNNNNTGIFRVQANASTMGLKFSNTSITVSGTSRILSRVILGGDRRETSLDDGKWDQGGFTGIVAETINGVDSNAHSQADTLRVIGDNIYFTHSYNYDAQTKTSAQGWKMETFSPFSSYAGNVVLKPYGINYRQSDIITGDVRLDNGDGSGYWVRGCIRTLRNCFQHYLNGGTTSGAMNAIRDALKEISGV
Physico‐chemical
properties
protein length:1821 AA
molecular weight: 196661,95300 Da
isoelectric point:5,91878
aromaticity:0,07743
hydropathy:-0,42669

Domains

Domains [InterPro]
DC_2250
STR
283–564
Coil
Unmapped
477–497
DC_2057
STR
529–823
G3DSA:1.10.287.1490
STR
532–662
A0A8S5V5W8
1 1821
Architecture
ATT
STR
ENZ
STR
STR
STR
ATT 1-78 | STR 79-166 | ENZ 167-282 | STR 283-823 | STR 888-1245 | STR 1254-1783 |
Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Taxonomy

  Name Taxonomy ID Lineage
Phage Siphoviridae sp. ctg4a4
[NCBI]
2825602 Uroviricota > Caudoviricetes >
Host No host information

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
DAG02003.1 [NCBI]
Genbank nucleotide accession
BK016202 [NCBI]
CDS location
range 3347 -> 8812
strand -
CDS
TTGATTACATTTTTAGATGAAAGAGATGTTGAGCATGGTGCACTTGCCACTATTAAAGTTACAAATGCTGTTAACGGTGAACGCTCACTGACTGGTGAAATTGAATCAGGCGATTATGTCCTAACAAATATCGAACGTGGCTGGCGTTTACGTTTTGATGATGAGTTTTATGTAGTAACTTACGCAAAGCCAATTGATGATGGTAAAGGTACGCATGTTACTTTTGACGCTGTTCATCAATTTTTTTGGGACTTTGATAAGTCATCAGTGCATGAACAATTAAATGATGGTTCGCATACGTTCTTGACTTACCTTGATTTCATATTCACTGGCAGTGATTACACGTATACAATTGACCCTCTATTGAAGGTCTATGCTTTTGAAAAACAATCATTTGGTTATAAGAGCCGTCTAAAACTTTTTAACGATGTCATCACTTCATCTGGCGTTGAATTCCAGGTTAATGGCAAAGTGGTCCGTATCTTAGAAAAAACTGGAACAGACCTATCAACGGTAGTTCGCAAGAACTTCAACATGAATGAACTTGGTATTGAAAAAAACATTGGTGATTTTGTTACTTATCAAAAAGGTTTTGGTGCGTGGATTGATGAGAATGACCACTCAAAGGGGCGTTTAGTTACTGAATACACTAGTCCATTGGCTAGCGTATACGGAAAACTTGAAGCTGAACCTTTAGTTGATGAACGTTATACACAAGCAGACAACATGGTTGCTGCTTTGAAAGCTAACGTTGATAATTCTTACAGCATCTCGATTACTCTTGACATGGAAGATTTAACTCGTGCTGGTTATGACTATACACAACCTAGAGCAGGTGATTACATCATGGCTATCAATGAAACATTAGATTTTCAAGAAAAAATTAGGATTGTTTCATTTACTAGTGAATATGATGTATCTGGTCAGTTGGTTAAACATGAAGTGACTTGTAATGACATTGGTGTAGTCAAGAAGTTATCAGCAAGTTACAACTTAACTAAAGAACAAGCTCAAAATGCGTCAGATTCAGTCGGTAAAGCTGTAGAAATGGCTAATAAAGCACTAGTTTCTGCAGATGGTAAAAGTACTGTTTATTTTGGTAATGAATTTCCAAAAAATGAGCCAAAAGGTACATTACATAAAGGTGACTCACTTTATTTGACAGTCGGCGACACAACGAAAATGTATTACTGGACTGGAGCAGATTGGGAAGAGCTCCCCATCGTTAATGATGTTGAAGCATTCAAAGAACAGATTGCTGATGAACTAAAAGACGTTCCAAATCGTGAAGAATTCGAAGCGACTATTACAGAAAAACTCGCTACATCAAAAGCTGAAATTAAAACACAGATTGACACAGCTAAAACACAGGCAGAATCAAACGCTAAGGCATACGCTGATGAAATCAATCAAGCAACAGCAGGAGTAGCGGAACAAGCGAACACAGCTGTCAATAGTTTAAAATCTGACTTAGCCAAAGTCAAAACTGATTTAACTACCACAACGTCAACTGCAAATGCTGCTAAGACGTCAGCGAGTGAAGCCAAACAGCAACTTACCGCAGTAGCTAATGATTTGTCTAAAGCAAAAACAGACTTGCAAAACGCAGTTAGCGAAGTTGACACAAAAGCTACGAATTTAAAGAGTGATTTGTCTAAAGCGAAACAAGATTTAACCAGTCAAGCTCAACAGTTACAAGCACAAGCTAACGCACAGTCTGAACTAACTAAGCGTGTCTCATCAGTCGAAAAAACCGCAAATGGCACGAAGACGACTGTTAGCGAATTAAGTAAGACAGTTGATAGTAATACCAAAAATATTAGTAGTGTTACTGCACGAACTAAGACAGTTGAAGATGATTTAACGAGCACTAAAACAACGCTATCACAAGTTAAGACGACCGCGGACAGTACCAGTCAAAAAACAGCAACGTTGGAAACTGGTCTGAACGGGTTGAGTGCGAAATTTGATAACTTAAAAATCGGCGGACATAATTATCTTCGAGGAACAAGCGATCAATATCAAACTTTGACAAGCAATAATTATATTTTAGGTTACACCGGCAATAAAAATATAAGCTTTCTGGATTTGTTGGAACCTTTGAAAGGTGAAACGGTCACAATCAGAAGCTACATTAAAAATGACACAGATTCCCCGGTACGAATTCAAATATGGTTCACGGGCGGAGGAATTAACGGAAACCCAGTCCCAGCTCACGAAGAAGGCTACTCAGTCGCAACTGGCAAAATATTGGAAAACTTCGCGTCATGTAATGTCGCTTTTGTACAGGTCGGTGGCGGTACGAAGAATGGTGGAACTATTCAGCATAAGGAAGACAAGCTCGAAAAAGGCAACATCGCAACAGACTACAGTCCGAACGATGCTGACCTCGAGCAAAAAGTAGCCGAATACAAACAGAACGCAGACCAAAATTATGCAAGTTTGCAAACGACCGTTCAAAATTTGGACGGAACAGTCCAAGCTAACAAAACCACTGCAGAGCAAACAGCAGCAGGTTTTAAGACACGTATTGAATCGCTTGAAACGTACAAGAGCGGTGAATCAACACGAGCTAACCAATACTTTGAGAGCGCTAAGACTGAAACAGCACGACAATTGACTGCTGAACGTACAGCGATCGCTAAGGATTATGTGGCTAAGTCTACATATACTAGTGATGTCACTGGTCTGCGTAACGATTTAACAGCAACGACTACGACTGCGAACACAATCAAGACAAATCTTGCTAACTATCAAGCTAGCAATGATAAGGCAGTGGCTAACTTGCAAAGCAATCTACAAACAGCCAACGGCAACATTAGTAGTTTGAAGACGAAAGTTGAAGCAGTGCCTGGACAGATTACAAGTGCGGTGTCTGCGGTTGAGGGTAAGATACCGAAAAGCGTTGGAGCAGTTAACTTATTTAAAGGTAGTCGTGATTTTAGCGGTACGAACTGGATTAATAACAGTGGTGTTTATGCTGAAGATTATCAGGGTGTTAAAATCGTTAAAACGCAAGCTATGTGGGGCGGACGTTCGCAATATTTCGAGGCAAAAACTGGTGAAGAGTATGTGTTTAGTGCATACGTCAAAAGTAGCGCTAAAACAGACAGAGTTACATTCTATTTAGTCCACAGTTCAAAACAACCTCAAGCAGGAGGTGTTGTAAGCTTTGACTCTGCCGATGGTCGAGACGCTGTAAGTTTTGACTTGACAGATGAATATCAACGAATTGCCGTTAAAATCAAAATCACTAAAGATGGCTGGATAATGCCACGTTTAGAGCGGTATAACAATGACGCTTATCTTTTCTTTGGCGGGTATAAGTTGGAACGTGGCAACATCGCAACTGACTGGTCACCAGCACCAGAAGACACAGTTAGCCAAATTAGCTCGCTATCTAGTCAGATTCAGCAAACTGCTGATGGCATGACGTTGCTTGCTACTAAGACAGAGCTTAACAGTGCTAAAACCGAGTTGCAATCTGGTATTTCGACAGCCACAAGCAAAGCTGGGAACGCTCAATCCACGGCTAACAGCAACGCACAAACAATCAGTACACACACGACTCAAATCAGCGCATTGAATACAGGCTTGAAAGCCAAAGTCTCACAGACTGACTTCAATATGCTGTCTGGTCGTGTAACAACTGCTGAAAACAACATCACAGCTAAAGCTAACGAGTTGAGCAGTAAGATTACGAGTGTCGAAGGTAAAATTCCGACCAGTTCAGGTGGACGAAATCTAGCACAAGGAACTAGCAAAGATTGGTCTAAACCGTTTACAGGATTCTCAGGAATTAAGAACACTTGCCCTAATCTATATAAGGTGATTACAGATGGCCTTGTAGTTGGCGACACATTTAAAACACGTATTGTTCTCAAATATACTGATATTAAACCAGCAAGTGGAAAAACCGCTGAAATTTGGATACAGGGATCTGGAAATGTTACCGTTTGGAATAGTGGAGCCTATCCGTCTGGTGGCGGGGGGCGCAGGTCGTTAAGTGGAAGTGGGGAAACTGTCTTTGAGTTAACTGACAAAATCAATGCCGACCACTTAAAAAATGACTATTGGAGTTGGGCTTTTAGAACTGATTGGATTGCAAGTGGTTCGCTACAATGGAAACTTGCTAAAGTTGAAAGAGGAATGTTCTTCACAGACTGGTCATCCGCACCAGAAGACTACGACAGCAAGCTAGCCAGTGCACAGTCTGAAATCAAGCAGACAACAGACTCAATCAAAGCCAGCGTATCTTCGTTGGATAAATCAACAGTTAAGAGTGCTAGCTTGACTATTAATACAGACGGAATCGTCATGAAAGCTGGCAAGTCAACAACTGATGTTGCTAATGCGATTGGTTCTTATTTTGCTGTTAACCAAAACGCTATCAACTTATTCTCTGATAAGATAAACGTCAAAGGTAGCATGATTGTTGATGGTGCTATCACAAGTAATAAGATAGCTAGCAAATCGATTAATACGGCACATTTGAACGGTAAAATCATTACTGCTGACGTGATAGCCACAGGAGCGATTACAGCAAATGCCATTAAAGCAGGAGCGGTAACTACCGACAAGATGACAGCGAACAGTATCAATGGCGACCGTATCACAGCTGGCACATTAGATGCAGCCAAAATCAAAGCTGGTAGCATTACAGCTAGTCAAATTGCAAGTGGCACAATTACCAGCGCACAAATCAAAACAGGAACAATTAGTGCAGCGAATATCGCCGCAGGTGCGATTACCACAGATAAAATAGCTGCTAATTCTATTAATTCAAGCAAAATTGTATCAAGTGGTATTACAGCGAACGTTATCAAAGGTGGTAAATTACAATCACTATCTAACGCAACTAATTTTGAACTTGATACTGGTAAGCTTTTTTACAATAACAACAACACTGGTATTTTTCGTGTTCAAGCAAACGCTAGTACAATGGGACTTAAATTTTCAAATACTAGTATCACAGTTAGTGGAACTAGCCGAATCTTATCGCGAGTTATTTTAGGCGGTGACCGTCGTGAAACTTCACTAGATGACGGAAAGTGGGACCAAGGTGGGTTTACTGGTATTGTGGCTGAAACAATCAACGGCGTTGATTCTAACGCTCACAGTCAAGCTGATACTTTACGTGTGATTGGAGATAATATTTATTTCACCCACAGTTACAACTACGACGCTCAAACAAAAACAAGTGCACAAGGTTGGAAGATGGAAACGTTCAGCCCTTTTTCAAGTTATGCAGGAAATGTCGTCTTGAAACCGTACGGTATTAATTATCGTCAATCAGACATCATCACTGGTGATGTTCGTTTAGATAACGGGGATGGCTCTGGTTATTGGGTGCGAGGATGTATAAGGACTTTAAGAAACTGTTTTCAACATTATCTCAACGGTGGAACAACATCAGGTGCTATGAATGCAATACGAGATGCTTTAAAAGAAATTTCAGGAGTTTAA

Genome Context

Genome Context

Gene Ontology

Description Category Evidence (source)
GO:0003682 chromatin binding Molecular Function IEA:TreeGrafter (UniProt)

Tertiary structure

PDB ID
c42d5191378aa63db5870804404aaaf812d70c6121753945a132ee88cfb4c5b8
ColabFold
Source ColabFold
Method ColabFold
Resolution 0,6809
Oligomeric State monomer
Model Confidence
Very high
pLDDT > 90
High
90 > pLDDT > 70
Low
70 > pLDDT > 50
Very low
pLDDT < 50