Protein

Genbank accession
QQG30944.1 [GenBank]
Protein name
large distal long tail fiber subunit
RBP type
TSP
Evidence DepoScope
Probability 0,94
TSP
Evidence RBPdetect
Probability 0,76
TF
Evidence RBPdetect2
Probability 0,95
Protein sequence
MATLKQIQFKRSKIAGVRPTPTVLAEGELAINLKDRLLFTKDDTGAIIDLGFAKGGNIDGNVIHKGNYNQTGDYTINGTFTQTGNFNLTGIARVTRDIIAAGQIMTEGGELISKSASTSHLRFFDGNDRERGIIFSPNNAGLTTQVVNIRVQDYAAGGEHSYSFSGDGILTSPIVNAWKSISSPTVMTDKVITNAKKDGDYDIYSMADNTPLTESETAINHLRSMRNAVGAGIFHEVKDNDGITWYAGDGLEAYLWSFTWSGGLKAGHSISIGTPGGPKGYSELGTASIALGDNDTGFKWHQDGYFFTVNNGTKTFLSGPAETTSLRKMVMGYSVNGTDLTTPPAENYALATVVTYHDNNAYGDGQTLLGYYQGGNYHHYFRGKGTTNVNTAGGLLVTPGDINVIGGSVNIDGRNNASTLLFKGNTTGNSSVDNMTISVWGNTFANVDGDRKNVMEISDDTSWIQYYQRLTSGSIQSHLNGTLGVNESINVGQEVNVSGTIAGNAVNALRIWNDDYAAIFRRSEGSLHIIPTAFGEGKTGDIGPLRPFSLALDTGKVVIPDLDLSHTTFAENGFIKFGGHGAGAGGYDIQYGQAAPIFQEIDDDAVSKYYPIVKQKFLNGKAVWSLGTEINSGTFVIHHLKEDGTQAHTSRFNADGTVNFPDNVQVGGGEATIAKNGNIFSDIWKTFTSAGDTTNIRDAIATRVSKEGDTMTGRLTLKTNSDAVVIDYPADEAGYVKGKKGGADNWYVGNGGADNGLAFWSFQSQGGININPNGEVILSPQGTSIFNINRDRIHMNGAHWVARKSGAWGDQWGLEAPYFLDFGSVGEDSYYPIIKGRSVITGQGYTTSVDLGIRRTPQAWGQAIIRVGNAERGDGPVGIFEFHSSGLFYSPTLIQTPAIGVGTVNGLGTPSIAIGDNDTGLSHGGDGRINMVANSIHIASWGAGYQSHPGLWDSTGAFWTETGRAIVSHGHLVQANDSYSTYVRDVYVRSDIRVKKNLVKFENASEKLSKINGYTYMQKRGTDEEGNQKWEPNAGLIAQEVQAILPELVEGDLDGEALLRLNYNGVIGLNTAAINEHTAEIAELKSEIEELKKLVKSLLK
Physico‐chemical
properties
protein length:1100 AA
molecular weight: 118105,57630 Da
isoelectric point:5,44685
aromaticity:0,09182
hydropathy:-0,31882

Domains

Domains [InterPro]
Legend: Pfam SMART CDD TIGRFAM HAMAP SUPFAM PRINTS Gene3D PANTHER Other

Taxonomy

  Name Taxonomy ID Lineage
Phage Escherichia phage UPEC01
[NCBI]
2796516 Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host No host information

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
QQG30944.1 [NCBI]
Genbank nucleotide accession
MW233709 [NCBI]
CDS location
range 73176 -> 76478
strand -
CDS
ATGGCTACTTTAAAACAAATACAATTTAAAAGAAGTAAAATTGCTGGTGTCCGCCCAACCCCAACTGTATTGGCTGAAGGTGAACTCGCAATTAACTTGAAAGACCGCTTGTTATTCACAAAGGATGATACCGGAGCTATTATTGACCTTGGTTTTGCTAAGGGTGGCAATATCGATGGTAACGTTATTCATAAAGGCAATTATAATCAAACCGGTGATTATACCATCAATGGCACATTTACCCAGACAGGTAATTTTAATTTAACTGGAATTGCTCGTGTAACTCGTGATATTATTGCAGCAGGTCAGATAATGACTGAAGGTGGCGAACTGATTTCTAAGAGCGCTTCTACTTCGCACCTTCGTTTCTTTGATGGCAATGACCGTGAACGTGGGATTATCTTTTCTCCAAATAATGCCGGTTTGACAACCCAGGTAGTTAATATTCGAGTACAAGATTACGCAGCAGGCGGTGAGCACAGCTATTCTTTCTCCGGTGATGGTATTTTGACCTCTCCTATAGTTAATGCTTGGAAATCTATTTCATCGCCGACAGTTATGACTGATAAAGTTATTACCAATGCTAAGAAAGATGGTGATTATGATATCTATTCAATGGCTGACAACACTCCTTTAACCGAAAGCGAAACAGCAATTAACCATCTTCGTTCGATGCGCAATGCGGTAGGAGCTGGTATTTTCCATGAAGTTAAAGATAATGATGGAATAACTTGGTACGCTGGCGACGGGTTAGAGGCCTATCTATGGTCGTTTACATGGTCTGGTGGATTGAAAGCGGGCCATTCCATTTCTATAGGCACCCCAGGCGGCCCCAAAGGATATTCTGAATTAGGAACAGCTTCAATTGCCCTCGGTGATAATGACACCGGATTTAAATGGCATCAAGATGGATATTTTTTTACGGTAAACAACGGTACAAAAACTTTCCTTTCCGGTCCGGCGGAAACTACTAGTCTTAGAAAAATGGTTATGGGTTATTCTGTAAATGGTACTGATTTGACTACTCCTCCGGCTGAAAACTATGCTCTGGCAACTGTAGTTACTTACCATGATAATAACGCATACGGTGATGGTCAAACTCTTTTGGGTTATTACCAAGGCGGTAATTACCACCACTATTTCCGTGGTAAAGGCACTACAAACGTTAACACCGCTGGCGGATTGTTAGTTACTCCAGGTGATATTAATGTTATCGGCGGTTCGGTTAATATCGACGGCCGCAACAATGCATCTACTCTGTTGTTCAAAGGAAATACTACAGGAAATAGTTCAGTTGATAATATGACTATCAGCGTTTGGGGTAATACCTTTGCTAATGTTGATGGCGACCGTAAAAACGTAATGGAAATATCTGATGACACTAGCTGGATTCAATATTATCAACGTCTGACTTCAGGTTCTATTCAAAGCCATTTAAATGGAACTTTGGGCGTAAACGAAAGTATAAATGTCGGTCAGGAAGTTAACGTCTCCGGCACTATTGCTGGTAATGCGGTCAATGCTCTTAGAATTTGGAACGACGATTACGCCGCTATTTTCCGTCGTTCAGAAGGAAGTCTTCATATTATTCCAACAGCCTTTGGTGAGGGTAAAACCGGGGACATCGGTCCACTTCGCCCGTTTAGTTTGGCTTTAGATACTGGTAAGGTGGTTATTCCGGACCTAGATTTGAGCCATACAACTTTTGCTGAAAATGGTTTTATTAAATTTGGTGGACACGGCGCAGGCGCAGGTGGATATGATATTCAATACGGCCAGGCTGCTCCTATTTTCCAAGAAATTGATGATGACGCTGTAAGTAAATATTATCCGATTGTCAAACAGAAGTTTTTAAACGGTAAAGCTGTTTGGTCTTTAGGTACTGAAATTAATTCAGGTACATTCGTTATTCATCATCTTAAAGAAGATGGAACACAAGCCCATACCTCAAGATTTAATGCTGATGGTACAGTTAACTTCCCCGATAATGTTCAGGTTGGTGGTGGTGAAGCTACTATTGCTAAAAATGGTAACATCTTCTCTGATATCTGGAAAACGTTCACTTCAGCAGGAGACACTACAAATATTCGCGATGCAATAGCTACTCGTGTTTCAAAAGAAGGCGACACGATGACCGGACGTTTAACTCTTAAAACCAACTCGGATGCTGTTGTTATTGATTATCCAGCAGATGAAGCGGGCTATGTTAAGGGTAAAAAAGGTGGTGCTGATAACTGGTATGTCGGTAATGGCGGTGCTGATAACGGACTTGCCTTCTGGAGTTTCCAATCTCAAGGCGGTATTAATATCAACCCTAACGGTGAAGTTATTCTATCTCCACAGGGCACTAGTATATTCAATATAAACCGTGACCGAATTCATATGAACGGTGCTCACTGGGTTGCGCGTAAATCTGGTGCGTGGGGCGACCAATGGGGCTTAGAAGCACCTTATTTCCTTGATTTTGGTAGCGTTGGCGAAGATAGTTATTATCCTATTATTAAAGGCCGTTCTGTAATTACTGGTCAAGGATATACTACTTCTGTTGACCTTGGTATTAGACGTACACCACAAGCCTGGGGACAAGCTATAATTCGAGTAGGTAATGCCGAGCGCGGCGATGGGCCTGTAGGTATTTTTGAATTCCATTCGTCTGGACTATTCTATAGCCCTACTTTGATTCAAACTCCTGCAATCGGTGTTGGTACTGTTAACGGACTTGGCACTCCGAGTATCGCCATCGGTGACAACGATACAGGCTTATCACACGGTGGTGATGGTCGAATTAACATGGTTGCCAATAGTATACATATTGCAAGCTGGGGCGCAGGCTATCAATCTCATCCTGGACTTTGGGATTCAACTGGTGCTTTTTGGACAGAAACCGGAAGAGCTATCGTTTCTCATGGTCATTTAGTTCAGGCGAATGACAGCTATTCAACGTATGTCCGTGATGTTTATGTCCGCTCTGATATTCGTGTTAAAAAGAACCTCGTTAAATTTGAAAATGCTTCTGAGAAGCTTTCTAAAATTAACGGTTACACTTATATGCAGAAACGTGGAACAGATGAAGAAGGTAATCAGAAATGGGAACCTAACGCTGGTTTGATAGCTCAAGAAGTTCAAGCTATTTTACCAGAATTAGTTGAAGGCGACCTGGATGGTGAAGCTTTACTTCGTTTGAACTATAACGGTGTAATTGGTTTAAATACAGCTGCAATCAACGAGCATACTGCAGAAATTGCAGAACTTAAATCAGAGATTGAAGAGCTTAAAAAATTAGTTAAATCATTGTTGAAATAA

Gene Ontology

No Gene Ontology terms available.

Enzymatic activity

No enzymatic activity data available.

Tertiary structure

PDB ID
c8a72f4d18840c79522d9fa8ec92007e9e0a598d10dec5ad17e5b2ef850b1086
ESMFold
Source ESMFold
Method ESMFold
Resolution 0,5392
Evidence 0,5392

Literature

Title Authors Date PMID Source
Genome sequences of avian pathogenic Escherichia coli bacteriophages UPEC01, UPEC03, UPEC06 and UPEC07 Kazibwe,G., Hinkley,T.C., Le Ny,A.-L.M. and Nakavuma,J.L. 2022-03-17 GenBank