Protein

Genbank accession
QHR70554.1 [GenBank]
Protein name
long tail fiber distal subunit adhesine
RBP type
TSP
Evidence DepoScope
Probability 1,00
TSP
Evidence RBPdetect
Probability 0,80
TF
Evidence RBPdetect2
Probability 0,94
Protein sequence
MATLKSIQFKRSKIAGAKPTAAQLDEGELAINLRDRTIFTKSDQGQIIDLGFAKGGTIDGDVLQNGTFNLNGNQYVYAGKYIEFLPKTAGNGAWANQHLNKAPIFTDLSSTTSVSEYHPLIKQRYKDGTFSAGTLVNEGSFKFHYINETGDSKYWTFNRNGNFQVDSGSLMVSAGNISASGNINSANGIITGPEIVTKNINFSTKTFVANANIGYDWVSLPTWVYNPPADGSDDTTNGLNYLRKLRASSASSIFHEIADCRKGKPQEISWWTGVGPSSFQWAFDNSGRITAGKSISVGLPDNGTNGRYPLDSAISIGIAIGDNDTGIKWVRDGVIDFMANGISSATILNNGINSTKKLMVGYSRDSGTTWDFPNNNQAMFTARTDVDDNNNGDGQTHIGYSSNAKMYHYFRGQGRMSVSMGDGLLVEPGILDVKTGSNRVAIRADGTFDSTNRISMRTGLFLNGDDNTNALSFKAPSGVDGTKTINWDAGTRNGQNKNTVTIKAWGNSFNAGGGNRETVFEVSDSQGYYFYAQRTNPSVAGGVGPVNFKFNGTVETGHIVGLGDITASGKGSFGGGVTFENGAAIRGGANISGQVKIGGVNDALRIWNDRYGAIFRRSETSLHIIPTNENEGENGPISNLRPFSIELGTGAINIGHSLMIGNSARGDGLLNIDTKAFLITINSHSKINPNYRMDLENGAYINALMDANGRSAGAGSFASQNNENVRAPFYMNIDRDDTSTYVPMIKQRYVQGNGCFSIGTLLNNGNFRVHYHAGGDGGSTGAQIADYGWEFTKSGDFVSPKRVSAGGSVYLGTDGNITGGSGNFSNLNTTLDRKVTTGWINYSSASGWYKLATVNMPQGVATVQFKITGGSGFNVGIFKQATINEIVLRSGNNTPKGINGVLWQRETDAIKDIAYVNTSGDEYDVYINCGTYLNRLTLEYSTSENASVVVHGLYGPTQSPVEELPVDTVKGRVFKLLNNSSDVFDAGSSNISTNATFVANTTVGFRHKSNGDESGSAATLFYNDGTTFHILLTDKNTDTDKTKASGSNNSLRPFSINIASGKVTISNSMSVSGVAEFYNGLNLKNNGSINFDKSGANPRNMCIFHAGDASRGNRIEIADESNYIVYFEKTPGGANRSSYNQCEVNGITTLNVNTKINTPQIGAFGVNTTNAWGGNSIAIGDNDTGFRQVGDGLLEVWTNAARRMRFQGGDTYSDMNINAPNVYIRSDIRLKSNFKPIENALEKVEQLDGLIYDKADYIGGEVVHTEAGVIAQKLNDVLPEAIREVEDIKGNKVLTVSTQAQVALLIEAVKTLSAKVKELEAKLN
Physico‐chemical
properties
protein length:1324 AA
molecular weight: 142204,80070 Da
isoelectric point:6,24873
aromaticity:0,09063
hydropathy:-0,37855

Domains

Domains [InterPro]
QHR70554.1
1 1324
Legend: Pfam SMART CDD TIGRFAM HAMAP SUPFAM PRINTS Gene3D PANTHER Other

Taxonomy

  Name Taxonomy ID Lineage
Phage Escherichia phage dhaeg
[NCBI]
2696391 Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host No host information

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
QHR70554.1 [NCBI]
Genbank nucleotide accession
MN850609 [NCBI]
CDS location
range 4253 -> 8227
strand -
CDS
ATGGCTACTTTAAAATCGATACAATTTAAAAGAAGTAAAATAGCAGGAGCCAAGCCTACTGCAGCCCAGTTAGATGAAGGTGAACTGGCTATTAACTTGCGTGATCGCACTATTTTTACTAAGTCAGACCAAGGTCAGATTATTGATTTAGGCTTTGCAAAGGGTGGGACCATTGATGGGGATGTTCTTCAAAACGGGACATTTAACCTCAATGGCAACCAATATGTTTATGCAGGTAAATACATCGAATTCCTGCCTAAAACAGCTGGCAACGGCGCCTGGGCTAACCAACATCTGAATAAAGCCCCTATCTTTACAGATTTGAGTTCAACTACTTCTGTTTCAGAATACCACCCTTTGATTAAGCAACGTTATAAAGACGGTACTTTTTCAGCAGGTACATTAGTAAACGAAGGCAGTTTTAAATTCCACTATATTAATGAAACAGGTGATTCAAAATATTGGACCTTTAATCGTAATGGTAATTTTCAAGTTGATAGCGGTAGTTTAATGGTATCAGCAGGTAATATTTCTGCATCAGGAAACATAAATTCAGCTAATGGTATTATCACCGGTCCTGAAATTGTTACCAAAAATATTAATTTCAGTACAAAAACATTTGTAGCTAACGCCAACATCGGGTATGATTGGGTTTCATTACCTACCTGGGTTTATAATCCACCTGCTGATGGCTCTGATGATACTACTAACGGTTTAAACTATTTGCGTAAATTGCGTGCATCAAGTGCATCAAGTATTTTCCATGAAATTGCTGATTGTCGCAAAGGTAAACCACAAGAAATTTCTTGGTGGACTGGTGTAGGTCCTTCATCTTTCCAATGGGCGTTTGATAACTCTGGACGTATTACTGCGGGTAAATCTATTTCAGTAGGTCTTCCGGATAACGGTACAAATGGACGCTATCCTTTAGATTCCGCCATTTCTATTGGTATTGCAATTGGCGATAACGATACCGGTATTAAATGGGTCCGCGATGGTGTTATTGATTTCATGGCTAATGGTATTTCATCTGCTACCATTTTGAATAACGGTATTAATAGCACTAAGAAATTGATGGTTGGTTATAGCCGTGATTCAGGTACTACATGGGATTTCCCAAATAACAACCAAGCAATGTTTACTGCACGCACTGATGTCGACGATAATAATAACGGTGATGGGCAGACTCATATCGGTTATAGCAGCAATGCAAAGATGTATCACTATTTCCGTGGCCAAGGTCGTATGTCTGTTAGTATGGGCGACGGGCTTCTTGTTGAGCCGGGTATTTTAGATGTTAAAACCGGGTCCAATAGAGTTGCTATTAGAGCAGATGGTACATTTGACTCCACCAATCGCATTTCTATGCGTACTGGTTTATTTTTAAACGGTGATGATAATACCAATGCATTATCATTTAAAGCTCCTTCCGGTGTAGATGGTACTAAAACCATTAACTGGGACGCCGGCACCCGAAATGGCCAGAACAAAAATACCGTTACAATTAAGGCATGGGGTAACTCATTTAACGCGGGCGGTGGTAATAGAGAAACTGTATTCGAAGTATCAGACTCACAAGGATATTATTTCTATGCTCAACGTACTAATCCATCCGTTGCTGGTGGTGTAGGACCTGTTAATTTTAAGTTTAACGGAACTGTTGAAACAGGTCATATCGTTGGTCTTGGCGATATTACCGCTTCAGGTAAAGGTTCTTTTGGTGGTGGTGTTACTTTTGAAAATGGAGCGGCTATTCGCGGCGGCGCTAATATAAGCGGCCAGGTTAAAATTGGTGGCGTTAACGACGCATTAAGAATTTGGAACGACCGGTATGGGGCTATTTTCCGCCGCTCAGAAACATCATTGCATATTATCCCAACCAATGAAAACGAAGGGGAAAACGGGCCGATAAGCAATTTACGTCCATTTAGTATTGAATTAGGTACTGGCGCAATTAATATAGGCCATTCTTTAATGATAGGCAACTCGGCTCGAGGCGATGGCCTGCTGAATATTGATACCAAAGCATTCTTGATTACAATTAACAGTCATTCTAAAATTAACCCTAACTATCGTATGGACCTGGAAAACGGTGCTTATATAAATGCTTTGATGGATGCAAATGGTCGTTCAGCTGGTGCAGGTTCATTTGCTTCCCAGAATAATGAAAATGTCCGCGCTCCATTCTACATGAATATTGACCGAGATGATACTAGCACTTATGTTCCAATGATTAAGCAACGTTATGTTCAGGGTAATGGATGTTTTTCAATCGGTACTTTGTTGAATAACGGCAACTTCCGCGTTCATTATCATGCTGGTGGTGATGGTGGTTCGACCGGTGCTCAGATTGCGGACTACGGTTGGGAATTCACTAAATCAGGTGATTTTGTATCTCCTAAACGTGTTTCTGCTGGCGGTTCTGTTTATCTAGGTACGGATGGTAATATCACTGGTGGTTCTGGTAATTTCTCTAACCTGAATACTACTTTAGACCGCAAAGTTACCACGGGCTGGATTAACTATTCTTCTGCAAGTGGTTGGTATAAATTGGCAACAGTAAATATGCCTCAAGGTGTAGCTACGGTCCAATTTAAAATAACAGGCGGCTCTGGTTTTAACGTTGGTATTTTCAAACAAGCAACAATTAATGAAATTGTATTACGTTCTGGTAATAATACGCCTAAAGGAATTAACGGTGTTTTATGGCAACGTGAAACAGATGCTATTAAAGATATTGCGTATGTTAATACCTCAGGCGATGAGTATGATGTTTATATTAATTGTGGCACTTATTTAAATAGACTTACTCTAGAATATAGCACTTCAGAAAACGCCTCAGTAGTAGTTCATGGATTATACGGGCCTACGCAATCACCGGTAGAAGAGCTTCCTGTAGATACTGTTAAAGGTCGTGTTTTTAAACTTCTTAATAATAGCTCAGACGTTTTTGACGCGGGTAGTTCTAATATTTCTACAAATGCCACCTTTGTTGCTAATACAACTGTAGGTTTCCGCCATAAATCCAATGGTGATGAAAGTGGTTCTGCCGCTACTCTGTTTTATAATGATGGTACGACGTTCCATATATTATTAACAGATAAGAACACTGACACTGATAAGACTAAAGCCTCTGGTTCTAACAACAGTTTAAGGCCTTTTTCTATCAATATTGCTTCCGGTAAAGTAACTATTTCAAACTCTATGAGTGTTTCTGGAGTTGCAGAGTTTTATAATGGCCTTAACCTCAAAAATAATGGAAGCATTAACTTTGATAAGTCTGGGGCGAACCCGAGAAACATGTGTATATTCCATGCAGGTGATGCTTCTCGTGGAAACCGTATTGAAATAGCTGACGAATCAAATTATATTGTTTATTTCGAAAAAACTCCAGGTGGTGCAAACCGTTCTTCATATAACCAGTGTGAAGTAAACGGTATAACTACTCTTAACGTTAATACCAAGATTAATACGCCTCAAATTGGTGCCTTTGGTGTCAACACAACTAATGCCTGGGGTGGTAACTCGATTGCAATTGGCGATAACGATACGGGTTTCAGACAAGTTGGTGACGGGCTTTTAGAAGTTTGGACCAATGCCGCCCGCCGAATGAGATTCCAAGGTGGCGACACTTATTCAGATATGAATATAAATGCTCCAAACGTTTATATTCGTTCTGATATTCGTTTGAAATCAAACTTCAAACCAATTGAAAACGCTCTTGAAAAGGTTGAACAGCTTGATGGTTTAATCTATGATAAAGCTGATTATATTGGTGGAGAGGTTGTTCATACTGAAGCTGGTGTTATTGCTCAGAAATTGAATGATGTATTACCTGAAGCTATTCGTGAAGTTGAAGATATCAAAGGTAATAAAGTTCTGACAGTTTCGACTCAGGCACAAGTTGCTCTATTAATTGAAGCAGTTAAAACCCTGTCGGCTAAAGTAAAAGAACTTGAAGCTAAGTTAAACTAA

Gene Ontology

No Gene Ontology terms available.

Enzymatic activity

No enzymatic activity data available.

Tertiary structure

PDB ID
41f6d2501c85212e91dcf85574aa6bdd84b88f48f4db65171ee80e21544b635f
ESMFold
Source ESMFold
Method ESMFold
Resolution 0,4769
Evidence 0,4769

Literature

Title Authors Date PMID Source
Exploring the Remarkable Diversity of Culturable Escherichia coli Phages in the Danish Wastewater Environment Olsen,N.S., Forero-Junco,L., Kot,W. and Hansen,L.H. 2020 GenBank