Protein

Genbank accession
QHR72382.1 [GenBank]
Protein name
long tail fiber distal subunit
RBP type
TSP
Evidence DepoScope
Probability 1,00
TSP
Evidence RBPdetect
Probability 0,72
TF
Evidence RBPdetect2
Probability 0,95
Protein sequence
MATLKSIQFKRSKIAGAKPTAAQLDEGELAINLRDRTIFTKSDQGQIIDLGFAKGGQVDGDVNINGTLNLNGELVQTGTAGMRTEGSITAPVFRASKGSFYSRASNDTSNAHYWFENANGTERGVLYAKPQLENEGVITMRVRQGTAAGAQNSEFHFISNDGGIFQARKLAALTSISTPTISVNLVNHDSKTFGQYDSQSLVNYVYPGTGETNGVNYLRKVRAKSGGTMWHELCTAQLGQADEMSWWTGNTPQSKQYGVRNDGRLIGRNSLALGTMTTDFPSSDYGNTGAMGDKYLVLGDTATGLKYIKQGNFDLVGGGYSVASITTDGFRGTSKTIFGRSNDQGLTWLLPGQNSSMVSIRTEIDGNNSGDGQTHLGYNSNGKLYHYFRGTGRVAISMAEGMIIEPGILNIKTGVNELNLRADGTVSTTQRLMVNNGLVLNANNNTSALALTAPTGVDGTKTINWDAGTRNGQNKNTVTMKAWGNSFNAGGGNRETVFEVSDSQGYYFYGQRTNPASGETVGPINFKFNGSVETGHFSSLGNISASGTGSFGGNVTMTNGLFVQGGASISGQVKMGGTADALRIWNAEYGLIFRRSETGSSASFHLIPTLQNAGENGGISDLRPLSINLANGTVIMGNKSTGGPLFTVDNVSKFVQTDCRLRVNMDSDGIVLNASSQAASNFIQGRKADVTKWYLGIGDGGNVVRLHNYTYSHGIALNSDTVDITKPLKIGSDIRIGTDGNITGSSTLDNFKNLNSTLDHKVNMGGWSGGATTGWYKFATVEIPQSTGTVSFKIFGGSGFNFKSYGQASIAEIILRTGNNNPKGLNATLWNRTSEAISQIASVNTSEDIYDIYVYLGGYSNSLVVEYTCSSNSKVTVVGMDSGIQPLVETLPEGHIVGKSVRMLNNIDGMFAAGESDIVTRGEYVTNNQKGMRIKSKGNDLDSNAALLRNDGGSFYILATDKNTTEKPDAANGDWNGLRPFSINMADGRVGMNHGLNITGGGLNVTGGNTNLGNITSRVVSSARSPAGWADNSDAMKPKITFMADHGDLSNSGSYYPIVGAWSNYGSAGYRQTFEFGWVGSGTTAGWRDGIIRIRGDNANGQQARWRFVMDGTLECPGKVLLPQTSAFGINTINGFGGNSLVIGDSDTGFRQVGDGLLEVWTNASRRMRFQGGDTYSDMNINAPNVYIRSDIRLKSNFKPIENALEKVEQLDGLIYDKADYIGGEVVHTEAGVIAQKLNEVLPEAIREVEDIKGNKVLTVSTQAQVALLIEAVKTLSAKVKELEAKLN
Physico‐chemical
properties
protein length:1288 AA
molecular weight: 137578,54120 Da
isoelectric point:6,77017
aromaticity:0,08075
hydropathy:-0,33579

Domains

Domains [InterPro]
Legend: Pfam SMART CDD TIGRFAM HAMAP SUPFAM PRINTS Gene3D PANTHER Other

Taxonomy

  Name Taxonomy ID Lineage
Phage Escherichia phage dhabil
[NCBI]
2696390 Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host No host information

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
QHR72382.1 [NCBI]
Genbank nucleotide accession
MN850621 [NCBI]
CDS location
range 24169 -> 28035
strand +
CDS
ATGGCTACTTTAAAATCGATACAATTTAAAAGAAGTAAAATAGCAGGAGCCAAGCCTACTGCAGCCCAGTTAGATGAAGGTGAACTGGCTATTAACTTGCGTGACCGCACTATTTTTACTAAGTCAGACCAAGGACAGATTATTGATTTGGGCTTTGCTAAAGGTGGACAAGTTGATGGTGATGTTAATATTAACGGGACTTTGAATTTAAATGGTGAACTTGTCCAAACAGGTACGGCAGGTATGAGAACTGAAGGTAGTATTACTGCCCCTGTTTTCCGAGCTAGTAAGGGCTCATTTTATTCTAGAGCGTCTAATGATACTTCTAACGCACATTATTGGTTTGAAAACGCAAATGGCACTGAACGTGGTGTTTTATATGCTAAACCACAGCTTGAAAATGAAGGCGTAATTACCATGCGTGTTCGCCAAGGTACTGCTGCCGGCGCGCAAAATTCAGAGTTTCACTTTATTTCTAATGATGGTGGTATTTTTCAGGCTCGTAAATTAGCGGCTTTAACTTCAATATCAACACCTACAATTTCCGTTAACTTAGTAAACCATGATTCAAAAACGTTTGGACAGTATGACAGCCAATCTTTAGTTAATTACGTATACCCGGGCACCGGCGAAACAAATGGTGTAAACTATCTTCGTAAAGTTCGTGCCAAATCTGGCGGCACTATGTGGCATGAGCTTTGTACTGCTCAATTAGGCCAAGCTGATGAAATGTCTTGGTGGACAGGTAATACTCCTCAGTCTAAACAATACGGTGTTCGTAACGACGGCCGTTTGATTGGTAGAAATAGCCTTGCATTAGGTACTATGACTACCGATTTCCCATCTAGCGATTATGGTAATACCGGAGCTATGGGTGACAAATACCTAGTTTTAGGTGATACCGCGACCGGTTTAAAATATATTAAACAAGGTAATTTTGATTTGGTGGGTGGAGGTTATTCTGTTGCTTCTATTACTACTGATGGTTTCCGCGGTACAAGCAAAACCATATTTGGACGTAGTAATGACCAGGGGCTTACTTGGCTTCTGCCGGGCCAGAATTCTTCTATGGTTTCTATTAGAACCGAAATAGATGGTAATAACTCCGGGGATGGCCAAACCCATTTGGGTTATAATTCTAATGGTAAACTTTATCATTATTTCCGTGGCACAGGTCGTGTAGCCATTTCTATGGCAGAAGGTATGATTATTGAACCTGGTATTTTAAATATTAAGACCGGGGTTAACGAATTAAATCTTAGAGCAGACGGCACAGTTTCTACTACACAGCGTTTAATGGTTAATAACGGCCTAGTTCTTAACGCAAACAATAATACTTCTGCATTGGCATTAACTGCTCCTACCGGTGTTGATGGTACAAAAACCATTAACTGGGACGCTGGTACCCGAAATGGCCAGAACAAAAATACCGTTACCATGAAAGCATGGGGTAACTCATTTAACGCCGGTGGCGGTAATAGAGAAACTGTATTCGAAGTATCAGATTCACAAGGATATTATTTCTATGGCCAACGTACTAATCCGGCTTCCGGTGAAACTGTAGGCCCTATTAACTTCAAGTTCAACGGCTCTGTTGAAACAGGTCATTTTTCTAGTCTCGGAAATATAAGTGCATCCGGTACCGGTTCTTTTGGTGGCAATGTTACCATGACTAATGGCCTGTTTGTCCAAGGCGGCGCTTCAATTAGTGGCCAAGTTAAAATGGGTGGTACTGCTGACGCATTAAGAATTTGGAACGCTGAATATGGTTTGATTTTCCGTCGTTCAGAAACGGGTTCTTCTGCTTCATTCCATCTTATTCCTACCCTTCAAAACGCCGGTGAAAATGGTGGAATAAGCGACCTCCGTCCGTTGTCTATTAATTTAGCCAATGGTACCGTTATAATGGGGAATAAATCTACAGGTGGTCCACTTTTTACAGTCGACAACGTAAGTAAATTTGTCCAAACTGACTGTAGGTTGCGTGTTAATATGGATTCCGATGGTATTGTTTTGAATGCTTCATCTCAAGCAGCATCCAACTTTATCCAAGGACGTAAAGCAGACGTTACAAAATGGTATCTTGGTATTGGTGACGGCGGTAACGTTGTTCGTTTACATAACTATACTTATTCACATGGTATTGCATTAAACTCTGATACTGTTGATATAACCAAGCCTCTTAAAATAGGTTCTGATATTCGTATTGGTACAGATGGTAACATTACAGGCAGTTCTACCTTAGACAACTTTAAAAACCTGAATTCAACATTAGACCATAAAGTTAATATGGGCGGATGGTCGGGTGGTGCTACTACAGGTTGGTATAAATTTGCTACTGTAGAAATTCCGCAGTCAACAGGCACGGTATCTTTTAAAATATTTGGTGGTTCCGGATTTAATTTTAAAAGTTATGGTCAGGCTTCAATAGCTGAAATAATCCTTAGAACTGGTAATAATAACCCTAAAGGCCTTAATGCTACGTTGTGGAATAGGACTTCTGAAGCTATTTCCCAGATTGCTTCGGTTAATACAAGCGAAGATATCTATGATATTTACGTTTATTTGGGTGGATATTCTAATTCTTTAGTAGTAGAATATACATGCAGTAGCAATAGTAAAGTAACCGTAGTAGGTATGGATAGCGGCATCCAGCCTTTGGTAGAAACATTACCTGAAGGTCATATTGTAGGTAAATCTGTAAGAATGCTGAACAATATTGACGGAATGTTTGCTGCTGGTGAATCAGATATTGTTACTCGTGGTGAATATGTTACCAATAACCAAAAAGGTATGCGTATTAAATCTAAAGGTAATGATTTAGATTCTAATGCTGCTTTACTTAGAAACGACGGTGGAAGTTTTTATATTTTAGCTACAGATAAAAATACGACAGAAAAACCCGATGCGGCTAATGGTGATTGGAATGGCTTAAGACCTTTCTCTATTAATATGGCTGATGGTCGCGTTGGTATGAACCACGGTCTGAATATTACTGGTGGCGGATTAAACGTTACAGGTGGTAATACAAACCTTGGTAATATTACCTCTCGTGTAGTTTCTTCTGCACGTTCACCTGCAGGCTGGGCTGATAACTCAGATGCAATGAAACCTAAAATCACCTTTATGGCAGACCATGGTGATTTATCCAATTCAGGTAGTTATTATCCTATTGTCGGAGCGTGGAGTAACTATGGTTCAGCAGGTTATCGTCAGACCTTTGAGTTTGGTTGGGTTGGTTCTGGTACCACAGCTGGATGGCGTGATGGTATTATTCGTATACGTGGCGACAATGCTAATGGCCAACAAGCAAGATGGCGCTTTGTAATGGACGGTACTTTAGAGTGTCCAGGTAAAGTACTGCTACCACAAACAAGTGCCTTCGGTATTAACACAATAAACGGGTTTGGTGGTAACTCACTTGTAATTGGGGATAGCGATACTGGTTTTAGACAAGTTGGTGACGGTCTTTTAGAAGTTTGGACTAATGCTTCTCGCCGTATGCGATTCCAAGGTGGTGACACTTATTCAGATATGAATATAAATGCTCCAAACGTTTATATTCGTTCTGATATTCGTTTGAAATCAAACTTCAAACCAATTGAAAACGCTCTTGAAAAGGTTGAACAGCTTGATGGTTTAATCTATGATAAAGCTGATTATATTGGTGGAGAGGTTGTTCACACTGAAGCAGGTGTTATTGCACAGAAATTGAATGAAGTATTACCTGAAGCTATTCGTGAAGTTGAAGATATCAAAGGTAATAAAGTTCTGACAGTTTCTACTCAGGCACAAGTTGCTCTATTAATTGAAGCAGTTAAAACTCTGTCGGCTAAAGTAAAAGAACTTGAAGCTAAGTTAAACTAA

Gene Ontology

No Gene Ontology terms available.

Enzymatic activity

No enzymatic activity data available.

Tertiary structure

PDB ID
5acb301b25c00fd645dacd34fca16cbed98788270530d26c1f3d31b469774e0d
ESMFold
Source ESMFold
Method ESMFold
Resolution 0,5149
Evidence 0,5149

Literature

Title Authors Date PMID Source
Exploring the Remarkable Diversity of Culturable Escherichia coli Phages in the Danish Wastewater Environment Olsen,N.S., Forero-Junco,L., Kot,W. and Hansen,L.H. 2020 GenBank