Protein

Genbank accession
AEN93878.1 [GenBank]
Protein name
long tail fiber proximal subunit
RBP type
TF
Evidence RBPdetect
Probability 0,58
TF
Evidence RBPdetect2
Probability 0,85
Protein sequence
MADILKPAFRATSGLDAAGEKVINVAKADYNVLDDGVNVEFFIDENTIQAYDETRGYKKGFAVIHDQRIWVAQRDINAPAGTFVPGYWTATRTDPKWITVASPTRQLASGEYIAVDSAASFTTFTLPPNPTDGDTVVIKDIGGRVGYNEIKVQSSSAPGGGNQKIVRFGNQFTETLITKPFSYNMIIFANRLWHFWESGNEERGIRVEPNTAQFQAQAGDNILRRYTSGAVIKFTLPKYANQGDIIKTADIDGLGSKFHLIVETFDASSALGKPGQHSMEFRTSGDGFFVYNSTEKLWYVWDGDLKTRLRVIRDDVELLANESIIVFGPNNTTPQTINITLPTGVAQGDVVKIALNYLRKAQTVNIKAAVGYKIASSVQLLQFPKRSEYPPDTEWVLNDVLTFNGDISYTPVIELSYIEDTTTGGKYWVVAQNVPTIERVDSKDDLTRARLGVIALASQTQANVDHENNPEKELAITPQTLANRVATESRRGIARIATTAQVNQDTTFAFQDDLIISPKKLNERTATETRRGVAEIATQVETNTGTDDTTIITPKKLQARQGSESLSGIVTYTSTVGTTPATARDTVGTNVYNKNVGNLVISPKALDQYKATQVQQGTVYLSNQSEVNAGQTASGFANSAVSPETLHARVALDTRTGLIEIATQTETDTGTDYTRAVTPKTLNDRKATERLTGIARIATQVEFDAGVLDNVISTPLKIKTRFNDTARTSVSAASGLVESGTLWNHYTLDIREANETQRGTARLATQTEVNVGTDDKTIVTPLKLHSKKSTESSEGIIRVATNTETTAGTSKVLAVSPSGLKYVVQTETTWEATALRRGFVKLTEGALTYSGNKVTGSGVKFNSGTGLYENDDTVLNAANYPKTGYAVSSYEMNKTLQNFLPINATAVNSEKLDGLDSLQFIRRDVDQTVNGSLTLTKQLNLAAPLVSSSTANITGNTILGSLEVTGNSTFKNDVSVSSGKSIKFVGPQSGAGTWNSQGDTLAPIFAEINSTPDAKFHPIVKQRLGQGTFSLGTVNDGTRDFKIHYLPSPGSLESFYWTFNTTGDFAVNSGSISISKNANITGTTTSNGVSTTTLNASALSSLQNVTTSGTIVSTGQVSANNGLVAQKYVRSVGVKPTLASQAPTAETVGFWSVDINDSATFNLFPGYWTMKTKRQVNIDTVQTKPAGVSDEIWNASGWLTETGAFSSPAIRYRNEDGSFGDEVLSTTGQKLRGTWFDYSVRDKEVKYPGTLTQFGNTLDSCYQDWVCYPTGLNGGTIRYTRTWQKNKNAWTTFSMVYTADNPPSAEEVGALPADNATMGNITILDWLRIGNVRIIPDPVTKSVKFEWIE
Physico‐chemical
properties
protein length:1349 AA
molecular weight: 146414,44090 Da
isoelectric point:5,73530
aromaticity:0,08302
hydropathy:-0,32987

Domains

Domains [InterPro]
AEN93878.1
1 1349
Legend: Pfam SMART CDD TIGRFAM HAMAP SUPFAM PRINTS Gene3D PANTHER Other

Taxonomy

  Name Taxonomy ID Lineage
Phage Escherichia phage Bp7
[NCBI]
1052121 Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host Escherichia coli
[NCBI]
562 Bacteria > Proteobacteria > Gammaproteobacteria > Enterobacteriales > Enterobacteriaceae > Escherichia

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
AEN93878.1 [NCBI]
Genbank nucleotide accession
HQ829472 [NCBI]
CDS location
range 83103 -> 87152
strand -
CDS
ATGGCCGATATTTTAAAACCTGCCTTCCGTGCTACATCCGGACTCGATGCTGCAGGCGAGAAAGTTATCAATGTTGCCAAAGCCGATTACAATGTATTAGACGACGGCGTCAACGTTGAATTCTTTATAGATGAGAACACCATCCAGGCGTACGACGAGACGCGCGGATATAAGAAAGGGTTTGCCGTAATCCATGACCAACGTATCTGGGTTGCTCAACGTGATATCAATGCTCCAGCAGGAACCTTTGTACCTGGTTATTGGACTGCTACCCGTACTGACCCTAAATGGATTACCGTAGCATCTCCTACACGCCAACTGGCTTCTGGTGAATATATTGCAGTGGATTCTGCTGCTAGCTTTACTACATTTACCCTGCCTCCTAACCCTACAGATGGCGATACCGTTGTAATTAAAGATATCGGTGGACGTGTTGGTTATAATGAAATCAAGGTTCAGTCTAGTTCTGCTCCGGGCGGTGGTAACCAGAAAATTGTCCGTTTCGGTAACCAGTTCACTGAGACCTTAATTACGAAGCCTTTTTCCTATAATATGATTATCTTTGCCAACCGTTTATGGCATTTCTGGGAATCAGGTAACGAAGAACGTGGTATCCGTGTAGAACCTAACACCGCCCAGTTCCAAGCTCAAGCTGGTGATAACATCCTCCGTCGTTATACTTCAGGTGCAGTAATTAAGTTTACTCTTCCTAAGTATGCGAACCAAGGCGATATTATTAAAACCGCTGATATCGATGGTTTAGGAAGTAAATTCCATTTAATCGTTGAAACGTTTGATGCTTCGTCTGCATTAGGTAAACCCGGACAGCATAGCATGGAATTCCGTACCTCCGGTGATGGATTCTTTGTTTATAACTCTACCGAAAAATTATGGTATGTTTGGGACGGTGACCTTAAAACCCGTTTACGTGTAATTCGCGATGATGTTGAACTCTTGGCTAACGAAAGTATTATTGTTTTTGGTCCTAATAATACAACGCCGCAGACGATTAATATCACATTACCTACAGGCGTAGCCCAGGGTGATGTCGTTAAGATTGCTCTGAACTATCTCCGTAAAGCTCAGACGGTAAATATTAAGGCTGCTGTAGGATATAAAATTGCTTCTTCAGTTCAATTGCTCCAGTTCCCTAAACGTTCTGAATATCCGCCGGATACTGAATGGGTGTTGAATGATGTACTGACCTTTAATGGCGATATAAGTTATACTCCGGTTATTGAACTGAGTTATATCGAAGACACCACTACAGGTGGCAAATATTGGGTTGTTGCTCAGAACGTTCCTACTATAGAACGTGTAGATTCTAAAGATGATTTAACTCGTGCTCGTTTAGGTGTTATTGCCCTTGCGTCGCAGACTCAGGCAAACGTTGACCATGAAAATAACCCTGAGAAAGAACTTGCAATTACTCCACAGACTTTAGCTAATCGTGTAGCGACTGAATCTCGTCGTGGTATTGCTCGTATTGCTACTACTGCTCAGGTGAACCAGGACACAACCTTCGCATTCCAGGACGATTTGATTATTTCTCCTAAGAAATTAAACGAACGTACTGCAACCGAAACTCGCCGTGGTGTTGCTGAAATTGCTACGCAAGTTGAAACTAACACGGGTACAGATGATACTACAATCATCACTCCTAAGAAGCTACAAGCACGCCAGGGTTCGGAAAGTCTTTCAGGTATTGTAACATATACCTCTACTGTAGGAACCACTCCTGCGACTGCTAGAGACACTGTAGGTACTAACGTTTATAATAAGAACGTAGGCAATTTGGTTATTTCTCCTAAAGCTCTCGACCAGTATAAAGCTACCCAAGTTCAACAGGGTACAGTATATCTTTCTAACCAATCTGAAGTTAACGCAGGTCAAACTGCAAGTGGATTTGCCAACAGTGCTGTTTCTCCTGAAACATTACATGCTCGTGTGGCTCTTGATACTCGTACAGGGTTAATTGAAATTGCTACGCAAACAGAGACTGATACTGGAACAGATTATACTCGTGCGGTAACGCCTAAGACGTTAAATGATAGGAAAGCTACGGAAAGATTGACTGGTATTGCTAGAATTGCAACACAGGTAGAATTTGATGCAGGTGTATTAGATAATGTTATTTCAACTCCGTTGAAAATTAAAACAAGATTTAATGATACCGCTAGAACTTCTGTCTCAGCAGCCAGTGGTTTGGTTGAATCAGGAACCTTATGGAACCATTATACACTAGATATTAGAGAAGCAAATGAGACTCAACGTGGTACTGCTCGCCTGGCGACCCAGACCGAAGTCAACGTTGGTACTGATGATAAAACTATCGTCACTCCTTTGAAATTACATTCTAAAAAATCTACTGAAAGTTCTGAAGGTATTATTCGTGTTGCAACGAATACCGAAACAACCGCAGGAACTTCTAAAGTTCTGGCTGTAAGCCCTTCTGGTTTAAAATATGTAGTACAGACCGAAACCACTTGGGAAGCTACTGCACTTCGTCGTGGATTTGTTAAATTAACCGAAGGTGCTTTAACCTATTCAGGAAATAAAGTTACCGGTTCTGGTGTTAAATTTAACTCAGGTACAGGCCTTTATGAGAACGACGATACTGTTCTGAACGCAGCTAACTACCCTAAAACAGGTTATGCTGTTTCATCTTACGAGATGAATAAAACTTTACAGAACTTTTTACCTATAAATGCTACGGCTGTGAACTCCGAGAAATTGGATGGCCTAGATTCACTCCAGTTCATTCGTAGAGACGTTGACCAAACGGTTAATGGTTCTTTAACGTTGACAAAACAATTGAACCTGGCCGCTCCTCTGGTGTCTTCTAGTACGGCTAATATTACCGGCAACACTATTTTAGGTTCTCTAGAAGTAACTGGAAATTCTACTTTTAAAAATGATGTATCTGTTAGCTCAGGTAAATCTATTAAATTTGTAGGACCCCAATCTGGTGCAGGTACTTGGAACTCTCAAGGTGATACTTTAGCTCCGATTTTTGCCGAGATAAATTCGACCCCGGATGCCAAGTTCCATCCTATTGTTAAACAACGTTTAGGGCAAGGTACATTCTCTTTAGGCACTGTAAACGACGGAACTCGTGATTTTAAAATACATTATCTTCCATCGCCGGGTTCTTTAGAATCTTTCTACTGGACCTTTAATACGACCGGTGATTTTGCTGTTAATAGTGGTTCTATTAGTATTTCCAAGAACGCTAATATCACCGGTACAACTACTTCTAACGGTGTTTCTACAACTACATTAAATGCTTCTGCTCTGTCTTCATTACAAAACGTAACTACTTCAGGTACTATCGTTTCTACCGGGCAGGTATCGGCAAATAATGGTTTGGTTGCTCAAAAATACGTCCGTTCTGTTGGTGTTAAACCTACATTAGCATCCCAGGCCCCTACTGCAGAAACCGTTGGCTTCTGGTCTGTCGATATCAATGATTCGGCTACATTTAACCTGTTCCCTGGTTATTGGACGATGAAAACTAAACGTCAGGTTAATATCGATACGGTCCAAACTAAACCTGCCGGTGTTTCTGATGAGATATGGAATGCTTCTGGTTGGTTGACAGAAACGGGTGCATTTAGTTCTCCGGCTATTCGTTATCGTAACGAAGACGGTAGTTTTGGTGACGAAGTTCTCAGTACGACGGGTCAGAAATTACGTGGTACTTGGTTTGATTATTCTGTTCGTGATAAGGAAGTTAAATATCCTGGTACGTTAACTCAGTTTGGTAATACATTGGATTCATGTTATCAAGATTGGGTGTGCTATCCTACAGGACTGAATGGTGGTACTATTCGTTATACACGTACCTGGCAGAAAAATAAAAACGCATGGACTACGTTCTCTATGGTCTATACGGCAGATAACCCTCCTTCTGCGGAAGAGGTTGGTGCATTGCCTGCTGATAACGCTACAATGGGTAACATTACAATCCTTGATTGGTTACGTATTGGTAACGTTCGTATTATTCCTGACCCGGTCACTAAATCCGTTAAGTTTGAGTGGATTGAATAA

Gene Ontology

No Gene Ontology terms available.

Enzymatic activity

No enzymatic activity data available.

Tertiary structure

PDB ID
fe4c1204b54a29b3f03889a615d212e6604cb6055838b92493ad3747814a0a05
ESMFold
Source ESMFold
Method ESMFold
Resolution 0,5371
Evidence 0,5371

Literature

Title Authors Date PMID Source
Morphological observation on lytic cycle of bacteriophag Bp7 Liu,X., Ren,H., Liu,W., Wen,J., Zou,L. and Liu,C. 2010 GenBank
Complete genome sequence and analysis of polyvalent Phage Bp7 of E. coli Wu,D. and Ren,H. 2013-06-12 GenBank