Protein

Genbank accession
QLF81291.1 [GenBank]
Protein name
long tail fiber proximal subunit
RBP type
TF
Evidence RBPdetect
Probability 0,54
TF
Evidence RBPdetect2
Probability 0,90
Protein sequence
MADILKPAFRATSGLDAAGEKVINVAKADYNVLDDGVNVEFFIDENTIQAYDETRGYKKGFAVIHDQRIWVSQREIPSPAGTFTPGYWTATRTDPKWITVASPTRQLASGEYIAVDSAASFTTFTLPPNPTDGDTVVIKDIGGRVGYNEIKVQSSSAPGGGNQKIVRFGNQFSETLITKPFSYNMLIFANRLWHFWEAGNEERGIRVEPNTAQFQSQAGDNVLRRYTSGAVIKFTLPKYANQGDIIKTVDIDGLGSKFHLIVETFDASSSLGKLGQHSMEFRTSGDGFFVYNSTEKLWYVWDGDRQTRLRVIRDDVELLANESVIVFGPNNTTPQTINITLPTGVAQGDVVKIALNYLRKAQTVNIKATVGDKIASSVQLLQFPKRSEYPPDTEWVLNDVLTFNGDISYTPVIELSYIEDTTTGGKYWVVAQNVPTIERVDSKDDLTRARLGVIALASQTQANVDHENNPEKELAITPQTLANRVATESRRGIARIATTAQVNQDTTFAFQDDLIISPKKLNERTATETRRGVAEIATQVETNTGTDDTTIITPKKLQARQGSESLSGIVTYTSTVGTTPATARDTVGTNVYNKNVGNLVISPKALDQYKATQVQQGTVYLSNQSEVNAGQTASGFANSAVSPETLHARVALDTRTGLIEIATQAETDTGTDYTRAVTPKTLNDRKATEGLTGIARIATQVEFDAGTLDNVISTPLKIKTRFNDTARTSVSAASGLVESGTLWNHYTLDIREANETQRGTARLATQTEVNVGTDDKTIITPLKLHSKKSTESSEGIIRVATNTETTAGTSKVLAVSPSGLKYVVQTETTWEATALRRGFVKLTEGALTHSGNKVTGSGVKFNSGTGLYENDDTVLNAANYPKTGYAVSSYEMNKTLQNFLPINATAVNSEKLDGLDSLQFIRRDVDQTVNGSLTLTKQLNLAAPLVSSSTANITGNTILGSLEVTGNSTFKNDVSVSSGKSIKFVGPQSGAGSWDSQATNFAPIFSEINSTVDASYHPIVKQRLGQGTFSLGTLNDGSGDFKIHHISSASGALKSSYWTFNTTGDFAVNSGSISISKNANITGTTTSNGVSTTTLNASALSSLQNVTTSGTIVSTGQVSANNGLVAQKYVRSVGVKPTLASQAPTAETVGFWSVDINDSATFNLFPGYWTMKTKRQVNIDTVQTKPAGVSDEIWNASGWLTETGAFSSPAIRYSNEDGSFGDEVLGTSGQKLRGTWFDYSVRDKEVKYPGTLTQFGNTLDSCYQDWVCYPTGLNGGTIRYTRTWQKNKNAWTTFSMVYTADNPPSAEEVGALPADNATMGNITILDWLRIGNVRIIPDPVTKSVKFEWIE
Physico‐chemical
properties
protein length:1350 AA
molecular weight: 146111,76830 Da
isoelectric point:5,63822
aromaticity:0,08074
hydropathy:-0,33348

Domains

Domains [InterPro]
QLF81291.1
1 1350
Legend: Pfam SMART CDD TIGRFAM HAMAP SUPFAM PRINTS Gene3D PANTHER Other

Taxonomy

  Name Taxonomy ID Lineage
Phage Escherichia phage vB_EcoM_FB
[NCBI]
2750847 Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host No host information

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
QLF81291.1 [NCBI]
Genbank nucleotide accession
MT682711 [NCBI]
CDS location
range 152312 -> 156364
strand +
CDS
ATGGCCGATATTTTAAAACCTGCCTTCCGTGCTACATCCGGACTCGATGCTGCAGGCGAGAAAGTTATCAATGTTGCCAAAGCCGATTACAATGTATTAGACGACGGCGTCAACGTTGAATTCTTTATAGATGAGAACACCATCCAGGCGTACGACGAGACGCGTGGATATAAGAAAGGGTTTGCAGTAATCCATGACCAACGTATCTGGGTTTCTCAACGTGAAATTCCTTCTCCTGCAGGAACCTTTACACCGGGTTATTGGACTGCTACCCGTACTGACCCTAAGTGGATTACCGTAGCATCTCCTACCCGTCAGTTGGCTTCCGGTGAATATATTGCGGTGGATTCCGCTGCTAGCTTTACTACATTTACCCTGCCTCCTAACCCTACAGATGGCGATACCGTTGTAATTAAAGATATCGGTGGACGTGTCGGTTATAACGAAATCAAGGTCCAATCTAGTTCTGCGCCTGGCGGCGGTAACCAGAAAATTGTTCGTTTTGGTAATCAGTTCTCTGAAACCCTGATAACCAAACCATTTTCTTATAACATGCTTATCTTTGCCAACCGTTTATGGCATTTCTGGGAAGCAGGTAATGAAGAACGTGGTATTCGTGTAGAACCGAACACGGCCCAGTTCCAATCACAAGCAGGTGATAACGTTCTCCGTCGTTATACTTCAGGTGCAGTAATTAAGTTTACTCTTCCTAAGTATGCGAACCAGGGTGATATTATTAAAACCGTTGATATTGATGGTTTAGGAAGTAAATTCCATTTAATCGTCGAAACGTTTGATGCCTCGTCTTCATTAGGTAAGCTTGGTCAGCATAGCATGGAATTCCGTACCTCCGGTGATGGATTCTTTGTTTATAACTCTACCGAAAAATTATGGTATGTTTGGGACGGTGACCGTCAAACTCGTTTACGCGTAATTCGTGACGATGTTGAGCTCTTGGCTAATGAAAGTGTTATTGTTTTTGGTCCTAATAATACGACGCCGCAGACGATTAATATCACATTACCTACAGGCGTAGCCCAGGGTGATGTCGTTAAGATTGCTCTGAACTATCTCCGTAAAGCTCAGACGGTAAATATTAAGGCCACCGTAGGAGATAAAATTGCTTCTTCGGTTCAATTGCTCCAGTTCCCTAAACGTTCTGAATATCCGCCGGATACTGAATGGGTGTTGAATGATGTACTGACCTTTAATGGCGATATAAGTTATACTCCGGTTATTGAACTGAGTTATATCGAAGACACCACTACAGGTGGCAAATATTGGGTTGTTGCTCAGAACGTTCCTACTATAGAACGTGTAGATTCTAAAGATGATTTAACTCGTGCTCGTTTAGGTGTTATTGCCCTTGCGTCGCAGACTCAGGCAAACGTTGACCATGAAAATAACCCTGAGAAAGAACTTGCAATTACTCCACAGACTTTAGCTAATCGTGTAGCGACTGAATCTCGTCGTGGTATTGCTCGTATTGCTACTACTGCTCAGGTGAACCAGGACACAACCTTCGCATTCCAGGACGATTTGATTATTTCTCCTAAGAAATTAAACGAACGTACTGCAACCGAAACTCGCCGTGGTGTTGCTGAAATTGCTACGCAAGTTGAAACTAACACGGGTACAGATGATACTACAATCATCACTCCTAAGAAGCTACAAGCACGCCAGGGTTCGGAAAGTCTTTCAGGTATTGTAACATATACCTCTACTGTAGGAACCACTCCTGCGACTGCTAGAGACACTGTAGGTACTAACGTTTATAATAAGAACGTAGGCAATTTGGTTATTTCTCCTAAAGCTCTCGACCAGTATAAAGCTACCCAAGTTCAACAGGGTACGGTATATCTTTCTAACCAATCTGAAGTTAACGCAGGTCAAACTGCAAGTGGATTTGCCAACAGTGCTGTTTCTCCGGAAACATTACATGCCCGTGTGGCTCTTGATACTCGTACAGGGTTAATTGAAATTGCTACGCAAGCAGAGACTGATACTGGAACAGATTATACTCGTGCAGTAACGCCTAAGACGTTAAATGATAGGAAAGCTACGGAAGGATTGACTGGTATTGCTAGAATTGCAACACAGGTAGAATTTGATGCAGGTACGTTAGATAATGTTATTTCAACTCCGTTGAAAATTAAAACAAGATTTAATGATACTGCTAGAACTTCTGTCTCAGCAGCCAGCGGTTTGGTTGAATCAGGAACCTTATGGAACCATTATACACTAGATATTAGAGAAGCAAATGAGACACAACGTGGTACTGCTCGCCTGGCAACCCAGACCGAAGTCAACGTTGGTACTGATGACAAAACTATCATCACTCCTTTGAAATTACACTCTAAAAAATCTACTGAAAGTTCTGAGGGTATTATTCGTGTTGCAACTAATACCGAAACAACCGCAGGAACTTCTAAAGTTTTGGCTGTAAGCCCTTCTGGTTTAAAATATGTAGTACAGACCGAAACCACTTGGGAAGCTACTGCACTTCGTCGTGGATTTGTTAAACTAACCGAAGGTGCTTTAACCCATTCAGGAAATAAAGTTACCGGTTCCGGTGTTAAATTTAACTCAGGCACAGGCCTTTATGAGAACGATGATACTGTTCTGAACGCAGCGAACTACCCTAAAACGGGTTATGCTGTTTCATCTTACGAGATGAATAAAACTTTACAGAACTTTTTACCTATAAATGCTACGGCTGTGAACTCCGAGAAATTGGATGGCCTGGATTCACTTCAGTTCATTCGTAGAGACGTCGACCAAACGGTTAATGGTTCTTTAACCCTGACCAAACAATTGAACCTGGCAGCTCCTCTAGTGTCTTCTAGTACTGCTAATATTACTGGCAATACTATTTTAGGTTCTCTAGAAGTAACTGGAAATTCTACTTTTAAAAATGATGTATCTGTTAGCTCAGGTAAATCTATTAAATTTGTAGGACCCCAGTCTGGCGCAGGTTCTTGGGATTCTCAGGCAACTAATTTTGCACCTATTTTCTCTGAGATAAATTCTACTGTTGATGCTAGTTATCACCCTATTGTTAAGCAACGATTAGGGCAGGGTACTTTCTCTTTAGGTACTTTAAATGACGGTTCCGGCGATTTTAAAATCCATCATATCAGCAGTGCTTCTGGTGCTTTAAAATCTTCCTACTGGACCTTTAATACGACCGGTGATTTTGCTGTTAATAGTGGTTCTATTAGTATTTCCAAGAACGCTAATATCACAGGTACAACTACTTCTAACGGTGTTTCTACAACTACATTAAATGCTTCTGCTCTGTCTTCGTTGCAAAACGTAACTACTTCAGGTACTATCGTTTCCACCGGACAGGTATCGGCAAATAATGGTTTGGTTGCTCAAAAATACGTCCGTTCTGTTGGTGTTAAACCTACATTAGCATCCCAGGCCCCTACTGCAGAAACCGTTGGCTTCTGGTCTGTCGATATCAATGATTCGGCTACATTTAACCTGTTCCCTGGTTATTGGACGATGAAAACTAAACGTCAGGTTAATATCGATACGGTCCAAACTAAACCTGCCGGTGTTTCTGATGAGATATGGAATGCTTCTGGTTGGTTGACAGAAACGGGTGCATTTAGTTCTCCGGCTATTCGTTATAGTAACGAAGACGGTAGTTTTGGTGACGAAGTTCTCGGTACATCAGGTCAGAAATTACGTGGTACTTGGTTTGATTATTCTGTTCGTGATAAGGAAGTTAAATATCCTGGTACGTTAACTCAGTTTGGTAATACATTGGATTCATGTTATCAAGATTGGGTGTGCTATCCTACAGGACTGAATGGTGGTACTATTCGTTATACACGTACCTGGCAGAAAAATAAAAACGCATGGACTACGTTCTCTATGGTCTATACGGCAGATAACCCTCCTTCTGCGGAAGAGGTTGGTGCATTGCCTGCTGATAACGCTACAATGGGTAACATTACAATCCTTGATTGGTTACGTATTGGCAACGTTCGTATTATTCCTGACCCGGTCACTAAATCCGTTAAGTTTGAGTGGATTGAATAA

Gene Ontology

No Gene Ontology terms available.

Enzymatic activity

No enzymatic activity data available.

Tertiary structure

PDB ID
6b62a9490231f338c9e132c4c6fc465d1c65855d60d75cbb15a47b473a3644b6
ESMFold
Source ESMFold
Method ESMFold
Resolution 0,5273
Evidence 0,5273

Literature

Title Authors Date PMID Source
Complete genome sequences of eight phages infecting swine Enterotoxigenic Escherichia coli Ferreira,A., Oliveira,H., Silva,D., Almeida,C., Burgan,J., Azered,J. and Oliveira,A. 2020-09-03 GenBank