Protein
- Genbank accession
- AKN44640.1 [GenBank]
- Protein name
- long tail fiber distal subunit
- RBP type
-
TSPTSPTF
- Protein sequence
-
MATLKQIQFKRSKTAGARPAASVLAEGELAINLKDRVLFTKDDQGNIIDLGFAKGGSIDGNVIHIGNYNQTGDYTLNGTFTQTGNFNLTGIARVTRDIIAAGQIMTEGGELITKSSGTSHVRFHDSADRERGIIYAPANDGLTTQVVNIRVKDYAAGDESTYAFSGSGLFTSPEVSAWKSMSTPQILTNRVITNNKSTSDYDIYSMADNVPLSESTTAINHLRVMRNAVGAGVFHEVKDNDGITWYTGDGLDTYLWSFTWSGGLKAGHSISVGTPGGNKGYSELGTASISLGDNDTGLKWYQDGYFYVVNNGTRTFLYSPESTVSLRKMVMGYSVNGNDLTTPPTENYALATVVTYHDNNAYGDGQTLLGYYQGGNYHHYFRGKGTTNINTHGGLLVTPGNIDVIGGSVNIDGRNNSSTLMFRGNTTGSSSVDNMTISVWGNTFTNPSVGNRKNVMEISDATSWMSYIQRLTTGEVEMNVNGSFESSGVTAGNRGVHTTGEISSGAVNALRIWNADYGAIFRRSEGSLHIIPTAYGEGKHGDIGPLRPFSMALDTGKVTIPDLQSSYNTFAANGYIKFTGHGAGAGGYDIQYVQAAPVFQEIDDDAVSKYYPIVKQKFLNGKAVWSLGTEISSGTFVIHHLKEDGSQGHTSRFNQDGTVNFPDNVLVGGGEAAIARNGNIFSDIWKTFTSAGDITNIRDAIATRVAKEGDTMTGTLWINKDAAGIVLNPPLASDSSFIRSDTAGENNWYIGKGGADNGLGFYSYITQGGVYITNTGEISLSPQGQGTFHFNRDRLYINASQWVAHKSGAWGDQWGLEAPVFVDFGSVGNDSYYPIIKGKSGITNEGYVSGVDFGMRRITNQWAQAIIRVGNQENASDPQAIFEFHHNGNMYVPDMVKAGVRISAGGGDPAWTGACVVIGDNDTGLVHGGDGRINMVANGVHIASWSAAYQLHEGLWDTTGALWTEQGRAIISFGHLIQQSDAYSTFVRDVYVRSDIRVKKDLVKFENASEKLSKINGYTYMQKRGLDEEGNQKWEPNAGLIAQEVQAILPELVEGDPDGEALLRLNYNGVIGLNTAAINEHTAEIAELKSEIEELKALIKSLLK
- Physico‐chemical
properties -
protein length: 1104 AA molecular weight: 119100,60630 Da isoelectric point: 5,40689 aromaticity: 0,09601 hydropathy: -0,31685
Domains
Domains [InterPro]
Legend:
Pfam
SMART
CDD
TIGRFAM
HAMAP
SUPFAM
PRINTS
Gene3D
PANTHER
Other
Taxonomy
| Name | Taxonomy ID | Lineage | |
|---|---|---|---|
| Phage |
Escherichia phage PEC04 [NCBI] |
1647412 | Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes |
| Host | No host information | ||
Coding sequence (CDS)
Coding sequence (CDS)
Genbank protein accession
AKN44640.1
[NCBI]
Genbank nucleotide accession
KR233165
[NCBI]
CDS location
range 79270 -> 82584
strand -
strand -
CDS
ATGGCTACTTTAAAACAAATACAATTTAAAAGAAGCAAAACTGCAGGAGCACGTCCTGCCGCTTCAGTATTAGCCGAAGGTGAATTGGCTATAAACTTAAAAGACCGCGTACTTTTTACTAAAGATGACCAAGGAAATATCATTGATCTGGGTTTTGCTAAGGGCGGTAGTATTGACGGGAATGTTATTCATATAGGAAACTATAATCAAACTGGTGATTATACTTTAAATGGCACCTTCACTCAGACAGGTAATTTTAATTTAACTGGTATTGCTCGAGTAACTCGCGATATTATTGCCGCCGGGCAGATTATGACTGAGGGCGGAGAACTTATTACAAAAAGTTCAGGTACATCACATGTTCGTTTTCATGATTCGGCTGATCGTGAACGTGGAATCATTTATGCCCCGGCTAATGATGGATTAACTACGCAAGTAGTTAATATCCGCGTTAAAGACTACGCCGCTGGTGATGAAAGCACCTATGCATTTTCAGGCAGTGGCCTATTTACTTCACCTGAAGTATCAGCATGGAAATCTATGTCAACTCCTCAGATTTTGACAAATAGAGTTATTACTAATAATAAATCTACGAGCGATTATGACATTTATTCTATGGCAGACAACGTTCCATTGTCTGAAAGCACTACTGCTATTAATCATCTCCGTGTTATGCGCAATGCTGTAGGCGCTGGTGTATTCCATGAAGTTAAAGATAATGATGGAATAACTTGGTATACTGGAGATGGTTTAGACACTTATCTTTGGTCGTTTACCTGGTCCGGTGGATTGAAAGCAGGCCATTCTATTTCTGTTGGTACTCCTGGTGGCAATAAAGGATACTCTGAATTAGGGACTGCTTCAATTTCTCTTGGCGATAATGATACCGGATTAAAATGGTATCAAGATGGTTATTTCTATGTAGTAAACAATGGTACGAGAACTTTCCTTTATAGTCCTGAATCAACCGTAAGCCTTAGAAAAATGGTTATGGGTTATTCTGTAAATGGCAATGATTTGACTACTCCTCCGACTGAAAACTATGCTTTGGCTACTGTCGTGACATATCACGATAATAACGCGTATGGTGACGGTCAGACTCTTTTAGGATATTATCAAGGCGGTAACTATCATCATTATTTCCGCGGTAAGGGTACTACAAACATTAATACTCACGGTGGTTTATTAGTCACTCCTGGTAATATTGACGTTATTGGTGGTTCTGTTAATATTGATGGTCGTAATAATTCTTCTACACTGATGTTTAGAGGTAACACAACTGGTAGCAGTTCAGTTGATAATATGACAATTTCTGTATGGGGTAATACGTTTACTAATCCTAGTGTAGGTAATCGTAAAAACGTCATGGAAATTTCTGATGCAACTAGTTGGATGAGTTATATTCAAAGACTTACTACCGGTGAAGTAGAAATGAACGTCAACGGTTCATTTGAATCATCCGGTGTTACTGCTGGAAATAGAGGAGTTCACACAACAGGTGAAATTTCATCTGGAGCAGTGAATGCGCTTCGCATTTGGAACGCAGATTATGGAGCCATTTTTAGACGTTCAGAAGGCAGTCTTCATATTATTCCAACTGCTTACGGTGAAGGTAAACATGGTGATATCGGTCCACTTCGCCCGTTTAGTATGGCTTTAGATACTGGTAAAGTTACTATTCCAGATTTACAATCAAGTTACAATACGTTCGCAGCAAACGGTTATATTAAATTTACTGGTCATGGCGCGGGCGCTGGTGGTTATGATATTCAATATGTTCAAGCAGCTCCTGTTTTCCAGGAAATCGATGATGATGCTGTAAGCAAATATTATCCTATTGTTAAACAGAAGTTTTTAAATGGTAAAGCCGTTTGGTCTTTAGGTACTGAAATTAGTTCAGGTACATTCGTTATTCATCATCTGAAAGAAGATGGTTCACAAGGCCATACGTCTCGTTTTAATCAAGACGGTACTGTTAACTTCCCGGATAACGTTCTGGTCGGCGGTGGCGAAGCTGCTATTGCTCGTAATGGTAATATTTTCTCGGATATTTGGAAAACGTTTACTTCAGCAGGAGACATTACAAATATTCGCGATGCAATAGCTACTCGTGTTGCTAAAGAAGGCGATACGATGACCGGCACTCTTTGGATTAATAAAGATGCTGCTGGGATAGTTCTTAATCCTCCTTTAGCTAGTGATTCATCATTTATTCGTTCTGATACGGCCGGGGAGAATAATTGGTATATTGGTAAAGGCGGTGCCGACAATGGTCTAGGTTTTTACAGTTACATTACACAAGGCGGTGTATACATAACAAATACCGGTGAAATATCGCTTTCTCCTCAAGGACAAGGAACATTTCATTTTAATAGAGACCGCCTTTATATAAATGCTAGTCAATGGGTTGCACATAAATCTGGCGCTTGGGGCGACCAATGGGGCTTAGAAGCTCCTGTATTTGTAGATTTTGGTAGTGTCGGCAATGACTCCTATTATCCTATTATTAAAGGAAAATCTGGTATTACTAACGAAGGATACGTATCAGGCGTAGATTTTGGTATGCGCCGTATCACTAACCAATGGGCTCAGGCTATTATTCGTGTTGGTAACCAGGAAAATGCTAGCGATCCGCAAGCTATCTTCGAATTCCACCATAATGGAAACATGTACGTTCCTGACATGGTTAAAGCTGGAGTAAGAATATCAGCTGGTGGAGGTGATCCTGCATGGACAGGCGCATGTGTTGTTATTGGTGATAATGATACTGGTTTAGTCCATGGTGGTGACGGCCGAATCAATATGGTTGCAAATGGAGTGCATATTGCTTCATGGTCGGCCGCTTACCAACTCCATGAAGGTCTTTGGGATACTACTGGTGCTTTGTGGACTGAGCAAGGAAGAGCTATTATTTCTTTTGGTCATTTAATTCAACAAAGCGATGCCTATTCAACATTTGTCCGTGATGTTTATGTCCGTTCTGATATTCGTGTTAAAAAAGACCTTGTTAAATTTGAAAATGCTTCTGAGAAGCTTTCTAAAATTAACGGTTACACTTATATGCAGAAGCGAGGCTTAGATGAAGAAGGCAATCAGAAATGGGAACCTAACGCCGGTTTGATAGCTCAAGAAGTTCAAGCTATTTTGCCTGAATTAGTTGAAGGTGACCCTGATGGCGAAGCTTTACTTCGTTTGAACTATAACGGTGTAATTGGTTTAAATACAGCTGCAATCAATGAGCATACTGCAGAAATTGCAGAACTTAAATCAGAAATCGAAGAACTTAAAGCATTAATTAAATCATTGTTAAAATAA
Gene Ontology
No Gene Ontology terms available.
Enzymatic activity
No enzymatic activity data available.
Tertiary structure
PDB ID
386752a5ad319ed85676505c482ffc4c42ea5703a77a071ba4853725edce1c1f
Literature
| Title | Authors | Date | PMID | Source |
|---|---|---|---|---|
| Complete Genome Sequence of E. coli O157:H7 Bacteriophage PEC04 | Lee,J.-H. and Lee,H.Y. | 2016-12-29 | — | GenBank |