Protein
- Genbank accession
- USL83645.1 [GenBank]
- Protein name
- long tail fiber proximal subunit
- RBP type
-
TFTF
- Protein sequence
-
MYSIKTDLAVTGNTNVGKELSVKGNAVFDKNVTIKGTVSFADATFTAITVDQATINTTLDVTGKASLKGGMDVLGNTVIGNTTAGSDTATINSNATFNGTSTFAKDITQTSGKAIFQDTTTSALEVNGTTTLNGNLTAAAATTASFDKLTANEATIATVSATDITATGATVENLTVTGKLDGDFTLGDVNTDNLVVEKLSTLKGAVTLESNIIGTNTVANIKAVSLGSNAADSTARLGFAYTAPGLRPTVILQNEVQSELMTPANLTVLKTATFGDVSAATNGITAKGLNLFDYLTLSGNSIQDPTTPILRVTKGKTQLTDLQVDGTTNITGKTTVGDLDITGTLSGNFVLSDITADNLVVEKLTTLKGALNLESNIVGSTANANLKSVTLGGNVADTNAKVNFTYTAPGLRPTVILQNEVQSELMTPANLTVLKTATFGDVSASTYGITAKGLNLFDYLKITGNAVQDPNTLTLDVDGKAQFKDVNFTGTVTGFVPDISGQDITPKDVTASGNISGVNLDASGTLTVDGDSVLKGTTITDLTVTGTTTGITLAGQDITPKDVTASGNVKGVDVTASGNLTVDGTTTLVGNTVVDGLFEVVGQTTTVKDLNVTGTLSGAAIKANVDGLDILPNSVTTTEEVAVGTNLSVGGNALFSGLKVEVTGKVTGVGSDALETGSIESDGTISAPNITATTKVTAASAQITGTGTGLSVDHNASVGGDLNVTGTLTAGVIDLSAADVTVKTLDVSESAHIGGNLTVDGTVDLSAADVSVKSLTSAGPVISNDATGTNILPKLQSTDITTTNSTTGTATVTTANISTLNVTGESTLAAVSAVSVTTPSIVNTDGINLENDTVAHGDLTVKGTFTPEGGLDLSPVDISSKSLTTTEGATIGGSLTVDGAINAAAADLTVKSLTSSGVITVTENTEPSILPKLTSTEATAGKLNVTGDATVGGKATVSGALEVTGTSTFGNAVTVNVGGITAKGGLTVASGNLKVAAAAVVDGSVSAGSYTSAGDKITLAKPTDVTGDLHVEGAFTATSVDFSTTDLTVKSLQVDNDVTIDGNLTITNADLETNSLASTTSTTVGTDLILTTGTITGAPTISGATTLSSTLHTVGAATFDGTVDVGGKITSKSIQVSATGVGVAVDNDATVGGYLTIGETLGVTGLSTLSGGVDAGSALIKTTGEVQSATLQTSGKATLASVDVSGDAVVTGDLTVKGAFTPEGSLNLGSAVLNVEGVDASANLTALGSVTAGTTLTVTGVSTLNGGTNTTTLSTSGKATLSSAEVTGALSAGGALAVTGTTNLTGKLTAGEAALSSLTVSGDVTINGTLNPGTLDLSTTPVDAKSLKSRETLEVTGLSTLTGGLAVSANTAITAAGDITGTTITTTGKGTFGSAAVTTGLTVGGALVVNGASVNISDASTVTMPKADISAKGIIIGPKVSSRPETIQFVGDTYIGSNLFVAGNINGSVDLAGQDISLNSLTSNTTIHAVEDITTDEDMHARAATFGAQGSTANSLTVNGNAVTTGDFTVSGKIIGTLDQSASAVEVKSLTSTTFIAAGTTLTVGSTITAEGLSTLKGGIATNGATINAGDGAITTTGDVSGANVSASGAVTTATITTSGLATMASAKINTTLAVTGATTLSDVVTIGKKLTVSTGGIEITAGGFNVVAGGAAITGATNLKGAVTLGSASADAITVTGTSSFAENATFAKDVTIEGTLHTDIADLVTESVTTKKYAVTPSPKVTASTAAVGGNWTPDGLSNVYYITLDQNVMMTPITGLIGSGKAGSYYIYVAQDTTGGHSFDWDGTYANVGGEINTNPGGVSIVQLIYDGYSPVVDMFIAQRTA
- Physico‐chemical
properties -
protein length: 1845 AA molecular weight: 182553,36040 Da isoelectric point: 4,29859 aromaticity: 0,03089 hydropathy: 0,19718
Domains
Domains [InterPro]
IPR058970
1754–1832
1754–1832
1
1845
Legend:
Pfam
SMART
CDD
TIGRFAM
HAMAP
SUPFAM
PRINTS
Gene3D
PANTHER
Other
Taxonomy
| Name | Taxonomy ID | Lineage | |
|---|---|---|---|
| Phage |
Escherichia phage A4 [NCBI] |
2950725 | Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes |
| Host | No host information | ||
Coding sequence (CDS)
Coding sequence (CDS)
Genbank protein accession
USL83645.1
[NCBI]
Genbank nucleotide accession
ON286972
[NCBI]
CDS location
range 162381 -> 167918
strand -
strand -
CDS
ATGTACTCGATAAAAACAGATCTAGCAGTAACTGGTAATACTAATGTTGGTAAAGAATTATCAGTTAAAGGTAATGCGGTCTTCGATAAAAACGTAACCATTAAGGGGACCGTTAGTTTCGCTGATGCTACCTTCACTGCAATTACAGTAGATCAAGCAACAATCAACACAACACTCGATGTTACAGGCAAAGCGTCACTTAAGGGTGGAATGGATGTACTTGGCAATACAGTTATTGGTAATACTACTGCTGGTTCCGATACAGCAACTATTAATTCCAATGCTACTTTTAATGGCACTTCTACTTTTGCCAAAGATATTACACAAACATCAGGAAAAGCAATTTTTCAAGATACCACCACTTCTGCATTAGAAGTTAATGGTACAACAACATTAAATGGTAACCTCACTGCTGCGGCAGCAACCACTGCAAGCTTTGATAAATTAACTGCTAATGAAGCAACCATTGCAACTGTATCAGCAACTGATATTACTGCAACTGGTGCAACCGTTGAGAATCTAACTGTAACTGGTAAATTAGATGGTGATTTCACATTAGGGGATGTTAATACCGATAATTTAGTTGTTGAAAAACTATCTACATTAAAAGGTGCTGTAACCCTAGAATCAAACATCATTGGTACTAATACTGTAGCAAACATAAAAGCTGTATCTTTAGGTTCTAATGCAGCGGACTCGACTGCACGCCTAGGCTTTGCATACACTGCTCCAGGATTACGCCCAACTGTAATTCTACAAAACGAAGTACAGTCCGAGCTAATGACTCCAGCAAATCTAACAGTACTTAAAACTGCTACATTTGGTGATGTATCAGCAGCAACCAATGGTATTACCGCAAAAGGTTTGAACCTATTTGATTACCTAACACTTTCTGGTAACTCAATACAAGATCCAACCACACCAATTCTACGTGTAACTAAAGGTAAAACACAATTAACTGACCTACAAGTTGATGGAACTACTAATATTACTGGTAAAACTACTGTTGGTGATTTGGATATTACTGGAACACTATCAGGTAACTTTGTACTAAGTGATATTACTGCGGATAATTTAGTTGTTGAAAAACTAACTACACTAAAAGGTGCATTAAACCTAGAATCTAATATTGTTGGTTCAACTGCGAATGCTAATTTAAAATCTGTCACTTTAGGTGGAAACGTAGCAGACACGAATGCTAAAGTTAACTTTACATATACTGCTCCTGGTTTACGCCCAACTGTAATTCTACAAAACGAAGTACAGTCTGAATTAATGACCCCAGCAAATCTAACAGTACTGAAAACTGCTACATTTGGTGATGTATCTGCATCTACCTACGGTATTACAGCAAAAGGTTTGAACCTATTTGATTATTTGAAAATAACTGGTAATGCGGTACAAGATCCAAATACATTAACTCTAGATGTGGATGGTAAGGCTCAATTCAAAGACGTTAATTTCACTGGTACAGTTACTGGTTTTGTTCCTGACATTTCTGGTCAAGATATTACACCTAAAGATGTAACTGCTTCTGGTAATATTAGTGGTGTTAATCTAGATGCTTCTGGTACACTAACAGTTGATGGGGATTCCGTTCTAAAAGGCACAACTATAACTGATTTGACTGTTACTGGAACTACAACTGGTATTACACTAGCTGGTCAAGACATTACTCCTAAAGATGTAACTGCATCTGGTAATGTTAAAGGTGTTGACGTAACTGCATCTGGAAACCTAACAGTTGACGGTACTACCACATTGGTTGGTAACACGGTAGTTGATGGTTTATTTGAAGTTGTTGGTCAAACAACCACTGTTAAAGATTTGAACGTTACTGGTACACTATCTGGTGCTGCAATTAAAGCAAACGTTGATGGTCTAGACATTCTACCTAATTCTGTAACCACAACTGAAGAAGTTGCAGTGGGAACTAATCTAAGTGTTGGTGGAAACGCACTCTTTAGTGGCTTGAAAGTTGAAGTTACTGGTAAAGTTACTGGTGTTGGTTCTGATGCATTAGAAACTGGTTCAATTGAATCTGACGGTACTATCTCTGCCCCAAATATCACAGCAACTACTAAAGTGACCGCAGCTTCCGCACAAATTACCGGAACCGGAACTGGTCTAAGTGTAGATCATAATGCATCAGTTGGTGGTGATTTGAATGTTACTGGAACTTTAACGGCTGGTGTTATTGACCTAAGTGCGGCTGATGTAACTGTTAAAACACTTGATGTATCTGAAAGTGCACATATAGGTGGAAACCTAACTGTTGATGGTACTGTAGATTTAAGTGCAGCAGATGTAAGTGTTAAATCTTTAACTAGTGCTGGTCCTGTGATTAGTAATGATGCTACTGGAACTAACATTCTACCAAAATTACAAAGTACTGATATTACTACAACTAACAGTACAACTGGTACAGCAACAGTAACTACAGCAAACATTTCTACATTAAATGTTACTGGTGAAAGTACATTGGCTGCTGTTTCTGCTGTTTCTGTAACTACTCCTTCTATTGTTAATACCGATGGTATTAATTTAGAAAATGATACAGTTGCACATGGTGACTTAACTGTTAAAGGTACATTTACACCTGAAGGTGGATTAGATTTAAGCCCAGTTGATATCAGTTCTAAATCATTAACAACAACTGAAGGTGCAACCATTGGTGGAAGCTTAACTGTTGATGGTGCAATTAATGCTGCTGCGGCAGATCTAACTGTTAAATCACTAACTTCTTCTGGTGTTATTACTGTTACTGAAAATACTGAACCAAGTATTCTACCAAAACTAACAAGTACTGAAGCAACCGCTGGTAAATTGAATGTTACTGGTGATGCAACAGTCGGTGGTAAAGCGACCGTTTCTGGTGCACTTGAAGTTACTGGTACTTCAACATTTGGTAACGCAGTAACTGTAAACGTCGGTGGTATTACTGCTAAAGGTGGCTTGACTGTTGCTTCTGGAAACTTGAAAGTTGCTGCTGCGGCAGTGGTTGATGGTTCAGTAAGTGCTGGTTCATACACAAGTGCTGGAGATAAAATAACACTAGCTAAACCAACAGATGTTACTGGTGATTTGCACGTTGAAGGTGCTTTCACTGCAACTTCCGTTGATTTTAGTACAACTGATTTGACTGTTAAATCACTACAAGTTGATAATGACGTTACTATCGATGGTAACTTGACTATCACAAATGCTGATTTGGAAACTAACTCATTAGCAAGTACTACAAGTACTACTGTTGGTACTGACCTAATTCTAACTACTGGTACAATTACTGGTGCTCCAACAATTTCTGGTGCAACTACACTAAGTTCAACCCTACATACTGTAGGTGCTGCAACTTTTGATGGTACTGTTGATGTTGGTGGTAAAATTACTTCTAAATCAATCCAAGTAAGTGCTACTGGTGTTGGTGTAGCAGTTGATAATGACGCAACTGTTGGTGGTTATTTGACAATTGGTGAAACATTAGGTGTTACTGGACTAAGTACTCTATCTGGTGGGGTTGATGCAGGTTCTGCATTAATCAAAACTACTGGTGAAGTTCAATCCGCAACTCTACAAACTTCTGGTAAAGCAACACTAGCAAGTGTTGATGTTTCAGGTGATGCAGTTGTTACTGGTGACCTAACTGTTAAAGGTGCATTTACACCTGAAGGTAGCCTAAACTTAGGTTCTGCTGTTCTAAACGTTGAAGGTGTTGATGCAAGTGCTAACTTAACTGCACTCGGTTCTGTAACTGCTGGTACTACACTAACTGTTACTGGTGTTTCAACTCTAAATGGTGGTACTAACACTACTACTCTTTCAACAAGTGGTAAAGCTACATTAAGTAGTGCGGAAGTTACTGGTGCTCTAAGTGCTGGTGGTGCTTTGGCTGTTACTGGTACTACAAATCTAACTGGAAAACTAACCGCTGGTGAAGCTGCTCTCAGTTCACTAACAGTTTCTGGTGATGTTACCATTAATGGAACACTAAACCCTGGAACATTGGATCTATCTACTACTCCAGTTGATGCGAAAAGCTTGAAATCCAGAGAAACACTAGAAGTTACTGGTCTAAGCACTCTAACTGGTGGTTTGGCTGTTAGTGCAAATACCGCAATCACTGCTGCTGGTGACATTACTGGTACTACAATTACCACAACTGGTAAAGGTACATTTGGTAGTGCAGCGGTAACTACTGGTTTGACTGTTGGTGGTGCTTTGGTTGTTAATGGTGCATCCGTGAACATCTCTGATGCTTCTACTGTGACTATGCCTAAAGCTGATATTTCTGCGAAAGGTATTATCATCGGTCCTAAAGTTAGTTCAAGACCGGAAACTATCCAATTTGTTGGTGATACTTATATTGGTAGTAACCTATTTGTTGCTGGTAATATTAACGGTTCAGTAGATTTGGCTGGTCAGGATATTTCCCTGAACTCATTAACTTCTAATACCACAATTCACGCAGTTGAGGATATTACTACTGATGAAGATATGCACGCACGTGCTGCAACATTCGGTGCACAAGGTTCAACAGCTAACAGCCTAACTGTTAATGGTAACGCAGTAACTACTGGCGACTTTACTGTTAGTGGTAAGATTATTGGTACACTGGACCAATCTGCAAGTGCAGTTGAAGTTAAATCTCTAACTTCTACAACCTTTATCGCTGCTGGTACAACCCTAACAGTTGGTTCAACAATCACTGCTGAAGGTTTGAGTACTTTGAAAGGTGGTATTGCAACTAATGGTGCTACTATCAACGCTGGTGATGGTGCAATCACCACAACTGGTGATGTGTCTGGTGCAAACGTTAGTGCGTCTGGTGCAGTAACTACTGCAACTATTACAACTTCTGGCCTAGCAACTATGGCAAGTGCTAAGATTAACACAACTCTAGCAGTTACTGGTGCAACTACACTATCTGATGTTGTTACTATCGGTAAGAAACTAACTGTTAGTACTGGTGGTATCGAAATCACTGCGGGTGGCTTCAATGTAGTTGCGGGTGGTGCAGCAATTACTGGTGCTACTAACCTTAAAGGTGCTGTAACACTAGGTTCTGCGTCTGCTGATGCAATCACAGTTACTGGTACATCTTCATTTGCTGAAAATGCAACATTTGCTAAAGATGTAACTATTGAAGGTACACTACATACAGATATTGCTGATTTAGTAACTGAAAGTGTAACTACTAAAAAGTATGCTGTTACTCCATCACCTAAAGTTACTGCAAGTACTGCTGCTGTTGGTGGTAATTGGACACCAGATGGTCTATCAAATGTGTATTATATAACACTAGATCAAAACGTAATGATGACACCAATAACTGGTTTAATTGGTAGTGGTAAAGCTGGTTCTTATTATATCTATGTCGCACAAGATACAACTGGTGGACATAGTTTTGATTGGGACGGAACTTATGCAAACGTTGGTGGTGAAATTAACACAAATCCAGGTGGAGTGAGTATCGTTCAGTTGATTTATGATGGATACAGTCCAGTAGTAGATATGTTTATTGCTCAACGTACTGCTTAA
Gene Ontology
No Gene Ontology terms available.
Enzymatic activity
No enzymatic activity data available.
Tertiary structure
PDB ID
81538d7b3b4436f1a041e1bee22856f8dff9bafb26aaa499100980226d024f22
Literature
No literature entries available.