Protein

Genbank accession
USL83645.1 [GenBank]
Protein name
long tail fiber proximal subunit
RBP type
TF
Evidence RBPdetect2
Probability 0,95
TF
Evidence Phold
Probability 1,00
Protein sequence
MYSIKTDLAVTGNTNVGKELSVKGNAVFDKNVTIKGTVSFADATFTAITVDQATINTTLDVTGKASLKGGMDVLGNTVIGNTTAGSDTATINSNATFNGTSTFAKDITQTSGKAIFQDTTTSALEVNGTTTLNGNLTAAAATTASFDKLTANEATIATVSATDITATGATVENLTVTGKLDGDFTLGDVNTDNLVVEKLSTLKGAVTLESNIIGTNTVANIKAVSLGSNAADSTARLGFAYTAPGLRPTVILQNEVQSELMTPANLTVLKTATFGDVSAATNGITAKGLNLFDYLTLSGNSIQDPTTPILRVTKGKTQLTDLQVDGTTNITGKTTVGDLDITGTLSGNFVLSDITADNLVVEKLTTLKGALNLESNIVGSTANANLKSVTLGGNVADTNAKVNFTYTAPGLRPTVILQNEVQSELMTPANLTVLKTATFGDVSASTYGITAKGLNLFDYLKITGNAVQDPNTLTLDVDGKAQFKDVNFTGTVTGFVPDISGQDITPKDVTASGNISGVNLDASGTLTVDGDSVLKGTTITDLTVTGTTTGITLAGQDITPKDVTASGNVKGVDVTASGNLTVDGTTTLVGNTVVDGLFEVVGQTTTVKDLNVTGTLSGAAIKANVDGLDILPNSVTTTEEVAVGTNLSVGGNALFSGLKVEVTGKVTGVGSDALETGSIESDGTISAPNITATTKVTAASAQITGTGTGLSVDHNASVGGDLNVTGTLTAGVIDLSAADVTVKTLDVSESAHIGGNLTVDGTVDLSAADVSVKSLTSAGPVISNDATGTNILPKLQSTDITTTNSTTGTATVTTANISTLNVTGESTLAAVSAVSVTTPSIVNTDGINLENDTVAHGDLTVKGTFTPEGGLDLSPVDISSKSLTTTEGATIGGSLTVDGAINAAAADLTVKSLTSSGVITVTENTEPSILPKLTSTEATAGKLNVTGDATVGGKATVSGALEVTGTSTFGNAVTVNVGGITAKGGLTVASGNLKVAAAAVVDGSVSAGSYTSAGDKITLAKPTDVTGDLHVEGAFTATSVDFSTTDLTVKSLQVDNDVTIDGNLTITNADLETNSLASTTSTTVGTDLILTTGTITGAPTISGATTLSSTLHTVGAATFDGTVDVGGKITSKSIQVSATGVGVAVDNDATVGGYLTIGETLGVTGLSTLSGGVDAGSALIKTTGEVQSATLQTSGKATLASVDVSGDAVVTGDLTVKGAFTPEGSLNLGSAVLNVEGVDASANLTALGSVTAGTTLTVTGVSTLNGGTNTTTLSTSGKATLSSAEVTGALSAGGALAVTGTTNLTGKLTAGEAALSSLTVSGDVTINGTLNPGTLDLSTTPVDAKSLKSRETLEVTGLSTLTGGLAVSANTAITAAGDITGTTITTTGKGTFGSAAVTTGLTVGGALVVNGASVNISDASTVTMPKADISAKGIIIGPKVSSRPETIQFVGDTYIGSNLFVAGNINGSVDLAGQDISLNSLTSNTTIHAVEDITTDEDMHARAATFGAQGSTANSLTVNGNAVTTGDFTVSGKIIGTLDQSASAVEVKSLTSTTFIAAGTTLTVGSTITAEGLSTLKGGIATNGATINAGDGAITTTGDVSGANVSASGAVTTATITTSGLATMASAKINTTLAVTGATTLSDVVTIGKKLTVSTGGIEITAGGFNVVAGGAAITGATNLKGAVTLGSASADAITVTGTSSFAENATFAKDVTIEGTLHTDIADLVTESVTTKKYAVTPSPKVTASTAAVGGNWTPDGLSNVYYITLDQNVMMTPITGLIGSGKAGSYYIYVAQDTTGGHSFDWDGTYANVGGEINTNPGGVSIVQLIYDGYSPVVDMFIAQRTA
Physico‐chemical
properties
protein length:1845 AA
molecular weight: 182553,36040 Da
isoelectric point:4,29859
aromaticity:0,03089
hydropathy:0,19718

Domains

Domains [InterPro]
USL83645.1
1 1845
Legend: Pfam SMART CDD TIGRFAM HAMAP SUPFAM PRINTS Gene3D PANTHER Other

Taxonomy

  Name Taxonomy ID Lineage
Phage Escherichia phage A4
[NCBI]
2950725 Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host No host information

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
USL83645.1 [NCBI]
Genbank nucleotide accession
ON286972 [NCBI]
CDS location
range 162381 -> 167918
strand -
CDS
ATGTACTCGATAAAAACAGATCTAGCAGTAACTGGTAATACTAATGTTGGTAAAGAATTATCAGTTAAAGGTAATGCGGTCTTCGATAAAAACGTAACCATTAAGGGGACCGTTAGTTTCGCTGATGCTACCTTCACTGCAATTACAGTAGATCAAGCAACAATCAACACAACACTCGATGTTACAGGCAAAGCGTCACTTAAGGGTGGAATGGATGTACTTGGCAATACAGTTATTGGTAATACTACTGCTGGTTCCGATACAGCAACTATTAATTCCAATGCTACTTTTAATGGCACTTCTACTTTTGCCAAAGATATTACACAAACATCAGGAAAAGCAATTTTTCAAGATACCACCACTTCTGCATTAGAAGTTAATGGTACAACAACATTAAATGGTAACCTCACTGCTGCGGCAGCAACCACTGCAAGCTTTGATAAATTAACTGCTAATGAAGCAACCATTGCAACTGTATCAGCAACTGATATTACTGCAACTGGTGCAACCGTTGAGAATCTAACTGTAACTGGTAAATTAGATGGTGATTTCACATTAGGGGATGTTAATACCGATAATTTAGTTGTTGAAAAACTATCTACATTAAAAGGTGCTGTAACCCTAGAATCAAACATCATTGGTACTAATACTGTAGCAAACATAAAAGCTGTATCTTTAGGTTCTAATGCAGCGGACTCGACTGCACGCCTAGGCTTTGCATACACTGCTCCAGGATTACGCCCAACTGTAATTCTACAAAACGAAGTACAGTCCGAGCTAATGACTCCAGCAAATCTAACAGTACTTAAAACTGCTACATTTGGTGATGTATCAGCAGCAACCAATGGTATTACCGCAAAAGGTTTGAACCTATTTGATTACCTAACACTTTCTGGTAACTCAATACAAGATCCAACCACACCAATTCTACGTGTAACTAAAGGTAAAACACAATTAACTGACCTACAAGTTGATGGAACTACTAATATTACTGGTAAAACTACTGTTGGTGATTTGGATATTACTGGAACACTATCAGGTAACTTTGTACTAAGTGATATTACTGCGGATAATTTAGTTGTTGAAAAACTAACTACACTAAAAGGTGCATTAAACCTAGAATCTAATATTGTTGGTTCAACTGCGAATGCTAATTTAAAATCTGTCACTTTAGGTGGAAACGTAGCAGACACGAATGCTAAAGTTAACTTTACATATACTGCTCCTGGTTTACGCCCAACTGTAATTCTACAAAACGAAGTACAGTCTGAATTAATGACCCCAGCAAATCTAACAGTACTGAAAACTGCTACATTTGGTGATGTATCTGCATCTACCTACGGTATTACAGCAAAAGGTTTGAACCTATTTGATTATTTGAAAATAACTGGTAATGCGGTACAAGATCCAAATACATTAACTCTAGATGTGGATGGTAAGGCTCAATTCAAAGACGTTAATTTCACTGGTACAGTTACTGGTTTTGTTCCTGACATTTCTGGTCAAGATATTACACCTAAAGATGTAACTGCTTCTGGTAATATTAGTGGTGTTAATCTAGATGCTTCTGGTACACTAACAGTTGATGGGGATTCCGTTCTAAAAGGCACAACTATAACTGATTTGACTGTTACTGGAACTACAACTGGTATTACACTAGCTGGTCAAGACATTACTCCTAAAGATGTAACTGCATCTGGTAATGTTAAAGGTGTTGACGTAACTGCATCTGGAAACCTAACAGTTGACGGTACTACCACATTGGTTGGTAACACGGTAGTTGATGGTTTATTTGAAGTTGTTGGTCAAACAACCACTGTTAAAGATTTGAACGTTACTGGTACACTATCTGGTGCTGCAATTAAAGCAAACGTTGATGGTCTAGACATTCTACCTAATTCTGTAACCACAACTGAAGAAGTTGCAGTGGGAACTAATCTAAGTGTTGGTGGAAACGCACTCTTTAGTGGCTTGAAAGTTGAAGTTACTGGTAAAGTTACTGGTGTTGGTTCTGATGCATTAGAAACTGGTTCAATTGAATCTGACGGTACTATCTCTGCCCCAAATATCACAGCAACTACTAAAGTGACCGCAGCTTCCGCACAAATTACCGGAACCGGAACTGGTCTAAGTGTAGATCATAATGCATCAGTTGGTGGTGATTTGAATGTTACTGGAACTTTAACGGCTGGTGTTATTGACCTAAGTGCGGCTGATGTAACTGTTAAAACACTTGATGTATCTGAAAGTGCACATATAGGTGGAAACCTAACTGTTGATGGTACTGTAGATTTAAGTGCAGCAGATGTAAGTGTTAAATCTTTAACTAGTGCTGGTCCTGTGATTAGTAATGATGCTACTGGAACTAACATTCTACCAAAATTACAAAGTACTGATATTACTACAACTAACAGTACAACTGGTACAGCAACAGTAACTACAGCAAACATTTCTACATTAAATGTTACTGGTGAAAGTACATTGGCTGCTGTTTCTGCTGTTTCTGTAACTACTCCTTCTATTGTTAATACCGATGGTATTAATTTAGAAAATGATACAGTTGCACATGGTGACTTAACTGTTAAAGGTACATTTACACCTGAAGGTGGATTAGATTTAAGCCCAGTTGATATCAGTTCTAAATCATTAACAACAACTGAAGGTGCAACCATTGGTGGAAGCTTAACTGTTGATGGTGCAATTAATGCTGCTGCGGCAGATCTAACTGTTAAATCACTAACTTCTTCTGGTGTTATTACTGTTACTGAAAATACTGAACCAAGTATTCTACCAAAACTAACAAGTACTGAAGCAACCGCTGGTAAATTGAATGTTACTGGTGATGCAACAGTCGGTGGTAAAGCGACCGTTTCTGGTGCACTTGAAGTTACTGGTACTTCAACATTTGGTAACGCAGTAACTGTAAACGTCGGTGGTATTACTGCTAAAGGTGGCTTGACTGTTGCTTCTGGAAACTTGAAAGTTGCTGCTGCGGCAGTGGTTGATGGTTCAGTAAGTGCTGGTTCATACACAAGTGCTGGAGATAAAATAACACTAGCTAAACCAACAGATGTTACTGGTGATTTGCACGTTGAAGGTGCTTTCACTGCAACTTCCGTTGATTTTAGTACAACTGATTTGACTGTTAAATCACTACAAGTTGATAATGACGTTACTATCGATGGTAACTTGACTATCACAAATGCTGATTTGGAAACTAACTCATTAGCAAGTACTACAAGTACTACTGTTGGTACTGACCTAATTCTAACTACTGGTACAATTACTGGTGCTCCAACAATTTCTGGTGCAACTACACTAAGTTCAACCCTACATACTGTAGGTGCTGCAACTTTTGATGGTACTGTTGATGTTGGTGGTAAAATTACTTCTAAATCAATCCAAGTAAGTGCTACTGGTGTTGGTGTAGCAGTTGATAATGACGCAACTGTTGGTGGTTATTTGACAATTGGTGAAACATTAGGTGTTACTGGACTAAGTACTCTATCTGGTGGGGTTGATGCAGGTTCTGCATTAATCAAAACTACTGGTGAAGTTCAATCCGCAACTCTACAAACTTCTGGTAAAGCAACACTAGCAAGTGTTGATGTTTCAGGTGATGCAGTTGTTACTGGTGACCTAACTGTTAAAGGTGCATTTACACCTGAAGGTAGCCTAAACTTAGGTTCTGCTGTTCTAAACGTTGAAGGTGTTGATGCAAGTGCTAACTTAACTGCACTCGGTTCTGTAACTGCTGGTACTACACTAACTGTTACTGGTGTTTCAACTCTAAATGGTGGTACTAACACTACTACTCTTTCAACAAGTGGTAAAGCTACATTAAGTAGTGCGGAAGTTACTGGTGCTCTAAGTGCTGGTGGTGCTTTGGCTGTTACTGGTACTACAAATCTAACTGGAAAACTAACCGCTGGTGAAGCTGCTCTCAGTTCACTAACAGTTTCTGGTGATGTTACCATTAATGGAACACTAAACCCTGGAACATTGGATCTATCTACTACTCCAGTTGATGCGAAAAGCTTGAAATCCAGAGAAACACTAGAAGTTACTGGTCTAAGCACTCTAACTGGTGGTTTGGCTGTTAGTGCAAATACCGCAATCACTGCTGCTGGTGACATTACTGGTACTACAATTACCACAACTGGTAAAGGTACATTTGGTAGTGCAGCGGTAACTACTGGTTTGACTGTTGGTGGTGCTTTGGTTGTTAATGGTGCATCCGTGAACATCTCTGATGCTTCTACTGTGACTATGCCTAAAGCTGATATTTCTGCGAAAGGTATTATCATCGGTCCTAAAGTTAGTTCAAGACCGGAAACTATCCAATTTGTTGGTGATACTTATATTGGTAGTAACCTATTTGTTGCTGGTAATATTAACGGTTCAGTAGATTTGGCTGGTCAGGATATTTCCCTGAACTCATTAACTTCTAATACCACAATTCACGCAGTTGAGGATATTACTACTGATGAAGATATGCACGCACGTGCTGCAACATTCGGTGCACAAGGTTCAACAGCTAACAGCCTAACTGTTAATGGTAACGCAGTAACTACTGGCGACTTTACTGTTAGTGGTAAGATTATTGGTACACTGGACCAATCTGCAAGTGCAGTTGAAGTTAAATCTCTAACTTCTACAACCTTTATCGCTGCTGGTACAACCCTAACAGTTGGTTCAACAATCACTGCTGAAGGTTTGAGTACTTTGAAAGGTGGTATTGCAACTAATGGTGCTACTATCAACGCTGGTGATGGTGCAATCACCACAACTGGTGATGTGTCTGGTGCAAACGTTAGTGCGTCTGGTGCAGTAACTACTGCAACTATTACAACTTCTGGCCTAGCAACTATGGCAAGTGCTAAGATTAACACAACTCTAGCAGTTACTGGTGCAACTACACTATCTGATGTTGTTACTATCGGTAAGAAACTAACTGTTAGTACTGGTGGTATCGAAATCACTGCGGGTGGCTTCAATGTAGTTGCGGGTGGTGCAGCAATTACTGGTGCTACTAACCTTAAAGGTGCTGTAACACTAGGTTCTGCGTCTGCTGATGCAATCACAGTTACTGGTACATCTTCATTTGCTGAAAATGCAACATTTGCTAAAGATGTAACTATTGAAGGTACACTACATACAGATATTGCTGATTTAGTAACTGAAAGTGTAACTACTAAAAAGTATGCTGTTACTCCATCACCTAAAGTTACTGCAAGTACTGCTGCTGTTGGTGGTAATTGGACACCAGATGGTCTATCAAATGTGTATTATATAACACTAGATCAAAACGTAATGATGACACCAATAACTGGTTTAATTGGTAGTGGTAAAGCTGGTTCTTATTATATCTATGTCGCACAAGATACAACTGGTGGACATAGTTTTGATTGGGACGGAACTTATGCAAACGTTGGTGGTGAAATTAACACAAATCCAGGTGGAGTGAGTATCGTTCAGTTGATTTATGATGGATACAGTCCAGTAGTAGATATGTTTATTGCTCAACGTACTGCTTAA

Gene Ontology

No Gene Ontology terms available.

Enzymatic activity

No enzymatic activity data available.

Tertiary structure

PDB ID
81538d7b3b4436f1a041e1bee22856f8dff9bafb26aaa499100980226d024f22
ColabFold
Source ColabFold
Method ColabFold
Resolution 0,5161
Evidence 0,5161

Literature

No literature entries available.