Protein

Genbank accession
AWY07149.1 [GenBank]
Protein name
long tail fiber, distal subunit
RBP type
TSP
Evidence RBPdetect
Probability 0,77
TF
Evidence RBPdetect2
Probability 0,96
TF
Evidence Phold
Probability 1,00
Protein sequence
MADQNLKQIQFKRTSTENKAPGADIVARGEIALNTHGRTLAIYTKDEADNVVQLAGKGVPFLDTSGTLSVDGTTTLKDNVTISPNKAINFETTDLSGEITRHIVGKCATNDGWYIGAGGTSNSGILEIGTIDDGAETIQFVQRGAGNVEARKLVLLDGSGNTTLPGDLRLSTNKTVKINSGSTLVLEMGVGSNDVYIKNQRGTGVLQLTNDSNLTFRNSQVYYAMSGRGPGKSGTLLTNVENNRQAWQYTISASTATTSRWVKVATMKHPGMASSQLDLMISGGIDSGHGKHYVDFITLSGRNLTSWSTNNLDNWVEWRRVGSPSKTNVPEYYVVKNDSATDADASFDFYAKVPRYSNDLYVTVLNTSGYNGQSSGSVIIYETGQDTGATGPSGSILVSMKQIFDSYAKPDFGDTTGTLPVNRGGTGATNVGDARNNLGLRTAAVRDVGESSGNVMEVGAFGIGGNGKSLVDITSDVDLMTRLKALGGTVFRANTASGYTGAPYYSHGTGFYGRASDTMAALNIDYATGNVRVFAINDSGLASGRVNSNVLYGTANKPSKADVGLGNLTNDTQVKKAGDTMTGDLTVPNLHASGTGTASVYVNAGSGNAHVWFRTNGNERGVIWATPNTADLGQINIRAKTTGGTSAGDFSFRSDGRLDVPVAVKVGGAAMLTKDGNITSGSMFGGNLNNYLTSIKNDIVAGDNKQVSKTGDTMTGNLTINANLKVENPNGTFVDLGSENSDKYSRLTLARKVGDGAAVAMLKITPEGYVQFGYQTAVATPSPTKYIRVKPDGLDVEGDLVFNQTYRGTEEAVDISDKTIDLNSLVIKRTDPGTRQLYKCVSSGGGSNISNKPTSDGNFVLEVLSLRKVSDTDWSCKQTFTTKNGGVEGTYIRYAQNGSWSAWKEVVAGVQPINLGGTGATSVAAARNNLGVGEGQTVSFGNLVTNDLTANGNARLVGRLNLGSTSATGVLRANETGAVVLGSASGQNIHIRAGSPDTSSGETRFEPNGNVLVGGAITVSGNLQVNGEATMGRSLIVSQNIKNTNDNSFILMGKDSDLGFVKKSNSGAKLVFASGKSFTVAKSSATTIANPATETYTDVFKIDADGNQTVYGNAQVNRQLTVSSSATVNGIINANGGIIVPTTKYVQIADAPTQNNQATNKKYVDDKVASAISNAGDTYLPLTGGTVTGPLNITGNQLKTTSLWVTGNSALNGALEVGGNVVSNTGIGSFIGAVDVKAPAADNGTTHLWFRHSNGGERGVIYMPRDNNTMMGLRAGGSEWQLDGPTGQMLGPGARWRIHSDGNLQGDVYGGYITNYINDRFNQCAQWVRTGAQQDFGQIGRPAPGKTVPGGWVVVGLNANGNEANQNMQLIGGRLQVWKPGVEWVDSAT
Physico‐chemical
properties
protein length:1389 AA
molecular weight: 145715,91670 Da
isoelectric point:7,58610
aromaticity:0,06695
hydropathy:-0,31447

Domains

Domains [InterPro]
cd19958
819–906
AWY07149.1
1 1389
Legend: Pfam SMART CDD TIGRFAM HAMAP SUPFAM PRINTS Gene3D PANTHER Other

Taxonomy

  Name Taxonomy ID Lineage
Phage Klebsiella phage Mineola
[NCBI]
2234047 Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host No host information

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
AWY07149.1 [NCBI]
Genbank nucleotide accession
MH333064 [NCBI]
CDS location
range 153450 -> 157619
strand +
CDS
ATGGCCGATCAAAACTTAAAACAAATACAATTTAAAAGAACTAGCACAGAGAATAAAGCACCTGGTGCAGATATCGTAGCCCGTGGCGAAATCGCGTTGAATACACATGGGCGTACTCTTGCCATTTACACTAAAGATGAAGCTGATAACGTTGTTCAGCTTGCAGGTAAAGGGGTTCCTTTCTTAGATACCTCTGGCACTCTTAGCGTTGATGGAACTACTACATTAAAAGACAACGTTACTATTTCTCCGAATAAAGCGATAAATTTTGAAACTACTGATTTAAGCGGTGAAATAACTCGTCATATCGTTGGCAAATGTGCTACTAATGATGGCTGGTACATTGGTGCCGGTGGTACAAGCAACAGTGGTATTCTTGAAATCGGTACTATTGATGATGGCGCTGAAACTATTCAATTCGTACAACGCGGCGCGGGCAACGTTGAAGCCCGAAAATTGGTCTTGCTTGACGGCTCGGGTAATACGACTCTTCCTGGCGATTTAAGATTATCCACCAATAAGACTGTTAAAATTAACAGTGGAAGCACTCTTGTTCTTGAAATGGGTGTAGGCTCTAACGACGTCTATATTAAAAACCAAAGAGGCACCGGTGTTCTTCAATTAACTAATGACAGTAATTTAACGTTCAGAAATTCACAGGTGTATTACGCTATGAGCGGAAGAGGCCCTGGTAAATCTGGTACTCTTCTGACGAATGTAGAAAACAATCGTCAGGCTTGGCAATACACTATTTCTGCCTCAACTGCTACAACTTCGCGCTGGGTTAAAGTAGCTACAATGAAGCACCCGGGAATGGCTTCTTCACAGCTGGATTTAATGATTAGCGGTGGTATTGATTCAGGCCACGGCAAGCACTACGTTGATTTTATCACGTTATCTGGGCGAAATTTAACATCTTGGAGCACTAACAATTTAGATAACTGGGTCGAATGGCGTCGAGTTGGTTCTCCTTCTAAAACAAACGTTCCAGAGTATTACGTTGTTAAAAACGATTCTGCCACGGATGCGGATGCTTCATTTGATTTTTACGCTAAGGTTCCTCGATACTCCAATGACCTTTATGTCACAGTACTAAACACTTCTGGGTATAATGGACAAAGTTCTGGTAGTGTAATTATCTATGAAACTGGTCAAGACACCGGTGCTACTGGACCGTCTGGAAGTATTCTTGTTTCGATGAAACAAATTTTTGACAGTTACGCAAAACCAGATTTCGGCGATACTACCGGTACTCTTCCGGTTAACCGAGGTGGTACAGGTGCTACTAACGTAGGAGACGCTCGAAATAACTTAGGTCTTAGAACTGCGGCTGTTCGCGATGTTGGTGAATCTAGCGGAAACGTGATGGAAGTTGGTGCCTTTGGTATTGGTGGTAACGGAAAATCACTAGTAGATATTACTTCTGACGTTGATTTAATGACTCGCCTTAAGGCTCTTGGTGGTACAGTGTTCAGAGCCAACACAGCGAGTGGTTATACCGGGGCTCCTTATTACTCCCATGGCACCGGGTTTTACGGAAGAGCTTCTGACACAATGGCTGCACTTAATATAGATTATGCAACTGGTAACGTCAGAGTATTTGCTATAAACGATAGTGGTTTAGCAAGTGGAAGAGTAAATTCTAATGTTCTCTACGGCACAGCAAATAAGCCATCTAAGGCTGATGTCGGACTTGGTAATCTGACAAACGATACTCAAGTTAAGAAAGCCGGCGATACCATGACTGGTGATTTAACTGTTCCTAATTTACATGCTTCCGGCACTGGTACTGCATCAGTATATGTTAACGCAGGAAGTGGAAACGCTCATGTATGGTTTAGAACAAACGGTAACGAACGTGGTGTAATTTGGGCAACTCCGAATACTGCTGACTTAGGTCAGATTAATATTCGTGCAAAAACTACTGGAGGCACTTCTGCTGGTGATTTTAGCTTCCGTTCTGATGGGCGCCTTGATGTTCCTGTAGCAGTTAAAGTTGGTGGTGCAGCAATGCTAACTAAAGACGGGAATATTACCTCTGGTTCGATGTTTGGTGGTAACCTTAACAACTATTTGACTTCTATTAAAAACGATATCGTTGCTGGCGATAATAAACAAGTAAGCAAGACTGGTGACACAATGACCGGTAACTTGACTATTAACGCTAACCTAAAAGTCGAAAATCCTAATGGGACATTTGTTGATTTGGGTTCAGAGAACTCTGATAAGTATAGCAGATTAACCCTTGCTCGTAAAGTTGGCGATGGCGCTGCTGTAGCAATGCTTAAAATTACTCCTGAAGGATACGTGCAATTTGGTTATCAAACTGCAGTTGCTACTCCATCTCCTACTAAGTACATCCGAGTTAAACCTGATGGTCTTGATGTAGAAGGGGATTTAGTTTTTAATCAGACCTATCGCGGCACTGAAGAGGCAGTGGATATTTCTGATAAGACCATTGACCTTAATAGTCTTGTCATTAAAAGAACCGACCCAGGTACTCGTCAGTTATATAAATGTGTATCATCTGGCGGCGGAAGTAATATATCGAACAAACCTACCTCTGATGGCAACTTTGTTCTTGAAGTTCTGTCTTTACGCAAGGTTTCTGATACCGATTGGTCATGTAAGCAGACCTTTACTACAAAGAACGGTGGTGTTGAAGGTACATATATTCGCTACGCGCAAAACGGTTCATGGTCCGCATGGAAAGAGGTTGTTGCTGGTGTTCAACCGATCAATCTAGGCGGTACTGGAGCAACGTCTGTAGCAGCTGCTCGTAATAACCTCGGCGTTGGTGAAGGACAAACAGTATCATTCGGTAATTTAGTTACCAACGATTTAACTGCAAACGGAAACGCTAGATTAGTTGGAAGATTGAACCTCGGTTCTACTTCTGCGACTGGCGTATTACGAGCTAATGAAACCGGTGCGGTTGTCTTAGGTTCTGCTAGTGGTCAAAACATCCACATCAGAGCAGGAAGCCCAGATACTTCTTCTGGTGAAACCCGCTTTGAGCCAAATGGAAACGTTTTAGTTGGTGGTGCGATTACAGTCTCAGGAAACTTGCAAGTAAATGGCGAAGCCACTATGGGCAGAAGCTTGATCGTTTCTCAAAACATAAAGAATACTAACGATAACAGTTTTATTCTGATGGGAAAAGATTCGGATTTAGGTTTCGTTAAAAAATCTAACTCAGGCGCTAAACTGGTATTTGCTTCAGGAAAATCGTTTACTGTCGCTAAATCGTCAGCAACTACCATAGCTAACCCAGCGACGGAAACTTATACTGATGTGTTTAAAATTGATGCTGATGGAAACCAAACCGTTTACGGAAATGCCCAAGTTAACAGACAATTAACTGTTTCTAGTTCAGCAACTGTTAACGGTATTATTAATGCAAACGGCGGTATTATTGTTCCTACTACCAAGTATGTGCAAATTGCCGATGCTCCTACGCAGAATAACCAAGCCACCAACAAGAAATATGTTGATGATAAGGTTGCTTCTGCTATTAGTAATGCTGGTGATACTTATCTTCCGTTAACTGGCGGTACCGTAACTGGTCCATTAAATATTACTGGAAACCAGTTAAAAACCACATCGCTCTGGGTTACTGGAAATTCGGCTCTTAACGGTGCTTTAGAAGTAGGCGGTAATGTTGTTAGTAATACTGGTATTGGCAGCTTTATTGGTGCTGTAGATGTTAAGGCTCCTGCTGCGGATAATGGTACAACACACCTTTGGTTCCGACATTCTAACGGTGGTGAGCGTGGTGTGATTTATATGCCGCGTGACAATAATACCATGATGGGATTAAGAGCTGGCGGTAGTGAATGGCAATTGGATGGCCCTACAGGTCAAATGCTAGGACCAGGAGCACGCTGGAGAATTCATTCTGATGGTAACCTACAGGGTGATGTTTACGGTGGTTATATCACTAACTATATCAACGATAGGTTTAATCAGTGTGCTCAATGGGTTCGTACTGGTGCTCAACAAGACTTTGGTCAAATTGGTCGCCCTGCTCCTGGTAAAACTGTTCCTGGCGGTTGGGTAGTAGTTGGTCTTAACGCAAACGGCAACGAAGCCAACCAGAACATGCAACTTATTGGCGGACGGTTACAGGTATGGAAACCCGGTGTCGAATGGGTTGATTCTGCGACTTGA

Gene Ontology

No Gene Ontology terms available.

Enzymatic activity

No enzymatic activity data available.

Tertiary structure

PDB ID
68c8623688847d94d9f5f172b099fed45e2c18388e149869d78e103770a45492
ESMFold
Source ESMFold
Method ESMFold
Resolution 0,5176
Evidence 0,5176

Literature

No literature entries available.