Protein

Genbank accession
USL84155.1 [GenBank]
Protein name
large distal tail fiber subunit
RBP type
TSP
Evidence DepoScope
Probability 1,00
TSP
Evidence RBPdetect
Probability 0,87
Protein sequence
MADLSRIQFKRTSTKGRKPDASTMNPGELAINLADQYLLTKNDSGDIINLSCPPVYDRDVTMAGKVKGNNYILGKTANYLEDQTARDLNYFGAFRTNGLDGFLELTLNVPHSSGVQHGRGFTFQYGHTGNRVETYGYNKEGQKAFSYKMYHEGDKPTPGELNVYSKQEIDRMFIKNVKMSVPSGDATRGYFKIATAMIPQNGRMAFLRIYGGNGYNVNSYDQVDFLEIVIRGGNNNPKGVSIAAYRRNSLNVHEVFAINTSGDNYDIYVNYGRYTDNVIVEFGKTVDVALTVHDVPEFSATKPATGTKFDARVITMFNTENKAGTLMFDNNGQGTYDIISLNNSTDSNKKYLRKFRSKSAETIWHEVVEGSVYRLATGVTDQSDQLKIDFNGVTVNRLFVKGNNAIRMERRDGQSNYLEFYDYRSGANRRQGYLGYGDGTTNTVQLVNELTEGTNSLRLDDTGQVTLSVGKTKIVYTNGQYYSANSDAFRMIYGNYGAFWRNDGQKVYLLSTAENDRFGGWNGNRPFIYDLSTGKVTLGGDGNEGALVLERDSRAARFAGDIYVGNGMLTFDAGRLNSRDYFRFNHWGDSNNARDNILQLDDSKGAHFTTERTLATGAIKTKFFGDLESAGQIKWGKGTATSTFNIRVWGADARKQVFECADESGWHWYTQRPGGPDTSAIEFVINGTVKPQAIHTGGNITLNGADIEFKRSGNKHLWFRDPNGLELGLLYCDDAGVMRIRGEKSTEVWKFSAKQIHLETGTAGNGVGLLRGAVGGGAWTQWRDRGTGLQVDCQQSENSAHNVWRATHQGKYHIAAMGVHVPGGTIGNAMVRIHVHDATFDFSATGDFQAGRNGNFNDVYIRSDARLKINKEEYKENATDKVNRLTVYTYDKVKSLSDRTVIAHEVGIIAQDLEKELPEAVKTSKIGDGDTPEEILTISNSAVNALLIKAFQEMSEELKAVKAELAELKKN
Physico‐chemical
properties
protein length:971 AA
molecular weight: 107798,73350 Da
isoelectric point:7,32134
aromaticity:0,10299
hydropathy:-0,55839

Domains

Domains [InterPro]
Legend: Pfam SMART CDD TIGRFAM HAMAP SUPFAM PRINTS Gene3D PANTHER Other

Taxonomy

  Name Taxonomy ID Lineage
Phage Escherichia phage W115
[NCBI]
2950728 Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host No host information

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
USL84155.1 [NCBI]
Genbank nucleotide accession
ON286974 [NCBI]
CDS location
range 151220 -> 154135
strand +
CDS
ATGGCAGATTTAAGCAGAATCCAATTTAAACGCACTAGCACTAAAGGTCGTAAACCGGATGCTAGTACGATGAATCCGGGGGAATTGGCAATCAACCTTGCGGATCAATATCTTCTTACTAAAAATGATTCCGGTGATATTATCAATTTAAGTTGTCCTCCGGTGTATGACCGCGATGTTACAATGGCGGGTAAGGTTAAAGGTAATAATTATATCTTAGGTAAAACCGCCAACTATCTGGAAGATCAGACAGCGCGAGATCTTAACTATTTTGGTGCTTTCCGTACCAATGGTCTTGATGGTTTTCTCGAACTCACGCTAAACGTTCCTCATTCTTCTGGTGTTCAGCATGGTCGAGGATTTACTTTCCAGTATGGACACACAGGAAACCGTGTAGAAACTTATGGTTATAATAAAGAAGGACAAAAAGCATTTAGTTATAAAATGTATCACGAAGGTGATAAACCAACTCCAGGAGAATTGAACGTCTATAGCAAACAAGAAATTGACAGAATGTTTATTAAAAACGTTAAAATGTCTGTTCCTTCCGGTGACGCAACTCGTGGTTACTTTAAGATCGCGACCGCAATGATTCCGCAGAATGGTCGAATGGCATTTTTACGGATTTACGGCGGAAACGGATATAATGTTAACTCCTACGATCAGGTGGATTTCCTTGAAATTGTGATTCGTGGTGGTAATAATAACCCTAAAGGTGTTAGTATTGCTGCATATCGTCGTAATTCTTTGAACGTCCATGAAGTATTTGCAATTAATACTTCCGGTGATAACTATGACATTTATGTTAACTATGGTCGTTACACCGATAACGTTATTGTAGAGTTTGGAAAAACTGTTGATGTTGCATTGACTGTTCATGATGTTCCTGAATTTTCGGCGACTAAACCAGCAACCGGAACTAAATTTGATGCTCGTGTTATTACAATGTTCAACACCGAAAACAAAGCCGGAACGTTGATGTTTGATAATAACGGTCAAGGAACGTATGATATTATCAGCTTGAATAACTCGACTGATAGCAATAAAAAATATCTTCGTAAGTTTCGTAGCAAATCCGCAGAAACAATATGGCATGAAGTTGTCGAGGGTAGCGTATATCGTTTAGCTACGGGCGTTACTGATCAGTCAGACCAACTAAAAATTGATTTTAATGGGGTTACTGTAAATCGTCTTTTCGTTAAGGGAAATAATGCTATCAGAATGGAGCGTAGAGACGGACAAAGTAATTACCTAGAATTTTATGATTATCGTTCCGGTGCTAACCGCCGTCAAGGTTATCTAGGATATGGTGACGGTACTACTAACACCGTACAGTTAGTAAATGAATTAACGGAAGGTACTAACTCATTACGACTGGATGATACTGGTCAGGTTACGCTGTCAGTAGGCAAAACAAAAATTGTATATACCAACGGACAATATTATTCCGCTAACTCTGATGCATTCCGTATGATTTACGGCAATTATGGCGCATTCTGGCGAAATGATGGTCAAAAAGTATATTTGTTGTCTACTGCCGAAAATGATCGTTTTGGTGGATGGAACGGCAACCGACCATTCATTTACGACCTGTCAACTGGTAAAGTTACTTTAGGTGGCGACGGTAACGAAGGCGCATTAGTTCTCGAAAGAGATAGCCGTGCGGCTAGATTTGCAGGTGACATTTATGTCGGTAACGGGATGTTAACCTTTGATGCTGGGCGATTAAATTCTCGTGATTACTTCCGATTTAATCATTGGGGCGATAGCAATAACGCTCGTGATAACATCTTACAGCTTGACGATAGCAAGGGTGCTCATTTTACCACTGAACGTACTTTAGCAACTGGTGCAATTAAAACTAAATTCTTCGGTGATTTGGAATCTGCTGGTCAAATTAAATGGGGTAAAGGGACCGCCACATCTACGTTTAATATACGTGTGTGGGGTGCTGATGCTCGTAAACAGGTGTTTGAGTGTGCTGATGAAAGCGGTTGGCATTGGTATACCCAACGTCCGGGCGGTCCAGATACTTCTGCAATTGAGTTTGTCATCAATGGTACTGTTAAACCTCAAGCAATCCACACTGGCGGTAATATCACGCTTAACGGTGCTGATATTGAATTTAAACGAAGCGGTAACAAGCATTTATGGTTTAGAGATCCGAACGGCTTAGAGTTGGGTCTGTTGTACTGCGATGATGCTGGTGTTATGCGTATTCGTGGGGAGAAATCGACCGAAGTATGGAAATTCTCAGCAAAACAGATTCATCTGGAAACTGGTACTGCCGGAAATGGTGTAGGCTTGCTTCGTGGTGCTGTAGGTGGTGGCGCATGGACTCAATGGCGAGATCGTGGCACTGGCTTGCAGGTTGATTGTCAGCAATCTGAAAACTCAGCGCATAACGTATGGAGAGCTACGCATCAAGGAAAATACCACATCGCGGCAATGGGTGTACACGTTCCTGGTGGTACTATCGGAAATGCTATGGTGCGTATTCACGTACACGATGCAACTTTTGACTTTAGCGCAACTGGTGATTTCCAAGCAGGTCGTAACGGTAATTTTAACGATGTGTACATTCGTTCTGATGCTCGCCTGAAAATCAATAAGGAAGAGTATAAAGAGAATGCTACCGATAAAGTTAATCGCTTGACGGTATACACCTATGACAAGGTTAAATCTTTAAGTGACCGTACTGTCATTGCTCATGAAGTTGGTATTATTGCTCAGGATCTTGAGAAAGAATTGCCAGAAGCAGTAAAAACCTCGAAGATCGGCGACGGTGATACACCAGAAGAGATCTTAACAATTTCTAACTCTGCTGTCAACGCTCTTTTAATTAAGGCGTTTCAGGAAATGAGCGAAGAATTGAAAGCCGTTAAAGCTGAACTAGCGGAACTTAAAAAGAATTAA

Gene Ontology

No Gene Ontology terms available.

Enzymatic activity

No enzymatic activity data available.

Tertiary structure

PDB ID
2bb3471765d3008fdf4b1002e2de7a6a99c484764363ebc82c35555a7c6c3feb
ESMFold
Source ESMFold
Method ESMFold
Resolution 0,5768
Evidence 0,5768

Literature

No literature entries available.