Protein

Genbank accession
WFG41953.1 [GenBank]
Protein name
tail fiber
RBP type
TSP
Evidence DepoScope
Probability 1,00
TSP
Evidence RBPdetect
Probability 0,80
TF
Evidence RBPdetect2
Probability 0,95
Protein sequence
MATLKQIQFKRSKTAGARPAASVLAEGELAINLKDRTIFTKDDSGNIIDLGIAKGGQIDGNVTINGLLRLNGDYVQTGGMTINGPIGSTDGVTAKVFRSTQGSFYARATNDTANAHLWFENTNGSERGVLYSKPQSENEGVITMRVRQGTAAGAQNSEFHFISTDGGIFQARKLTALTSISTPTISVNLINHDSKSFGQYDSQSLVNYVYPGTGETNGVNYLRKVRAKSGGTIYHEIVTAQTGLADEVSWWTGNIPLFKLYGIRNDGRMIIRNSLAIGTVTQGFPSSDYGNVGALGNIFLALGDNGTGLVYRKTGVFDFVGSGLSLASITPDSFRSTRKAIFGRSEDQGTTWIMPGTNAAFLSVQTQADENTAGDGQTHIGYNSGGKMNHYFRGKGKTNINTQEGMEVNPGILKLVTGSNNVMFYADGGITSVKQLSIYNGIYLAANNSTAGLTFAPTTTIDGTKQILWEGGKRAGQNKSYVTVKAWGNSFNTSGDRSRETVFEVSDGQGYHFYSQRVAPGSGSTVGPIQFRVNGGLLTSGSIVASGSITTESSLNVNNGLSVNGQAKFGGTADALRIWNAEYGAIFRRSEDKLYIIPTPQNVGESGGISNLRPFYIALSDGKVTMRHSVTLGDDGRGGNMITVDNDNKLVVVTSHSRISPNYRMQIGQSAYIDAECTDAVRPAGAGSFASQNNENVRAPFYMNIDRTDTSTYVPIVKQRYVQNNSCYSIGTLINGGNFRVHYHEGGDGGSTGAIIKDLGWEFNKNGDFYSPGKLGAGNVRIGTDGNITGGSLPNFANLNSTLDRKVNTRMVSYSGTGGWYKLATVTMPQSTSTVTFEIAGGNGYNVNTPHQCVTSKIVLRTSNNNPKGINAVVWSMDTDQGIKNVATVNTSGDVYDIYVNVGTYAQALAVSYYATPNATINQVFATDQPGATETAVELPETAIQGQVASVLNNLQKTPNGSKRYVAESEIAINNQTGIRITSNSDRSGSNSVLFRNDGGNFYILLTDKNSSDGDNKATEGDWNGKRPFSIDMTAGTVRLGENTSFDKDITINGNINSRVKAAGQWSVSFSAISDVTRDNSAFLANTGGISKTSQAYYPLFSGYSFLTDAGYRQSFEFGWLGVSGTWRQGIIRMRGDNPSGQQARWTFDMDGTFYAPILSCGSARAFGVNTSNGWGGNSIAIGDSDTGFRQVGDGLLEAWANNVKVVRFTSSEVYSEKNVNAPNVYIRSDVRLKSNFKPIKNALERVEQLDGLIYDKAEYIGGEPVQTEAGIIAQTLQDVLPEAVHETEDSKGNKILTVSSQAQIALLVEAVKTLSSRVKELESKLM
Physico‐chemical
properties
protein length:1327 AA
molecular weight: 142352,33500 Da
isoelectric point:7,95058
aromaticity:0,08817
hydropathy:-0,34288

Domains

Domains [InterPro]
WFG41953.1
1 1327
Legend: Pfam SMART CDD TIGRFAM HAMAP SUPFAM PRINTS Gene3D PANTHER Other

Taxonomy

  Name Taxonomy ID Lineage
Phage Escherichia phage ADUt
[NCBI]
3032370 Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host No host information

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
WFG41953.1 [NCBI]
Genbank nucleotide accession
OQ466432.1 [NCBI]
CDS location
range 71901 -> 75884
strand -
CDS
ATGGCTACTTTAAAACAAATACAATTTAAAAGAAGCAAAACCGCAGGTGCACGTCCTGCTGCTTCAGTATTAGCCGAAGGTGAATTGGCTATAAACTTAAAAGATAGAACAATTTTTACTAAAGATGATTCAGGAAATATCATTGATCTAGGTATTGCTAAAGGCGGTCAAATTGATGGAAATGTAACTATCAATGGTCTTTTGAGGTTAAACGGCGATTATGTACAAACAGGTGGAATGACTATAAATGGACCTATTGGTTCTACTGATGGCGTAACTGCAAAAGTTTTCAGATCTACACAGGGTTCATTTTATGCAAGAGCAACAAACGATACTGCAAATGCCCATCTTTGGTTTGAAAATACAAATGGCTCAGAACGTGGCGTTTTATATTCAAAACCGCAGTCTGAAAATGAAGGCGTAATTACAATGCGTGTTCGTCAAGGAACCGCTGCGGGAGCTCAAAATTCAGAATTTCATTTCATTTCTACCGATGGTGGTATCTTCCAGGCACGCAAATTAACTGCTTTAACTTCTATTAGTACACCAACTATTAGTGTTAATTTAATTAATCATGATTCTAAATCATTTGGACAATACGATTCACAATCTTTGGTTAACTATGTTTATCCTGGAACCGGTGAAACAAATGGCGTAAACTATCTTCGTAAAGTTCGCGCTAAGTCCGGTGGTACAATTTATCATGAAATTGTTACTGCCCAAACAGGCCTGGCTGATGAAGTTTCTTGGTGGACTGGTAATATACCGTTATTTAAACTATATGGTATTCGTAACGACGGTAGAATGATTATTCGCAATAGCTTGGCCATTGGTACTGTGACGCAAGGGTTTCCGTCAAGCGATTATGGAAATGTTGGGGCACTAGGAAATATATTTCTTGCTTTAGGTGATAATGGAACTGGTCTAGTTTATAGAAAAACCGGCGTATTTGATTTTGTTGGTTCTGGTTTATCTTTGGCATCTATTACACCTGATAGTTTCCGTAGTACTCGCAAAGCAATATTTGGACGCTCAGAAGACCAAGGTACAACATGGATTATGCCTGGAACGAACGCTGCATTTTTATCAGTTCAAACACAAGCTGATGAAAACACTGCTGGAGACGGTCAGACACATATTGGCTATAACTCAGGCGGAAAAATGAACCACTATTTCCGTGGTAAAGGCAAAACTAATATTAATACCCAAGAAGGCATGGAAGTTAACCCTGGTATTCTTAAACTAGTAACTGGCTCTAATAATGTAATGTTTTATGCTGATGGCGGTATTACATCTGTTAAGCAGCTTTCAATATATAACGGCATATATTTAGCAGCTAATAATTCTACTGCTGGGCTAACATTCGCTCCAACTACTACAATTGACGGCACTAAGCAAATTTTGTGGGAAGGTGGTAAGCGTGCTGGGCAGAATAAAAGCTATGTAACTGTTAAAGCGTGGGGTAATTCATTTAACACATCTGGAGATCGTTCCCGTGAAACAGTTTTTGAAGTATCAGATGGGCAAGGTTACCATTTTTATTCTCAGCGAGTTGCTCCCGGATCAGGTTCTACTGTCGGACCTATTCAATTTCGAGTTAATGGTGGTTTATTAACTTCAGGTAGTATTGTTGCTTCTGGTTCTATTACAACTGAATCTTCTTTAAATGTTAATAATGGATTATCTGTAAACGGACAAGCTAAATTTGGTGGAACGGCTGATGCATTAAGAATTTGGAATGCTGAATACGGTGCTATTTTCCGACGTTCTGAAGATAAGCTTTATATTATTCCAACTCCACAGAATGTTGGTGAATCAGGTGGTATTTCTAATTTACGCCCGTTCTATATTGCATTAAGTGATGGTAAAGTCACCATGCGTCATTCTGTCACATTAGGCGATGATGGCAGAGGCGGCAATATGATTACTGTAGACAATGATAACAAACTTGTTGTTGTTACTAGTCATAGTCGTATTTCTCCTAATTACCGTATGCAGATAGGTCAGTCGGCATACATTGATGCAGAATGTACTGATGCTGTTCGCCCAGCCGGTGCAGGTTCATTTGCTTCACAAAATAATGAAAACGTTCGTGCTCCGTTCTACATGAATATAGATAGAACCGATACAAGCACTTATGTTCCTATTGTGAAACAAAGATACGTTCAAAATAATAGTTGCTATTCTATTGGTACTTTAATTAATGGTGGTAACTTTAGAGTTCATTATCACGAAGGTGGCGATGGCGGTTCTACTGGCGCAATTATAAAGGATTTAGGTTGGGAATTTAATAAAAATGGTGATTTTTACTCTCCTGGTAAATTAGGTGCTGGTAATGTTCGTATTGGTACTGATGGTAATATCACGGGTGGTTCATTACCTAACTTTGCTAACTTGAACTCGACATTAGATCGTAAAGTCAATACCCGAATGGTTTCTTATTCAGGTACTGGCGGTTGGTACAAATTAGCAACGGTGACAATGCCACAATCCACTTCAACCGTCACATTCGAAATTGCTGGTGGTAATGGCTATAATGTCAACACCCCACACCAATGCGTTACTTCGAAAATTGTTTTAAGAACTTCGAACAATAACCCGAAAGGTATTAACGCTGTTGTTTGGTCGATGGATACCGATCAGGGTATTAAGAATGTTGCAACGGTTAATACATCAGGCGATGTTTATGACATCTATGTAAACGTTGGTACTTATGCTCAAGCGCTAGCAGTTTCTTATTATGCTACTCCTAATGCTACCATTAACCAGGTATTTGCAACGGACCAACCGGGTGCAACAGAAACTGCGGTTGAACTTCCTGAGACGGCTATTCAAGGACAGGTTGCTAGTGTTCTTAACAACTTGCAAAAAACGCCTAATGGTTCTAAGCGTTATGTAGCAGAGTCGGAAATTGCTATTAATAACCAAACCGGTATTCGTATTACGAGTAATTCTGATAGATCAGGTTCTAATTCCGTTTTATTTCGAAATGACGGTGGAAACTTCTATATTTTACTGACTGACAAAAACTCTTCAGACGGCGATAATAAAGCAACTGAAGGCGATTGGAATGGAAAACGACCGTTTTCAATCGATATGACTGCTGGTACTGTTCGTCTTGGCGAAAATACTTCTTTTGATAAAGATATTACTATTAATGGAAACATTAATTCACGAGTTAAAGCTGCCGGACAATGGAGTGTTAGCTTTTCTGCTATTTCAGATGTGACTCGCGACAATTCTGCATTCTTAGCGAATACGGGTGGCATTTCCAAGACAAGTCAAGCTTATTACCCGCTATTTTCTGGATACAGTTTTTTAACTGACGCGGGCTATCGTCAATCATTTGAATTTGGATGGTTAGGTGTTTCTGGTACTTGGCGTCAAGGTATTATTCGCATGCGTGGCGACAACCCATCGGGGCAACAGGCTCGTTGGACTTTTGATATGGACGGAACATTTTATGCTCCTATACTATCATGCGGATCTGCGAGAGCATTTGGTGTAAATACCTCCAACGGTTGGGGTGGTAACTCCATTGCAATTGGTGATAGTGATACTGGTTTTAGACAAGTAGGCGATGGGCTTTTAGAAGCGTGGGCGAACAACGTTAAAGTTGTTAGATTCACCTCAAGTGAAGTTTATTCCGAGAAAAACGTCAATGCTCCTAACGTTTATATTCGTTCTGATGTTCGCTTGAAATCTAATTTTAAACCTATTAAAAATGCGCTCGAAAGGGTTGAGCAACTTGATGGTTTAATCTATGACAAAGCTGAATATATAGGCGGTGAACCTGTTCAAACCGAAGCGGGTATTATAGCTCAAACGTTGCAAGACGTTTTACCAGAAGCCGTCCATGAAACAGAAGATAGCAAGGGTAATAAAATACTCACTGTTTCTTCTCAAGCCCAGATTGCTCTTCTGGTTGAAGCTGTGAAAACACTTTCTTCTCGTGTAAAAGAACTCGAATCTAAACTTATGTAA

Gene Ontology

No Gene Ontology terms available.

Enzymatic activity

No enzymatic activity data available.

Tertiary structure

PDB ID
ee7a546e5d000e83edd87e4eb50704a578dda3d03b28d4fbc8c5e716dac61596
ESMFold
Source ESMFold
Method ESMFold
Resolution 0,4997
Evidence 0,4997

Literature

Title Authors Date PMID Source
Extracted environmental DNA transformation resulted in an active phage in Escherichia coli Salih,H., Karaynir,A. and Bozdogan,B. 2023-10-13 GenBank