Protein

Genbank accession
WQY99578.1 [GenBank]
Protein name
long tail fiber protein
RBP type
TSP
Evidence DepoScope
Probability 1,00
TF
Evidence RBPdetect
Probability 0,90
TF
Evidence RBPdetect2
Probability 0,96
TF
Evidence Phold
Probability 1,00
Protein sequence
MAEFKLSELNSISEIRSDDLLHVRVKKRTEMLGDEDRRMTYADFLASFRLERFLQLVGGTMTGNLGIVKLTYGGKDLLDPTGNSEIVFGDTAKTFKLNANGLKLTIADASRSATVYHTLNKPSPNELGMRTNDENDARFAIKGTQNTFTASQIFQTDNAGLTLKNTAAAALYYEGRDTANAVRFTIGNLSSGSDVTIANTKQNTNIVLGTGSVGINKSLQVTGQVVPSDFANFDARFYTRDAADQRFVQLAAANTITGNNTLRGTTTLLGDGARLTLKNLTSGKALYIEGQNTDASMKWAVGNYADGSNSVVLTNISNDTYVLLDNMVRVNKSLAITGQVQPTDWSNIDARFIPAATLSTIARNNTANTFTGVQTIKNDGQGLVLMPSSAGKASYIISRDSDGTTNRWFIGVGSDGSTTLSLQNHILGSSLQLANEIVANKSVNITGQVKPSDFANFDSRYYTKSLSDLRYEMIGSISPNSSGTNGLWVKVATVVMPQSTSTVEMRFAGGAGYNAGSTAQAAPTSIILRTGNNSTPVGITAVLWNSTDTSPLFTDIGYVSNGSNSYDIYAKSGGYAHSISFSWRCTSNAAVSMYTTPEGSVTPPTSMVSGSVQSIYTSLLKPSASDVGAYTKTEVDQKIANAVTDSTDLKKVYPVGIVTWFATNQNPNTTLPGLTWTYLNEGVGRTVRIGAANGSDVKTVGGADTVTLAVGHLPSHTHSFSATTSSFDYGTKTSNTTGAHTHSVSGSAASAGSHKHAISWIGQNSTHYSGGGGGKLGTGPGYTDAGGAHTHTISGTAASAGNHAHTVGIGAHTHTVSGDTGGTGSGSAFSVVNLFIRLMAWVRTA
Physico‐chemical
properties
protein length:845 AA
molecular weight: 88869,54230 Da
isoelectric point:8,50623
aromaticity:0,07456
hydropathy:-0,21207

Domains

Domains [InterPro]
Legend: Pfam SMART CDD TIGRFAM HAMAP SUPFAM PRINTS Gene3D PANTHER Other

Taxonomy

  Name Taxonomy ID Lineage
Phage Escherichia phage EP1
[NCBI]
3110411 Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host No host information

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
WQY99578.1 [NCBI]
Genbank nucleotide accession
OR892555.1 [NCBI]
CDS location
range 42882 -> 45419
strand -
CDS
ATGGCAGAATTTAAATTGAGTGAATTAAACTCGATTAGTGAGATTCGTTCTGATGACCTATTGCATGTCAGAGTTAAGAAAAGAACTGAGATGCTAGGTGATGAAGACCGTAGAATGACTTATGCGGATTTCCTTGCATCATTTAGACTGGAAAGATTTCTGCAATTAGTTGGTGGAACCATGACAGGTAATTTAGGAATTGTAAAGCTTACCTATGGGGGAAAAGATTTACTTGACCCAACAGGTAACTCCGAAATTGTCTTCGGTGACACTGCAAAAACTTTCAAGCTTAATGCAAATGGTCTTAAACTGACTATTGCAGATGCTTCAAGAAGTGCAACTGTTTATCACACTCTGAATAAGCCATCTCCCAATGAACTTGGGATGAGAACTAATGATGAGAACGATGCAAGATTTGCTATCAAGGGAACTCAAAATACCTTTACAGCAAGTCAGATTTTCCAGACAGATAATGCTGGTTTGACTTTGAAGAACACTGCTGCGGCTGCATTGTATTATGAAGGTCGTGATACAGCAAACGCTGTAAGGTTCACAATTGGTAACTTGAGTTCTGGTTCTGACGTTACTATTGCAAACACCAAACAGAATACTAATATTGTTCTTGGTACTGGTTCTGTAGGTATTAACAAAAGTCTTCAAGTTACTGGACAGGTTGTTCCTTCAGACTTCGCAAACTTTGATGCAAGATTCTATACTCGTGATGCAGCAGACCAAAGATTTGTTCAGTTGGCAGCAGCTAACACGATTACTGGAAACAACACCCTCAGAGGTACTACAACGTTACTTGGTGATGGTGCAAGATTAACTCTGAAGAACTTGACAAGTGGTAAAGCACTTTACATTGAAGGTCAGAACACAGATGCTTCTATGAAGTGGGCTGTAGGTAACTATGCAGATGGTAGCAACTCAGTTGTATTGACAAACATCTCAAATGATACCTATGTATTACTTGATAACATGGTCAGAGTTAACAAGAGTCTTGCAATCACTGGACAGGTTCAGCCTACAGATTGGTCTAACATTGATGCCAGATTTATTCCTGCTGCAACACTTTCTACAATTGCAAGGAACAATACTGCAAACACCTTTACTGGTGTACAGACCATTAAGAATGATGGTCAGGGTCTAGTATTAATGCCAAGCAGTGCAGGTAAAGCCTCTTATATCATCTCAAGAGACTCAGATGGTACTACTAACAGGTGGTTTATTGGTGTTGGCTCAGATGGTTCAACAACTCTGTCATTGCAAAACCACATACTTGGTAGTTCTTTGCAGCTTGCTAATGAGATTGTCGCCAATAAAAGTGTGAATATCACTGGACAGGTGAAACCTTCAGACTTTGCAAACTTTGATTCAAGATATTATACAAAAAGTTTATCAGACTTAAGATATGAAATGATTGGGTCTATTAGTCCAAATAGCTCAGGTACTAATGGTTTATGGGTTAAGGTGGCAACCGTAGTTATGCCACAGAGTACATCAACTGTAGAAATGAGGTTTGCAGGTGGTGCTGGTTATAATGCTGGCTCAACAGCACAAGCCGCGCCTACTAGTATTATTTTAAGGACTGGAAACAACTCTACACCTGTTGGTATCACGGCAGTTCTTTGGAATAGTACTGACACTAGTCCATTGTTTACTGATATTGGTTATGTTTCGAATGGTAGCAATAGTTATGATATCTACGCTAAATCTGGTGGTTATGCACACAGTATTAGCTTTAGTTGGAGATGCACTTCAAATGCCGCAGTATCTATGTATACAACACCTGAAGGTTCTGTAACACCACCAACTAGCATGGTTTCTGGTAGTGTCCAGTCTATTTACACAAGCTTGTTAAAACCTTCAGCATCAGATGTTGGTGCATATACTAAAACTGAAGTTGACCAGAAGATTGCAAATGCTGTTACAGACTCTACAGACCTTAAGAAAGTTTACCCTGTAGGTATTGTAACATGGTTTGCAACTAACCAGAACCCTAATACTACCCTTCCGGGATTAACTTGGACGTATCTAAATGAAGGTGTCGGTAGAACTGTCAGAATCGGTGCAGCGAATGGTTCAGATGTTAAGACAGTTGGTGGTGCAGATACTGTGACATTAGCTGTAGGACACCTTCCTTCACATACTCACAGCTTCTCAGCTACAACGTCAAGCTTTGACTATGGTACTAAGACCTCTAACACGACTGGTGCTCATACCCACTCTGTAAGTGGTTCTGCTGCATCTGCTGGTAGTCACAAACATGCTATCTCATGGATTGGTCAGAACTCTACTCACTACTCTGGTGGTGGTGGTGGTAAGCTTGGTACAGGGCCAGGTTACACTGATGCAGGTGGTGCTCACACCCACACAATCTCTGGTACTGCTGCTTCTGCTGGTAACCACGCTCACACGGTTGGTATTGGTGCTCACACCCACACAGTTAGTGGTGACACTGGTGGTACAGGTTCTGGTTCAGCATTCAGTGTTGTAAACTTGTTTATCAGATTGATGGCATGGGTTAGAACGGCGTAA

Gene Ontology

No Gene Ontology terms available.

Enzymatic activity

No enzymatic activity data available.

Tertiary structure

PDB ID
b28a95a72d446808992a7fbcb37bcf2e58fe6f5bbb3fca33db867104c9223e86
ESMFold
Source ESMFold
Method ESMFold
Resolution 0,6349
Evidence 0,6349

Literature

No literature entries available.