Protein

Genbank accession
AVZ45056.1 [GenBank]
Protein name
putative tail fiber protein
RBP type
TSP
Evidence DepoScope
Probability 1,00
TSP
Evidence RBPdetect
Probability 0,91
TSP
Evidence RBPdetect2
Probability 0,95
TF
Evidence GenBank
Probability 1,00
TF
Evidence Phold
Probability 1,00
Protein sequence
MGYFQMTRNVEELFGGVITAPHQIPFTYKSNVGGETFLSLPFYPVTGVVTINGGMQVPLDNFEIEGNTLNLGRALSKGDVVYCLFDKILSPEDTAKGIRIYKFQAVGGETEFTPDFTSYGVQSLYIGGEYKTPEIEYSYNSMTGKVSLQTALTAGVWVVAEMSVRQPNISPAFDRSIQEIARSANVKDSEVIVSTDTISLLDGKKVVYDIATQTSYGLPTIPDGSVISSVSAGKLNYNPGDVQVDLLPLEDSFINVINTLGRNDGAKYIGECHSVADLRNTEPTMDGQRIILKQHTAGTLLGGGVFRALIDGTGKTDNNGTVIKTVGGAAWLRVNADRVNPFMFGALGGSNDDTIPVQSCVDSGKATQLTDAHYVSNIQLKYNTSSIYGSGLHYSRLHQLPSATGNCITIKDTCSLIVLDAFGVYGTGAQQGTSFTAGTTGIYVETPSGLSADYPFHTTADPRRDLCISKVHIAGFDEYGLNIDSGNFSVTTDSLLVNHINQVGVRCATTDWTWTNIQVNTCGKQCLVLDGCGNGRIIGGKFIWANWQPYGTVGQFPGITINNSQNMVINGIEVQDCGGNGIEISDSYSISMNGLNTNRNGINANNTFYNIVFNKSDAVINGFVGLNYAANSGSGANSSAGNFQFLSNDCSVTINGVVETGYMGINFIGDNNIINPTNSDLSINGLVNYSKTGLQTMNETPTFDGVSTTPVYVSVPSSVGQVNGLRLSQANKDKLLYSRTAGPEGITMAAVIVPTISGAEVFNFMAIGSGFSDTSNSLHLQLVIDASGKQTIALLLGGDGTTQILSGDLPNDLKLQSGVPYHIAIGAKPGYFWWSILNIQTGKRIRRSFRGAYLAVPFNSIFGLTSSLTFFSDSNAGGDACSGVGAKVYVGMFSSENDYVASRYYNLINPVDPTKLISYRILDSSI
Physico‐chemical
properties
protein length:926 AA
molecular weight: 98913,79560 Da
isoelectric point:4,99753
aromaticity:0,09179
hydropathy:-0,04168

Domains

Domains [InterPro]
AVZ45056.1
1 926
Legend: Pfam SMART CDD TIGRFAM HAMAP SUPFAM PRINTS Gene3D PANTHER Other

Taxonomy

  Name Taxonomy ID Lineage
Phage Escherichia phage EP75
[NCBI]
2070200 Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host No host information

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
AVZ45056.1 [NCBI]
Genbank nucleotide accession
MG748547 [NCBI]
CDS location
range 129268 -> 132048
strand +
CDS
ATGGGGTATTTTCAAATGACTAGAAATGTAGAAGAATTATTCGGCGGCGTAATCACAGCTCCCCACCAGATTCCTTTCACGTATAAATCAAATGTCGGTGGAGAAACTTTCCTTTCCTTGCCGTTCTATCCTGTCACTGGCGTAGTCACAATCAACGGTGGTATGCAAGTTCCGTTAGACAACTTTGAAATCGAAGGAAATACGTTGAATCTCGGGCGCGCATTGTCCAAAGGCGATGTTGTGTATTGCTTATTCGATAAAATTCTTTCGCCAGAAGATACAGCCAAAGGTATCCGCATATACAAATTTCAAGCCGTAGGAGGTGAAACCGAGTTCACTCCTGATTTCACATCTTATGGAGTCCAATCTCTTTATATCGGTGGCGAGTACAAAACACCCGAAATTGAATATTCCTATAACAGCATGACAGGGAAAGTATCTTTGCAAACTGCACTGACTGCAGGCGTTTGGGTAGTCGCTGAAATGTCTGTTAGACAACCGAATATCAGTCCGGCATTTGATCGAAGTATTCAAGAAATCGCCCGTTCTGCTAATGTAAAAGACTCTGAAGTCATCGTTAGTACGGACACCATATCTTTGTTGGATGGGAAGAAAGTTGTTTATGATATAGCGACGCAAACCAGTTATGGTTTACCAACCATACCTGATGGTTCTGTCATTTCTTCTGTATCTGCTGGGAAATTGAATTACAACCCAGGTGATGTGCAGGTTGATTTGTTGCCTTTAGAAGATTCATTTATTAATGTGATAAACACTCTGGGGCGCAATGATGGTGCCAAGTATATTGGAGAATGCCATTCTGTTGCTGATCTCAGGAATACTGAACCCACTATGGATGGACAACGCATTATTCTTAAGCAACACACTGCGGGTACTCTTCTTGGTGGAGGGGTATTCCGTGCGTTAATTGATGGTACAGGAAAGACTGATAATAACGGTACTGTGATCAAAACTGTTGGCGGCGCAGCATGGTTACGTGTTAATGCTGATAGAGTTAACCCATTCATGTTTGGTGCTTTGGGTGGTTCTAATGATGATACTATTCCAGTACAATCTTGTGTGGATAGTGGTAAGGCCACACAATTAACTGATGCACATTACGTTAGCAATATCCAGTTAAAATATAATACGTCGTCTATTTATGGGTCTGGATTACATTACTCAAGGTTGCATCAGTTGCCTTCTGCTACTGGGAATTGTATTACCATAAAAGATACATGCTCCCTTATTGTATTAGACGCCTTTGGGGTATATGGCACAGGTGCACAACAAGGCACGTCATTTACTGCGGGCACAACAGGTATCTATGTAGAAACTCCTTCAGGTCTCTCAGCCGATTATCCGTTCCACACTACCGCAGACCCAAGACGCGACTTGTGTATTTCTAAAGTCCATATAGCAGGTTTTGATGAATATGGGTTAAATATTGATAGTGGTAACTTTAGTGTTACTACAGATTCTCTTTTAGTCAACCACATCAATCAGGTGGGTGTCCGTTGTGCTACTACTGATTGGACTTGGACAAATATCCAGGTTAATACCTGCGGTAAACAATGTCTGGTTCTTGATGGTTGTGGTAATGGTCGTATTATTGGCGGTAAATTCATTTGGGCTAACTGGCAACCTTATGGTACAGTAGGACAGTTCCCAGGCATTACTATTAATAACAGCCAGAATATGGTTATTAATGGTATTGAGGTACAAGATTGTGGTGGGAATGGCATTGAGATTAGCGATTCATATTCAATTTCCATGAACGGATTGAACACCAATCGTAACGGCATCAATGCTAACAACACTTTCTACAACATCGTATTTAACAAAAGTGATGCAGTTATCAACGGATTCGTAGGACTCAATTATGCCGCGAATAGTGGTTCAGGTGCTAACTCTAGTGCAGGCAATTTTCAGTTCCTGTCTAATGATTGTAGTGTCACCATTAATGGTGTGGTTGAGACTGGTTATATGGGCATTAACTTTATTGGTGATAACAATATTATCAACCCCACCAATTCCGACCTGAGCATTAACGGATTGGTTAATTATTCCAAGACTGGTTTGCAAACCATGAACGAGACCCCTACATTTGATGGTGTTAGCACTACACCTGTTTATGTAAGTGTCCCATCTTCTGTAGGGCAAGTAAATGGTCTGAGACTATCACAAGCCAACAAAGATAAATTACTGTACTCAAGAACAGCAGGTCCAGAAGGTATTACCATGGCTGCTGTTATAGTACCTACTATATCTGGAGCTGAAGTATTTAACTTCATGGCCATTGGTTCAGGGTTTAGTGATACATCCAACAGTCTTCATCTTCAATTAGTTATAGACGCTTCTGGAAAACAAACAATTGCTTTGCTATTGGGGGGCGATGGTACAACCCAAATTTTATCTGGGGATTTACCTAACGACCTTAAACTACAAAGTGGTGTGCCATATCATATAGCTATTGGTGCTAAACCTGGATATTTCTGGTGGAGTATTCTTAATATTCAGACGGGTAAGAGAATCAGACGGTCATTCCGAGGCGCTTATTTAGCCGTACCATTTAATTCTATATTCGGATTAACTTCCTCATTAACATTCTTCTCGGATAGCAATGCTGGTGGGGATGCTTGTTCTGGGGTGGGCGCTAAAGTGTATGTTGGTATGTTCTCTTCTGAGAACGATTATGTAGCTTCACGATACTACAACCTGATTAATCCTGTAGACCCTACTAAGTTAATTAGTTACCGTATATTGGATTCTTCTATTTAA

Gene Ontology

No Gene Ontology terms available.

Enzymatic activity

No enzymatic activity data available.

Tertiary structure

PDB ID
92e0dc5bd4664fab1c2e654d45235684f81991219600582e37877a9451149bb6
ESMFold
Source ESMFold
Method ESMFold
Resolution 0,7233
Evidence 0,7233

Literature

No literature entries available.