Protein
- Genbank accession
- ADR32637.1 [GenBank]
- Protein name
- gp34 long tail fiber protein, proximal subunit
- RBP type
-
TFTF
- Protein sequence
-
MADILKPAFRATSGLDAAGEKVINVAKADYSVLSDGVNVNFFIEENTIQQYDATRGYKKDFAVIYDNRIWVSQREIAEPAGSFVQQYWTATRTDPKWETVASPTRQLNSGEFIAVDSAASFTTFTLPPNPTDGDTIVIKDIGGNTGYNEIKVQSSNVPGQGNQKIVRFGNQYSEVLITKPFSYNMLIFSNRLWQFWEAGNEERGIRIEPSSGKYRAQAADFIMRRYTTAEKITFVLPKYANQGDIVKSVDIDGLGPLYHLDVETFDESSSLGKQGQHSMEFRTTGDGFFVYNATEKLWVTWDGDNKTRLRVIRDSVKLLPNESIIVFGNDNSTPQTINIDLPTGVRPGDVVKIALNYLRKAQTVNIKATALDKIASSVQLLQFPKRSEYPPDTEWVLVDSLTFNGNISYTPVIELSYLEDTVKNINYWVVAQNVPTVERVDSKDDLTRARLGVIALANQAQVNVDHENNPEKELAITPQTLANRVATESRRGIARIANTAQVNQDTTFAFQDDIIVSPKKLNERTATETRRGLAEIATQQETDAGIDDTTIITPRKLQARQGSESLSGIVKYVPTTGTTPAASRITVGTNVYNKNTTNLVISPKALDQYKADQNNQGAVYLATQSEVNAGATNTGFSNSAVTPETLGARRATDSNHGLIEIATQVETNAGTDYTRAVTPKTLNDRKATESLSGIAEIATQSEFDTGTDDTRIATPLKIKTRFNNTARTSVIAASGLVETGTLWDHYTLNILEANETQRGTARLATQLEVNTGTDDKTIVTPLKLMSKKATEGTEGIVRIATRAETIAGTSSVLAVSPVSLKWIVQSEPTWAATTTTRGFVKMSEGAITFVGNATAGSTQALDLYEKNSYAISPYELNKTLGNFLPRLAKAVDSDKLDNLDSTQFVRRDVAQDINAAMTFKQPVRIESTLTVTGVVNLSGSITSNNTTLTGSTTINSNSTVGALNYIEFTSESQGSGTWNSQHDSNVKAPVFLNITTPVGSSRYVPLIKQRYKDGTFTFGTLINEPTSNDEGAFILHYIDAVKPQRKWTFRRNGDLEITAGNFVLGNGSAIINGGLSVTKASGITTTGLVANSESRFEGAVTINNFLTVSNKATLNNGLAVQKYARVAGDKTSDIYSRKPTMDTAGFWSVDINDSATYNQFPGYFKMVEKTNEVTGLPYLERGEEVKSPGTLTQFGNTLNSLYQDWITYPNTTTASTTRWTRTWQQNKNAWSGFVQVFDGGNPPQPSDIGALPADNASMSNLTIRDWLRIGNVRIVPDPVTKSVKFEWIDTP
- Physico‐chemical
properties -
protein length: 1291 AA molecular weight: 141433,07510 Da isoelectric point: 5,55689 aromaticity: 0,08211 hydropathy: -0,38133
Domains
Domains [InterPro]
IPR048391
1139–1237
1139–1237
1
1291
Legend:
Pfam
SMART
CDD
TIGRFAM
HAMAP
SUPFAM
PRINTS
Gene3D
PANTHER
Other
Taxonomy
| Name | Taxonomy ID | Lineage | |
|---|---|---|---|
| Phage |
Escherichia phage vB_EcoM_VR7 [NCBI] |
700939 | Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes |
| Host |
Escherichia coli [NCBI] |
562 | Bacteria > Proteobacteria > Gammaproteobacteria > Enterobacteriales > Enterobacteriaceae > Escherichia |
Coding sequence (CDS)
Coding sequence (CDS)
Genbank protein accession
ADR32637.1
[NCBI]
Genbank nucleotide accession
HM563683
[NCBI]
CDS location
range 149709 -> 153584
strand +
strand +
CDS
ATGGCCGATATTTTAAAACCAGCATTCAGAGCAACATCCGGTCTCGATGCTGCTGGTGAGAAAGTCATTAATGTCGCTAAAGCTGATTACTCAGTTTTGTCAGACGGCGTGAACGTAAACTTCTTTATAGAAGAAAACACAATTCAACAATATGATGCAACACGCGGATATAAGAAAGATTTTGCAGTTATTTATGATAACCGTATTTGGGTTTCCCAACGCGAAATCGCAGAACCAGCAGGCTCATTTGTTCAGCAATATTGGACTGCAACCCGTACTGACCCGAAATGGGAAACTGTTGCATCACCGACTCGTCAGCTTAATTCCGGGGAATTTATCGCGGTCGACTCAGCTGCAAGCTTTACCACATTTACATTGCCTCCGAACCCGACTGATGGTGATACCATCGTTATTAAAGATATCGGCGGCAATACCGGTTATAATGAAATCAAAGTTCAATCTAGCAATGTGCCGGGGCAAGGTAACCAAAAAATTGTTCGTTTTGGTAATCAGTATTCAGAAGTTTTAATTACCAAACCGTTCTCTTATAACATGCTTATTTTCTCCAACCGTTTATGGCAGTTCTGGGAAGCAGGGAACGAAGAACGTGGAATAAGAATTGAACCAAGCTCTGGTAAATATCGTGCTCAGGCTGCAGACTTTATTATGCGCCGCTACACGACTGCAGAGAAGATTACATTTGTTCTTCCTAAGTATGCTAACCAAGGTGATATTGTCAAATCGGTAGATATAGATGGATTAGGGCCATTATATCACCTGGATGTTGAAACGTTTGACGAGTCAAGCTCTCTGGGTAAACAGGGACAGCACAGTATGGAATTCCGTACAACTGGTGATGGCTTCTTCGTTTATAATGCCACTGAAAAACTGTGGGTGACTTGGGATGGTGATAACAAAACTCGCCTGCGTGTAATCCGTGACAGTGTGAAATTGCTGCCAAACGAAAGCATTATCGTATTTGGTAATGATAACAGCACTCCACAGACAATTAACATCGACCTTCCAACGGGTGTTCGTCCTGGGGACGTAGTTAAGATTGCTCTGAACTATCTTCGCAAGGCACAGACTGTTAATATTAAGGCCACCGCGCTTGATAAAATCGCGTCTTCTGTTCAGCTGCTTCAGTTCCCGAAACGTTCGGAATATCCACCTGACACTGAATGGGTATTGGTTGACTCTTTGACTTTCAATGGCAACATAAGTTATACGCCGGTTATCGAATTAAGTTATCTTGAAGATACGGTTAAGAACATTAACTATTGGGTTGTTGCACAAAACGTTCCGACTGTTGAGCGTGTTGACTCAAAAGATGATTTGACCCGAGCTCGTCTGGGTGTTATTGCACTGGCTAACCAGGCTCAGGTTAACGTTGACCATGAAAATAACCCTGAAAAAGAATTAGCAATTACCCCGCAAACTTTAGCTAACCGTGTGGCTACTGAATCACGCCGCGGTATTGCACGAATCGCTAACACAGCACAGGTTAACCAGGATACGACTTTTGCTTTCCAGGATGATATTATCGTTTCTCCGAAAAAGTTAAACGAACGTACAGCTACAGAAACAAGACGTGGGCTCGCAGAAATCGCCACACAGCAAGAAACTGATGCAGGTATAGATGATACCACAATCATCACTCCACGCAAGCTACAAGCTCGCCAGGGCTCCGAAAGCTTATCGGGTATTGTCAAGTATGTTCCTACTACTGGGACTACTCCAGCTGCAAGTCGTATAACTGTTGGGACTAACGTTTATAATAAGAACACAACTAATTTAGTTATTTCTCCTAAAGCTTTAGACCAATATAAAGCTGACCAGAATAACCAAGGTGCTGTATATCTAGCAACTCAGTCAGAAGTTAACGCAGGGGCAACAAATACAGGATTCAGTAACTCGGCAGTAACTCCTGAAACATTAGGTGCTCGCAGAGCAACAGATTCAAACCACGGTTTAATCGAGATTGCAACTCAGGTTGAAACTAATGCCGGTACTGATTATACCAGAGCTGTAACTCCTAAAACGTTGAATGACCGTAAAGCAACAGAATCATTATCCGGCATAGCCGAGATTGCTACGCAATCAGAATTTGATACTGGAACTGATGATACTCGTATTGCAACGCCATTAAAAATTAAAACTAGATTTAATAATACTGCTCGTACTTCTGTTATTGCAGCAAGTGGTTTAGTAGAAACAGGGACGCTCTGGGACCATTATACGCTGAATATTCTTGAAGCAAATGAGACTCAACGTGGCACCGCAAGACTGGCTACTCAGTTGGAAGTAAACACGGGTACTGACGATAAAACAATCGTTACTCCGCTTAAGTTGATGTCGAAAAAAGCTACAGAAGGCACCGAAGGTATTGTTCGCATCGCTACTCGCGCAGAAACCATCGCAGGAACAAGTTCAGTTCTGGCTGTTTCTCCGGTAAGTCTGAAATGGATTGTACAGTCCGAACCAACATGGGCAGCAACCACGACGACACGCGGCTTTGTTAAGATGTCTGAAGGCGCAATTACTTTTGTCGGTAATGCAACCGCAGGTTCCACTCAGGCTCTTGACCTGTACGAGAAAAATAGCTATGCTATTTCGCCATACGAGTTAAACAAAACCCTTGGTAACTTCCTGCCGCGTTTGGCAAAAGCGGTAGACTCTGATAAATTGGACAACCTGGACAGTACGCAGTTCGTTCGTCGTGATGTAGCCCAGGATATTAACGCTGCTATGACATTTAAACAGCCTGTAAGAATTGAAAGTACTTTAACCGTTACAGGTGTGGTTAATTTGAGTGGTTCTATTACTTCAAATAATACTACATTAACCGGTTCTACTACAATCAATAGCAATTCTACAGTAGGTGCTCTGAATTACATTGAGTTTACTTCAGAATCTCAAGGCTCCGGTACTTGGAACTCCCAACATGATAGTAATGTTAAAGCTCCTGTATTTTTAAATATAACTACTCCGGTAGGCTCATCTAGATATGTTCCTTTAATTAAGCAACGTTATAAAGATGGGACATTTACCTTTGGTACATTGATAAATGAACCCACCTCAAATGATGAGGGTGCTTTTATTCTTCACTATATAGATGCGGTAAAACCCCAGCGCAAATGGACCTTTAGACGTAACGGCGATTTAGAAATAACTGCAGGTAATTTCGTTCTTGGTAATGGGTCTGCTATAATTAACGGGGGTCTTAGTGTTACTAAAGCTTCAGGTATCACAACCACCGGGCTAGTTGCTAATAGTGAATCTAGATTCGAAGGCGCTGTTACTATTAACAACTTCCTTACGGTAAGCAACAAAGCTACACTTAACAACGGCTTAGCTGTTCAGAAATATGCAAGGGTTGCAGGAGATAAGACTTCTGATATCTATAGTAGAAAACCTACAATGGATACCGCAGGTTTTTGGTCTGTTGACATTAATGATTCAGCCACATATAATCAGTTCCCGGGTTATTTCAAAATGGTTGAAAAGACCAACGAAGTAACTGGTCTGCCTTATTTGGAGCGTGGTGAAGAAGTTAAATCACCGGGTACATTAACTCAGTTTGGTAACACACTGAATTCACTCTATCAAGATTGGATTACTTATCCGAATACGACCACGGCAAGCACCACTCGCTGGACTCGTACATGGCAGCAGAACAAAAATGCATGGTCTGGTTTTGTTCAGGTCTTTGATGGTGGTAACCCACCGCAGCCTTCGGATATCGGTGCATTGCCTGCTGATAACGCTTCGATGAGCAACCTGACTATCAGAGATTGGTTAAGAATCGGTAACGTACGTATTGTTCCGGACCCAGTAACTAAATCCGTTAAATTCGAATGGATTGATACACCATAA
Gene Ontology
No Gene Ontology terms available.
Enzymatic activity
No enzymatic activity data available.
Tertiary structure
PDB ID
62f56e13478d0fd05899473861ad57f3fde61bc3e7137efab8a06067a45007df
Literature
No literature entries available.