Protein
- Genbank accession
- WKM80872.1 [GenBank]
- Protein name
- long tail fiber protein
- RBP type
-
TSPTSPTF
- Protein sequence
-
MATLKQIQFKRSKTAGARPAASVLAEGELAINLKDRVLFTKDDQGNIIDLGFAKGGSIDGNVIHTGNYNQTGDYTLNGVFTQTGNFNLTGIARVTRDIIAAGQIMTEGGELITKSSGTAHVRFFDNNSRERGIIYAPANDGLTTQVLNIRVQDYAAGSESTYAFSGSGLFTSPEVSAWKSISSPQILTNKVITNNKSTGDYDIYSMADNVPLSESTTAINHLRVMRNAVGSGIFHEVKDNDGITWYSGDGLDAYLWSFTWSGGIKSSHSISIGLTPGNKDYSILGPSSIALGDNDTGFKWHQDGYYFSVNNGTKTFLFNPSETTSLRKFVAGYSTNGTDLTTPPTENYALATVVTYHDNNAFGDGQTLLGYYQGGNYHHYFRGKGTTNINTHGGLLVTPGNIDVIGGSVNIDGRNNSSTLMFRGNTTGYSSVDNMDIKVWGNTFVDPSGGIRKNIMEISDATSWMSYIQRLTTGEVEMNVNGSFESSGVTAGDRGVHTTGEISSGAMNALRIWNADYGAIFRRSEGSLHIIPTAYGEGKNGDIGPLRPFSMALDTGKVTIPDLQSSYNTFAANGYIKFVGHGAGAGGYDIQYAQAAPIFQEIDDDAVSKYYPIVKQKFLNGKAVWSLGTEINSGTFVIHHLKEDGSQGHTSRFNQDGTVNFPDNVSVGGGEATIARNGNIWSDIWKTFTSAGDTTNIRDAIATRVSKEGDTMTGTLWINKDAAGIVLNPPLTSDSSFIRSDTAGANNWYIGKGGADNGLGFYSYVTQGGVYITNNGEISLSPQGQGTFNFNRDRLHINGTQWAAHQGGGWGNQWNQEAPVFVDFGNVGNDSYYPIIKGKSGITNEGYISGVDFGMRRITNTWAQGIIRVGNQENGYDPQAVYEFHHNGTFYAPSLLKSSRVSAGGGDPAWGGPCIVLGDNDTGLLWENDGIFNAYANGQGVFSFRPGLAQTFGDVNFHCNAGMYVRDNIDVNDVYIRSDIRCKSEIKLIKNAQEKSKLLGGYTYLLKNSVTDEVKPSAGLIAQEVQEVLPELVSEDKETGLLRLNYNGIIGLNTAAINEHTDEIKELKSEITELKALIKSLIK
- Physico‐chemical
properties -
protein length: 1083 AA molecular weight: 116983,08040 Da isoelectric point: 5,42172 aromaticity: 0,10065 hydropathy: -0,35078
Domains
Domains [InterPro]
Legend:
Pfam
SMART
CDD
TIGRFAM
HAMAP
SUPFAM
PRINTS
Gene3D
PANTHER
Other
Taxonomy
| Name | Taxonomy ID | Lineage | |
|---|---|---|---|
| Phage |
Escherichia phage PECP20 [NCBI] |
3056225 | Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes |
| Host | No host information | ||
Coding sequence (CDS)
Coding sequence (CDS)
Genbank protein accession
WKM80872.1
[NCBI]
Genbank nucleotide accession
OQ873415.1
[NCBI]
CDS location
range 44571 -> 47822
strand +
strand +
CDS
ATGGCTACTTTAAAACAAATACAATTTAAAAGAAGCAAAACTGCAGGAGCACGTCCTGCCGCTTCAGTATTAGCCGAAGGTGAATTGGCTATAAACTTAAAAGACCGTGTACTTTTTACTAAAGATGACCAAGGAAATATTATTGATCTAGGTTTTGCTAAAGGTGGTAGTATTGACGGGAATGTTATTCATACTGGCAATTACAACCAAACTGGTGATTATACTTTAAATGGCGTCTTCACACAGACGGGTAATTTTAATTTAACTGGTATTGCTCGAGTAACTCGCGATATTATTGCCGCCGGGCAGATTATGACTGAAGGCGGTGAACTTATTACAAAAAGTTCAGGCACAGCACATGTTCGTTTTTTCGATAACAATAGTCGCGAACGCGGAATCATTTATGCCCCGGCTAATGATGGTTTAACTACACAAGTACTTAATATCAGGGTTCAAGACTATGCCGCTGGTAGCGAAAGCACTTATGCATTTTCAGGCAGTGGACTATTTACTTCACCTGAAGTATCAGCATGGAAATCTATTTCGTCTCCACAAATTCTAACCAACAAAGTCATTACTAATAATAAATCTACGGGTGATTATGACATCTATTCGATGGCAGACAATGTTCCATTGTCTGAAAGCACTACTGCTATTAATCATCTTCGTGTCATGCGTAATGCCGTTGGTTCTGGTATTTTCCATGAAGTTAAAGATAATGATGGAATAACTTGGTATAGTGGAGATGGATTAGATGCTTATCTTTGGTCATTTACCTGGAGCGGCGGAATTAAATCAAGTCACTCAATTTCTATCGGTTTAACACCAGGTAATAAAGATTATTCAATATTAGGACCATCTAGCATTGCTTTAGGAGATAATGATACTGGATTTAAATGGCATCAAGACGGATATTATTTCAGCGTTAATAATGGAACAAAAACGTTTTTATTTAATCCTAGCGAAACAACTAGCCTAAGAAAATTTGTAGCTGGATATTCTACTAATGGAACCGATTTAACTACTCCTCCAACTGAAAACTATGCTCTTGCTACTGTTGTGACATATCACGATAATAACGCGTTTGGAGATGGTCAGACTCTTTTGGGATATTATCAAGGCGGTAACTATCATCATTATTTCCGCGGCAAGGGTACTACAAACATTAATACTCACGGCGGTTTGTTAGTTACTCCTGGTAATATTGACGTTATTGGCGGTTCTGTAAATATAGATGGTAGAAATAATTCTTCTACACTAATGTTTAGAGGCAACACAACAGGATACAGCTCGGTTGATAATATGGATATTAAAGTTTGGGGTAATACGTTTGTTGATCCAAGCGGAGGTATCCGTAAAAACATTATGGAAATTTCTGATGCAACTAGCTGGATGAGCTATATTCAAAGACTTACTACTGGCGAAGTAGAAATGAACGTTAATGGTTCATTTGAATCATCTGGTGTTACTGCTGGAGATAGAGGAGTTCACACAACAGGTGAAATTTCATCTGGAGCAATGAATGCACTTCGCATTTGGAATGCAGATTATGGAGCCATTTTTAGACGTTCAGAAGGTAGTCTTCATATTATTCCAACTGCTTACGGTGAAGGCAAAAATGGTGATATCGGTCCACTTCGCCCGTTTAGTATGGCTTTAGATACCGGTAAAGTTACTATTCCAGATTTACAATCAAGTTACAATACGTTCGCAGCGAACGGCTATATTAAATTTGTTGGTCATGGCGCTGGCGCAGGTGGATATGATATTCAATATGCCCAAGCGGCTCCTATTTTCCAGGAAATTGATGATGATGCTGTAAGCAAATATTATCCTATTGTTAAACAGAAGTTTTTAAATGGTAAAGCCGTTTGGTCTTTAGGTACTGAAATTAATTCGGGTACATTCGTTATTCATCATCTGAAAGAAGATGGATCACAAGGCCATACGTCTCGTTTTAATCAAGACGGTACTGTTAACTTCCCAGATAACGTTTCTGTTGGCGGCGGTGAAGCTACTATTGCTCGCAATGGTAATATCTGGTCTGATATCTGGAAAACGTTTACTTCTGCCGGTGATACTACAAATATTCGCGATGCTATTGCGACTCGTGTTTCGAAAGAAGGCGACACGATGACCGGCACTCTTTGGATTAATAAAGATGCCGCTGGAATAGTTCTTAATCCTCCTTTGACCAGTGATTCATCATTTATTCGTTCTGATACGGCCGGGGCCAATAATTGGTATATTGGTAAAGGCGGTGCCGACAATGGTCTAGGTTTTTACAGTTATGTTACACAAGGCGGTGTATATATAACAAATAACGGAGAAATATCACTTTCTCCTCAAGGCCAAGGAACATTTAATTTTAATAGAGACCGCCTCCATATAAACGGTACACAATGGGCCGCACACCAGGGCGGTGGTTGGGGAAATCAATGGAATCAAGAAGCACCGGTATTTGTAGATTTTGGTAATGTTGGTAATGATAGTTATTATCCTATTATTAAAGGAAAATCCGGTATTACTAATGAAGGATACATATCTGGTGTAGATTTTGGTATGCGACGCATTACTAATACATGGGCACAAGGTATTATTCGTGTAGGTAATCAGGAAAACGGTTACGACCCACAAGCTGTATATGAATTCCATCATAACGGTACTTTTTATGCTCCAAGCTTACTTAAGAGCAGTAGAGTATCAGCTGGTGGTGGTGACCCTGCATGGGGCGGGCCGTGTATTGTACTTGGAGATAACGATACCGGTTTGCTTTGGGAAAACGATGGTATTTTCAACGCATATGCAAACGGCCAAGGTGTGTTTAGTTTTAGACCTGGTTTAGCTCAGACATTCGGTGATGTTAACTTCCACTGTAATGCAGGTATGTATGTTCGTGATAACATTGATGTTAATGACGTTTATATTCGTTCTGATATTCGTTGTAAGTCGGAAATTAAGCTTATTAAGAACGCTCAAGAGAAATCTAAACTATTGGGCGGTTATACTTATCTGCTTAAAAACTCTGTTACAGACGAAGTTAAACCGTCCGCAGGTTTAATTGCTCAGGAAGTTCAAGAAGTATTACCTGAACTTGTTTCTGAAGATAAAGAGACCGGACTGCTTCGTTTGAACTATAACGGTATTATTGGTTTAAATACAGCTGCAATAAACGAGCATACAGATGAAATCAAGGAATTGAAATCTGAAATTACCGAATTGAAAGCATTAATTAAATCATTGATAAAATAA
Gene Ontology
No Gene Ontology terms available.
Enzymatic activity
No enzymatic activity data available.
Tertiary structure
PDB ID
ee40be9f6fc945c610e62ce09ed601b451e2431664aaebba11f25dfb0d57c304
Literature
No literature entries available.