Protein
- Genbank accession
- YP_010247066.1 [GenBank]
- Protein name
- long tail fiber protein distal subunit
- RBP type
-
TSPTSPTF
- Protein sequence
-
MATLKQIQFKRSKVAGVNPTAAQLAEGELAINLKDRTLFTKDDLGNIISLGFAKGGDINGNVTQNGDYLQNGTFNLNGNMFVYAGKYIEFLPKTAGNGARWANQHLNKAPIFTDLSSTTSVSEYHPLIKQRYKDGTFSAGTLVNEGSFKFHYIDETGTSKYWTFNRNGNFQVDSGSLLVSNGYLVTQSNIETKAGSLIGPKVITKNINVSTKSWDTNIDTAYDLVSLPTWQYTPTETDLDTNGINYLRKFRGHVSSAIFHEVADARSGKPQNISYWTGRNAEVYQWSYTTDGRMSVANSIGIGLADVGDQGRYPLVSFGKGIAIGDNDTGIKWVRDGVIDLVANGISAGTILNNGINSTKKLMVGYSRDSGSTWDFPNNNQAMFTARTDIDGNNNGDGQTHIGYSSNAKMYHYFRGTGRMAVGMAEGLIVEPGILDIKTSSNTLSLRADGTVASVQTLKLNNGLYFNGDGTNASLVFKAASGIDGTKQIMWEGGTRAGQNKSYVTVKAWGNSFNASGDRNRETVFEVADGQGYYFYSQRVAPTGSETVGPVVTQINGQLNARGSIITDGSLRVNGLSTLSGQVTMDNGLVLSGGGSITGQVKIGNTADAFRIYNAEYGAIFRRSEASLYIIPTLKDAGESGGISNLRPLSISLNNGMVQMRHSVTLGDDGAGGNMITVDNDNKLVVVTSNSRISPNFRMQIGQSAYIDAECTDAVRPAGAGSFASQNNENVRAPFYMNIDRTDTSTYVPIVKQRYVQNNSCYSIGTLINGGNFRVHYHEGGDGGSTGAIIKDLGWEFNKNGDFYSPGKLGAGNVRIGTDGNITGGSGNFANLNTTINNLKTDIVSSYPIGAPIPWPTDTPPEGYAIMEGQTFDAGLYPKLAAVYPSGSLPDMRGQTIKGKPSGRAVLSTEADGVKSHSHSASASNTDLGTKTTSSFDYGSKTTSSFDYGTKTSNTTGNHNHTVSGNTSSAGAHQHARSGPQIQAGIPNNIFYDGYNSVGANANAKFTGTVNGATAGSNIAKTSSDGAHTHSWSGTTSATGNHAHTVGIGAHTHTVGIGAHSHTVAIGSHGHTITVNATGNTENTVKNVAFNYIVRLA
- Physico‐chemical
properties -
protein length: 1097 AA molecular weight: 116501,24120 Da isoelectric point: 8,07803 aromaticity: 0,08569 hydropathy: -0,38314
Domains
Domains [InterPro]
Legend:
Pfam
SMART
CDD
TIGRFAM
HAMAP
SUPFAM
PRINTS
Gene3D
PANTHER
Other
Taxonomy
| Name | Taxonomy ID | Lineage | |
|---|---|---|---|
| Phage |
Escherichia phage HX01 [NCBI] |
1237364 | Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes |
| Host |
Escherichia coli [NCBI] |
562 | Bacteria > Proteobacteria > Gammaproteobacteria > Enterobacteriales > Enterobacteriaceae > Escherichia |
Coding sequence (CDS)
Coding sequence (CDS)
Genbank protein accession
YP_010247066.1
[NCBI]
Genbank nucleotide accession
NC_018855
[NCBI]
CDS location
range 116155 -> 119448
strand -
strand -
CDS
ATGGCTACATTAAAACAGATACAATTTAAAAGAAGCAAAGTAGCAGGAGTTAATCCTACTGCGGCACAATTAGCCGAAGGCGAATTAGCGATAAACTTAAAAGATCGAACTCTTTTTACTAAAGATGACCTCGGTAATATTATTAGCCTAGGCTTTGCTAAGGGCGGGGATATTAACGGTAATGTAACTCAAAATGGTGATTATTTACAAAACGGCACATTTAACCTCAATGGTAATATGTTCGTTTACGCCGGTAAGTATATTGAATTTTTACCTAAAACCGCTGGAAATGGTGCTCGTTGGGCCAACCAACATTTGAATAAAGCCCCTATCTTTACAGATTTAAGTTCAACTACTTCTGTTTCAGAATACCATCCGCTGATTAAACAACGCTATAAAGATGGAACTTTTTCTGCTGGTACATTAGTAAACGAAGGTAGTTTTAAATTCCATTATATTGATGAAACCGGGACTTCAAAATACTGGACTTTTAATCGAAACGGTAATTTTCAAGTTGATTCCGGAAGTTTATTAGTATCTAATGGATATTTAGTTACTCAAAGTAATATTGAAACTAAAGCTGGTTCTTTAATTGGTCCTAAAGTTATTACCAAAAATATCAATGTGAGCACTAAATCTTGGGACACTAATATTGATACTGCATATGATTTAGTTTCATTACCGACTTGGCAGTATACTCCAACCGAAACGGATTTGGATACTAATGGTATAAACTACCTTCGTAAATTCCGCGGACATGTTTCTTCTGCTATTTTCCATGAAGTTGCTGATGCTCGTTCAGGTAAACCACAGAATATTTCGTATTGGACGGGACGTAATGCTGAAGTTTATCAATGGTCTTATACCACAGATGGGCGTATGTCTGTTGCTAATTCGATAGGTATAGGTCTTGCTGATGTTGGTGACCAAGGACGTTATCCATTGGTTTCGTTTGGTAAAGGTATTGCAATTGGTGACAATGATACTGGTATTAAATGGGTTCGTGACGGGGTTATCGATTTAGTTGCGAATGGTATTTCTGCCGGCACTATTCTTAATAACGGTATTAACAGTACTAAAAAATTGATGGTTGGTTATAGTCGAGATTCCGGTTCTACCTGGGATTTTCCAAATAACAACCAAGCAATGTTTACCGCACGCACCGATATTGATGGTAATAATAACGGCGATGGTCAGACTCATATAGGTTATAGCAGCAATGCCAAGATGTATCACTATTTCCGTGGTACAGGTCGTATGGCTGTTGGCATGGCCGAAGGACTTATTGTTGAACCAGGAATTTTAGATATTAAAACTAGTTCAAATACATTAAGTTTGCGTGCTGATGGTACCGTCGCTTCTGTTCAAACGTTAAAGCTTAATAATGGATTATATTTTAATGGTGATGGAACTAATGCTTCTCTAGTTTTTAAAGCAGCTTCAGGTATTGACGGCACTAAGCAAATCATGTGGGAAGGCGGTACTCGAGCAGGTCAGAATAAGAGTTATGTAACTGTTAAAGCATGGGGTAATTCATTTAACGCATCCGGCGATCGTAATCGTGAAACAGTTTTTGAAGTAGCTGACGGACAAGGATATTATTTTTATTCACAGCGTGTGGCTCCAACCGGTTCAGAAACTGTGGGACCTGTTGTAACACAAATTAATGGACAACTGAATGCAAGAGGGAGCATTATCACCGATGGAAGTCTTAGAGTTAATGGATTAAGTACATTATCCGGACAAGTTACTATGGATAACGGGCTTGTTTTATCCGGCGGTGGTTCTATTACAGGTCAAGTTAAAATCGGTAATACCGCAGATGCTTTCCGTATTTACAATGCTGAATATGGAGCTATTTTCCGTCGTTCTGAAGCGTCTTTGTATATTATACCTACACTTAAAGATGCAGGTGAAAGTGGTGGAATAAGTAATCTCCGCCCGCTTAGTATTAGCCTTAATAATGGTATGGTGCAAATGCGTCATTCTGTTACGTTAGGCGATGATGGTGCTGGTGGTAATATGATTACTGTGGACAACGATAACAAACTTGTTGTTGTTACTAGTAATAGTCGCATTTCTCCTAATTTCAGAATGCAGATAGGTCAGTCGGCGTACATTGATGCAGAATGTACTGATGCTGTTCGCCCAGCTGGAGCCGGTTCTTTTGCTTCACAAAATAATGAAAACGTTCGTGCTCCTTTCTATATGAATATTGATAGAACAGATACAAGCACTTATGTTCCTATTGTGAAACAAAGATACGTTCAAAATAATAGTTGCTATTCTATTGGTACTTTAATTAATGGTGGTAACTTTAGAGTTCATTATCACGAAGGTGGCGATGGCGGTTCTACTGGCGCAATTATAAAGGATTTAGGTTGGGAATTTAATAAAAACGGTGATTTTTACTCTCCTGGTAAATTAGGCGCTGGTAATGTTCGTATTGGTACTGATGGTAATATCACCGGTGGTTCTGGCAATTTTGCTAACTTGAATACCACAATAAATAACCTTAAGACGGATATTGTCTCAAGTTATCCAATTGGTGCTCCGATTCCTTGGCCTACTGATACACCTCCTGAAGGTTACGCCATAATGGAAGGTCAAACATTTGATGCTGGCTTGTATCCTAAGTTAGCTGCTGTGTATCCTTCCGGCTCTCTGCCTGATATGCGTGGTCAAACTATCAAGGGTAAACCATCTGGGCGTGCTGTATTAAGTACAGAAGCAGACGGTGTTAAGTCACATAGCCATAGTGCAAGTGCATCAAACACGGATTTGGGTACTAAGACCACTTCTAGTTTTGATTACGGTAGCAAAACGACTTCAAGCTTTGATTATGGTACTAAGACCAGTAATACCACTGGTAACCATAACCATACAGTGAGCGGTAATACTAGTTCCGCCGGTGCGCACCAACACGCGCGTTCAGGCCCTCAGATACAAGCCGGCATACCCAATAACATATTCTATGACGGATATAATAGTGTAGGTGCAAACGCCAACGCTAAATTCACTGGAACCGTGAATGGTGCTACTGCAGGGTCGAATATAGCCAAAACTTCTTCAGATGGTGCCCACACTCATAGTTGGTCAGGAACTACTAGCGCTACGGGTAACCATGCTCATACTGTGGGTATTGGTGCTCATACGCATACTGTGGGTATTGGTGCTCATTCTCATACTGTTGCAATTGGTTCCCATGGACATACAATAACTGTAAATGCCACAGGAAATACAGAAAACACAGTTAAAAACGTTGCTTTTAACTATATCGTTCGTTTAGCATAA
Gene Ontology
No Gene Ontology terms available.
Enzymatic activity
No enzymatic activity data available.
Tertiary structure
PDB ID
a9546f62bfb58b23b32ba5184fceaf04cc24cf81a233f17971b8cce6e365de57
Literature
| Title | Authors | Date | PMID | Source |
|---|---|---|---|---|
| Complete Genome Sequence of T4-Like Escherichia coli Bacteriophage HX01 | Tang,F., Li,Y., Zhang,W. and Lu,C. | 2012 | 23166268 | GenBank |