Protein
- Genbank accession
- XHY53443.1 [GenBank]
- Protein name
- long tail fiber protein distal subunit
- RBP type
-
TSPTSP
- Protein sequence
-
MADLSRIQFKRTSTKGRRPDAGTMNPGELAINLADQYLLTKNDSGAIINLSCPPVYDRQVRFAGKVDGDNYILGKTANYMDDSTARDLDKFGAFRTNNADGWSNLILNIPHSNGKAHGRGFEFQYGSSSSQVKTYGFDKDGNKRFSYRMYHEGDKPTPGELNVYSKQEVDRMFVKNVKLATVPVDTVEGYFKLATAMIPQNGRSVFFRIHGGNGYNVTAYDQVDIVEIVIRSGNNRPKGVNVIAYRRNTNKSFDVLAVNTSGDNYDIYVKYQRYTDNVIVEFGKSVDVNLTVHDVPDFVAERPAGDNVIGGRAVTLFNTENKRGVLSFDDNTQNSYDIVHLSNDRGTGRKYIRKFRSNYNEMVWHETVQGAVYRLATGVTDSTEVLRVDSNSAIPGSYKGYVITGKMELHGSGNAMTLHRQTDQAAYMAWWDRRDGKNQRSGYIGHADGTSDGFVWRNDVGANSFDLEGSGQVNLTTGKTKIVYTNGQYYSANSDAYRMIFGNYGAFWRNDGTKIYLLSTEENDRFGGWNGNRPFIYDLTNGKVTLGGDGNEGALVLERDSRAARFSNNVFLEKGLLTFSAGGNQSMDSFTINHWGNSNAGRYNVLQFEDTKGTHFTTERNADGGLLAHFRGDLTTEGKLTWGKGTATSGFNIRAWGNSGSRKQVFECVDESGWHWYTQRPGGPGTSAIEFAINGTVKPQAIHTGGNILLNGADIEFRRTGNKHIWFRDPDGLELGLMYSDDAGVIRFRGQKQAQTWKFADKMIQLEAGTVTGGGNGLIRGEVAGGSWASWRDRAAGLMVGCPQSVDSAHNVWKATHWGKYHIAAMGVHVPSGTITNALARLNVHDANFDFNASGDMSVGRNGSFNDVYIRSDARLKINKEEYKENATDKVNRLTVYTYDKVKSLTDRTVIAHEVGIIAQDLEKELPEAVTTSKVGDPDKPEEILTISNSAVNALLIKAFQEMSEELKAVKAELAELKKN
- Physico‐chemical
properties -
protein length: 980 AA molecular weight: 108515,32620 Da isoelectric point: 7,69938 aromaticity: 0,10204 hydropathy: -0,56082
Domains
Domains [InterPro]
Legend:
Pfam
SMART
CDD
TIGRFAM
HAMAP
SUPFAM
PRINTS
Gene3D
PANTHER
Other
Taxonomy
| Name | Taxonomy ID | Lineage | |
|---|---|---|---|
| Phage |
Shigella phage SFHK24 [NCBI] |
3350103 | Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes |
| Host | No host information | ||
Coding sequence (CDS)
Coding sequence (CDS)
Genbank protein accession
XHY53443.1
[NCBI]
Genbank nucleotide accession
PQ351812
[NCBI]
CDS location
range 106102 -> 109044
strand -
strand -
CDS
ATGGCAGATTTAAGCAGAATCCAATTTAAACGCACTAGCACTAAAGGTCGTCGACCTGATGCTGGTACGATGAATCCGGGGGAATTGGCAATCAACCTTGCGGATCAATATCTTCTTACTAAAAATGATTCCGGTGCTATTATCAATTTAAGTTGTCCTCCGGTTTATGACCGACAAGTTAGATTCGCTGGTAAGGTTGACGGCGACAACTATATTTTAGGTAAAACCGCTAACTATATGGACGATTCAACCGCTCGCGACCTTGACAAATTTGGTGCGTTTCGAACGAATAATGCTGATGGTTGGTCTAACTTGATTCTGAACATTCCTCATTCTAACGGTAAAGCACACGGTCGCGGGTTTGAATTTCAATATGGTTCTAGTTCCTCTCAGGTTAAAACCTATGGTTTTGATAAGGATGGCAACAAGAGATTCAGTTACCGCATGTATCACGAAGGTGATAAGCCAACTCCAGGAGAATTGAACGTTTATAGCAAACAAGAAGTAGATAGAATGTTTGTTAAGAACGTTAAACTTGCTACAGTTCCTGTTGATACCGTTGAAGGCTATTTTAAATTAGCAACTGCAATGATTCCACAAAATGGGCGTAGCGTATTTTTCCGTATTCATGGCGGCAACGGATATAACGTTACTGCATACGATCAAGTTGATATTGTAGAAATTGTTATTCGTAGTGGAAATAATCGCCCTAAAGGTGTTAACGTTATTGCATATCGCCGAAATACAAACAAATCATTTGATGTTTTGGCTGTTAACACTTCTGGCGATAACTATGATATCTATGTGAAATATCAGCGTTATACTGATAACGTTATTGTTGAATTTGGTAAAAGTGTTGATGTTAATTTAACAGTGCATGACGTTCCAGATTTTGTTGCTGAACGTCCTGCTGGCGATAATGTTATTGGCGGTCGCGCTGTAACTCTTTTCAACACCGAAAACAAACGAGGTGTGTTGAGTTTTGACGACAACACACAAAATAGCTATGATATTGTTCACTTGAGTAATGATAGAGGTACTGGTAGGAAATATATTCGTAAATTCCGTAGTAACTATAATGAAATGGTTTGGCATGAAACCGTTCAGGGTGCTGTATATCGTCTTGCTACTGGTGTTACAGATTCTACGGAAGTTCTTAGAGTTGATTCTAATAGTGCTATACCTGGTAGCTATAAAGGATATGTAATTACTGGTAAAATGGAATTGCACGGTAGTGGTAATGCGATGACTTTACATCGCCAGACTGATCAAGCTGCCTATATGGCGTGGTGGGATCGTCGTGATGGTAAAAACCAACGTAGTGGTTATATCGGTCATGCGGATGGTACTAGTGATGGTTTTGTGTGGCGTAATGATGTTGGTGCTAACTCATTTGATTTGGAAGGTAGTGGACAAGTAAATTTGACTACAGGAAAAACAAAAATTGTATATACCAACGGACAATACTATTCCGCTAACTCAGATGCATATCGCATGATCTTTGGTAATTACGGTGCATTCTGGCGTAATGACGGTACGAAAATTTATCTTCTTTCCACAGAAGAAAATGACCGTTTTGGTGGATGGAACGGCAACCGACCATTCATCTACGATTTGACAAATGGTAAAGTTACTTTAGGTGGTGATGGTAACGAAGGCGCATTAGTTCTCGAAAGAGATAGCCGTGCTGCTCGTTTTAGCAACAATGTATTCTTAGAAAAAGGATTGCTTACTTTCTCTGCGGGTGGGAATCAGTCGATGGATTCTTTCACTATTAACCATTGGGGGAATAGTAACGCTGGACGATATAATGTTTTACAATTTGAAGACACGAAAGGAACACATTTTACAACCGAACGTAATGCTGATGGTGGATTGCTTGCTCACTTCCGAGGGGATTTAACCACAGAAGGGAAATTAACGTGGGGCAAGGGTACAGCCACATCTGGCTTTAACATTCGTGCATGGGGTAATAGTGGTTCCCGTAAACAGGTTTTCGAGTGTGTAGATGAAAGTGGTTGGCATTGGTATACTCAACGGCCTGGCGGTCCGGGTACTTCTGCAATTGAGTTTGCCATCAACGGTACTGTTAAGCCTCAAGCAATTCACACTGGCGGCAATATTCTTTTGAACGGTGCTGATATTGAATTTCGTCGCACTGGTAATAAGCATATCTGGTTTAGAGATCCAGACGGTTTAGAACTAGGTTTGATGTATTCCGATGATGCTGGTGTTATTCGCTTCCGTGGTCAGAAACAAGCCCAGACGTGGAAATTTGCAGATAAAATGATCCAATTGGAAGCTGGTACTGTAACTGGTGGCGGTAATGGCCTGATTCGTGGTGAAGTTGCTGGCGGTAGTTGGGCTAGCTGGCGTGACCGTGCTGCTGGCCTTATGGTTGGGTGTCCTCAATCCGTTGACTCGGCACATAACGTATGGAAAGCGACGCATTGGGGTAAATATCATATCGCAGCAATGGGTGTACATGTTCCTAGTGGTACTATTACCAATGCTTTAGCTCGCCTAAACGTTCATGACGCCAACTTTGACTTTAACGCCTCCGGTGATATGTCGGTAGGTCGTAACGGTTCGTTTAACGATGTGTATATTCGTTCTGATGCTCGCCTTAAAATCAACAAGGAAGAGTATAAAGAGAATGCCACCGATAAAGTTAATCGCTTGACTGTATACACCTACGATAAGGTTAAATCTTTAACTGACCGTACTGTCATTGCTCATGAAGTTGGTATTATTGCACAGGATCTTGAAAAAGAATTGCCGGAAGCCGTAACAACTTCTAAGGTCGGCGATCCAGATAAACCAGAAGAGATATTAACAATTTCTAACTCTGCTGTCAACGCTCTTTTAATTAAGGCGTTTCAGGAAATGAGCGAAGAATTGAAAGCCGTTAAAGCTGAACTAGCGGAACTTAAAAAGAATTAA
Gene Ontology
No Gene Ontology terms available.
Enzymatic activity
No enzymatic activity data available.
Tertiary structure
PDB ID
f4e381c086fc400e532eebe561827cc926e778a2fe7d76d423dd4d4d4c2aaeed
Literature
No literature entries available.