Protein
View in Explore- Genbank accession
- AKP44707.1 [GenBank]
- Protein name
- hypothetical protein
- RBP type
-
TSP
- Protein sequence
-
MKKNKLLQRGSLFGNKEFKIEEFNKNFDTFNVKDIFTDMDSGSVFIIKDDLKLYAAGYNVFGNLGLGNKVSPIRYFSKIDIDNVKYVSSSGTHSLLLKNNGDVYSTGLNTDGELGLGDNIDRNTFTKINISNVKQIACGNGYSMLVTNDNELYVCGNNKFGGIGLGNTSTVNTFTKIDNLSVKEIFAGVSCSYILTLNNEVYSTGTNSYGQLGLNDTTNRNIFTKVNLDNVIKISTAQGAVNFLLENGDVYGCGDNSNGQVGVGGGATVTVLTKLSISNVKNIESGRYHKFYIANNNDIYVTGANPDGRLGDKINCDRSTYTPRKSSISIKNISKIKCAHAISFILTSNNELYMTGDNSYSFSYLKRYDKFIYGFEKFEDFDIEECNHIESIDNRLLINKNDERVLDIGLENNFVNISLVKANDTSTFIVVNGNELYAAGYNAYGGLGLGHNRHCYEFTRVPLELEEGVTIKDIYLNLGSYFTFILLSDNTLYSTGYNVFGVLGLGDNINRNTFTKVNISSVDKISVGDNHALLKTTTNELFSTGLNNYGQLGLNDTTNRNIFTKVSTVTYVNEIIAYSNSSYCIDNSRISYAAGYNVFGELSLNDTSSRSVFVKMRYSRYKTDTTVSDVSNIAEIIPFNNGCLIRTTSNNYYVSGRHNYYSTSIKNSVTDDYYSRFGEFVGSKNSNANEVAVLIDEPKLSKVLVSNYNLCLLLDASDGGYKEIKFTGRPSTFGASSQDKNLGLRSLISSSMPYYNHYLGTDNLLYTTSKTRMESKFEIRGRNAGGQRGDSSYYSNSQKYTLSNAFFAYNSQVIYASGLRIVIKDYFGNIYCSGVNSHGCFGIKKPYDVRHDGFVNISKQFSKKYIISNIKEIKSDRQALYILLNNSEGYVCGNNAGNKLGTIKARSEFIKVPIDNIKEFIPSNDCLFILTNNNQVYSIGTNDLGQLGLGDNIDRGTFTKVPIDNVKKVITCYKSSYILTYDNELFSTGSNGYGQLGLGDNINRNTFTKVNISGTIKDIFCGRYVFIILLENDNIISLMGCGNRNYISSNTNSNSLTKINIEGLTDPSTISNLMLEEGKTIITMKNRIFVTGYNSLGGLGVGTSYNNSSGYIEGYKDLAFNSNIKEVALGEYTIFVLLENGDLYSGGNADDGIGFNESGTVVLKKLTSNIKHIYANGKNAYYIDNDNALYVFGSRQLGQINNYSDVVQKTPVRNCLNVKQVYTQHNGLIVQYTNNKLEGKGNAVVGQVGIFNGHEENQIANTSGDNPSDLSFSNEMSIIRNNYGLLVNKKIFLHNDDSINYRIPFGTNAGNYSTSLPFDNIKKMSLSSTHSILILENGDVYGCGSNQFGELAINKSELTTTSEFIKINLTNIIDIACGDNFTYFLKNDGSLFSIGKNSEYQLGIGHNDEVNELQEVLTISNIREIYAYSNYILAITTEGQLYVQGYNINGILGLNENTKNTIIKLFTKVLENVKYIKSYDDKHIFVIKNDKTLYVTGINKETYKIKDVEIGSMLYTFSQIYIPRDVNDIVDALIKDETLYIISKVDSEKTCLEIKNKSYSSIEIDLQNPNNELTKIEMFINNISSSIIEDLSTGTVTFEINPENLVLGENKIVFKAHSDIGNNLYINVYIYKKETGATIVKDSTVLIDGNTYNVSSIVDNSQDVVLTLNKGLLEDLNSNNPIYHLVNKLKVQLKINESDTFKDMVKVETRKTENGYKEIYELKDMNIQSAQPKVIVEEGNTNTTIKKPSMLFNLDVETL
- Physico‐chemical
properties -
protein length: 1759 AA molecular weight: 195674,25020 Da isoelectric point: 5,77089 aromaticity: 0,10290 hydropathy: -0,30080
Domains
Domains [InterPro]
IPR009091
STR
14–181
STR
14–181
IPR009091
STR
45–361
STR
45–361
IPR000408
STR
51–100
STR
51–100
IPR000408
STR
101–149
STR
101–149
IPR051553
Unmapped
129–360
Unmapped
129–360
1
1759
Architecture
STR 14-367 | STR 387-1282 | STR 1295-1520 | RBD 1521-1759
Legend:
ATT
STR
RBD
CBM
LEC
ENZ
CHP
LNK
TAS
TTP
UNK
Unmapped
Tail Spike Domain Segmentation
Tail Spike Domain Segmentation
This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.
Domain Layout
1
1759
| Domain | Start | End | Length (AA) | Confidence |
|---|---|---|---|---|
| N-terminal | 1 | 29 | 29 | 0,6031 |
| Central domain | 30 | 228 | 200 | 0,5750 |
| C-terminal | 229 | 1759 | 1530 | 0,4041 |
Note: Constraints were applied during segmentation.
Fixed 23 C-terminal predictions appearing before Central domain
Fixed 23 C-terminal predictions appearing before Central domain
Legend:
N-terminal
Central domain
C-terminal
3D Structure with Domain Coloring
The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).
Domain Coloring
N-terminal
1-29
1-29
Central
30-228
30-228
C-terminal
229-1759
229-1759
Taxonomy
| Name | Taxonomy ID | Lineage | |
|---|---|---|---|
| Phage |
Peptoclostridium phage phiCDIF1296T [NCBI] |
1677909 | Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes |
| Host |
Clostridioides difficile [NCBI] |
1496 | cellular organisms > Bacteria > Bacillati > Bacillota > Clostridia > Peptostreptococcales |
Coding sequence (CDS)
Coding sequence (CDS)
Genbank protein accession
AKP44707.1
[NCBI]
Genbank nucleotide accession
CP011970
[NCBI]
CDS location
range 34436 -> 39715
strand +
strand +
CDS
ATGAAAAAGAATAAACTATTACAAAGAGGTTCTTTATTTGGAAACAAAGAATTTAAAATAGAAGAGTTTAATAAAAATTTTGATACTTTTAATGTTAAAGATATATTTACAGATATGGATTCTGGTTCTGTGTTTATAATTAAGGATGATTTAAAGTTATATGCAGCAGGATATAATGTTTTTGGCAATTTAGGACTTGGAAATAAAGTATCACCTATAAGATATTTTTCAAAAATAGATATTGACAATGTTAAGTATGTTTCATCTTCTGGAACTCATTCTCTTTTACTTAAAAATAACGGAGATGTGTATTCTACTGGCTTAAACACAGATGGGGAGTTAGGTTTGGGAGATAATATTGATAGAAATACTTTTACTAAGATAAATATAAGTAATGTAAAACAAATTGCTTGTGGGAATGGCTATTCTATGTTAGTTACAAATGACAACGAGCTTTATGTATGTGGTAATAATAAATTTGGAGGGATAGGCTTAGGAAATACATCTACTGTAAATACATTTACTAAAATTGATAATTTGAGTGTTAAAGAAATATTTGCAGGAGTCAGTTGTTCATATATATTAACTTTAAATAATGAAGTCTATTCAACAGGTACAAATTCCTATGGGCAGTTAGGACTTAATGACACTACTAATAGAAATATTTTTACTAAAGTAAATTTAGATAATGTAATAAAGATTTCTACTGCTCAAGGTGCTGTAAATTTTCTTTTAGAAAATGGGGATGTCTATGGTTGTGGAGATAATTCAAATGGGCAAGTTGGTGTTGGTGGAGGAGCTACAGTAACAGTCTTAACAAAACTATCTATATCTAATGTAAAAAATATAGAAAGTGGTAGATATCATAAATTTTATATAGCTAATAATAATGATATATATGTAACTGGAGCCAACCCAGATGGGCGTTTAGGAGATAAAATAAATTGTGATAGATCAACATATACTCCTAGAAAATCTTCTATTAGTATTAAAAATATAAGTAAAATTAAATGTGCTCATGCTATAAGCTTTATATTAACTAGCAACAATGAATTGTATATGACAGGAGATAACAGTTATAGTTTTTCTTATTTAAAAAGATATGATAAATTTATATATGGATTTGAAAAATTTGAGGACTTTGATATTGAAGAATGTAATCATATTGAGTCTATTGATAATAGATTATTAATAAATAAAAATGATGAAAGAGTTTTAGATATAGGGCTTGAAAATAATTTTGTGAATATCTCTTTAGTGAAAGCAAATGACACCTCTACATTTATTGTTGTGAATGGTAATGAACTATACGCAGCAGGATACAACGCTTATGGAGGTTTAGGTTTAGGTCATAATCGTCATTGTTATGAGTTTACTAGAGTGCCATTGGAATTAGAAGAAGGAGTTACTATAAAAGATATATATTTAAATCTAGGCTCATATTTCACGTTTATATTACTAAGTGATAATACATTATATTCAACAGGATATAATGTATTTGGAGTGTTAGGATTAGGGGATAATATTAATAGAAATACTTTTACTAAAGTAAATATTTCTTCTGTTGACAAAATTTCTGTAGGAGATAACCATGCGTTATTAAAAACAACTACTAATGAATTATTTTCAACTGGTTTAAACAATTATGGGCAGTTAGGACTTAATGACACTACTAATAGAAATATTTTTACTAAAGTAAGTACTGTAACTTATGTAAATGAAATTATTGCATATTCAAATTCTTCATATTGCATAGACAATAGCAGAATATCTTATGCAGCAGGATATAATGTTTTTGGCGAATTAAGTCTTAATGATACCTCAAGTAGGAGCGTTTTTGTTAAGATGAGATATTCAAGATATAAAACAGATACAACAGTATCAGATGTATCTAACATTGCTGAAATTATTCCTTTTAATAATGGATGTTTAATTAGAACTACGTCTAATAACTACTATGTTTCTGGGAGACATAATTATTATAGCACAAGTATTAAAAATTCTGTAACTGATGATTATTATTCAAGGTTTGGAGAGTTTGTAGGAAGTAAAAACTCAAATGCAAATGAAGTCGCAGTTTTAATAGATGAACCTAAATTATCAAAAGTTCTGGTTTCTAACTATAATTTATGTTTATTATTAGATGCTAGTGATGGAGGATATAAAGAAATAAAATTCACAGGAAGACCTTCGACTTTTGGAGCTTCATCCCAAGACAAGAATTTAGGTTTAAGAAGTCTTATATCGTCTTCTATGCCTTATTATAATCATTATCTTGGAACAGACAATCTTTTATATACAACAAGTAAAACAAGGATGGAGTCTAAATTTGAAATAAGAGGTAGAAATGCAGGTGGGCAAAGAGGAGACAGTAGTTATTATTCTAATAGTCAAAAATACACATTATCAAATGCTTTTTTTGCATATAATTCACAAGTAATATATGCTAGTGGATTAAGGATAGTAATTAAAGATTATTTTGGGAACATATATTGTTCTGGAGTAAATTCTCATGGCTGTTTTGGCATAAAAAAACCTTATGATGTTAGACATGATGGTTTTGTAAATATATCAAAACAATTTTCTAAAAAATATATCATATCAAATATAAAAGAAATTAAAAGTGATAGACAAGCTTTATATATATTATTAAATAATAGCGAAGGATATGTCTGTGGTAATAATGCTGGTAACAAGTTAGGGACAATTAAAGCTCGGTCTGAATTTATAAAAGTTCCTATAGATAATATAAAAGAATTTATTCCATCGAATGATTGTTTATTTATTCTTACAAATAATAATCAAGTCTATTCAATTGGAACAAATGACTTAGGGCAATTAGGTTTAGGAGATAATATTGATAGGGGTACTTTTACTAAGGTGCCTATTGATAATGTAAAAAAAGTAATAACATGTTACAAATCTTCTTACATTCTAACCTATGACAATGAATTATTTTCAACTGGTTCAAATGGCTATGGTCAATTAGGATTAGGGGATAATATTAATAGAAATACTTTTACTAAAGTAAATATTTCTGGAACAATAAAGGATATATTTTGTGGAAGGTATGTTTTTATTATATTATTGGAGAATGATAATATAATTTCTTTAATGGGTTGTGGAAATAGAAATTACATAAGTTCAAATACAAATTCAAACAGTTTAACTAAAATAAATATTGAAGGATTAACAGACCCATCAACTATATCAAATTTAATGTTGGAAGAAGGCAAAACTATAATTACAATGAAAAATAGAATATTTGTCACAGGATATAACTCATTAGGAGGTTTAGGTGTTGGTACTTCATATAATAATTCATCAGGATATATTGAAGGATATAAGGATTTAGCGTTTAATAGTAATATAAAAGAGGTTGCTCTAGGAGAATACACTATTTTTGTTTTACTTGAAAATGGAGATTTATATTCTGGAGGAAATGCTGATGATGGTATAGGTTTTAATGAATCTGGTACTGTAGTATTAAAAAAATTAACAAGTAATATAAAGCACATATATGCAAATGGTAAAAATGCTTATTATATAGATAATGATAATGCCTTATATGTGTTTGGTAGTAGACAATTGGGTCAAATCAATAATTATTCTGATGTTGTACAAAAAACACCTGTTAGAAATTGCCTTAATGTAAAACAGGTATATACACAGCATAATGGTCTTATAGTTCAATATACTAATAATAAATTAGAAGGAAAAGGTAATGCTGTAGTTGGTCAAGTAGGTATTTTTAATGGACATGAAGAAAATCAGATTGCAAACACTTCTGGTGATAATCCTAGTGATTTAAGTTTTTCTAATGAAATGTCTATTATAAGAAATAATTATGGACTATTAGTAAATAAGAAGATATTTTTACATAATGATGATAGTATTAATTATAGAATACCATTTGGCACAAATGCTGGAAATTACTCAACTTCATTGCCTTTTGATAATATAAAAAAGATGTCTTTATCATCAACTCATTCAATTTTGATATTAGAAAATGGGGATGTCTATGGTTGTGGTTCAAATCAATTTGGGGAACTTGCTATAAATAAATCTGAGCTAACAACAACTTCTGAATTTATAAAAATTAACTTAACAAATATAATAGATATTGCTTGTGGTGATAATTTTACTTACTTCTTAAAAAATGATGGCTCATTGTTTTCTATTGGTAAAAACTCAGAATATCAACTTGGAATAGGGCATAATGATGAGGTTAATGAGTTACAAGAAGTATTAACTATTTCTAATATAAGGGAGATATATGCTTATAGTAATTATATATTGGCTATAACTACAGAAGGTCAATTATACGTACAAGGATATAATATAAATGGGATTTTAGGACTGAATGAGAATACAAAAAATACAATTATTAAATTATTTACTAAAGTATTAGAAAATGTAAAATATATAAAATCTTATGATGATAAACATATATTTGTTATAAAAAATGATAAGACTTTGTATGTTACAGGGATAAATAAGGAAACATATAAAATTAAAGATGTAGAGATTGGTTCTATGTTATATACTTTCTCACAAATATATATTCCAAGAGATGTTAATGATATAGTGGATGCTTTAATAAAAGATGAAACATTATATATAATCTCAAAAGTAGATTCAGAGAAAACTTGTTTGGAAATAAAGAATAAGTCATACTCATCTATTGAAATAGATTTGCAAAATCCAAATAATGAATTGACAAAAATAGAGATGTTTATAAATAATATTAGTTCAAGTATAATAGAAGACTTATCTACAGGAACAGTCACGTTTGAGATTAATCCAGAGAATTTAGTTCTTGGAGAAAATAAGATTGTATTTAAAGCACATTCTGACATTGGAAATAATTTATATATAAATGTTTATATTTATAAAAAAGAAACAGGAGCAACTATAGTAAAAGATTCAACTGTATTAATCGATGGGAATACTTATAATGTATCTAGTATAGTTGATAATTCACAAGATGTAGTACTTACACTCAATAAAGGTCTGTTAGAAGATTTAAATTCTAACAATCCAATTTATCATTTAGTAAATAAATTAAAAGTACAATTAAAGATAAATGAATCAGATACATTTAAAGATATGGTTAAAGTAGAGACAAGAAAAACTGAGAATGGATATAAGGAGATATATGAGTTAAAAGATATGAATATACAATCTGCACAACCTAAAGTAATAGTAGAAGAAGGAAACACTAATACAACTATAAAAAAACCATCTATGTTATTCAATTTAGATGTTGAAACACTTTAA
Genome Context
Genome Context
Tertiary structure
PDB ID
5b50c9ffb71d5adc8a8ea2630098ba536932f1d9f257ea7a89326c83467ac617
Model Confidence
Very high
pLDDT > 90
pLDDT > 90
High
90 > pLDDT > 70
90 > pLDDT > 70
Low
70 > pLDDT > 50
70 > pLDDT > 50
Very low
pLDDT < 50
pLDDT < 50