Protein

View in Explore

Genbank accession

ALA47090.1 [GenBank]

Protein name

hypothetical protein

RBP type

Evidence RBPdetect2

Probability 0,77

Protein sequence

MDALTRRQFDRAMFAKERTLAIRVGDYASRDIKEASFEYGYIKGDTYKPGGTCAGSGKITFTNIITTFNKLDTLHPEIGLLVGDTYQWVKMGEYFINDIEIDRNRNTTTLELMDGMFKLNREYVTDLHFPAEVREVIQEICLKTGIELANDYFGISAMRYHIEQVPEGKKLSFRDMLSAMTQMIGMSCFFNREGKMEIRDLTESNITINADSYFLHGLTKSEIEYQIAGITCKTDKKSLTVGMKTGRSLELDNVFMTQSALNDLYYKLKNLTYYPYNLNYQGHLLLEVGQWVTIQTNKKETFKVPVLSQSFTFKGGLRGRISADSKAGNDTQYSYEGTITKHIKQQDDIEAKIQAQIEAADKDFDQKVDKIKKDFNDQVELAKARAEEVKRELSDTINQRFNSFDNGPLKETKRKAEEALRNAGASTLLAQEAKRIGLDSVARLEAFKSQTTSAQTALSGELDALKRTIVNDIRPKQAQAEAEIAKQAEALSRTKNELAGASTLLAQEAKRIELDSVARLEAFKSQTTSAQTALSGDLDALKRTIANDIRQKQAQAETEIAKQVEALSRTKNELAGVKSAQATYEETTTRRLSELTNLANGKASKSELTQTAEELASRIASVQAGSSRNYFRNSRSRTFTTGGQAVYDYRTFIVPDFWKNSDRFKRDYVRISFDVTFPVALVNDMPAMVHFSAHPWYAYRNLIFKGGTVERQHFEFTIDLSSSSEDYQTNNVFIRFGTNYGFPAGLQVVIENAMLSVGNYFPAYQPAYEDQEDRVSVVESNFKQRADSLEAGVNRLTEGLRTKADISSLNVTAENIRQSVKSLETDTQNKLNQKLSQAEFEVRAGSIRQEILNATKDKASKSELTQTAEELASKIASVQASGRNLFLNSLFKQDIPKTGIWTTSTYTVTIDSESKYLGHKALKIIGLNPSGRDGGNPKVTYPALGQFGKVIPGSTTNQDVIISFYAKANKNGIMLRSRLGNIGYKTGNVTLSTEIKRYVVHIPKGWTNESKRTTNEWLFNFNQEGTVWIWMPKFEISDVDTSYSEAPEDIEGQISTVESTFKQRANSLEAGVNRLTEGLRTKADISSLNVTAENIRQSVKSLETDTQNKLNQKLSQAEFEVRAGSIRQEILNATKDKASKSELTQTAEELASKIASVHLGRRNLLKGTKELARYKPVSEYNGFKVIRTVAGATRYQDSYVERTVIPTAGTEYIAIFYARASENDYPVRCHFYNPNTVVSSENSSGYKSRSSDGLSIIRLSTDWQLCWVKWTQTATDQAKTVIIGRHGPQVGGKEGVWVEICAPAIFEGNLAGDWSPAYEDQDERVSAVESNFKQRADSLEAGVSRLTEGLRTKVDISALNVTAENIRQSVKSLETDTQNKLNQKLSQAEFEVRAXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXRALRQTRRTN

Physico‐chemical properties

protein length:	1439 AA
molecular weight:	157375,81060 Da
isoelectric point:	8,48779
aromaticity:	0,08333
hydropathy:	-0,54459

Domains

Domains [InterPro]

DC_0909
STR
1–500

DC_0909 Coil DC_0720 DC_0720 Coil

Coil
Unmapped
372–399

Coil Coil IPR050163

DC_0909
STR
483–687

DC_0909 Coil DC_0720 Coil Coil

ALA47090.1

1 1439

Architecture

STR

STR 1-1283 | STR 1294-1401 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0909	STR	DC_0909	1	500	Novel HMM	DC_0909	Central	Low	Positional only	53 proteins / 53 hits
Coil	Unmapped	-	372	399	Coils	Coil	-	-	-	-
Coil	Unmapped	-	477	497	Coils	Coil	-	-	-	-
DC_0909	STR	DC_0909	483	687	Novel HMM	DC_0909	Central	Low	Positional only	53 proteins / 53 hits
Coil	Unmapped	-	553	573	Coils	Coil	-	-	-	-
DC_0720	STR	DC_0720	687	918	Novel HMM	DC_0720	Central	Low	Positional only	121 proteins / 121 hits
IPR050163	Unmapped	-	767	1393	InterPro	Apolipoprotein A1/A4/E	-	-	-	-
Coil	Unmapped	-	861	881	Coils	Coil	-	-	-	-
DC_0720	STR	DC_0720	902	1283	Novel HMM	DC_0720	Central	Low	Positional only	121 proteins / 121 hits
DC_0720	STR	DC_0720	1294	1401	Novel HMM	DC_0720	Central	Low	Positional only	121 proteins / 121 hits
Coil	Unmapped	-	1356	1376	Coils	Coil	-	-	-	-
Coil	Unmapped	-	1378	1394	Coils	Coil	-	-	-	-
Coil	Unmapped	-	1430	1438	Coils	Coil	-	-	-	-

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Streptococcus phage phiARI0460-2 [NCBI]	1701825	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Streptococcus pneumoniae [NCBI]	1313	cellular organisms > Bacteria > Bacillati > Bacillota > Bacilli > Lactobacillales

Coding sequence (CDS)

Genbank protein accession

ALA47090.1 [NCBI]

Genbank nucleotide accession

KT337353 [NCBI]

CDS location

range 5757 -> 10076
strand -

CDS

ATGGACGCTTTAACTAGACGACAATTTGACAGAGCCATGTTTGCCAAGGAAAGGACGCTGGCTATTCGTGTTGGTGATTATGCTTCACGGGATATCAAAGAGGCTAGTTTTGAGTATGGCTACATTAAGGGCGATACTTATAAGCCTGGTGGAACCTGCGCTGGTAGCGGTAAAATTACCTTTACCAATATCATTACCACGTTCAATAAGCTGGATACCCTGCACCCTGAGATTGGTCTACTGGTTGGGGATACCTACCAGTGGGTCAAGATGGGGGAATACTTCATCAACGATATTGAGATTGACCGAAACCGAAACACTACCACGCTTGAACTTATGGACGGTATGTTTAAGCTCAATCGTGAGTACGTGACGGACTTGCATTTCCCAGCTGAAGTACGAGAGGTTATTCAGGAAATCTGCCTGAAAACAGGCATTGAGTTAGCGAATGACTATTTCGGAATCAGCGCGATGCGTTATCATATTGAGCAAGTTCCTGAGGGTAAGAAACTTTCCTTTAGGGATATGCTGAGCGCTATGACTCAGATGATTGGGATGTCTTGTTTCTTCAACAGAGAAGGCAAGATGGAAATCCGTGATTTGACTGAGTCCAATATCACGATCAACGCTGACAGTTACTTCTTGCATGGCTTGACCAAGAGTGAGATTGAGTATCAGATAGCTGGTATCACTTGTAAGACGGACAAGAAGTCTCTGACGGTCGGTATGAAGACAGGCCGGTCTTTGGAACTGGACAATGTCTTCATGACCCAGAGCGCTTTAAATGACCTGTATTACAAACTGAAAAACCTAACTTACTATCCGTATAATCTCAACTACCAAGGGCATTTACTGCTTGAGGTCGGGCAGTGGGTAACCATTCAGACCAACAAGAAAGAGACTTTTAAAGTTCCTGTGTTAAGTCAGAGCTTTACTTTTAAAGGTGGTCTGAGAGGGCGTATCAGCGCAGATAGTAAGGCTGGAAACGATACTCAGTATTCTTACGAGGGTACGATTACCAAGCATATTAAGCAACAAGATGACATTGAAGCGAAAATCCAAGCGCAGATTGAAGCAGCAGATAAAGATTTTGACCAAAAGGTCGACAAAATCAAAAAAGACTTTAACGATCAAGTAGAACTGGCCAAAGCCAGAGCTGAAGAAGTCAAGAGAGAACTGTCTGATACTATCAATCAGCGCTTTAATAGCTTTGACAACGGGCCATTGAAAGAAACTAAGCGCAAGGCTGAGGAAGCTTTGCGAAATGCTGGTGCAAGTACCCTGCTTGCACAGGAAGCTAAGCGGATTGGGCTGGATTCTGTTGCTAGACTTGAAGCGTTTAAGTCGCAGACTACGAGCGCACAAACAGCTCTGTCGGGTGAATTAGACGCTCTGAAACGGACTATAGTGAATGATATTCGACCGAAGCAAGCACAGGCTGAAGCTGAGATTGCCAAGCAAGCTGAAGCACTTAGCCGGACTAAAAATGAACTGGCTGGCGCAAGTACCCTGCTTGCACAGGAAGCTAAGCGGATTGAGCTGGATTCTGTTGCTAGACTTGAAGCGTTTAAGTCGCAGACTACGAGCGCACAAACGGCTCTGTCGGGTGACTTGGATGCCCTGAAACGGACTATCGCGAATGATATTCGACAGAAGCAAGCACAGGCTGAAACTGAGATTGCCAAGCAAGTTGAAGCACTTAGCCGGACTAAAAATGAACTGGCTGGCGTGAAGTCAGCGCAAGCGACGTATGAGGAGACGACGACTCGTAGACTGTCAGAACTGACCAACTTGGCCAATGGTAAAGCCAGCAAGTCAGAACTCACGCAAACAGCTGAGGAGCTGGCTAGTCGGATTGCGAGTGTGCAGGCAGGTAGTTCACGGAATTACTTCAGGAATTCACGTTCAAGAACGTTCACAACAGGAGGTCAAGCGGTATACGACTATCGAACATTCATAGTTCCTGATTTCTGGAAGAACAGTGACAGGTTCAAGCGTGATTATGTTCGCATATCTTTTGATGTGACTTTCCCTGTCGCCCTAGTAAATGACATGCCTGCTATGGTGCATTTTAGTGCTCATCCATGGTATGCCTACAGAAACTTAATTTTTAAAGGTGGAACTGTCGAACGCCAACATTTTGAGTTTACGATTGACTTGTCTAGTTCTTCTGAGGACTATCAGACTAATAATGTGTTCATTCGTTTTGGTACTAATTATGGATTTCCTGCTGGTCTGCAGGTCGTCATTGAGAACGCTATGTTATCGGTTGGTAATTATTTTCCAGCCTATCAACCAGCGTATGAAGACCAAGAAGACCGTGTCTCAGTAGTCGAATCCAACTTTAAGCAGCGTGCTGATTCACTCGAAGCTGGTGTGAATCGTCTGACTGAAGGCCTTAGAACTAAAGCCGATATCAGTTCACTCAATGTGACTGCTGAAAATATCCGGCAATCTGTGAAGAGCCTTGAGACAGACACGCAGAACAAACTAAATCAGAAGTTGAGTCAGGCTGAATTTGAGGTGCGAGCTGGCTCTATCCGTCAGGAAATCCTGAACGCAACCAAGGATAAAGCCAGCAAGTCAGAACTCACGCAGACAGCTGAGGAGCTAGCTAGTAAGATAGCGAGTGTGCAGGCATCCGGTCGAAATCTATTCTTGAACTCACTATTCAAGCAGGATATTCCAAAAACAGGAATTTGGACAACGAGTACATATACGGTTACTATCGATAGCGAAAGTAAGTATCTTGGACACAAGGCTCTTAAAATTATAGGTCTGAATCCATCTGGCCGTGATGGAGGTAATCCCAAGGTTACTTATCCAGCTCTGGGTCAATTCGGGAAAGTAATTCCCGGAAGTACGACTAATCAAGATGTAATCATTAGTTTTTATGCTAAGGCAAATAAAAATGGAATAATGCTAAGATCTCGATTAGGGAATATCGGATATAAAACTGGAAATGTGACATTGTCGACAGAAATTAAGCGATATGTTGTCCATATTCCAAAAGGTTGGACAAACGAATCCAAGCGGACCACAAATGAATGGTTGTTCAATTTCAACCAAGAAGGAACCGTTTGGATTTGGATGCCGAAGTTTGAAATAAGCGATGTAGATACTTCTTATTCAGAAGCTCCTGAAGATATAGAAGGTCAGATTTCAACAGTTGAATCGACCTTCAAACAACGAGCCAACTCGCTCGAAGCTGGTGTGAATCGTCTGACTGAAGGCCTTAGAACTAAAGCCGATATCAGTTCACTCAATGTGACTGCTGAAAATATCCGGCAATCTGTGAAGAGCCTTGAGACAGACACGCAGAACAAACTAAATCAGAAGTTGAGTCAGGCTGAATTTGAGGTGCGAGCTGGCTCTATCCGTCAGGAAATCCTGAACGCAACCAAGGATAAAGCCAGCAAGTCAGAACTCACGCAGACAGCTGAGGAGCTAGCTAGTAAGATAGCGAGTGTGCACTTAGGGCGCAGAAATCTGCTGAAAGGCACAAAAGAGCTTGCGAGATACAAGCCGGTTAGTGAATATAATGGTTTTAAAGTTATCAGAACAGTCGCAGGAGCAACTAGATATCAGGATAGCTATGTGGAAAGAACCGTTATACCAACGGCTGGGACAGAGTATATAGCTATCTTTTATGCACGAGCCAGTGAAAATGACTATCCTGTGCGCTGTCATTTTTACAATCCTAACACGGTTGTATCATCAGAAAACAGCAGCGGATATAAGTCAAGGTCGTCAGATGGCTTGTCTATTATCCGTCTCTCGACAGACTGGCAGTTGTGCTGGGTTAAATGGACCCAAACCGCAACAGATCAAGCCAAGACGGTCATCATTGGCCGCCATGGCCCTCAAGTAGGCGGTAAAGAGGGGGTATGGGTTGAAATCTGCGCCCCTGCCATTTTTGAGGGAAATCTTGCAGGTGACTGGTCACCAGCATACGAAGACCAAGACGAACGTGTCTCAGCGGTCGAATCCAACTTTAAACAGCGTGCTGATTCACTCGAAGCTGGTGTAAGCCGTCTGACTGAAGGCCTTAGAACTAAAGTGGATATCAGCGCACTCAACGTGACTGCTGAAAATATTAGGCAGTCGGTGAAGAGTCTTGAGACAGACACGCAGAACAAACTAAATCAGAAGTTGAGTCAGGCTGAATTTGAGGTGCGAGCNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNAGAGCCTTGAGACAGACACGCAGAACAAACTAA

Genome Context

Tertiary structure

PDB ID

07be010762ebdfe2b0783590569da5e28ac1fa123f7c1284b28b93f27da0a677

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,7348

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence