Protein

View in Explore

Genbank accession

YP_009009163.1 [GenBank]

Protein name

minor head protein

RBP type

Evidence RBPdetect2

Probability 0,94

Protein sequence

MRTPSGILHVVDFKTDQIVAAIQPQDYWDDKRQWEIKNNVDMLDFTVFDGTTHSATLQQQNLVLKEVRDGRIVPYVIRETEKNSDNRSITTYASGAWVQIAKSGIIKPQRIEGETVNKYIDMALVGMKWKRGKTDYAGFHTMTIDEFIDPLTFLKKIASLFKLEIQYRVEVQGSQIIGWYVDMIQRRGRDTGKEIELGKDLIGVTRIEHSRDICTALVGFVKGEGDNVITIESINRGLPYIVDNDAFQRWNERGKHKFGFYTPETEELNMTPERLMTLMGIELKKRVNSSVSYEVEAQSIGRIFGLAHELINEGDTIRIKDTGFTPKLYLEARVIAGDESFTDPTQDKYVFGDYREITDPNEELRKIYNRILSKFGEKQEMLDQLDKLVKEANETASSAKKESEAAKTLAEKVQENIKNNTVEIIEAKNPPTTGLKPNKTLWRDMSNGKPGILKIWTGTAWESVVPDVESIKKDTLMQVNKDIENTKTELNKKVEEAQSQATGQFNEVQEGLQGVNRTISNIENKQGEIDKKVTKFEQDSNGFTTSIESLTKKDTEISNKLNTVESNVEGTKKTISDVQQTTNELKQKTTEMKEEAGKISEKLTSVEKKVNSDKAGGRNLLLKSNVKYEKTDYLINQYTLTENFSTGEEYTFVMKGNVPAGQKFGIWMNGGSSNVGYATSVYVNGITYVTFKAVAATSGNERKLSLYNYPSSTTKSIVEWVALYKGNKPQDWTAPPEEQVTTDEFTQKTTEITKSVDGIKETITKVENNQNGFDKRVATVEKDATTIKQNVSSIQNTQTEQGRQLQEAKAGWENTAKALQGKVELKQVEDYVAGFKIPELKQTVNQNKQDLLDELANKLATEQFNQKMTMIDNRFTINEEGINAAAKKKEVYTIEQANGQFAKDSYVKDMETRLQLTEKGVSLSVKENDVIAAFNMSKENITLNANRINLVGFITANHIKGKVLEGVTLKTSGNRFVEINKQDMKIFDLDKPRGYIGFMETNDGSIQPSLVLGSDNRKYAGTGSFYIYQVMPRINGVDQPSKAYAKFGVSKGENAEGTNIWSNYVQMQNDGGHLSVYSDGQFRFKNLNDIIFESEGWAPGYGYFFVTTTEPHIFNNNWGQFTFKRKGSDYNISFINGASDHDLIMGNAMIRSSFVQGYNNGLQIKDMMGKGWKDIELRTLRAQENINANGQMWAKAFNPTSARSMKENIKDIPFSALDKIMSLAIKQYNFKDDMYDLYQMRVNKPEEQTEPYTTKDIETYFGMIADDTDGIFTDKEKGHEIYIILFLFLLQLSNRCIMNSYR

Physico‐chemical properties

protein length:	1302 AA
molecular weight:	147560,63070 Da
isoelectric point:	5,77032
aromaticity:	0,08909
hydropathy:	-0,62757

Domains

Domains [InterPro]

DC_1956
STR
1–653

DC_1956 IPR030392

IPR007119
Unmapped
29–352

IPR007119 Coil G3DSA:1.10.287.1490 IPR030392

Coil
Unmapped
473–500

Coil Coil DC_0850

SSF57997
STR
481–610

SSF57997

YP_009009163.1

1 1302

Architecture

STR

CHP

STR 1-1283 | CHP 1284-1302

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_1956	STR	DC_1956	1	653	Novel HMM	DC_1956	Central	Low	Positional only	117 proteins / 117 hits
IPR007119	Unmapped	-	29	352	InterPro	Phage tail spike protein, N-terminal domain	-	-	-	-
Coil	Unmapped	-	382	416	Coils	Coil	-	-	-	-
G3DSA:1.10.287.1490	STR	G3DSA:1.10.287.1490	472	627	Merged direct domain	G3DSA:1.10.287.1490	Central	Low	Positional only	5 proteins / 5 hits
Coil	Unmapped	-	473	500	Coils	Coil	-	-	-	-
SSF57997	STR	SSF57997	481	610	Merged direct domain	SSF57997	Central	Low	Positional only	14 proteins / 14 hits
Coil	Unmapped	-	575	598	Coils	Coil	-	-	-	-
DC_0850	STR	DC_0850	622	1283	Novel HMM	DC_0850	Central	Low	Positional only	6 proteins / 6 hits
IPR030392	CHP	DC_0088	1201	1302	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits
IPR030392	CHP	DC_0088	1202	1273	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Bacillus phage phiCM3 [NCBI]	1357713	Uroviricota > Caudoviricetes > Camtrevirus >
Host	Bacillus thuringiensis [NCBI]	1428	cellular organisms > Bacteria > Bacillati > Bacillota > Bacilli > Bacillales

Coding sequence (CDS)

Genbank protein accession

YP_009009163.1 [NCBI]

Genbank nucleotide accession

NC_023599 [NCBI]

CDS location

range 15174 -> 19082
strand +

CDS

ATGAGAACACCAAGCGGCATTTTGCATGTTGTGGATTTCAAAACAGATCAAATCGTTGCAGCTATTCAGCCGCAGGACTATTGGGATGATAAAAGGCAGTGGGAAATCAAAAACAATGTTGATATGTTGGATTTTACTGTTTTTGATGGAACAACTCATTCGGCTACGCTACAACAACAAAATCTTGTTTTAAAAGAAGTTCGTGACGGAAGAATTGTACCATATGTTATTAGAGAAACAGAAAAGAATTCAGACAACCGATCCATTACCACATATGCTTCAGGAGCTTGGGTTCAAATTGCTAAGTCAGGTATTATAAAACCGCAAAGAATAGAAGGGGAAACGGTAAACAAATATATTGATATGGCCCTAGTAGGAATGAAATGGAAACGTGGGAAAACGGATTATGCAGGATTCCATACGATGACCATTGATGAATTTATTGATCCCCTAACATTTTTAAAGAAAATAGCTTCTTTATTCAAATTAGAAATTCAGTACCGTGTTGAGGTTCAAGGATCACAAATCATTGGATGGTATGTTGATATGATTCAAAGACGTGGTCGAGACACAGGCAAAGAAATAGAGCTCGGGAAAGATTTGATAGGCGTTACACGTATTGAACATTCAAGAGATATTTGTACAGCACTAGTTGGATTTGTGAAAGGTGAAGGCGACAATGTAATTACCATCGAAAGTATCAACAGGGGACTTCCGTATATTGTTGATAATGATGCATTTCAACGATGGAACGAACGTGGTAAGCATAAGTTTGGTTTTTATACGCCAGAAACAGAAGAGTTAAATATGACGCCAGAACGTTTAATGACGTTAATGGGAATAGAATTAAAAAAACGTGTTAATTCTTCCGTTTCGTATGAAGTAGAAGCACAATCGATTGGACGTATTTTCGGACTAGCACATGAACTCATTAACGAGGGCGATACGATCCGAATTAAAGATACGGGCTTCACACCTAAGTTATACCTGGAAGCACGTGTAATTGCCGGTGATGAATCTTTTACGGATCCTACACAAGATAAATATGTGTTTGGTGATTATCGTGAAATTACGGATCCGAACGAGGAATTACGAAAGATTTACAATCGAATCCTTAGTAAATTCGGTGAAAAACAAGAAATGCTGGATCAGCTAGATAAATTGGTGAAAGAAGCGAATGAAACAGCAAGTAGCGCTAAGAAAGAATCAGAAGCAGCGAAAACACTTGCTGAAAAGGTACAAGAGAATATTAAAAACAATACTGTTGAAATTATAGAAGCTAAGAATCCACCAACAACAGGGCTTAAACCTAATAAAACGCTTTGGCGTGATATGAGTAACGGAAAGCCCGGTATTTTAAAAATATGGACAGGTACAGCTTGGGAATCAGTTGTTCCTGATGTAGAATCAATCAAAAAAGATACACTGATGCAGGTTAATAAAGATATTGAAAACACAAAAACAGAGTTGAATAAAAAAGTGGAAGAAGCACAAAGTCAAGCAACAGGACAATTCAACGAAGTGCAGGAAGGTTTACAAGGTGTCAACCGGACAATTTCTAATATCGAAAATAAGCAAGGTGAAATTGATAAGAAAGTAACTAAGTTTGAACAGGATTCTAATGGATTTACAACTTCTATTGAATCGTTAACGAAAAAAGATACTGAAATTAGCAATAAATTAAATACAGTCGAATCAAATGTGGAAGGTACAAAAAAGACTATTTCGGATGTGCAACAAACAACGAATGAGCTTAAGCAAAAAACAACTGAAATGAAAGAAGAAGCTGGGAAAATCAGTGAGAAGTTAACAAGTGTAGAAAAAAAGGTTAATAGCGATAAAGCTGGTGGACGTAACCTTTTATTAAAATCAAATGTTAAATATGAGAAAACAGATTATTTAATTAATCAGTATACTCTTACTGAAAATTTCTCTACAGGTGAAGAATATACTTTCGTAATGAAAGGAAATGTACCTGCGGGTCAAAAGTTTGGTATATGGATGAATGGTGGGTCTAGCAATGTTGGATATGCAACAAGTGTTTATGTGAATGGAATAACGTATGTAACCTTCAAAGCTGTTGCGGCTACAAGTGGAAATGAACGAAAGTTAAGCTTATATAATTATCCGAGTAGTACTACGAAATCTATTGTGGAATGGGTTGCCTTGTATAAAGGGAATAAGCCGCAGGATTGGACAGCACCGCCTGAAGAGCAGGTAACAACGGATGAATTCACCCAGAAGACAACTGAAATTACAAAAAGTGTGGATGGAATTAAAGAAACAATTACAAAAGTGGAAAATAATCAAAATGGTTTTGATAAACGTGTTGCTACTGTAGAAAAAGATGCAACTACTATTAAACAAAATGTCTCTTCCATACAAAATACACAGACAGAACAAGGAAGACAATTACAAGAGGCGAAAGCTGGATGGGAAAATACTGCGAAAGCACTTCAAGGTAAAGTTGAGCTTAAACAAGTAGAGGATTATGTTGCGGGGTTTAAGATTCCAGAGTTGAAGCAAACAGTTAATCAGAATAAACAAGATTTGTTAGATGAATTAGCTAATAAGCTTGCAACGGAACAATTTAATCAGAAAATGACTATGATCGACAACCGTTTCACTATAAATGAAGAGGGTATCAATGCCGCAGCAAAAAAGAAAGAAGTATACACAATAGAGCAAGCAAATGGACAATTTGCAAAAGATTCTTACGTAAAAGATATGGAAACCCGTCTTCAGTTAACTGAAAAGGGTGTTAGTCTATCTGTAAAAGAAAATGATGTAATCGCAGCATTTAATATGAGTAAAGAAAACATTACTTTGAATGCGAACAGAATTAACTTAGTAGGTTTTATTACAGCAAATCATATTAAAGGAAAAGTTCTAGAAGGAGTAACACTTAAAACAAGTGGAAACAGATTTGTGGAAATAAATAAGCAAGACATGAAGATTTTCGATTTAGATAAACCACGTGGTTATATAGGATTTATGGAAACAAATGATGGAAGTATTCAACCTTCGCTCGTCCTTGGTTCTGATAATAGAAAATACGCTGGCACAGGATCATTTTATATTTATCAAGTCATGCCACGAATTAATGGAGTCGATCAACCTTCTAAAGCGTATGCAAAATTTGGGGTTTCTAAAGGAGAAAATGCAGAAGGAACTAATATTTGGTCAAATTATGTTCAAATGCAAAATGACGGTGGACATCTGAGCGTTTATTCAGATGGACAATTTCGTTTTAAAAACTTGAATGATATTATTTTTGAATCTGAAGGATGGGCTCCAGGATATGGTTACTTCTTTGTAACCACAACGGAACCTCATATTTTTAACAATAACTGGGGACAGTTTACGTTTAAAAGGAAAGGCAGTGACTACAATATATCTTTCATCAATGGTGCCTCTGATCATGATTTAATCATGGGTAATGCAATGATAAGATCAAGTTTTGTACAAGGTTATAACAACGGCTTACAGATTAAAGATATGATGGGCAAAGGATGGAAAGATATAGAGTTAAGAACCCTACGAGCACAAGAAAATATAAATGCCAATGGCCAAATGTGGGCAAAAGCATTTAATCCTACATCAGCTAGAAGTATGAAAGAAAATATAAAAGATATTCCTTTCTCGGCTCTTGATAAAATTATGAGTTTAGCTATTAAACAGTACAACTTCAAAGACGATATGTATGATCTGTATCAAATGCGTGTGAACAAGCCGGAAGAACAAACGGAACCATATACAACGAAAGATATCGAAACGTATTTCGGTATGATTGCAGATGATACGGATGGTATATTTACAGATAAGGAAAAGGGCCATGAAATTTATATAATACTGTTTCTATTCTTATTGCAGCTTTCCAACAGATGTATTATGAATTCATATCGTTAA

Genome Context

Tertiary structure

PDB ID

b9b5eb0b395fe1a0d2661670355b64decdb5320e358eb6461a63f9ab13c025c7

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,7524

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence