Protein

View in Explore

Genbank accession

QBX21888.1 [GenBank]

Protein name

endopeptidase

RBP type

Evidence RBPdetect2

Probability 0,95

Protein sequence

MLSLLDKTVRTAKWHGKPLPETIKASVKETLNGDFVLNFTYPITDSGLFRELKEDYLVRSPVPVLGHQLFRIKKVIEGDTSLEVVAYHISDDIMTRLVSQFRCEQVTCATALSSMVMASKSPLGDFSFTSDIVKNRTYTTDKEQTLYSSLMDGKHSILGTWEGELVRDNLALTIKGERGQDRGVVISTHYNLKKYQRTKESSQIITRIHASSSFKQEGQDRETVLQVTVDSPLINSYPFINEVTYTNNHLRTRQELIEWASSKFRLEGIDKPKDAIIIEAFELDDQTVHLGDTVTLKSKLHGIDVRKKAIAYDYDPLAKNYRSITFDDKASIGTGNTGGSLTTLANNLIDGNKRSEDVAVAIALENANRAFDAEFEKRQVAIDNAIEQAQSHGEVYADRLKASIDNELTSIHQQMRQQEEEQQRTTRDLLAKAGVNTNLATEAKLKAEQAQTGATEALRRAEQAKLDAIQEANRLTSTERSQTELKITTAKSQAISEASRLVDVAKSLLVGQLATVSTNLSQTKEDIKLLASRKLVDSLTGRVTSAESMIQVQADQISQRVKTSDFDRANQRISTAESTITQLGNRITTEISETVAKIPTSIGGRNLFKGSREFSGVWYNAGNGSFFEEYKDVHIHRTKTAWLGKSQRISVKSGEIYTFSFYAKSDSENDGIMFYLSHSGTGTPAQGHPVNKYIAISTDYQRYSITFKIISNGIIVPRLERTNTTSSLFFGGFKLEIGSISTDWSPAPEDISNEIESVKTIITQTASGVEQVSTRLTETNGKISSSETQIRQLVSDVSSKVSQTDFNTVKRIVEGHTTSIQQTQQSILLKADKTVLEGVKTTADNALAKANTNASQITQTKADLRIANDAISQKVARTDFNNLTGRVTSAESTIRTQAGQIEQRLTSTQVESAINSKGYQTKSQVDSNISGRGYLTSSSLQPYATTTSVQNLVRTTSDSFTQRISQTESRIPTSVSHRNLIAGTSDRWSAYQTINVSSNWIASLGRVQFGDSSGIYVGSKVHIYVHVSADEITFDPAVTTRTMKLQGPILDSQNVWTWTNWNLYHPFYNKWSSNLTTGNNYRLIKLTATVTQEMYQHSKGFELQVRVDGVKTGKFHVRALMVSTGDLFPDYWTPSLDDFTTVTAFHEVRDTVSIHTRTIGDHTNQISQVVQTATGIVTRVGNLETSRATTATVNAIQTQVSTLAGSWSVRNLTSAGTVLSQLNLNKDGSVKIDGKLVQITGTTYIQDGVIASGKIASLDAGKITTGIISAARIGAEAITADKLKVDQAFFTKFMATEAYLKQLFAKSAFITQVQSVTLSANNISGGILSAINGAMKINLSLGNIKFFTNSPSISREVSGYPHQWVSFETGTSNGKPCGVTIIGSNRWNNWNANDGGFVGIRAWNGTDTDQIDVVGDKVRLASAPYTNPDGWEIVTLPNRLSIDAYKASDRPSSILNIGDIRIYRNGTTYVSLKDVLHQFNHNFKHLVNITGRGDVILTWDTIK

Physico‐chemical properties

protein length:	1503 AA
molecular weight:	165673,67500 Da
isoelectric point:	8,70177
aromaticity:	0,07119
hydropathy:	-0,36707

Domains

Domains [InterPro]

DC_1274
ATT
1–622

DC_1274 DC_0899 IPR012892

IPR007119
Unmapped
27–327

IPR007119 Coil Coil G3DSA:2.60.120.260 DC_0171

IPR010572
ENZ
130–328

IPR010572 IPR008979

QBX21888.1

1 1503

Architecture

ATT

STR

RBD

ATT 1-622 | STR 623-849 | RBD 850-1501 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_1274	ATT	DC_1274	1	622	Novel HMM	DC_1274	N-terminal	Low	Positional only	124 proteins / 124 hits
IPR007119	Unmapped	-	27	327	InterPro	Phage tail spike protein, N-terminal domain	-	-	-	-
IPR010572	ENZ	DC_0675	130	328	InterPro cluster	Tail spike domain	Central	High	Text match	419 proteins / 419 hits
Coil	Unmapped	-	401	421	Coils	Coil	-	-	-	-
Coil	Unmapped	-	458	478	Coils	Coil	-	-	-	-
G3DSA:2.60.120.260	STR	G3DSA:2.60.120.260	613	735	Merged direct domain	G3DSA:2.60.120.260	Central	Low	Positional only	264 proteins / 264 hits
IPR008979	STR	IPR008979	615	713	Merged direct domain	Galactose-binding-like domain superfamily	Central	Low	Positional only	24 proteins / 24 hits
DC_0899	STR	DC_0899	627	849	Novel HMM	DC_0899	Central	Low	Positional only	49 proteins / 49 hits
DC_0171	RBD	DC_0171	813	1501	Novel HMM	DC_0171	C-terminal	Low	Positional only	43 proteins / 43 hits
IPR012892	RBD	DC_0453	1145	1421	InterPro cluster	Gp58-like	C-terminal	Low	Positional only	116 proteins / 119 hits

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Streptococcus phage Javan599 [NCBI]	2548280	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Streptococcus suis YS49 [NCBI]	1214205	Bacillota > Bacilli > Lactobacillales > Streptococcaceae > Streptococcus > Streptococcus suis

Coding sequence (CDS)

Genbank protein accession

QBX21888.1 [NCBI]

Genbank nucleotide accession

MK448819 [NCBI]

CDS location

range 28896 -> 33407
strand +

CDS

GTGCTATCATTATTAGACAAAACGGTTCGAACGGCAAAATGGCATGGGAAACCACTCCCAGAGACCATAAAAGCAAGCGTTAAAGAAACCTTGAATGGGGATTTTGTCCTGAATTTTACCTATCCAATCACAGACAGCGGTCTATTTCGAGAGCTAAAAGAGGACTACCTTGTTCGTAGTCCAGTTCCAGTATTGGGACACCAGTTGTTTCGGATAAAGAAAGTAATCGAAGGAGACACCAGTCTTGAAGTTGTGGCCTATCACATATCAGATGACATCATGACTAGGTTGGTATCTCAATTTAGGTGTGAACAGGTAACCTGTGCAACAGCTCTATCAAGCATGGTCATGGCAAGCAAGTCTCCACTGGGAGATTTTTCTTTTACCAGTGACATTGTCAAGAACAGAACCTATACAACGGACAAGGAACAGACGCTGTACTCCAGCCTGATGGATGGTAAACATTCTATTCTTGGAACTTGGGAGGGTGAACTGGTTCGTGATAACCTTGCCCTAACTATAAAGGGTGAGCGGGGACAAGACCGTGGGGTAGTCATCTCTACTCACTACAATTTGAAGAAGTATCAACGAACCAAGGAAAGTTCACAGATTATCACTCGTATCCATGCCTCTTCAAGCTTTAAACAGGAGGGGCAGGATAGGGAAACTGTACTTCAAGTAACTGTAGACAGTCCGTTGATAAACTCCTATCCTTTCATCAATGAAGTAACCTATACCAATAATCATCTCAGAACTCGTCAGGAGTTAATAGAGTGGGCTAGTAGCAAGTTTCGCTTAGAGGGAATCGATAAGCCAAAAGATGCCATCATCATTGAGGCATTTGAGTTAGATGATCAAACGGTTCATCTAGGCGATACAGTGACTTTAAAAAGTAAGCTACACGGCATTGATGTGAGGAAGAAAGCCATCGCTTATGATTATGATCCTCTAGCTAAGAATTACCGCTCTATCACATTTGATGATAAGGCAAGTATCGGAACAGGTAATACTGGCGGTAGCTTAACTACACTAGCAAATAATCTCATTGATGGGAATAAGCGGAGTGAGGATGTTGCCGTTGCTATTGCCCTTGAGAATGCCAACAGAGCCTTTGATGCAGAATTTGAGAAACGTCAAGTAGCCATCGATAACGCTATAGAACAGGCTCAAAGTCATGGGGAGGTTTATGCGGATCGATTAAAGGCTAGCATTGATAATGAACTTACTTCTATTCACCAACAGATGCGGCAACAAGAAGAGGAGCAGCAACGCACAACTCGTGATTTATTGGCAAAGGCTGGGGTAAATACTAACCTAGCCACAGAAGCCAAACTGAAGGCAGAACAGGCTCAAACTGGGGCAACTGAAGCTCTCAGAAGGGCAGAACAAGCCAAGCTTGATGCCATTCAAGAAGCTAACCGCTTGACTTCGACTGAGCGTAGTCAAACAGAGTTAAAGATTACGACAGCAAAATCACAAGCTATCTCTGAAGCCAGTCGATTGGTTGATGTAGCAAAATCACTGTTAGTTGGGCAATTGGCAACTGTCAGTACCAATCTCTCACAAACTAAGGAGGATATAAAACTTCTTGCGAGTAGGAAACTAGTGGATAGTCTGACTGGTCGAGTGACTAGTGCTGAATCCATGATTCAAGTACAGGCAGACCAAATTTCTCAGCGAGTAAAGACTAGCGATTTTGACCGAGCCAATCAAAGGATAAGTACAGCTGAGAGCACTATTACTCAACTTGGTAATCGGATAACTACTGAAATTAGTGAGACCGTAGCGAAGATACCGACTTCAATAGGTGGTCGTAATCTTTTTAAAGGAAGTCGAGAGTTTTCTGGTGTTTGGTATAACGCTGGCAATGGTTCGTTTTTTGAAGAATACAAAGATGTCCATATTCATAGAACAAAAACAGCTTGGTTAGGTAAGTCACAGAGAATTTCTGTGAAATCTGGGGAAATATACACATTCAGTTTTTATGCCAAGAGCGATTCAGAAAATGATGGGATTATGTTTTATCTTTCCCATAGTGGTACTGGAACACCAGCACAGGGTCATCCAGTTAATAAATATATTGCTATTTCAACTGATTATCAGCGCTACTCTATCACCTTTAAAATAATCTCTAATGGAATAATTGTTCCGAGATTGGAAAGAACTAACACTACAAGTTCTTTGTTTTTTGGAGGTTTTAAACTTGAAATCGGGTCTATCTCAACTGACTGGTCTCCAGCACCAGAAGATATTTCGAATGAAATTGAAAGTGTGAAAACCATTATCACTCAAACGGCTTCTGGTGTGGAGCAGGTTTCTACAAGATTAACCGAGACAAATGGAAAGATTTCTAGTAGTGAGACACAGATTCGACAATTAGTTTCGGATGTATCCTCAAAGGTTAGTCAAACAGACTTTAATACAGTAAAACGAATAGTTGAAGGACATACTACATCCATCCAACAAACACAGCAATCCATCTTGCTTAAGGCTGATAAGACAGTTCTTGAAGGGGTAAAAACAACCGCTGATAATGCCTTGGCTAAGGCCAACACAAACGCTAGTCAGATTACCCAAACCAAGGCAGATTTACGGATTGCCAATGATGCCATCTCACAGAAAGTCGCAAGAACTGATTTTAATAACTTGACTGGTCGAGTAACAAGTGCAGAATCCACTATACGTACACAGGCTGGGCAAATTGAACAACGACTAACAAGTACACAAGTTGAATCAGCTATTAACTCAAAAGGTTACCAAACCAAGTCACAGGTCGATTCCAATATTTCTGGTCGTGGCTATCTAACCAGCAGTTCTCTCCAACCCTATGCGACGACAACTAGTGTGCAGAATTTGGTTAGAACCACCTCTGATAGTTTTACCCAGCGAATCAGTCAAACGGAAAGTAGAATTCCTACCTCAGTTTCGCATCGCAACTTGATAGCTGGTACTTCGGATAGATGGAGTGCTTATCAGACGATAAATGTGAGTAGTAACTGGATAGCATCATTAGGAAGAGTGCAATTTGGGGATAGTAGTGGAATTTATGTTGGATCAAAAGTTCATATATATGTTCATGTCTCAGCGGATGAGATTACCTTTGACCCTGCTGTAACGACTCGTACTATGAAACTTCAAGGTCCAATCTTGGATAGTCAAAATGTTTGGACATGGACCAACTGGAATTTGTATCACCCTTTCTATAATAAATGGAGTAGCAATCTGACAACGGGTAACAACTATCGCTTAATTAAACTGACAGCCACCGTCACTCAAGAGATGTACCAACACTCTAAAGGATTTGAACTTCAAGTCAGAGTTGATGGGGTTAAGACTGGTAAGTTCCATGTGAGAGCCTTAATGGTATCAACTGGTGATCTTTTTCCAGACTATTGGACACCGTCATTAGACGACTTTACGACGGTTACCGCCTTTCATGAAGTGCGGGATACTGTAAGCATTCATACTCGAACAATTGGAGATCACACCAATCAAATCAGTCAGGTTGTTCAAACGGCTACTGGGATTGTGACACGAGTTGGCAATCTAGAAACAAGTCGAGCGACAACGGCAACAGTAAATGCCATTCAAACGCAGGTTTCAACACTTGCAGGGTCGTGGTCGGTTCGAAATTTGACAAGTGCAGGCACAGTTTTGAGTCAACTTAACCTCAATAAGGATGGGTCCGTCAAAATCGATGGAAAACTCGTCCAAATTACAGGCACAACCTATATCCAAGATGGAGTTATTGCGAGCGGTAAGATTGCCAGTCTTGATGCAGGAAAGATTACGACAGGTATTATCTCTGCAGCTCGAATTGGAGCAGAAGCAATCACTGCGGATAAGTTAAAGGTTGACCAAGCTTTCTTTACCAAGTTTATGGCAACAGAAGCCTATCTTAAGCAGTTGTTTGCCAAATCAGCCTTTATAACCCAAGTGCAGTCAGTAACCCTATCTGCCAACAACATTTCTGGTGGAATCTTGTCAGCAATCAACGGAGCGATGAAAATCAATCTGTCACTTGGAAACATCAAGTTCTTTACAAACTCTCCATCCATTTCTCGTGAGGTTAGTGGTTATCCTCACCAGTGGGTTTCATTTGAAACAGGTACGTCAAACGGTAAGCCATGTGGTGTAACCATTATCGGTTCCAATCGATGGAACAACTGGAATGCCAATGACGGTGGCTTTGTAGGAATCCGAGCATGGAACGGTACAGATACCGACCAAATTGATGTTGTAGGCGATAAGGTACGTTTAGCTAGTGCCCCATATACCAATCCAGATGGCTGGGAAATAGTAACGTTGCCTAACCGACTGAGTATTGATGCCTATAAAGCTTCTGACCGACCAAGTTCAATTTTGAATATCGGAGATATCCGCATCTATCGAAACGGTACAACATACGTCAGTTTGAAAGATGTTCTTCATCAATTCAACCACAATTTTAAACACTTAGTAAACATCACAGGTCGAGGTGATGTCATCTTGACATGGGATACGATTAAATAA

Genome Context

Tertiary structure

PDB ID

44f56c360de19a9db64a4d074bcfd57bc0e3783b4a326b8342d6fc39af5572a2

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,7086

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence