Protein

View in Explore

Genbank accession

QBX16524.1 [GenBank]

Protein name

tail fibers protein

RBP type

Evidence GenBank

Probability 1,00

Evidence RBPdetect2

Probability 0,96

Protein sequence

MLSLLDKTVKTAKWHGKALPETIKASVKEILNGDFVLTFTYPITDSGLYRELKEDYLVRSPVPVLGHQLFRIKKVIEGDCSIEVTAYHISEDIMTRLLAPFRCEQVPCATALTSLVMASKTPLGDFSFTSDIVKPRTYTADKEQTLYSTLLDGNHSIVGTWEGELVRDNLALSIQSNRGENRGVILSTHFNLKTYQRTTESSQMITRIHATSSFKQEGQDEETVLTVTVDSPLITQYPFINEVTYTNNNLKTRQELEEWARAKFRLERIDRPKDTLTIEAYELDGQTVHLGDTVTLKSRLHGIDMTKKAVAYDYDPLAESYRSITFDDKATVGTSSTSGGLSTLAHSLVEGNKRSEDVAIEAAIEHANRAFEAAFEKGKAAIDDAIEQAQSHGEVYADRLKASLDSELSAVNQRMHQQEEEQNRTTRDLLAQAGVNTHLATEAKQKAEEAETGAREALRRAEQAKVEAVQEANRFTTSERSQTETKIATAKAQAILEASRLVDVAKALLSGQLTTVSTSLTQTKEEMKLLSSKQVVDSLTGRVTSTETTITQLGDRITTDIRQVEGKIPVSLDTVNLVKGTDQAFVMGYGITNTSWDSSEKKAVLSLTQTGVEKARYDEILPQNHQFFSFIPQNGTTYTQSMLVDTDASFLGRNGLEWSWYTSRGHQTTPAFIRQIGTNTYQIWSTHTWTLTNERLRAFDVFHLHRVLGFRTSGTYLKFYKPKLTLGPLPSDWSPSPEDVTDEFRSVKTSIQQTASGVEQVSTRLTEEAGKLSTAETQIRQLVNDVSSKVSQTDFNTVKQTVESHTTSLHQTNQSIALKADKAFVDGVKSSADVALSKASNNATLIAQTKAELRVAQDAITQKVAKTDFNTLLGRVSNAETSIRTQAGQIEEKLSNVQLEQILGQKGYQNLSQVETLITTTAGEITTRLSQVEGKIPTQIGGVNLMRNTDKAFVMGYGITNTTWEEATKKATLRFSSGVRRDIHQEVLPQSGRFFDFVPTKGTTYTQSIFVETDATFISEGNFSCTWFTAPDRHNEQPAKIKKMGDKLYRIWSTYTWNLENNRLRAFDFFDLHNVLAFRTSGTYLSFFHPQLEVGTIPTDWHISPQEFVRETVFHEVRDTVSNHTRAIGDHTNQISQVIQTANGIVTRVGSLETSRATTTTVNAIQTQVSTLAGSWSVRNLTSAGTVLSQLNLNKDGSVKIDGKLVQITGTTYIQDGVIASGKIASLDAGKITSGLIAAARIGSEAITSDKLKVDQAFFNKFMANDAYLRQLFAKSAFITQVQAVTLSANNISGGILTALNGAMKIHLTQGNIKFFTNSPSISREVSGYPHQWVSFETGTSNGKPCGVTIIGSNRWNNWNANDGGFVGIRAWNGANDDQIDIVGDSVRLASSPYTNPDGWNIVTLPNRLSIDAHRAVDRPTSVLNIGDIRIYRNASTYVSLKDVLQQFNHNFKHLVNITGRGDVLLTWDTIK

Physico‐chemical properties

protein length:	1472 AA
molecular weight:	162976,73540 Da
isoelectric point:	6,40839
aromaticity:	0,07473
hydropathy:	-0,37439

Domains

Domains [InterPro]

DC_1353
STR
1–722

DC_1353 DC_1955

IPR007119
Unmapped
28–327

IPR007119 Coil Coil DC_0171

IPR010572
ENZ
134–328

IPR010572

QBX16524.1

1 1472

Architecture

STR

RBD

STR 1-722 | STR 746-808 | RBD 809-1470 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_1353	STR	DC_1353	1	722	Novel HMM	DC_1353	Central	Low	Positional only	61 proteins / 61 hits
IPR007119	Unmapped	-	28	327	InterPro	Phage tail spike protein, N-terminal domain	-	-	-	-
IPR010572	ENZ	DC_0675	134	328	InterPro cluster	Tail spike domain	Central	High	Text match	419 proteins / 419 hits
Coil	Unmapped	-	401	428	Coils	Coil	-	-	-	-
Coil	Unmapped	-	440	474	Coils	Coil	-	-	-	-
DC_1955	STR	DC_1955	746	808	Novel HMM	DC_1955	Central	Low	Positional only	20 proteins / 20 hits
DC_0171	RBD	DC_0171	791	1470	Novel HMM	DC_0171	C-terminal	Low	Positional only	43 proteins / 43 hits

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Streptococcus phage Javan255 [NCBI]	2548075	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Streptococcus himalayensis [NCBI]	1888195	cellular organisms > Bacteria > Bacillati > Bacillota > Bacilli > Lactobacillales

Coding sequence (CDS)

Genbank protein accession

QBX16524.1 [NCBI]

Genbank nucleotide accession

MK448719.1 [NCBI]

CDS location

range 29454 -> 33872
strand +

CDS

GTGCTTTCATTATTAGACAAAACAGTTAAAACGGCAAAATGGCATGGGAAGGCACTTCCTGAAACGATAAAGGCCAGTGTCAAAGAAATCTTGAATGGGGATTTTGTCCTGACCTTTACCTATCCCATTACAGATAGTGGCTTATACAGGGAGTTGAAAGAGGACTACTTGGTTCGCAGTCCAGTCCCAGTATTGGGGCATCAACTCTTTCGTATCAAGAAAGTGATTGAAGGGGATTGTAGTATTGAAGTGACAGCTTATCACATTTCTGAAGACATTATGACTCGGCTATTAGCTCCTTTTAGGTGCGAACAAGTACCGTGTGCAACTGCTCTTACCAGCCTTGTGATGGCTAGTAAAACGCCTCTGGGTGATTTTTCCTTTACTAGTGATATTGTCAAACCTCGAACCTACACGGCAGACAAGGAACAAACGCTTTATTCCACCTTACTGGATGGCAACCATTCCATTGTGGGCACTTGGGAGGGGGAGTTGGTCAGAGATAACCTTGCCTTATCGATTCAGTCCAATCGTGGAGAGAACCGTGGTGTCATTCTTTCTACTCATTTTAATTTGAAAACGTATCAGAGAACAACAGAAAGTTCCCAGATGATCACTCGGATTCATGCGACCTCAAGTTTCAAACAGGAAGGTCAAGACGAAGAAACCGTGCTTACAGTAACAGTTGATAGCCCACTGATTACGCAGTATCCCTTCATCAATGAAGTGACCTATACCAATAATAACTTGAAAACCAGACAAGAGTTGGAGGAGTGGGCGAGAGCTAAGTTTCGCTTGGAGAGAATTGATCGACCAAAGGATACCCTTACCATTGAAGCTTATGAGTTGGATGGGCAGACGGTTCATTTGGGTGATACGGTAACTCTTAAAAGTCGGCTGCATGGCATTGATATGACCAAGAAAGCTGTCGCTTATGACTATGACCCCTTGGCTGAGAGTTATCGTTCGATTACCTTTGACGATAAGGCAACTGTTGGTACATCTAGCACTAGTGGTGGTTTGTCTACTTTGGCACACTCTCTTGTCGAAGGAAACAAGCGAAGTGAAGATGTGGCTATTGAAGCAGCGATTGAACATGCCAACAGAGCTTTTGAAGCGGCATTTGAGAAAGGCAAAGCAGCGATTGACGATGCCATCGAGCAAGCCCAAAGTCATGGAGAGGTGTATGCGGACCGACTAAAGGCGAGCCTTGATTCGGAACTTTCTGCCGTCAACCAACGAATGCATCAACAGGAAGAGGAGCAGAATCGGACAACCCGAGATTTGTTGGCACAGGCAGGGGTCAACACACATCTAGCCACAGAAGCCAAACAAAAGGCGGAGGAGGCAGAGACTGGGGCAAGAGAAGCCCTCAGAAGGGCAGAACAAGCCAAGGTTGAAGCGGTTCAAGAAGCGAATCGTTTCACCACTAGTGAACGAAGTCAAACAGAGACGAAGATTGCGACGGCTAAAGCTCAGGCTATTTTAGAAGCTAGCCGTTTGGTTGATGTAGCAAAGGCTCTGTTAAGTGGACAGTTGACCACAGTCAGTACCAGTCTCACCCAAACGAAGGAGGAGATGAAACTTCTTTCCAGTAAGCAGGTAGTGGATAGCCTAACTGGTAGAGTAACGAGTACCGAGACGACCATCACACAGTTAGGAGACCGCATCACGACTGACATTCGTCAGGTGGAAGGAAAGATACCAGTGAGTCTTGATACGGTGAATCTCGTGAAAGGAACGGATCAAGCCTTTGTCATGGGATACGGCATCACCAATACTAGTTGGGATTCAAGCGAGAAAAAAGCAGTTCTTAGCCTCACTCAAACTGGAGTTGAAAAAGCGAGATACGATGAAATTCTTCCGCAGAATCATCAGTTTTTTAGCTTTATTCCTCAAAATGGAACGACTTATACCCAGTCTATGTTAGTGGATACGGATGCTTCTTTCCTTGGGAGGAATGGTCTAGAGTGGAGCTGGTATACCTCAAGGGGGCATCAAACCACACCAGCTTTCATTCGGCAAATAGGAACAAATACCTATCAAATTTGGAGTACCCACACTTGGACCTTGACGAACGAACGTTTGCGAGCCTTTGATGTGTTCCATCTTCACCGTGTGCTTGGCTTTCGAACGAGTGGCACCTACCTCAAGTTTTACAAACCCAAGTTAACTCTGGGACCACTTCCTTCTGATTGGTCACCTTCTCCAGAAGATGTGACAGATGAATTTAGGAGTGTCAAGACCAGCATCCAACAAACAGCAAGTGGGGTAGAACAAGTTTCTACCAGATTAACAGAAGAAGCAGGCAAATTATCGACTGCAGAAACTCAAATTCGTCAATTGGTGAATGATGTGTCTTCGAAAGTTAGTCAAACGGATTTTAATACAGTGAAGCAGACCGTAGAAAGTCACACGACTAGCCTTCACCAAACCAATCAGTCTATTGCCCTAAAGGCAGACAAAGCTTTCGTAGATGGAGTGAAATCAAGTGCGGATGTTGCCCTTTCAAAAGCCAGTAACAATGCGACTCTCATTGCACAAACGAAAGCGGAGTTAAGGGTCGCACAGGATGCCATCACTCAAAAAGTGGCTAAAACGGATTTCAATACTTTACTTGGTAGGGTTTCGAATGCGGAGACAAGTATTCGAACACAGGCAGGGCAGATTGAGGAGAAGCTAAGCAACGTGCAGTTAGAACAGATTTTGGGTCAGAAAGGCTATCAGAATCTGTCTCAAGTCGAGACCTTGATTACGACGACAGCAGGAGAAATCACCACAAGATTAAGTCAAGTCGAAGGGAAGATACCGACTCAAATAGGCGGAGTGAACCTGATGCGAAATACAGATAAAGCTTTTGTGATGGGCTATGGTATCACGAATACTACTTGGGAAGAGGCTACTAAAAAAGCGACTTTGCGCTTTAGTTCTGGTGTCAGGAGGGATATCCATCAGGAGGTTCTACCTCAGAGTGGTCGTTTTTTTGATTTTGTTCCTACAAAAGGGACGACCTACACACAATCTATTTTTGTCGAAACGGATGCGACTTTTATCTCAGAAGGAAATTTTTCTTGTACTTGGTTCACTGCCCCTGATCGGCATAATGAACAGCCCGCAAAAATCAAAAAGATGGGAGATAAGCTCTATCGCATTTGGTCAACCTACACATGGAATTTAGAGAATAATCGCCTGAGAGCGTTTGATTTCTTTGATTTGCATAACGTATTGGCATTTAGAACGAGTGGAACGTATCTTTCCTTCTTTCATCCACAGCTAGAAGTCGGGACTATTCCAACGGATTGGCACATTTCTCCTCAAGAATTCGTCAGAGAAACCGTATTTCATGAAGTTCGAGACACTGTTTCAAATCATACTCGAGCGATAGGAGACCATACCAATCAAATCAGTCAAGTCATTCAGACGGCAAACGGTATTGTGACGAGGGTTGGCAGTCTTGAGACTAGCCGAGCAACGACTACGACTGTAAATGCCATCCAAACCCAAGTGAGCACTCTTGCAGGCTCATGGTCAGTAAGAAATTTGACCAGTGCAGGAACGGTATTGAGTCAGCTCAATCTCAATAAGGATGGATCGGTAAAAATTGATGGAAAGTTGGTTCAAATCACAGGGACGACCTATATTCAGGATGGCGTCATTGCAAGTGGAAAGATTGCCAGTCTTGATGCAGGAAAAATCACCTCAGGACTCATCGCTGCGGCTCGCATTGGTTCAGAAGCGATCACATCTGATAAGTTAAAAGTTGATCAAGCTTTCTTTAACAAGTTTATGGCAAACGATGCCTATCTGAGACAGCTCTTTGCCAAGTCAGCCTTCATTACCCAAGTACAGGCAGTAACCTTATCTGCCAACAACATCTCGGGAGGCATTTTAACGGCTCTAAATGGAGCTATGAAGATTCATCTCACCCAAGGAAATATCAAGTTCTTCACCAATTCTCCTTCCATATCGCGAGAGGTTTCAGGCTATCCCCATCAATGGGTTTCGTTTGAGACTGGAACATCCAATGGCAAGCCCTGTGGTGTGACCATTATCGGCTCAAACCGCTGGAATAATTGGAATGCCAATGATGGTGGTTTTGTCGGTATTCGAGCTTGGAATGGGGCAAATGATGACCAGATTGATATCGTTGGTGATAGTGTCAGATTAGCGAGTTCACCTTATACCAATCCAGATGGCTGGAACATTGTCACTCTTCCCAATCGCCTTTCTATCGATGCCCACCGAGCAGTGGATAGACCGACATCTGTCCTTAATATTGGCGATATCCGCATATATCGTAATGCATCCACCTATGTCAGTTTGAAGGATGTTCTTCAACAGTTCAATCATAATTTTAAACACTTAGTCAATATCACAGGTCGAGGCGATGTTCTTCTGACTTGGGATACCATCAAATAA

Genome Context

Tertiary structure

PDB ID

d7fa7644ecd6a35f59e4e8906e73bc70570543d3d793db3503450a5664ded2e9

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,5831

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence