Protein

View in Explore

Genbank accession

QBX22251.1 [GenBank]

Protein name

tail fibers protein

RBP type

Evidence GenBank

Probability 1,00

Evidence RBPdetect2

Probability 0,93

Protein sequence

MQITFYDKNMIETATADNQLLNAIKIKKASLSSYFEEATHYVEFEFSKETGEWWGIKENGYLAFRFRGKFYRFNIVKFKEDVKTNSISILGDYFNLEMLNENCLAYEKQPSRTIVQHLVAMEILPYANFEIGVNELASSSRVVEYTGEEMKYKRLISLINNFDGECQFEIRQKRNGEFDKLILNIYKANDGEKIQGVGRNRRDLELNIDNTNNISRSVDSTTIRTAIEPTGKDGLRLGNSGKTWRNNDGRVEFEQKDGRIYAVIAAEETTRVLSNDKWLVWKQNFDTDSLDKLESESYKWIKNNCYAKETIEVAGSFDVEIGDTVILNHKGVGRYGLLGTLRVVKIVWDLLTEENEVSFANFKRLSSKISAQGLALQESIETPASYDITFNTTAGQVFKNNTGASIVSFNFKKNGLDAAVIGQRWYNGTQLLSNGLEVTIKPDMLTDGKLNLRLEVDVTDAITFSKELTFINVSDGEKGNGIESGKVTYGKTTSISTQPVNWSDSRPAVGQGEVLWSKTTLSYTDKNVPDTIDIKYTYQGKDGALDEEQYNAIVAKNVSQDELISQVKSTADAAKDTASVALSNIVSESKKLTDQMSALSKTEGEHYSATSQQLTQIDGTVKGLQTDYTALVNKDNEITQTLTNYKQTIDQNTAHIAENKQSVDGTISSLQTQVTQNKNDIATKASQLTVNNLSGRMSSAETTITQNANEISTRLSQTNIESLITSKATVITDNKVKETSDSFSREITRVEGLVDGIFSGNRNLLVNTKSMDNIPYTSANKTSETYMGGSVVSALGQSGSYKDAFRQKMSIVPDELEYIVSFYAKSTAVSHNVTCYFYAPNTTIKSVSSQGVVNDRPTGSDGSINISLTNEWKRYWIKWTLRAPKDDTEKIPKEVIVGRNWDSVNSVSIALPALYAGNLNTEWSQAPEDLKAVTDGLTIKYNTVKDTVDSHTQQIGQQGISLTTTIQRVDSIQSSVSSIDGRLSTVTQTADGLVTTVQNLSVGGNNLLLNADFELLENKTSFTVGGVTYSQGPKYWSTYNGGIPNPVTSFHSYSGSFAGRNNVVIFNESDGSRNWKAINQSIGKTIMSDFPDSTDDFILSFDAYADLSGAKLFGGFYYVNKLTGTANFHAGQFTVNLITSGSWNRYSVKVPFNKDNCDFSKTFSFLIYGYGFSSNAILALDNVKLETGTISSAFSKSKKELDDQISSIQTTVTQTSNSWAVKNLTSNGSILSQINLTDGTVKIDGKYVKITGQTLIDNGIITNAMIKDLTADKIIGGTIDANKISVINLNASNITSGQISGGLIKGGVLTALNGAMSIDLNNGTTEMYNDNPAIRRVTADLPNQFIKFSTGTQPNDNNYRIIGSGTKSNLTAAITSIGTNRLRTENNLDGGFTGINIYAGGSGTGDSVVDRIEISSDILKIAHSANSSDRGWVFENINGLNNQYVFRPNTTYQDTYKAMIGTSLNPVDEMYINEMYIKGQRLGYILKDIANRIGNVGSWAAVIS

Physico‐chemical properties

protein length:	1504 AA
molecular weight:	165512,59020 Da
isoelectric point:	5,35295
aromaticity:	0,08577
hydropathy:	-0,38684

Domains

Domains [InterPro]

DC_0266
STR
1–636

DC_0266 DC_2006 IPR012892

DC_2025
RBD
930–1501

DC_2025

QBX22251.1

1 1504

Architecture

STR

RBD

STR 1-636 | STR 661-982 | RBD 983-1501 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0266	STR	DC_0266	1	636	Novel HMM	DC_0266	Central	Low	Positional only	76 proteins / 76 hits
DC_2006	STR	DC_2006	661	982	Novel HMM	DC_2006	Central	Low	Positional only	13 proteins / 13 hits
DC_2025	RBD	DC_2025	930	1501	Novel HMM	DC_2025	C-terminal	Low	Positional only	28 proteins / 28 hits
IPR012892	RBD	DC_0453	1186	1427	InterPro cluster	Gp58-like	C-terminal	Low	Positional only	116 proteins / 119 hits

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Streptococcus phage Javan645 [NCBI]	2548298	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Streptococcus urinalis [NCBI]	149016	cellular organisms > Bacteria > Bacillati > Bacillota > Bacilli > Lactobacillales

Coding sequence (CDS)

Genbank protein accession

QBX22251.1 [NCBI]

Genbank nucleotide accession

MK448826.1 [NCBI]

CDS location

range 28881 -> 33395
strand +

CDS

GTGCAGATTACTTTTTATGATAAGAATATGATTGAAACAGCAACTGCTGACAATCAATTGTTAAATGCTATCAAAATTAAAAAGGCATCATTATCATCATATTTTGAAGAGGCAACTCATTATGTTGAGTTTGAATTTTCAAAAGAAACAGGTGAATGGTGGGGGATCAAAGAAAATGGCTATCTTGCATTTAGATTTAGAGGCAAATTTTATAGATTTAATATCGTAAAATTCAAAGAAGATGTCAAAACCAATTCCATCAGCATTTTAGGTGATTATTTCAATCTAGAAATGCTAAATGAGAACTGTTTAGCATATGAAAAACAACCATCAAGGACTATTGTACAGCATTTAGTAGCAATGGAGATTTTGCCATATGCTAACTTTGAAATAGGTGTCAATGAACTAGCAAGCAGCAGCAGAGTTGTTGAATATACAGGTGAAGAGATGAAATACAAAAGACTCATCTCTCTAATCAATAACTTTGATGGTGAGTGTCAATTTGAAATTAGACAAAAAAGAAATGGTGAGTTTGACAAACTAATTCTAAATATCTATAAAGCAAATGATGGTGAAAAAATTCAAGGTGTTGGTAGAAATAGAAGAGATTTAGAACTCAATATTGATAACACTAACAACATTAGCAGATCGGTTGATTCAACAACTATAAGAACAGCTATTGAACCAACAGGAAAAGATGGGTTGAGGTTAGGCAATAGCGGAAAAACCTGGAGAAATAATGATGGTAGAGTTGAATTTGAACAAAAAGATGGCAGAATTTATGCTGTTATTGCTGCCGAAGAAACAACTCGTGTATTATCTAATGACAAATGGTTAGTTTGGAAACAAAATTTTGATACTGATTCATTAGATAAACTTGAGTCTGAGTCATACAAATGGATAAAAAACAATTGTTATGCAAAAGAAACCATTGAGGTTGCAGGGTCTTTTGATGTTGAAATTGGAGATACTGTAATTTTGAATCATAAAGGTGTTGGTAGATATGGGCTTTTGGGAACTTTGCGTGTTGTTAAAATTGTATGGGATTTACTAACTGAGGAAAATGAAGTCTCATTTGCTAATTTCAAACGATTATCATCCAAAATTTCTGCTCAAGGTCTTGCTTTACAAGAAAGTATTGAGACACCTGCAAGTTATGATATTACATTTAATACAACTGCCGGACAAGTTTTTAAAAACAACACTGGGGCATCAATAGTATCATTCAATTTTAAAAAGAATGGATTGGATGCTGCTGTCATTGGTCAAAGATGGTACAATGGCACTCAACTATTATCAAATGGCTTAGAAGTGACAATAAAGCCTGACATGCTGACAGATGGCAAGTTAAATTTGAGGCTTGAGGTTGATGTCACTGATGCAATTACATTTAGCAAAGAGTTAACATTTATCAATGTTAGTGACGGCGAAAAAGGGAATGGCATTGAGTCAGGAAAAGTCACATATGGCAAGACAACATCAATATCAACCCAACCTGTAAATTGGTCAGATAGCAGGCCAGCTGTCGGTCAGGGAGAGGTGCTTTGGTCAAAAACAACACTATCATATACTGATAAAAATGTTCCTGATACTATCGATATAAAGTATACATATCAAGGTAAAGACGGGGCGCTAGACGAAGAACAATATAATGCAATTGTTGCAAAAAATGTCAGTCAAGATGAGCTAATAAGTCAAGTTAAATCAACAGCTGATGCTGCTAAGGATACCGCGAGTGTTGCCTTGTCTAACATAGTTAGTGAGTCTAAAAAATTAACTGATCAGATGTCCGCTTTGTCTAAAACAGAAGGCGAACATTACTCTGCAACATCTCAACAACTAACTCAAATTGATGGAACTGTAAAAGGTCTACAAACTGATTACACTGCATTAGTTAACAAAGATAATGAGATTACTCAGACATTAACTAACTACAAGCAGACTATCGATCAGAATACAGCCCACATTGCAGAAAATAAACAATCTGTCGATGGAACGATCAGCAGTCTACAAACACAAGTTACTCAAAATAAAAATGATATTGCCACAAAAGCAAGTCAGTTAACAGTAAATAACTTATCAGGTCGAATGTCTAGCGCTGAGACGACTATCACGCAGAATGCTAACGAGATTAGTACACGATTATCTCAGACTAATATCGAGTCACTCATTACTAGCAAAGCAACTGTCATTACGGATAACAAAGTCAAAGAGACATCAGATAGTTTTAGTCGTGAGATAACGAGAGTTGAAGGATTAGTTGATGGGATTTTTTCAGGCAATCGTAACCTATTGGTTAATACAAAATCAATGGACAATATACCTTATACATCAGCAAATAAGACTTCAGAGACATACATGGGTGGTTCTGTTGTTTCAGCGTTGGGTCAATCTGGTAGCTACAAAGATGCTTTTAGACAAAAAATGAGCATTGTTCCTGACGAATTAGAGTATATTGTTTCTTTTTACGCAAAATCAACGGCTGTCAGTCATAATGTGACTTGTTATTTTTACGCACCTAACACGACAATAAAATCGGTTTCGTCCCAAGGGGTTGTAAATGATAGACCTACCGGTTCTGATGGGTCCATAAATATCTCATTAACGAATGAGTGGAAACGATATTGGATAAAATGGACTCTCAGAGCTCCAAAAGACGATACGGAAAAAATTCCAAAGGAAGTAATTGTCGGAAGGAATTGGGATAGTGTTAACAGCGTGTCTATCGCTTTACCTGCTTTATACGCTGGCAATCTTAACACAGAGTGGTCTCAAGCTCCCGAAGACCTCAAAGCTGTCACAGATGGATTAACTATCAAATACAACACAGTAAAAGATACAGTAGATAGTCACACTCAACAAATTGGTCAGCAGGGAATATCTTTAACGACTACAATTCAAAGAGTAGACTCTATCCAATCGTCAGTAAGCAGTATTGACGGTAGGTTATCGACAGTCACACAGACTGCTGATGGACTTGTAACAACAGTTCAAAATCTATCTGTTGGTGGAAATAATCTGTTGTTAAATGCTGATTTTGAATTATTAGAAAATAAAACATCTTTTACTGTTGGTGGAGTTACTTATTCACAAGGTCCTAAATATTGGTCGACTTATAATGGTGGAATTCCGAATCCAGTAACATCTTTTCATTCATATAGTGGTTCGTTTGCCGGTCGAAATAATGTTGTAATTTTCAATGAATCTGACGGATCAAGGAATTGGAAAGCAATAAATCAATCAATAGGAAAAACAATAATGTCAGATTTTCCTGATTCAACAGATGATTTTATTCTTTCGTTTGATGCATATGCTGATCTATCCGGTGCTAAATTATTTGGTGGTTTTTATTATGTTAACAAATTGACTGGTACAGCGAATTTCCACGCCGGGCAATTTACAGTCAACTTAATAACTTCTGGATCTTGGAACAGATACTCTGTTAAAGTTCCGTTTAACAAGGATAACTGTGATTTTAGTAAGACATTTTCATTTTTAATCTACGGTTATGGTTTTTCATCAAATGCAATATTAGCGCTTGATAATGTTAAGTTAGAAACAGGAACAATATCATCAGCATTTAGCAAATCTAAAAAAGAACTTGACGATCAAATATCATCAATTCAAACGACAGTTACCCAAACATCCAATAGCTGGGCGGTTAAAAACTTAACATCAAATGGTTCAATCCTTAGTCAAATCAATCTAACCGATGGCACAGTAAAAATTGATGGTAAGTATGTTAAAATCACCGGTCAGACATTAATTGACAACGGTATTATTACTAATGCAATGATTAAGGATTTGACAGCTGATAAAATTATAGGTGGTACCATTGATGCAAATAAAATATCAGTAATTAATTTAAATGCGAGTAACATTACTTCAGGTCAGATTTCTGGAGGTCTTATTAAAGGTGGCGTTTTAACCGCATTAAATGGTGCGATGTCGATTGATTTGAATAATGGTACAACAGAAATGTACAATGATAACCCAGCAATCAGAAGAGTAACTGCTGATTTACCAAATCAATTTATTAAATTCAGTACTGGTACTCAACCCAATGACAACAATTATAGAATTATTGGTTCCGGCACAAAATCAAATTTGACAGCTGCTATTACATCAATTGGCACTAATCGATTGCGAACGGAAAATAATTTAGATGGTGGTTTTACTGGCATCAATATCTACGCTGGTGGAAGTGGAACTGGTGACAGCGTTGTAGACAGAATTGAAATTTCATCAGATATTTTAAAAATTGCGCATTCAGCGAATTCTAGTGATAGAGGCTGGGTATTTGAAAATATTAATGGTTTGAATAACCAGTATGTTTTTAGACCAAATACGACATATCAGGATACGTATAAAGCAATGATTGGAACATCTCTGAATCCTGTTGATGAAATGTACATTAATGAAATGTATATTAAAGGCCAACGTTTGGGTTATATACTAAAAGACATAGCTAATCGAATCGGTAATGTAGGCTCATGGGCAGCAGTTATCTCATAG

Genome Context

Tertiary structure

PDB ID

b820f4014f3f3fc7974cdd9e41b4e27cd82d62b60de840a27c3d241b5006bf59

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,7538

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence