Protein

View in Explore

Genbank accession

XBS49029.1 [GenBank]

Protein name

tail protein

RBP type

Evidence RBPdetect2

Probability 0,95

Protein sequence

MIKFHDPSGTPHFGQATITRTTSVNGGLSLTGEVFAGDDVLNGLDYGWWLNFDNEKYVITYKKLSDDTNTVVFDAVQQFFWDFAKVALHAQYTGSHEYTFYLGQLFDKSGYTYKNDVTVPAFEKENWGYKNKLDLFNDIIDQAGVEFEVHNETVHIAKQIGSDLTSFARKGINLSNLTEEMKISDFATYAKGYGAFKDTEDQSKGRLEVEYRSELAKQFGDLEMDPIVDERYTIADNLIAALKKQVDATYTVSMTMNIYDLENAGYPNYEAPKVGDWILAIDEALNFKRKIRIIQLEEQFDVTGKRIGYTATCGDLSIVDQYTHLQSSLDSKVQRIQESVDNVAISANGKSKNYYGVKEPMSANEGDLWFDQSNSDPDKWSIKQWVNGRWEQITLNPGEVDAKVDVAKKEAETAVENAKSASDKADQLAAKYDDTNALANQAMDKAVGAQSDASSAAATANSTASEFGKVDQKADSALSAALNAQNDASSAVNQASSAAADSKDAKQIAGAVSQSYKTLTDGSTMTIAELQNGLGAKLTKSDLDGYATQTWAQNQIKMTADGINGTISSVKGTVDSQTTSINDLKADSSSFKGQFTTVNNTLGKQTTDISTLQASSKELTTGFNTLTTDNTTNKNDISQLKQTATEVSSTLETVQTQVQNSAVGTNLYTDTKNFDNPASWYASIVWTKTTDTYKGLVVIQTTDDWNGLSQYIQVKKGDILTYSVYAKYANGSGTSSIFFPLNNPTEGNYSAAAASVWGSNVTITDSWQRLSATTVVTSDGYLRPRLERTNGNTNTLQIAGIKVEKGSLATDWCANPADNATVTAVSKISQTVDGMKTDISKKIEQKDLNGYATQTWAQNQINTTANGINGTISSVKSTVDGHTTSINDLKADSSGFKAQFTTVNNTLGKQTTDIGSLQATSNELTTRFNTLTSDNTTNKNDISQLKQTATEVSSTLETVQTQVKDSAVGTNLIIQSDLKYGCIFPDGSLGSNTVDFHSDNYIPTNGATVFTFSSPDYAFKGNGNDDRIAMYDSDKNYLGYQSLDSPTQTLSQSNVAYIRFSINSADEGNTTGNSSDWLANHRYKLEKGSVATDWCPNPADNATVTAVSSISQTVDSIKTTVRGKVDNETYQTKVTQLSGQITSVVKKADDNFTAIQQTASDINLKVSKDGVINAINVSNEGTSIYGNKLHITADTYIDNATIKSAMIDYIEAEKIRTGTLDATNVKVVHLNADSITSGAIRGANLLIDLDVGNVEFQKGRIHNTSNTIDINIDAGYMSVANGSNRAMLKNGEMQFVEPGTYDTSNNPYLRISNTFGGQSTEGAAFIGRSYAALTNSANLTGSGIFDIGMGTETFSGIATGYGSGFLNKGWHMTKVGGAERGVVISGGKATSYRQYWSASPSIMVGATSNSTSSGGMHGSNIIMDCDYLYNFSTYMRTTSHAANVYVADDGAIVRASSASKYKTNIERSFDIGMGERILEVPTAHWFDKAEVRKKTLDPQAPDPRRYFGMIADDLDDAGLTELVEYNEKGEVEGIMYDRVALTLIPIVRNYRDRITKLESEIKQLKEG

Physico‐chemical properties

protein length:	1567 AA
molecular weight:	170192,62830 Da
isoelectric point:	4,88374
aromaticity:	0,08424
hydropathy:	-0,46324

Domains

Domains [InterPro]

DC_0366
ATT
1–76

DC_0366 G3DSA:3.55.50.40 Coil G3DSA:1.10.287.1490 G3DSA:1.10.287.1490 DC_0469 Coil

DC_1274
ATT
93–552

DC_1274 DC_1746 IPR012892 IPR030392

IPR010572
ENZ
105–299

IPR010572

XBS49029.1

1 1567

Architecture

ATT

STR

ATT

STR

RBD

CHP

ATT 1-76 | STR 79-92 | ATT 93-552 | STR 553-968 | RBD 986-1543 | CHP 1544-1561 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0366	ATT	DC_0366	1	76	Novel HMM	DC_0366	N-terminal	Low	Positional only	7 proteins / 7 hits
G3DSA:3.55.50.40	STR	G3DSA:3.55.50.40	79	161	Merged direct domain	G3DSA:3.55.50.40	Central	Low	Positional only	63 proteins / 63 hits
DC_1274	ATT	DC_1274	93	552	Novel HMM	DC_1274	N-terminal	Low	Positional only	124 proteins / 124 hits
IPR010572	ENZ	DC_0675	105	299	InterPro cluster	Tail spike domain	Central	High	Text match	419 proteins / 419 hits
Coil	Unmapped	-	404	431	Coils	Coil	-	-	-	-
G3DSA:1.10.287.1490	STR	G3DSA:1.10.287.1490	551	663	Merged direct domain	G3DSA:1.10.287.1490	Central	Low	Positional only	5 proteins / 5 hits
DC_1746	STR	DC_1746	584	906	Novel HMM	DC_1746	Central	Low	Positional only	92 proteins / 92 hits
G3DSA:1.10.287.1490	STR	G3DSA:1.10.287.1490	856	968	Merged direct domain	G3DSA:1.10.287.1490	Central	Low	Positional only	5 proteins / 5 hits
DC_0469	RBD	DC_0469	986	1543	Novel HMM	DC_0469	C-terminal	Low	Positional only	48 proteins / 48 hits
IPR012892	RBD	DC_0453	1106	1312	InterPro cluster	Gp58-like	C-terminal	Low	Positional only	116 proteins / 119 hits
IPR030392	CHP	DC_0088	1457	1561	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits
Coil	Unmapped	-	1547	1567	Coils	Coil	-	-	-	-

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Lactiplantibacillus phage H1-Guo [NCBI]	3155565	Viruses >
Host	Lactiplantibacillus plantarum [NCBI]	1590	cellular organisms > Bacteria > Bacillati > Bacillota > Bacilli > Lactobacillales

Coding sequence (CDS)

Genbank protein accession

XBS49029.1 [NCBI]

Genbank nucleotide accession

PP779551 [NCBI]

CDS location

range 200 -> 4903
strand -

CDS

TTGATTAAATTTCATGATCCGTCTGGGACGCCCCATTTCGGCCAAGCTACCATTACAAGAACTACTAGCGTCAATGGCGGACTGTCACTGACTGGTGAAGTGTTTGCTGGTGATGACGTATTGAACGGTTTAGACTACGGCTGGTGGTTAAACTTCGATAACGAAAAGTACGTCATTACGTATAAGAAGCTGAGTGATGATACCAATACCGTTGTCTTTGATGCGGTACAACAGTTCTTTTGGGACTTTGCCAAAGTAGCATTGCACGCACAATACACGGGTAGTCATGAGTATACATTCTATCTAGGACAACTCTTTGATAAATCCGGGTATACCTACAAGAATGACGTTACCGTACCAGCATTTGAAAAAGAAAATTGGGGTTATAAAAATAAGTTAGATTTATTTAACGACATTATTGATCAGGCTGGCGTTGAATTTGAAGTGCATAATGAGACGGTTCACATTGCTAAACAGATTGGTAGTGACCTGACCAGTTTTGCCCGTAAAGGGATTAACCTTAGTAATCTCACGGAAGAAATGAAAATATCCGATTTTGCGACGTATGCTAAGGGCTATGGTGCTTTCAAAGATACTGAAGACCAAAGTAAGGGTCGATTAGAAGTTGAGTATCGCAGTGAGTTAGCCAAGCAGTTTGGCGACTTAGAAATGGATCCGATTGTCGATGAACGATACACAATTGCAGATAACTTGATTGCCGCCTTAAAAAAGCAGGTTGATGCGACCTATACCGTGTCAATGACTATGAACATCTATGACTTAGAGAACGCTGGTTATCCTAATTATGAAGCACCTAAAGTCGGGGACTGGATTCTAGCGATTGATGAAGCATTAAATTTCAAGCGTAAGATTCGCATTATTCAGCTTGAAGAACAGTTTGACGTGACCGGTAAGCGTATCGGGTATACGGCCACTTGTGGTGATTTGAGTATTGTGGATCAGTACACACATCTACAAAGTAGTTTGGATAGCAAGGTACAGCGTATTCAAGAAAGTGTTGATAATGTAGCTATCAGTGCTAACGGCAAGAGTAAAAACTACTATGGTGTAAAAGAACCTATGAGTGCCAATGAAGGTGACTTATGGTTTGACCAAAGTAATAGTGATCCAGACAAGTGGTCTATCAAACAATGGGTCAACGGGCGTTGGGAGCAGATTACGTTGAACCCTGGCGAGGTAGACGCCAAAGTTGATGTAGCTAAAAAGGAAGCTGAAACCGCGGTTGAAAATGCTAAAAGTGCATCAGATAAAGCTGACCAGCTTGCGGCTAAGTACGATGATACAAATGCATTAGCTAATCAAGCTATGGATAAAGCAGTAGGTGCACAAAGCGACGCTAGTTCCGCAGCTGCTACAGCAAACTCTACAGCTTCGGAGTTCGGTAAAGTTGACCAAAAGGCAGATAGTGCCTTATCTGCTGCTTTAAATGCTCAAAATGATGCTAGTTCTGCAGTAAACCAAGCATCGTCCGCTGCAGCTGACTCTAAAGATGCTAAGCAAATTGCTGGAGCAGTTAGCCAGAGTTATAAGACGTTAACCGATGGGTCAACTATGACCATTGCTGAATTACAAAATGGTCTAGGTGCTAAGTTGACTAAGTCTGATTTGGATGGATATGCTACTCAGACATGGGCACAAAATCAGATTAAAATGACTGCTGATGGTATTAATGGCACCATATCTAGTGTTAAGGGCACCGTCGACAGTCAGACAACTAGTATTAATGACCTTAAGGCGGATTCGAGTTCGTTTAAAGGCCAGTTTACGACCGTTAACAATACTCTTGGTAAGCAAACTACAGATATTAGTACACTTCAAGCATCATCTAAAGAACTGACTACTGGGTTTAATACGTTAACGACTGATAATACGACTAACAAGAACGATATTAGTCAGCTTAAACAGACCGCCACGGAAGTCAGTAGCACCTTGGAAACTGTTCAAACACAGGTCCAAAATAGTGCAGTGGGAACTAACTTGTACACTGATACCAAGAATTTTGACAACCCAGCATCATGGTATGCATCCATTGTGTGGACAAAAACTACGGATACCTATAAAGGATTAGTTGTAATACAGACAACAGACGATTGGAATGGGCTGAGCCAATATATCCAAGTTAAAAAAGGTGATATTTTAACTTATAGTGTATATGCAAAATATGCAAATGGTAGTGGAACAAGCAGCATCTTCTTCCCACTCAACAATCCAACTGAAGGTAATTACAGCGCTGCTGCAGCAAGCGTATGGGGTAGCAACGTAACTATAACAGATTCATGGCAGCGGTTGTCAGCGACAACGGTTGTCACTAGTGACGGTTATTTACGCCCTCGACTTGAACGAACTAATGGAAACACCAATACTCTTCAGATTGCCGGAATCAAGGTAGAAAAAGGTAGTCTAGCTACTGATTGGTGCGCTAATCCAGCAGATAATGCAACCGTTACAGCTGTATCCAAGATTTCTCAAACTGTTGATGGTATGAAGACTGACATTTCTAAGAAAATTGAGCAGAAAGATCTTAATGGTTATGCTACCCAGACTTGGGCGCAGAATCAGATTAATACTACTGCCAATGGTATTAACGGAACCATATCCAGTGTTAAGAGTACCGTCGATGGGCATACAACCAGTATCAATGATCTTAAGGCTGATTCCAGTGGGTTTAAAGCTCAGTTTACGACGGTTAATAATACTCTCGGCAAACAAACAACTGATATTGGAAGTCTGCAAGCCACGTCTAACGAATTAACTACCAGGTTTAATACGTTAACAAGTGATAATACGACTAATAAGAATGATATTAGCCAGCTTAAACAGACTGCTACGGAAGTCAGCAGCACTTTAGAAACTGTTCAAACGCAGGTTAAAGATAGTGCCGTTGGGACTAACTTAATCATTCAATCAGACTTAAAATATGGGTGTATTTTTCCAGATGGTAGTTTAGGCAGCAATACCGTTGATTTTCATTCAGATAATTATATACCTACTAATGGAGCAACTGTGTTTACGTTCAGTTCACCAGATTATGCATTCAAAGGAAATGGTAATGATGATCGTATTGCAATGTATGATAGCGATAAAAATTATCTGGGTTATCAATCTTTAGATTCACCAACCCAAACATTAAGCCAATCTAATGTTGCATATATTAGATTCTCTATTAACTCTGCGGACGAAGGTAACACTACTGGCAATTCATCTGATTGGTTAGCTAATCATAGATACAAGCTGGAAAAAGGCTCCGTAGCTACCGATTGGTGTCCTAATCCAGCTGATAACGCCACAGTCACAGCTGTATCAAGCATCTCTCAAACTGTGGATTCCATTAAAACAACTGTACGCGGAAAGGTTGATAATGAAACTTATCAGACCAAGGTAACCCAATTAAGCGGCCAGATAACATCGGTTGTAAAGAAAGCTGATGATAATTTTACTGCAATTCAACAAACTGCGTCAGACATCAATCTTAAAGTTTCCAAAGATGGCGTTATAAATGCAATTAACGTATCGAATGAAGGAACATCAATATACGGTAACAAACTGCATATAACGGCTGATACCTATATTGATAATGCAACTATTAAGTCCGCCATGATAGATTACATCGAAGCAGAAAAAATCCGAACTGGTACACTCGATGCTACCAATGTTAAAGTGGTCCATTTGAATGCGGACAGTATTACATCTGGTGCGATTAGAGGCGCCAACCTATTAATTGACCTTGATGTTGGTAATGTTGAGTTCCAAAAGGGTCGTATTCACAACACTAGTAACACAATTGATATTAATATTGACGCAGGGTATATGTCAGTAGCAAACGGCAGTAATCGTGCAATGTTAAAAAATGGTGAAATGCAATTTGTAGAACCTGGAACTTATGACACATCTAATAATCCCTATCTACGTATCTCAAATACGTTTGGCGGGCAATCAACTGAAGGCGCTGCTTTTATTGGTCGTAGCTACGCAGCCTTGACAAATTCGGCTAACTTAACTGGAAGCGGAATATTTGACATAGGAATGGGAACAGAAACATTTAGTGGTATTGCGACTGGATATGGTTCTGGCTTTTTGAATAAAGGGTGGCACATGACCAAAGTTGGTGGAGCTGAGCGTGGCGTGGTTATATCTGGAGGTAAAGCCACATCATACCGTCAATACTGGTCAGCCAGTCCTTCAATTATGGTTGGTGCTACAAGTAATAGCACTAGTTCTGGAGGTATGCATGGGTCAAACATTATTATGGATTGTGACTACTTGTACAACTTTAGCACATACATGCGAACCACCAGTCATGCGGCTAACGTATATGTTGCTGATGATGGCGCCATTGTTAGAGCTAGTTCGGCTTCTAAGTATAAAACAAATATCGAACGATCATTTGATATTGGGATGGGTGAACGTATCCTAGAGGTTCCAACGGCGCATTGGTTTGATAAAGCAGAAGTTCGTAAAAAAACATTAGACCCTCAAGCTCCAGATCCTCGCCGCTATTTCGGTATGATTGCTGATGATTTAGACGATGCTGGATTAACTGAATTAGTAGAATACAACGAAAAAGGCGAAGTAGAAGGGATCATGTATGACCGGGTTGCATTGACTCTTATCCCAATCGTTCGTAACTACCGAGACCGAATTACCAAATTAGAATCAGAAATTAAACAATTGAAAGAAGGATAA

Genome Context

Tertiary structure

PDB ID

2401c1ba763b00a3c316843c331ac5f3556f6bf614d3522e8ba4e6d0f11b1cf9

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,7085

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence