Protein

View in Explore

Genbank accession

USN14229.1 [GenBank]

Protein name

putative tail protein

RBP type

TSP

Evidence DepoScope

Probability 1,00

Protein sequence

MDPFSFAVMAVAQIGIGFLFPAEGPRLKDLKISASTYGAAIPNAYGIVRVAGNMIWTDKIKEIKKKKTVALKRYKYYLYTGTFAMAICRGPITNVRKIWANHKLIYDATGTGKLAIKKTFKFKVYDGGENQMPDPTIEKIVGEGNTPAYRGLAYILFQDMPLEDFGNSIPQISVEVFAQGDGEGEIIGRATPVTFSRITSYQTTEVAYNGDMDLIAVGLTNGGIAALRPSSSREEGRGATPGLAALLGVSPTTGALVTQGDGGFSNSEPFILYDPVTFETIGRFGTSSNSTSEFPVGNRAGAFSVDREGREWCMYTSVLGYQRALCTSAFGLGGLADLGSQSRGVYGDSFYVGVSGEPSATFYIFEGGDRSGSAVTNLHLYRVSQAGGWAKSEVVAIENEGAISNFQTLGCHYDPADKGVLLVWRNAQRHYIGKYLPEQSRWAWRKTALNAGVAGVQSSVLTTGEFWWVSGSRLYKMNAATGDYIVEIHDPYAALDPDWMSQAAVNESTSNLLYRGQPLYGPTGNTVTFPSSVSQYADPGNGQIVTYGSQGIQVIRKGLTVKPESTTLAGLVATLLNRAGLTPAQYDLTALQSQPVRGYGWASLSDLRSVLAQLRMLYLFDLVERNGVMVGVMRGAGSNESQTGKPVRRITSKLLGTTGDGEGVDFWKESRLQDADLPRRVHLSYMNWDQDFETSTAQTRRISNPIPAMFSYQQVSMEMGVVMTAKEAKDQVNRMLWAQWAERTQHETSLPWAYIDLDPADIVDVRFPDGRRYRERLHQTEFGANWTYALETFSQDSMAYESDAVADGGSGVIDPLPFIPPRAAKAIVLNTPLMRDADDTGGAYSLHYLGVAHGGQTPFDGAGMWRSEDGVNYDLVYLTDQDTEWAQVSGVVPPPRHGAHGLDWETRITLWPTIDWFELESITDDELWSGANMCALGAELIQFRDCVENADGSWTIWNLLRGRRGTEYACASHALGEMFVVLSPSTLEPGAELLDQRAKTRWHRAVGDGVKPELSPSTITRYEPRDLMPYAPKDIRRTVLGTTVTLTWKRRTRMGGNMQDLTGSVPLNEGRERYEVFILKAGFTGDLSRSDEVPAEAQVLYRVETDSPELTVDVSGFTAPFDVNLDSIHVLIYQLSTAVGRGFPGVRSIEPWQDF

Physico‐chemical properties

protein length:	1155 AA
molecular weight:	126826,26370 Da
isoelectric point:	5,29128
aromaticity:	0,10216
hydropathy:	-0,25948

Domains

Domains [InterPro]

DC_1879
ATT
1–218

DC_1879 IPR032876 IPR056490 DC_0263

DC_2254
STR
640–883

DC_2254

USN14229.1

1 1155

Architecture

ATT

STR

RBD

ATT 1-218 | ATT 607-780 | STR 781-883 | RBD 901-1152 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_1879	ATT	DC_1879	1	218	Novel HMM	DC_1879	N-terminal	Low	Positional only	54 proteins / 54 hits
IPR032876	ATT	DC_0307	607	780	InterPro cluster	Tip attachment protein J	Central	Medium	Text match	1111 proteins / 1112 hits
DC_2254	STR	DC_2254	640	883	Novel HMM	DC_2254	Central	Low	Positional only	17 proteins / 17 hits
IPR056490	RBD	DC_0637	901	980	InterPro cluster	Rcc01698-like, C-terminal domain	C-terminal	Low	Positional only	42 proteins / 42 hits
DC_0263	RBD	DC_0263	981	1152	Novel HMM	DC_0263	C-terminal	Low	Positional only	13 proteins / 13 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

USN14229.1

1 1155

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	208	208	0,8387
Central domain	209	407	200	0,5553
C-terminal	408	1155	747	0,1287

Note: Constraints were applied during segmentation.
Fixed 46 C-terminal predictions appearing before Central domain

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-208

Central
209-407

C-terminal
408-1155

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Brevundimonas phage vB_BpoS-Kabachok [NCBI]	2948600	Uroviricota > Caudoviricetes > Jeanschmidtviridae > Marchewkavirus kabachok >
Host	Brevundimonas pondensis [NCBI]	2774189	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Alphaproteobacteria > Caulobacterales

Coding sequence (CDS)

Genbank protein accession

USN14229.1 [NCBI]

Genbank nucleotide accession

ON529852 [NCBI]

CDS location

range 238475 -> 241942
strand -

CDS

ATGGACCCGTTTTCGTTCGCCGTCATGGCGGTGGCCCAGATCGGGATCGGTTTCCTGTTCCCGGCCGAAGGCCCCCGCCTGAAGGACCTGAAAATCTCCGCCTCCACCTATGGCGCGGCGATCCCGAATGCTTACGGGATCGTGCGGGTGGCCGGCAACATGATTTGGACGGACAAGATCAAGGAGATCAAGAAGAAGAAGACCGTCGCGCTCAAGCGTTACAAATATTACCTCTACACGGGTACGTTCGCGATGGCGATCTGCCGAGGACCGATCACCAACGTCCGGAAAATCTGGGCCAACCACAAGCTGATCTACGACGCCACGGGAACCGGAAAACTCGCCATCAAGAAGACCTTCAAGTTCAAGGTCTACGATGGCGGCGAGAACCAGATGCCGGACCCGACCATCGAGAAGATCGTGGGCGAGGGCAATACGCCGGCCTATCGCGGCCTGGCCTATATCCTGTTCCAGGACATGCCTCTGGAGGACTTCGGCAACTCGATCCCTCAGATCAGCGTCGAGGTGTTCGCCCAGGGCGACGGCGAGGGCGAGATCATCGGCCGCGCCACGCCGGTCACCTTCTCGCGCATCACCAGCTATCAGACGACCGAAGTCGCCTACAACGGCGACATGGACCTGATCGCCGTCGGCCTGACGAACGGCGGCATCGCGGCCTTGCGTCCGTCCAGCAGCCGGGAAGAGGGGCGTGGCGCCACGCCGGGCCTCGCCGCCCTGCTGGGGGTATCGCCCACCACTGGCGCTCTGGTCACCCAGGGCGACGGCGGCTTCTCCAATTCCGAGCCCTTCATCCTCTATGATCCGGTGACGTTCGAAACCATCGGGCGCTTCGGGACCTCCTCCAACTCCACCTCCGAGTTCCCCGTCGGCAACCGGGCTGGCGCTTTCAGCGTGGATCGGGAAGGCCGTGAGTGGTGCATGTATACCAGCGTGCTGGGCTACCAGCGCGCCCTGTGCACCTCGGCGTTTGGTTTGGGAGGCCTGGCTGATCTCGGGTCTCAAAGTCGCGGCGTCTACGGCGACAGCTTCTATGTCGGCGTGTCGGGCGAACCCAGCGCGACCTTCTACATCTTCGAAGGCGGAGACCGCTCGGGAAGCGCGGTGACGAACCTGCATCTGTATCGCGTGTCCCAGGCCGGAGGCTGGGCGAAGTCCGAGGTCGTCGCCATCGAGAATGAAGGCGCGATCAGCAACTTCCAGACGCTCGGCTGCCACTATGACCCGGCCGATAAGGGCGTTCTGCTGGTTTGGCGCAACGCCCAACGGCACTATATCGGCAAATACCTCCCGGAACAGTCCCGCTGGGCCTGGCGCAAGACGGCGCTCAACGCCGGCGTGGCCGGCGTGCAATCCTCCGTGCTGACCACCGGCGAGTTCTGGTGGGTCTCCGGCTCGCGCCTCTACAAGATGAACGCGGCGACCGGCGACTACATCGTCGAGATTCACGATCCTTACGCGGCGCTCGACCCGGACTGGATGTCCCAGGCCGCCGTGAACGAGTCGACGTCCAATCTGCTCTATCGGGGGCAGCCCCTCTATGGCCCGACCGGGAACACCGTCACCTTCCCTTCCAGCGTCTCGCAGTACGCTGATCCGGGCAATGGGCAGATCGTGACCTATGGCTCTCAGGGCATCCAGGTCATTCGCAAGGGCCTCACCGTGAAGCCGGAGTCCACCACGCTGGCGGGGCTTGTGGCGACCCTGTTGAACCGCGCAGGACTGACCCCGGCGCAGTACGATCTGACGGCCTTGCAATCGCAGCCCGTGCGAGGCTACGGCTGGGCTTCCCTGTCGGACCTGCGATCCGTCCTGGCCCAGTTGCGCATGCTCTATCTGTTCGATCTGGTCGAGCGGAACGGCGTCATGGTCGGCGTCATGCGCGGCGCCGGATCGAACGAATCCCAGACCGGGAAACCCGTGCGTCGGATCACGTCCAAGCTTCTGGGGACGACCGGCGACGGCGAGGGCGTCGATTTCTGGAAGGAAAGCCGTCTCCAGGACGCCGATCTGCCGCGCCGCGTCCACCTGTCCTACATGAACTGGGATCAGGACTTCGAGACCTCGACCGCCCAGACGCGCCGCATCTCCAACCCGATCCCGGCGATGTTCTCCTATCAGCAGGTCTCGATGGAGATGGGCGTCGTCATGACGGCCAAAGAGGCCAAGGATCAGGTCAATCGCATGCTCTGGGCGCAATGGGCTGAGCGCACCCAGCATGAGACCAGCCTGCCCTGGGCCTACATCGATCTCGATCCGGCGGACATCGTCGACGTTCGCTTCCCTGACGGCCGCCGCTACCGTGAGCGCCTGCATCAGACCGAGTTCGGCGCCAACTGGACCTACGCCCTGGAGACCTTCAGCCAGGACTCCATGGCCTATGAGAGCGACGCCGTGGCCGACGGCGGCTCCGGCGTCATCGATCCTCTACCCTTCATCCCGCCGCGCGCCGCCAAGGCCATCGTGCTGAACACGCCGCTGATGCGCGACGCGGACGACACGGGCGGCGCCTACTCCTTGCACTACCTCGGTGTGGCGCATGGCGGACAAACCCCGTTCGACGGCGCCGGCATGTGGCGTTCTGAAGACGGCGTCAACTATGACCTGGTCTACCTGACGGATCAGGACACGGAGTGGGCGCAGGTGTCCGGCGTCGTCCCGCCGCCGCGTCACGGCGCGCACGGCCTTGACTGGGAGACGCGGATCACCCTGTGGCCGACGATCGACTGGTTCGAACTGGAATCGATCACGGATGACGAACTGTGGTCCGGGGCCAACATGTGCGCGCTCGGGGCTGAACTGATCCAGTTCCGCGATTGCGTCGAGAACGCGGACGGCTCGTGGACCATCTGGAACCTCCTGCGCGGACGCCGGGGCACCGAATACGCCTGCGCGTCGCATGCCCTGGGCGAGATGTTCGTCGTCCTCTCCCCCAGCACGCTCGAACCGGGAGCGGAACTGCTCGACCAACGGGCCAAGACCCGCTGGCACCGGGCCGTCGGCGACGGCGTCAAGCCTGAGTTGTCGCCCTCCACCATCACGCGCTACGAGCCGCGCGACCTGATGCCCTATGCGCCCAAGGACATTCGACGGACTGTGCTTGGCACGACGGTGACCCTGACGTGGAAACGTCGGACCCGCATGGGCGGAAACATGCAAGACCTGACGGGATCGGTGCCGCTCAATGAAGGGCGTGAGCGCTATGAGGTCTTCATCCTCAAGGCAGGGTTCACGGGTGATCTGTCGCGCAGCGACGAAGTCCCGGCCGAGGCCCAGGTCCTCTACCGGGTCGAAACGGACAGTCCCGAACTGACCGTCGATGTGTCAGGATTTACGGCGCCCTTTGACGTAAATCTTGACTCGATCCACGTTCTGATCTATCAACTGTCTACTGCGGTTGGCCGTGGATTCCCCGGTGTTCGTTCGATCGAGCCCTGGCAGGACTTTTAA

Genome Context

Tertiary structure

PDB ID

2d5e7ebd57581f2050dad8b0126b8876dce4398ab1c6743da4dbe4c093c135ce

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,2828

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence