Protein

View in Explore

Genbank accession

YP_006989482.1 [GenBank]

Protein name

tail protein

RBP type

TSP

Evidence RBPdetect

Probability 0,58

Protein sequence

MTDYTPILKLPEVAPNQNQKEDTINTALAILESAMNNVKVYTLTGAGPRNLTEDDYTRYFLHRFSGQTAAYEVTVPAALPRWFAVENAGSFAITVRCQGVTGGLPFEVPPGKIGLAVSDGSDVRTVVPQSGMGLLQDLSDVSGVPTDKQVLRYDAATSLWKPSTFTMAFTQLTDVPGSYSAQQGKLVAVNAAGTGLEFVTSASNVNDFLDLTDTPSSYAGAAGKTVKVSSGGTGLVFGSPTFLESTDTPSSYSGGANKFVRVNPGSSALIFSDVKLTDLSDGPGTYTGFGGMFLRVKNDGTGFEFNTGSGGPDNFLDLTDTPDAYTGQGNKAVRVKSDVSGLEFYTPNFLLLSDTPADYSGAANKVLRVNGAGNAVIFSTLAFQDLQNVPTAQANKWLRWNPTATALINDTPTFLGLSDTPAAYTGNEGKYVYVKGDGSGLGFTATSANLSFLELNDTIDTTYDSKTDMVPIVTIVSGSPVLQLGYYAFAKLAGISLSSPTEGQILGYNATSGLWTNIDAPEGGGGSIGVPSYGAHPYWRLLLHATDGSTVEYGIQEIEFKHTKTGADLANGGTASASSTAEGSPDGAFDNTVGAAWFSSTAADGQWIKYHFTAPVDVRYLTLKGSQSRPNGSPSAFSVQYSDDDSAWTTAWEVTGQTGWAAGQTREFHAPIDLFFTDLADAPPSYIGQAGKALRVNTGETALEFFTPATTLATMGDVDFTFPPTDGQVLAFDNATGKWKPYTLTSEAQQPAFRGEWSGSGENVTLTFDSLTIPSELTPDATGWTIVGQADATAGTTQALKTRPISHNGLCYIQQTVNFVGDTPFKVRYKVSSESVDLFRVLVDGSQVYSDGGNNGTFEEFSTTLSGTHTIRYQYTKDPSASIGDDCVYISQISYKKVLDTPFIYGDTVTYLGETYFCLTSNTTETPGTGNDWVKYGGSGSGTFLGLTDTPASYSGQSLKAVRVKADETGLEFYTAATGGSGGAGGVLPERTRLHRTTTQAIPSGTWTAVQWDSEVEDPVGAFVSSANTRITVPAGVQKARVTAYTTWNTSPTSATIGLALRRNGVEIGASGGTNIAATRTGFAESHLNLTSEWFSVTQGDYYEVYVLQNSGSSQSLNGPVSKFGEHSYVQFEWDVGPAAQQYEAHAAHQGWRVVVTESQTDTFATIAELKFYDRSGTLVPTTGGKVYDTNSHGTYPASQAFDGNTSTYWSSLQQTSTDLPGGPGYIFASGVDVGSFKITTTGSDFNTTNSPKNFSLQYTDDDGASWKTYAIYTNQTGWGVSEERTFTVPVVGVAANAPGGGNTSADFGSFIAGKPLASEKAIRFVVATPFTVTTGVHQGSAETAATASRTFSFAKNGVEFLTATFAAAGTVATFSANTATSFAAGDILLITAPSTQDATLADISFTLKGIR

Physico‐chemical properties

protein length:	1412 AA
molecular weight:	149008,18690 Da
isoelectric point:	4,64985
aromaticity:	0,10836
hydropathy:	-0,19915

Domains

Domains [InterPro]

DC_1385
ATT
1–207

DC_1385 DC_1385 DC_1385 DC_1385 DC_1385 G3DSA:2.60.120.260

DC_1385
ATT
200–240

DC_1385 DC_0349 DC_1385 IPR000421 DC_1385 IPR008979

G3DSA:2.60.120.260
STR
566–676

G3DSA:2.60.120.260 IPR000421

IPR008979
STR
570–659

IPR008979 DC_1049

IPR000421
RBD
574–672

IPR000421

YP_006989482.1

1 1412

Architecture

ATT

STR

RBD

ATT 1-480 | ATT 484-1062 | STR 1180-1298 | RBD 1299-1412

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_1385	ATT	DC_1385	1	207	Novel HMM	DC_1385	N-terminal	Low	Positional only	25 proteins / 25 hits
DC_1385	ATT	DC_1385	200	240	Novel HMM	DC_1385	N-terminal	Low	Positional only	25 proteins / 25 hits
DC_1385	ATT	DC_1385	238	277	Novel HMM	DC_1385	N-terminal	Low	Positional only	25 proteins / 25 hits
DC_0349	ATT	DC_0349	272	313	Novel HMM	DC_0349	N-terminal	Low	Positional only	13 proteins / 13 hits
DC_1385	ATT	DC_1385	305	348	Novel HMM	DC_1385	N-terminal	Low	Positional only	25 proteins / 25 hits
DC_1385	ATT	DC_1385	346	384	Novel HMM	DC_1385	N-terminal	Low	Positional only	25 proteins / 25 hits
DC_1385	ATT	DC_1385	379	480	Novel HMM	DC_1385	N-terminal	Low	Positional only	25 proteins / 25 hits
DC_1385	ATT	DC_1385	484	761	Novel HMM	DC_1385	N-terminal	Low	Positional only	25 proteins / 25 hits
IPR000421	RBD	DC_0058	548	672	InterPro cluster	Coagulation factor 5/8, C-terminal domain	C-terminal	Low	Positional only	33 proteins / 66 hits
G3DSA:2.60.120.260	STR	G3DSA:2.60.120.260	566	676	Merged direct domain	G3DSA:2.60.120.260	Central	Low	Positional only	264 proteins / 264 hits
IPR008979	STR	IPR008979	570	659	Merged direct domain	Galactose-binding-like domain superfamily	Central	Low	Positional only	24 proteins / 24 hits
IPR000421	RBD	DC_0058	574	672	InterPro cluster	Coagulation factor 5/8, C-terminal domain	C-terminal	Low	Positional only	33 proteins / 66 hits
DC_1385	ATT	DC_1385	756	1062	Novel HMM	DC_1385	N-terminal	Low	Positional only	25 proteins / 25 hits
G3DSA:2.60.120.260	STR	G3DSA:2.60.120.260	1180	1298	Merged direct domain	G3DSA:2.60.120.260	Central	Low	Positional only	264 proteins / 264 hits
IPR008979	STR	IPR008979	1184	1291	Merged direct domain	Galactose-binding-like domain superfamily	Central	Low	Positional only	24 proteins / 24 hits
IPR000421	RBD	DC_0058	1191	1292	InterPro cluster	Coagulation factor 5/8, C-terminal domain	C-terminal	Low	Positional only	33 proteins / 66 hits
DC_1049	RBD	DC_1049	1265	1412	Novel HMM	DC_1049	C-terminal	Low	Positional only	12 proteins / 12 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

YP_006989482.1

1 1412

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	534	534	0,9844
Central domain	535	733	200	0,2158
C-terminal	734	1412	678	0,4890

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-534

Central
535-733

C-terminal
734-1412

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Caulobacter virus Karma [NCBI]	1211641	No lineage information
Host	Caulobacter crescentus [NCBI]	155892	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Alphaproteobacteria > Caulobacterales

Coding sequence (CDS)

Genbank protein accession

YP_006989482.1 [NCBI]

Genbank nucleotide accession

NC_019410 [NCBI]

CDS location

range 72952 -> 77190
strand +

CDS

ATGACCGATTACACGCCGATCCTGAAGCTCCCTGAGGTCGCGCCGAACCAAAACCAGAAGGAAGACACGATCAACACCGCGCTCGCCATCCTGGAGAGCGCGATGAACAACGTGAAGGTCTATACCCTCACCGGCGCGGGGCCGCGCAACCTCACCGAGGACGACTACACCCGCTACTTCCTGCACCGGTTCTCGGGCCAGACCGCCGCCTACGAGGTCACCGTGCCGGCCGCCCTGCCGCGTTGGTTCGCGGTCGAGAACGCCGGCAGCTTCGCCATCACCGTGCGCTGCCAGGGCGTCACCGGCGGCCTGCCGTTCGAGGTTCCGCCCGGCAAGATCGGGCTGGCGGTCTCCGACGGCTCGGACGTCCGCACCGTCGTGCCGCAGTCGGGCATGGGCCTGCTCCAGGACCTCTCGGACGTCTCGGGCGTGCCGACCGACAAGCAGGTCCTGCGCTACGACGCCGCCACCAGCCTGTGGAAGCCTTCGACTTTCACGATGGCCTTCACCCAACTGACCGACGTGCCGGGCAGCTATTCGGCCCAGCAAGGCAAGCTCGTGGCGGTCAACGCCGCCGGCACGGGTCTGGAGTTCGTCACCTCGGCCTCCAACGTCAACGACTTCCTCGACCTCACCGACACGCCCAGTTCCTATGCGGGCGCGGCGGGCAAGACCGTCAAGGTCTCGTCCGGCGGCACGGGCCTCGTGTTCGGGAGCCCGACCTTCCTGGAGAGCACCGACACCCCGTCCAGCTACAGCGGCGGCGCCAACAAGTTCGTCCGGGTCAATCCCGGCTCCAGCGCCCTGATCTTCTCGGACGTCAAGCTGACCGACCTCTCGGACGGGCCGGGGACCTATACCGGCTTCGGCGGCATGTTCCTGCGCGTCAAGAACGATGGCACGGGGTTCGAGTTCAACACCGGCTCGGGCGGCCCCGATAACTTCCTGGACCTGACCGACACGCCTGACGCGTACACGGGTCAGGGGAACAAGGCCGTGCGGGTCAAATCCGACGTCTCGGGCCTGGAGTTCTATACCCCCAACTTCCTGCTCCTGTCGGACACCCCGGCCGACTACTCGGGCGCGGCCAACAAGGTCCTGCGCGTCAATGGCGCGGGCAACGCCGTCATCTTCAGCACCCTGGCCTTCCAGGACCTCCAGAACGTCCCGACGGCCCAGGCCAACAAGTGGCTGCGCTGGAACCCGACGGCCACGGCGCTGATCAACGACACCCCGACCTTCCTGGGTCTGTCGGACACCCCGGCGGCCTATACCGGCAACGAGGGCAAGTACGTCTACGTCAAGGGTGACGGCTCGGGCCTGGGCTTCACCGCGACCTCGGCCAATCTGTCGTTCCTGGAATTGAACGACACGATCGACACCACCTACGATTCCAAGACCGACATGGTGCCGATCGTCACCATCGTCTCGGGATCGCCGGTTCTGCAACTGGGCTACTACGCCTTCGCCAAGTTGGCCGGGATCAGCCTGTCCTCGCCGACCGAGGGCCAAATCCTCGGCTACAACGCCACCTCCGGCCTGTGGACCAACATCGACGCGCCCGAGGGCGGCGGTGGCTCGATCGGCGTGCCGTCGTATGGAGCGCATCCCTATTGGCGCCTGCTCCTGCACGCCACCGACGGTTCGACCGTCGAGTACGGCATCCAGGAGATCGAGTTCAAGCACACCAAGACCGGGGCTGATCTGGCCAATGGCGGCACCGCCTCGGCCTCCTCGACGGCCGAAGGGTCGCCGGATGGGGCTTTTGACAACACCGTGGGTGCGGCGTGGTTCTCCTCGACGGCGGCGGATGGCCAGTGGATCAAGTACCACTTCACCGCGCCGGTCGACGTGCGCTACCTGACCCTGAAGGGCTCGCAGTCGCGGCCTAACGGCTCGCCCTCGGCCTTTTCCGTCCAGTACAGCGACGACGACTCGGCCTGGACCACCGCCTGGGAAGTCACGGGCCAGACGGGCTGGGCGGCGGGCCAGACCCGCGAGTTCCACGCCCCGATCGATCTCTTCTTCACCGACCTCGCCGACGCGCCGCCCAGCTACATCGGGCAGGCGGGCAAGGCCCTGCGCGTCAACACCGGCGAGACCGCCCTGGAGTTCTTCACGCCCGCCACGACCCTGGCGACCATGGGCGACGTCGACTTCACCTTCCCGCCGACCGATGGGCAGGTCCTGGCCTTCGACAACGCGACGGGCAAGTGGAAGCCCTACACCCTGACGTCCGAGGCCCAGCAGCCGGCCTTCCGGGGGGAATGGTCCGGCTCGGGCGAGAACGTCACCCTGACCTTCGATTCCCTGACCATTCCAAGCGAGTTGACGCCCGACGCCACCGGTTGGACGATCGTGGGGCAGGCCGACGCTACGGCCGGCACCACCCAGGCCCTGAAAACGCGCCCGATCAGCCACAACGGGCTCTGCTATATCCAGCAGACCGTCAACTTTGTCGGCGATACGCCGTTCAAGGTGCGCTACAAGGTTTCCTCTGAATCGGTGGACCTGTTCCGCGTTCTGGTGGATGGCTCGCAGGTCTACTCCGACGGCGGGAACAACGGGACCTTCGAAGAGTTCTCGACGACCCTGTCGGGCACGCACACCATCCGTTATCAGTACACCAAGGACCCTAGCGCTTCCATCGGCGATGACTGTGTCTATATCAGCCAGATCAGCTACAAGAAGGTTCTGGACACGCCGTTCATCTACGGTGACACCGTCACCTATCTTGGCGAGACCTATTTCTGTCTGACCAGCAACACCACCGAGACGCCGGGCACGGGGAACGACTGGGTCAAATACGGCGGCTCGGGCTCGGGCACCTTCCTGGGTCTCACCGACACCCCGGCCAGCTATTCGGGACAGTCGCTCAAGGCCGTGCGGGTCAAGGCCGACGAGACGGGCCTGGAGTTCTACACCGCCGCGACCGGCGGCAGCGGCGGTGCGGGCGGCGTCCTGCCCGAGCGCACGCGCCTGCATCGCACCACCACCCAGGCGATCCCGTCGGGGACCTGGACGGCCGTCCAGTGGGACTCGGAAGTGGAGGACCCGGTCGGGGCCTTCGTGTCGAGCGCCAATACCCGCATCACCGTCCCGGCCGGCGTCCAGAAGGCGCGGGTGACGGCCTATACGACCTGGAACACCAGCCCCACCAGCGCGACGATTGGCTTGGCGCTGCGGCGCAATGGCGTCGAGATTGGCGCCTCGGGCGGCACCAACATCGCCGCCACCCGGACGGGGTTCGCCGAAAGCCACCTGAACCTCACCTCCGAATGGTTCTCGGTCACGCAGGGCGACTACTACGAGGTCTATGTCCTCCAGAACTCCGGCTCCTCCCAGTCCCTGAACGGGCCGGTGTCGAAGTTCGGCGAGCACTCCTATGTCCAGTTCGAGTGGGACGTGGGACCGGCGGCCCAGCAGTACGAAGCCCACGCCGCCCATCAGGGCTGGCGCGTGGTGGTCACCGAGAGCCAGACCGACACCTTCGCGACGATCGCGGAATTGAAGTTCTACGACCGGTCCGGAACCTTGGTCCCGACGACGGGCGGCAAGGTCTACGACACCAACTCCCACGGGACCTATCCGGCCTCCCAGGCGTTCGACGGCAACACCTCCACCTACTGGTCGTCGTTGCAGCAGACCTCGACCGACCTCCCCGGCGGTCCCGGCTATATCTTTGCCTCGGGCGTGGACGTGGGGTCGTTCAAGATCACCACCACCGGCTCGGACTTCAACACCACCAACTCCCCCAAGAACTTCTCGCTGCAATATACCGACGACGATGGGGCGTCGTGGAAGACCTACGCGATCTATACCAACCAGACGGGCTGGGGCGTCAGCGAGGAGCGCACCTTCACCGTGCCGGTGGTGGGCGTGGCGGCCAACGCGCCGGGCGGCGGCAACACCTCGGCCGACTTTGGCTCCTTCATCGCCGGCAAGCCCCTGGCCAGCGAGAAAGCGATCCGCTTCGTGGTCGCCACCCCGTTCACGGTCACGACCGGCGTCCACCAAGGCTCGGCCGAGACGGCGGCGACCGCTTCGCGCACGTTCAGCTTCGCCAAGAATGGCGTTGAGTTCCTGACCGCGACCTTCGCGGCGGCGGGGACGGTGGCCACGTTCTCGGCCAACACCGCCACGAGCTTCGCCGCCGGGGACATCCTGCTGATCACCGCCCCGTCGACCCAGGACGCCACCCTGGCGGACATCTCCTTCACCCTCAAGGGAATCCGATAG

Genome Context

Tertiary structure

PDB ID

d89949de596c85ea6de26c692b96f64379362776f595b8d441686cbf4b6e893f

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,7255

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence