Protein

View in Explore

Genbank accession

ARB14314.1 [GenBank]

Protein name

hypothetical protein

RBP type

TSP

Evidence DepoScope

Probability 1,00

Protein sequence

MAAAIALPIVSAIVSTAISYAFPSDGPRLRDTKVSASTYGNVIPEIYGTARVGGNMIWSKPFTEKKKKKRAGKGGSYYNEYTYYCDFAMAFCRGPVKEVRRIWADGKVIYDTTGGSEVIDNNKYRFRFYSGDEAQLPDSLIVEDKGADYAPAYRGLCYVVFDDFALADFGNRIPQIMAEVYAGDEGGAAITDIVPLPSSPVTGGSYQLGQMMIDADRGYFYLVDPVSNPAGTVLRRFLLANGKEDRREIVSIPQAQFPPSPYDSPDLTSVRAVTSKGELLCVFGGINNYMRIEKLDPYSWQSLGTIGRSYPFAGTPENSLEHSNTNFEISRDEKGNYLCLTLGVFGEYNIFDPSDMSFKAKGAMAGWNGPATPMYICARQGGPATSRRFYHVTYAGGASLQVCSLGEVLYNHPVEFPGNSQTATAWAFWDEGDPGVVFFYSDGPNRYIAKWSESTGVLAWKTQLRNSDPFCGYGVYGLRARIKDNEFHWVYNKHLFSINTATGQWIDRTFDQDFYKSDNDKTAEQVNDGDKGLLLPRDISEDYVIYDPRRNIVICVGQIQGQNGIVHVGGYTGGKTSVGAIVERLLVSTGQMTSNDYDLTPLYDIPVYGYGYASSTDIKSIIAELRNLFMFDLVESDGRLVARVRGDQDPDAEVPWKLLGSQSGPTPDKADYWKETRMSESDLPASIDLTYSNIDDDYNPSTAKSKRIASPVATMLSRQQVKAECNLVMDATEAKNRVNIMLYTQWEERTQHQTALPWLYANLDASDLISVTMEDGRNYFERIGSIEFGADFSSRLETYGTDSGAYLSDKTGDGGGAGRPTVVPAPKPVVGFILNTPLLRDTHDSGGNFSNWYSAIGAGAPGVFLGGTMFKSANAQDYVDLYQEPESAEWGTVMGVVPSPSHGWFALDWETRITITPAVDFFELESITDDELWEGLNLVVIGDEVLQFRDAVQNADGTWTIWNLLRGRRGTQYACDNHKAGERFVFLDERSIEFQAENLDTSGQNRWYKAVGSGMSLFETDPIQINYQPRDLMPYRPADIRRAVAGGDVTVTWKRRTRFTATLKDGTGVVSLNEGAEAYEAYVLAAPYSGDLSRQDAPTAYRRKYTLTSPSFTYTAAEQTADGFDVNLDTLHVVIYQLSSVVGRGFPGARSIESWQDF

Physico‐chemical properties

protein length:	1158 AA
molecular weight:	128254,59190 Da
isoelectric point:	4,84947
aromaticity:	0,11917
hydropathy:	-0,36036

Domains

Domains [InterPro]

DC_1879
ATT
1–248

DC_1879 DC_1657 IPR056490

IPR032876
ATT
615–787

IPR032876

DC_1311
RBD
784–1157

DC_1311

ARB14314.1

1 1158

Architecture

ATT

STR

ATT

STR

RBD

ATT 1-248 | STR 557-614 | ATT 615-787 | STR 788-813 | RBD 814-1157 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_1879	ATT	DC_1879	1	248	Novel HMM	DC_1879	N-terminal	Low	Positional only	54 proteins / 54 hits
DC_1657	STR	DC_1657	557	813	Novel HMM	DC_1657	Central	Low	Positional only	43 proteins / 43 hits
IPR032876	ATT	DC_0307	615	787	InterPro cluster	Tip attachment protein J	Central	Medium	Text match	1111 proteins / 1112 hits
DC_1311	RBD	DC_1311	784	1157	Novel HMM	DC_1311	C-terminal	Low	Positional only	46 proteins / 46 hits
IPR056490	RBD	DC_0637	893	985	InterPro cluster	Rcc01698-like, C-terminal domain	C-terminal	Low	Positional only	42 proteins / 42 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

ARB14314.1

1 1158

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	197	197	0,8529
Central domain	198	578	382	0,8390
C-terminal	579	1158	579	0,1093

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-197

Central
198-578

C-terminal
579-1158

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Caulobacter phage Ccr5 [NCBI]	1959740	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Caulobacter crescentus NA1000 [NCBI]	565050	Pseudomonadota > Alphaproteobacteria > Caulobacterales > Caulobacteraceae > Caulobacter > Caulobacter vibrioides

Coding sequence (CDS)

Genbank protein accession

ARB14314.1 [NCBI]

Genbank nucleotide accession

KY555144 [NCBI]

CDS location

range 67751 -> 71227
strand +

CDS

ATGGCCGCCGCCATTGCCCTTCCGATCGTCTCCGCCATTGTCAGCACGGCGATCAGCTACGCCTTCCCGAGCGACGGCCCGCGCCTGCGCGACACCAAGGTCTCGGCCTCGACTTACGGCAATGTGATCCCGGAAATCTACGGGACCGCCCGCGTCGGCGGCAACATGATCTGGTCCAAGCCGTTCACCGAGAAGAAGAAGAAGAAGCGGGCCGGCAAGGGCGGCTCCTACTACAATGAGTACACCTACTACTGCGACTTCGCCATGGCGTTCTGCCGGGGTCCGGTCAAGGAAGTGCGCCGCATCTGGGCCGACGGCAAGGTGATCTACGACACCACCGGCGGCTCGGAGGTGATCGACAACAACAAGTACCGCTTCCGCTTCTATTCCGGCGACGAGGCGCAGCTTCCCGACAGCCTCATCGTCGAGGACAAGGGCGCCGACTACGCCCCCGCCTACCGGGGTCTCTGCTATGTCGTGTTCGACGACTTCGCCCTGGCCGATTTCGGCAACCGCATCCCGCAGATCATGGCCGAAGTCTATGCTGGAGACGAAGGCGGCGCGGCGATCACCGACATCGTCCCGCTGCCCAGTTCTCCGGTCACCGGCGGCTCCTACCAGCTTGGCCAGATGATGATCGACGCCGACCGGGGCTACTTCTACCTCGTCGATCCGGTGTCCAACCCGGCGGGCACCGTCCTGCGCCGCTTCCTGCTGGCGAACGGCAAGGAAGACCGTCGCGAGATCGTCTCGATCCCGCAGGCCCAGTTCCCGCCCTCGCCCTATGACAGCCCCGATCTGACCTCGGTCCGGGCCGTCACTTCCAAGGGCGAGCTTCTCTGCGTCTTCGGTGGCATCAACAACTACATGCGGATCGAGAAACTCGATCCCTATTCCTGGCAGTCGCTGGGGACGATCGGCCGCAGTTATCCGTTCGCGGGCACGCCCGAGAACAGCCTGGAGCACTCCAACACCAACTTCGAGATTTCGCGGGACGAGAAAGGGAATTATCTCTGCCTGACGCTGGGGGTGTTTGGCGAGTACAACATCTTCGACCCGAGCGATATGTCGTTCAAGGCCAAGGGCGCCATGGCGGGCTGGAACGGACCAGCGACGCCGATGTACATCTGCGCCCGTCAGGGCGGCCCGGCGACCAGCCGCCGGTTCTACCACGTCACCTATGCCGGCGGGGCGTCCTTGCAGGTGTGCAGCCTGGGCGAGGTGCTCTACAACCATCCGGTGGAGTTCCCCGGCAATTCGCAGACCGCCACGGCTTGGGCCTTCTGGGACGAAGGCGATCCGGGCGTGGTCTTCTTCTATTCCGACGGCCCCAATCGCTACATCGCCAAGTGGTCGGAATCCACCGGCGTGCTCGCCTGGAAGACTCAGCTTCGCAACTCCGATCCGTTCTGCGGCTACGGGGTCTATGGCCTGCGGGCGCGGATCAAGGACAACGAGTTCCACTGGGTCTACAACAAGCACCTGTTCTCGATCAACACCGCCACGGGCCAGTGGATCGACCGGACGTTCGACCAGGACTTCTACAAGAGCGACAACGACAAAACCGCCGAACAGGTCAACGACGGCGACAAGGGCCTGCTGCTGCCCCGCGACATCTCCGAGGACTATGTCATCTACGATCCGCGCCGCAACATCGTGATTTGCGTCGGACAGATTCAGGGCCAAAACGGCATCGTCCACGTCGGAGGCTACACGGGGGGCAAGACCTCGGTGGGGGCCATTGTCGAGCGTCTTCTGGTCTCGACGGGGCAGATGACCTCGAACGACTACGACCTGACGCCGCTCTACGACATCCCGGTCTACGGGTACGGCTACGCCTCCTCGACCGACATCAAGTCGATCATCGCCGAACTGCGCAACCTCTTCATGTTCGACCTCGTCGAAAGCGACGGTCGACTGGTCGCGCGCGTGCGCGGCGATCAGGACCCTGACGCCGAGGTGCCCTGGAAGCTCCTGGGCTCCCAGAGCGGCCCGACCCCGGACAAGGCCGACTACTGGAAAGAGACCCGGATGTCGGAGTCCGACCTCCCGGCCTCGATCGATCTGACCTATTCGAACATCGATGACGACTACAATCCGTCAACGGCCAAGTCCAAGCGGATCGCCTCGCCGGTGGCGACCATGCTGTCGCGTCAACAGGTCAAGGCCGAGTGCAACCTCGTCATGGACGCGACCGAGGCCAAGAACCGCGTCAACATCATGCTCTACACCCAGTGGGAGGAGCGCACGCAGCACCAGACGGCCCTTCCCTGGCTCTACGCCAATCTCGACGCCTCGGACCTGATCTCGGTGACCATGGAGGACGGCCGCAACTATTTCGAGCGGATCGGTTCGATCGAGTTCGGCGCCGACTTCTCCTCGCGCCTGGAAACCTATGGCACCGACAGCGGTGCCTACCTTTCGGACAAGACCGGCGACGGCGGCGGCGCTGGCCGTCCGACCGTCGTGCCGGCCCCCAAGCCGGTGGTGGGCTTCATCCTCAACACCCCACTGCTGCGCGACACCCACGACAGCGGCGGCAACTTCTCCAACTGGTATAGCGCCATCGGCGCGGGCGCGCCGGGCGTGTTCCTCGGCGGCACGATGTTCAAGTCCGCCAACGCGCAGGACTATGTCGACCTCTACCAGGAGCCGGAGAGCGCCGAGTGGGGCACGGTGATGGGGGTTGTGCCCTCCCCCTCGCACGGCTGGTTCGCGCTCGACTGGGAGACGCGCATCACCATCACGCCAGCGGTGGACTTCTTCGAACTGGAGTCGATCACCGACGACGAGCTTTGGGAAGGGCTCAATCTCGTGGTGATCGGCGACGAGGTCCTCCAGTTCCGCGACGCGGTCCAGAACGCCGACGGCACCTGGACGATCTGGAACCTGCTGCGCGGCCGGCGCGGGACGCAGTATGCCTGCGACAATCACAAGGCCGGCGAGCGGTTCGTGTTCCTCGACGAGCGCTCGATCGAGTTCCAGGCCGAGAACCTCGACACCTCGGGCCAGAACCGCTGGTATAAGGCCGTCGGCTCGGGCATGTCGCTGTTCGAGACCGATCCGATCCAGATCAACTACCAGCCCCGCGACCTCATGCCCTACCGCCCGGCCGACATCCGTCGGGCGGTCGCGGGCGGAGACGTCACCGTGACCTGGAAGCGCCGCACGCGCTTCACGGCCACGCTGAAGGACGGCACCGGCGTGGTCAGCCTCAACGAAGGCGCCGAAGCTTACGAGGCCTATGTGCTCGCCGCACCGTACTCGGGCGACCTGTCGCGTCAAGACGCGCCGACCGCCTACCGTCGCAAATACACCCTGACGAGCCCAAGCTTCACCTACACGGCGGCCGAGCAGACGGCTGATGGATTTGACGTGAATCTTGACACTCTGCACGTGGTGATCTATCAGTTGAGTTCGGTTGTTGGTCGGGGTTTCCCCGGCGCGCGCTCGATTGAGTCCTGGCAGGACTTCTAA

Genome Context

Tertiary structure

PDB ID

7ff935995e61ab1869bf6c6ffb56fba38c101b81efdabd91dd245593262e3c81

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,7415

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence