Protein

View in Explore

Genbank accession

CAH9012726.1 [GenBank]

Protein name

putative methyl-accepting chemotaxis protein

RBP type

TSP

Evidence RBPdetect

Probability 0,71

Protein sequence

MTINYDNYNNRLEAATSEAEDSSAKFRAVANGDENTEVPLDTGSTPSIRKFLKEQESKINVGAQSVLAQCTEQKDLAEAQATIATEQVELAENQVTAATEQATLAAASAAKAEEVAGLTQVQEAIDLTLSEFAGLMTESEVRAIQATNLNHFDASGMVHMGRSLVALSAGKINEGMMVSSGASLSLTGQIGLGLAANSTQPSLGTSETKHPILHVAGSTPNISTIEENLTGYGARFKLPEAEDGTRIYDSTGDARGSGKASLDLKVDVDPKYGNAPTGTEGQILREGVGRAFEGVLKNGDVRLGDNGDWSASGDSSVSQGYLEAINGGGSVSFTQTFNAELGKTYKLSMSYKDKVGARLRFTLSGIVDFPYIADEGDGTYSIEWVSTVTGNVLLVINRGVGDTSTWKVSDVSIKPVTEEVVTHPVDGVFLEYYEEELTDPREEVMECIQSLSTTFGDTDVPTVLSTRPLSYFQQYDGQFADPTLPNDKYRCVVWGDLTDEQKRKVAAYMGEKLFIGVNGNIVNGRLRARTIRGAGNGDWLSVRPTEGTGLSFGTSVASRVAAQGALDSSEAYSINKPYMSKASNSESFVEPSDFSLWYLRDLSSTQDIAYQGRCFMYVVATVPRANKGAYHPDLNPWGTAFLKRLSAAGGKPWHDSSITYTPTHAECFIEVPYATSGKKGYEQNTGKISNGQSGHPDGIFYDGIEAGGLNGVIDLRLGAVANDSPSEVSKTLSKVENGTYRGLEKLVRTIPVATKVTKVGSYGGYSYVGIGEVISQYTSAAASEGNVFGQVIATDGTMYDIYTAHGTAGTEFRIRNHGTLNPATGHTGKLPVGADITIVLTQPINLSVSGEFNTQMVIGDPANLLLTDALKNGWLGTWCPVIPNGVIGANEFYLTRKCLEPSIGMIYTEDNGGTWANAAQSISNVTNSRTNTSAYPTTRVIIHNYKAFAKQTKPSTNKPVYNGKAGLMGVFVTSDYRESSGVHLAESLISKVLKASTGNRKQTVNLTAHELWELGQLSTGSGEPRHIPFDNVSAPNNNSPAIKILPYQISNNGQGSIGFQANELTWKAPVVTEETATTSTVVDGSLYRPVTGSGATSLMYITVQATYDGGINWANYSLIDGKIYANTDLTKPTPNMVVWNGSGWGDDDTIKITSDGSDTFVDRNGIVNESVVHELAIPCTWISNRARSGEQVEGVDL

Physico‐chemical properties

protein length:	1197 AA
molecular weight:	127975,70330 Da
isoelectric point:	4,95098
aromaticity:	0,07769
hydropathy:	-0,29323

Domains

Domains [InterPro]

DC_1387
STR
1–1197

DC_1387

Coil
Unmapped
5–25

Coil Coil

CAH9012726.1

1 1197

Architecture

STR

STR 1-1197

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_1387	STR	DC_1387	1	1197	Novel HMM	DC_1387	Central	Low	Positional only	53 proteins / 53 hits
Coil	Unmapped	-	5	25	Coils	Coil	-	-	-	-
Coil	Unmapped	-	67	101	Coils	Coil	-	-	-	-

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

CAH9012726.1

1 1197

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	427	427	0,5981
Central domain	428	683	257	0,9297
C-terminal	684	1197	513	0,1990

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-427

Central
428-683

C-terminal
684-1197

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Vibrio phage 424E50-1 [NCBI]	2963198	No lineage information
Host	No host information

Coding sequence (CDS)

Genbank protein accession

CAH9012726.1 [NCBI]

Genbank nucleotide accession

OX241437 [NCBI]

CDS location

range 37906 -> 41499
strand +

CDS

ATGACCATTAATTACGACAACTACAATAATAGATTAGAAGCTGCTACTTCTGAAGCAGAAGATAGTAGTGCTAAATTCCGTGCCGTTGCTAACGGAGATGAGAATACAGAAGTACCTTTGGATACGGGTTCCACCCCTTCTATCCGTAAATTCCTAAAAGAGCAAGAAAGCAAAATCAACGTAGGAGCACAATCAGTATTAGCTCAGTGTACTGAACAAAAAGATTTAGCAGAAGCTCAAGCTACTATTGCTACTGAACAGGTAGAATTAGCTGAAAATCAAGTTACGGCTGCTACTGAGCAGGCGACACTAGCCGCCGCATCTGCTGCAAAGGCAGAAGAAGTAGCCGGACTAACCCAAGTACAAGAGGCTATAGATCTTACTTTAAGTGAGTTCGCAGGCTTGATGACTGAATCAGAAGTTCGTGCAATCCAAGCAACCAACCTAAACCACTTTGATGCTAGTGGTATGGTTCATATGGGTCGTAGTTTAGTAGCTCTCTCTGCCGGAAAGATAAACGAAGGTATGATGGTTTCCAGCGGGGCATCATTATCCCTTACTGGTCAAATTGGACTCGGTCTTGCGGCGAATAGTACTCAGCCGTCTTTAGGTACAAGCGAAACTAAACATCCTATATTGCATGTAGCAGGTTCCACACCAAATATCTCTACAATTGAAGAAAACCTAACAGGTTACGGGGCTAGATTTAAGCTACCAGAAGCCGAAGACGGTACACGCATTTATGATTCAACAGGTGATGCCCGTGGTAGTGGTAAAGCAAGCCTAGACCTAAAGGTAGATGTTGACCCTAAGTACGGTAACGCTCCAACAGGTACAGAAGGGCAGATTCTTAGAGAGGGTGTTGGGCGAGCTTTTGAAGGTGTACTAAAGAATGGTGATGTCCGTCTAGGTGATAATGGGGATTGGTCAGCTAGTGGGGATTCAAGTGTGTCTCAGGGCTACTTAGAGGCTATCAATGGCGGCGGTTCTGTGTCATTCACGCAAACATTCAACGCTGAGCTAGGAAAAACTTACAAGCTCTCTATGAGCTATAAAGACAAGGTTGGTGCTCGACTAAGATTTACGTTGAGTGGAATTGTTGATTTCCCTTACATCGCTGATGAGGGTGATGGGACGTATTCCATTGAATGGGTATCAACTGTAACGGGCAATGTGTTATTGGTTATAAATCGAGGGGTGGGTGATACTTCTACATGGAAAGTGTCTGATGTATCAATCAAACCAGTAACAGAAGAAGTAGTAACACACCCTGTAGACGGTGTTTTCCTTGAGTATTACGAAGAAGAACTAACAGACCCTCGCGAAGAGGTTATGGAATGTATTCAATCGTTGTCTACTACGTTCGGTGATACCGATGTGCCGACCGTTCTATCAACTCGCCCTCTTTCATACTTCCAACAGTATGACGGGCAGTTTGCAGACCCTACATTACCGAATGACAAATACCGTTGTGTTGTTTGGGGCGACTTAACCGATGAGCAAAAGCGCAAGGTTGCTGCTTACATGGGTGAAAAGCTGTTTATAGGTGTTAACGGTAATATTGTTAATGGTCGTTTACGTGCGCGTACTATTCGTGGTGCGGGTAATGGTGATTGGTTGTCAGTGAGACCAACTGAGGGTACAGGTCTGTCATTCGGCACAAGTGTAGCGTCAAGAGTCGCAGCTCAGGGCGCTCTGGACAGCAGTGAGGCGTATTCAATAAATAAGCCTTACATGAGTAAAGCGTCTAACTCTGAGTCTTTTGTCGAACCTTCTGATTTTTCTCTTTGGTATCTCAGGGATTTGTCGTCGACACAGGATATTGCATACCAAGGTCGTTGCTTTATGTATGTAGTAGCTACCGTACCTAGAGCGAATAAAGGGGCGTATCATCCTGATTTGAATCCGTGGGGCACTGCTTTTTTGAAAAGATTGTCGGCAGCAGGAGGGAAACCTTGGCACGATTCATCAATCACGTACACCCCTACACATGCAGAGTGTTTTATAGAAGTTCCTTACGCAACCTCAGGTAAAAAAGGGTATGAGCAGAATACGGGTAAAATTTCCAACGGACAGTCAGGCCATCCAGACGGCATTTTCTACGACGGTATCGAAGCGGGTGGTTTGAATGGCGTTATTGATTTGCGTCTAGGCGCTGTAGCCAATGACTCTCCGTCAGAGGTAAGTAAGACTCTATCTAAGGTAGAGAATGGTACTTATCGTGGTTTGGAAAAGTTGGTCAGAACTATACCGGTTGCAACAAAAGTTACAAAAGTTGGTTCTTACGGGGGCTACTCTTATGTTGGTATTGGTGAGGTTATTTCACAATATACGTCTGCCGCAGCATCTGAGGGTAATGTATTCGGACAGGTAATCGCAACTGATGGAACAATGTATGATATCTACACTGCTCACGGAACAGCAGGTACAGAGTTTAGAATTCGTAATCACGGAACTCTAAACCCTGCTACGGGGCATACAGGCAAGTTACCTGTAGGTGCTGATATCACAATTGTACTAACTCAACCAATCAACCTATCAGTATCAGGTGAGTTCAATACTCAAATGGTTATTGGCGACCCTGCTAATCTCCTGCTAACTGATGCGCTTAAAAATGGTTGGTTGGGAACTTGGTGTCCGGTTATTCCTAACGGAGTTATTGGTGCCAATGAGTTTTACCTTACCAGAAAGTGCCTAGAACCCTCTATCGGCATGATCTACACAGAGGATAACGGTGGCACTTGGGCTAATGCAGCTCAAAGTATAAGTAATGTAACCAACAGCCGTACAAATACAAGCGCTTACCCGACTACAAGGGTGATTATCCATAACTACAAAGCATTCGCCAAGCAAACCAAACCAAGCACTAACAAACCTGTTTACAATGGTAAGGCGGGGTTGATGGGTGTGTTTGTGACTTCTGACTATAGAGAATCATCAGGCGTTCACCTTGCAGAGTCGTTAATATCTAAGGTGCTAAAAGCATCCACAGGTAACAGAAAGCAAACTGTAAACCTAACGGCGCACGAATTGTGGGAGCTAGGACAACTTAGCACTGGCTCAGGCGAACCACGTCACATACCTTTTGATAATGTTTCCGCACCAAACAACAACAGTCCTGCGATTAAAATCCTACCTTACCAAATCAGCAACAACGGTCAGGGTAGTATTGGGTTTCAAGCTAACGAGTTGACTTGGAAAGCTCCGGTAGTTACGGAAGAGACAGCAACAACTTCTACTGTAGTTGACGGTTCGCTTTACAGACCTGTCACTGGCTCTGGCGCAACAAGTTTAATGTACATCACTGTACAGGCAACTTATGACGGTGGAATAAATTGGGCTAACTATTCATTAATTGATGGCAAAATTTATGCAAACACAGACCTAACAAAGCCAACACCTAATATGGTTGTATGGAACGGTTCTGGTTGGGGTGATGACGACACAATCAAAATCACCTCAGATGGTAGTGATACCTTTGTGGATAGAAACGGTATCGTTAATGAGTCGGTAGTTCACGAACTGGCTATACCTTGCACATGGATAAGTAACCGAGCACGTTCAGGTGAGCAAGTCGAAGGCGTGGATCTTTAA

Genome Context

Tertiary structure

PDB ID

dc18d398fe0ec7c018ceb5519c8a689587375fb70f2809e6bb38d19b7358580a

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,2762

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence