Protein

View in Explore

Genbank accession

CAO2433739.1 [GenBank]

Protein name

central tail fiber J

RBP type

Evidence GenBank

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,74

Evidence RBPdetect2

Probability 0,93

Protein sequence

MPIAMIDNIVASARSSSYDWNASKAALADSLNTVTTRTLDKIFEGNKSYRSQQDRQKLLRSSAAPCSVVYGKTRTSGLLAFLEQDSDRTLHCAIVLANHPLEGIEDILIDGNPISSYGDLVSWELHNDRKTSDPFMGTHCPSWSPDMIGRGISWLRASFRFDPNKFPFGLPNVTLVKIGKKCYDPRISKEVYTNNAALVILDYLRTYLKCPDETINWESFKEAANICDEAVKNADGTSERRYTINGEFDMDEAPASIMAEMLKACGADLSYVAGKYGLLVGAYYGPATMTLSEDCVCGEVKIYPEASFDKRSNTITGRFTSPTKGYSETDFPSVFVPEWIEKDGERKIIDIDYRFVTSPYQAQRVSAIFLRRARAGRIIEVTCNMRGFKFKPGRYVTMDLPSIGIVGQEMRVLEWEFTKKGGVKVKLRQDAKEWNDATGQLPDSGDVDIPISPSGVAQPQNFRYSVLQAGEVTHGVLAWDNVGTYAQNIVQVRKNGEIVWTAQTVEQFVRVEGLTKGSYTATVVATSYKGGVSPEAYCEFNIQAPEAPVSVEVKQGYFAITLIPHSRDLASVSTQYDFWTSGMTRLPDTSDATVTSNATRMGVGSTWTSEGLQNDKVYYWYIRTTNAFGSSQFVECAARCYTSIEDLMPQIDAEFKKTETYKELMSTLDSSIEEVENRVTELNRYMDGRVDEAFQQLGDRIGAVVTETTQKFEDVNGNITALDRKLVAAQNKFTNDLNTESGRLASLIETTNKATTDLLNKKTEALDEKLVAAKGELVEQIEGVESGYLAGDKTLDGKINTQRTELDASILSTNQATVDLLNRTSETLDQKISQTNATVFKNYTTLDGKITTAKTDLNTLIANTNKATTDLLNQKTSALSEQITSARGEISTNKQAIDALDGKLTSTKTALDATISDTNKATVDLINGTASAIRQELAVAKQEIIDDVGDVSEIRAAVATTSKAVTDLEGKVNAQWGTKIQVDSAGNKYVAGIQLGMEGSGGQVQSYFMVSANNFAVYNPGNGTATLAFAIKNNQAFLKDAFIENGTISSAKIAQEISSNNYDGNGYHKYGWYINKNGHAQFMDVWVKGNINASSGNFTGAVNATSGTFRGDVYANNGSFRGTIDATGGTFRGRVEASVIRANQFEGAIVAHRTYGDCAPVYNSQQRVCRWRWRYVDNVSGQGKNVTFFFKLNGTLASSQLNVWIAGHQILAGKKYGNDNNGMCAVGITGLGEQTIDIVVEIYTPWSTSSVTGVAISCPTVVVSRSNSSFQGPWNESHD

Physico‐chemical properties

protein length:	1279 AA
molecular weight:	140116,13830 Da
isoelectric point:	5,34061
aromaticity:	0,08757
hydropathy:	-0,34285

Domains

Domains [InterPro]

DC_0187
STR
1–832

DC_0187 IPR015406

IPR053171
Unmapped
470–1119

IPR053171

IPR057587
ATT
547–651

IPR057587 DC_0515

CAO2433739.1

1 1279

Architecture

STR

ATT

STR

RBD

STR 1-546 | ATT 547-651 | STR 652-832 | RBD 833-1183 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0187	STR	DC_0187	1	832	Novel HMM	DC_0187	Central	Low	Positional only	466 proteins / 466 hits
IPR053171	Unmapped	-	470	1119	InterPro	Viral Tip Attachment Protein	-	-	-	-
IPR057587	ATT	DC_0130	547	651	InterPro cluster	Tip attachment protein J, second Ig-like domain	Central	Medium	Text match	309 proteins / 309 hits
DC_0515	RBD	DC_0515	767	1183	Novel HMM	DC_0515	C-terminal	Low	Positional only	63 proteins / 63 hits
IPR015406	RBD	DC_0135	957	1097	InterPro cluster	Tip attachment protein J, central straight fiber domain	C-terminal	High	Text match	1265 proteins / 1266 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

CAO2433739.1

1 1279

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	1075	1075	0,8372
Central domain	1076	1268	194	0,3809
C-terminal	1269	1279	10	0,9793

Note: Constraints were applied during segmentation.
C-terminal too short, adjusted boundary

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-1075

Central
1076-1268

C-terminal
1269-1279

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Escherichia phage KCP_059 [NCBI]	3465690	Viruses >
Host	No host information

Coding sequence (CDS)

Genbank protein accession

CAO2433739.1 [NCBI]

Genbank nucleotide accession

OZ346222.1 [NCBI]

CDS location

range 26596 -> 30435
strand +

CDS

ATGCCAATTGCAATGATTGATAACATCGTTGCTTCTGCAAGATCTTCAAGTTATGACTGGAACGCATCCAAGGCAGCTCTGGCTGACAGCCTGAACACTGTGACCACCAGAACTTTGGATAAGATTTTTGAGGGCAACAAATCTTACAGAAGTCAGCAAGATAGACAAAAGCTTCTCAGATCTTCTGCTGCACCTTGCTCTGTAGTGTATGGAAAGACACGCACATCTGGATTGCTTGCGTTTTTGGAGCAGGATAGCGACAGAACCCTCCATTGTGCTATTGTTCTTGCCAATCACCCTCTGGAAGGTATAGAAGATATACTTATCGACGGTAATCCTATTTCCTCGTATGGAGATCTGGTATCGTGGGAGCTACATAACGACAGAAAAACATCTGATCCTTTCATGGGTACACACTGCCCATCATGGTCACCTGACATGATAGGTAGAGGGATCAGTTGGCTACGTGCCAGCTTCAGGTTTGACCCTAACAAGTTTCCTTTTGGGTTGCCAAACGTTACACTCGTCAAGATTGGTAAAAAATGCTATGATCCTCGTATCAGTAAAGAGGTGTACACCAATAACGCTGCCTTGGTGATCCTAGACTATTTAAGAACGTACCTTAAATGTCCTGACGAAACCATCAACTGGGAGTCCTTCAAGGAGGCTGCCAACATATGCGACGAGGCGGTAAAAAACGCAGACGGAACCAGTGAGCGCCGTTACACCATTAACGGTGAGTTTGACATGGATGAGGCCCCAGCAAGTATTATGGCAGAAATGCTGAAAGCTTGCGGTGCAGATCTTAGTTATGTTGCTGGTAAGTATGGTTTGCTGGTTGGTGCATACTATGGCCCAGCAACAATGACACTTAGTGAGGACTGTGTCTGTGGTGAGGTTAAGATCTATCCGGAAGCCTCATTTGACAAAAGATCCAACACAATAACTGGCAGATTCACTAGCCCGACCAAAGGGTATTCTGAAACAGATTTTCCATCAGTGTTTGTCCCAGAGTGGATAGAGAAGGATGGAGAAAGAAAGATAATCGATATAGATTATCGCTTTGTTACCAGTCCTTATCAAGCTCAGCGTGTTTCTGCAATCTTCCTAAGACGTGCTAGAGCTGGCAGGATTATTGAAGTCACCTGCAATATGCGAGGTTTTAAATTTAAGCCTGGCCGTTATGTTACAATGGACCTCCCAAGTATTGGTATCGTGGGCCAAGAAATGAGGGTTCTTGAATGGGAGTTCACCAAAAAGGGCGGTGTCAAGGTAAAACTTCGTCAAGATGCTAAAGAGTGGAATGATGCCACAGGGCAACTTCCGGATTCCGGCGATGTAGATATTCCGATATCCCCGTCCGGTGTAGCTCAGCCGCAAAACTTCAGATACTCCGTTCTCCAAGCTGGGGAAGTAACTCACGGTGTTTTGGCCTGGGACAACGTTGGGACTTACGCTCAAAATATTGTGCAGGTAAGAAAGAACGGAGAGATTGTTTGGACAGCACAGACAGTTGAGCAGTTTGTCCGTGTTGAAGGTCTGACTAAAGGTTCCTACACAGCCACTGTTGTTGCAACATCTTATAAAGGTGGTGTATCTCCAGAAGCGTATTGTGAGTTTAACATTCAGGCACCTGAAGCTCCGGTTTCTGTAGAGGTTAAGCAAGGATACTTTGCTATCACCTTGATTCCGCATAGTAGGGATTTAGCAAGTGTTAGCACCCAGTATGACTTTTGGACATCCGGTATGACAAGGTTGCCCGACACCAGTGATGCAACCGTTACTTCAAACGCCACCCGTATGGGTGTTGGTTCAACTTGGACATCTGAAGGTCTGCAGAACGATAAGGTTTATTATTGGTATATTCGAACCACAAACGCTTTTGGTAGTTCTCAGTTTGTAGAATGCGCTGCACGCTGCTACACCTCTATTGAGGATTTGATGCCTCAGATAGATGCTGAATTCAAAAAGACAGAAACTTATAAAGAGTTGATGAGCACTTTGGATTCCTCTATTGAAGAGGTTGAAAATCGTGTCACAGAACTTAACAGGTACATGGATGGTAGGGTAGATGAGGCATTCCAGCAACTTGGAGACAGAATAGGTGCGGTAGTTACAGAGACAACTCAGAAGTTTGAGGATGTCAATGGCAATATCACAGCGCTGGATAGGAAACTTGTTGCTGCACAGAACAAGTTCACCAACGATCTGAACACTGAAAGTGGAAGATTGGCATCCCTGATTGAGACAACCAATAAAGCAACTACTGATCTTCTGAACAAAAAGACAGAGGCTTTAGATGAGAAATTGGTTGCCGCCAAAGGTGAGCTGGTAGAGCAGATAGAGGGAGTTGAGAGCGGGTATTTAGCCGGAGATAAAACTCTGGATGGTAAGATCAATACTCAGAGAACAGAACTTGACGCAAGCATCTTGAGCACTAACCAGGCCACTGTGGATCTTTTGAACAGGACATCTGAAACTCTGGATCAAAAGATTAGTCAGACAAACGCGACGGTATTTAAAAACTATACCACCCTTGACGGCAAGATAACTACCGCAAAAACTGACCTCAACACCTTGATTGCCAATACCAACAAGGCCACCACTGACTTGTTGAATCAGAAAACATCTGCACTGTCAGAGCAGATAACTTCTGCACGTGGGGAGATTTCTACCAACAAGCAAGCGATTGATGCTTTGGATGGAAAACTGACCTCCACAAAAACAGCGCTGGATGCTACAATTTCCGATACCAATAAAGCCACTGTGGATCTTATCAACGGCACAGCGTCAGCTATTCGTCAAGAACTTGCTGTTGCTAAGCAGGAGATCATTGATGATGTTGGGGATGTGTCTGAGATCAGGGCTGCAGTAGCTACAACATCTAAGGCTGTAACCGACTTAGAGGGTAAAGTAAATGCTCAATGGGGCACAAAAATACAGGTAGACTCCGCAGGGAATAAATATGTTGCAGGTATTCAGTTGGGGATGGAAGGGTCTGGAGGCCAAGTTCAATCCTACTTCATGGTTAGCGCAAACAATTTTGCGGTATACAACCCTGGCAATGGAACAGCAACCCTTGCTTTCGCAATCAAGAACAACCAAGCGTTCTTGAAAGACGCTTTTATAGAGAATGGCACGATCTCCTCTGCCAAGATTGCACAAGAAATTTCGTCAAACAACTACGATGGCAACGGGTACCATAAATACGGTTGGTATATTAACAAGAACGGGCACGCCCAATTTATGGATGTGTGGGTGAAAGGCAACATCAACGCCAGTTCTGGTAACTTCACAGGGGCAGTTAACGCCACTAGTGGTACCTTCCGTGGGGATGTTTATGCCAATAATGGTAGCTTTAGAGGCACCATAGATGCAACCGGAGGTACCTTCCGTGGTCGTGTAGAAGCTTCTGTTATCCGCGCTAACCAGTTCGAAGGTGCAATTGTTGCACACAGGACTTACGGAGATTGTGCTCCAGTATATAACTCCCAGCAAAGGGTTTGCCGTTGGAGGTGGAGATACGTAGATAACGTTTCAGGTCAGGGTAAGAACGTAACATTCTTCTTTAAACTGAATGGTACTCTTGCCAGCTCTCAGCTTAACGTTTGGATAGCCGGACATCAAATCCTTGCAGGTAAGAAGTACGGAAACGACAACAACGGCATGTGTGCGGTAGGGATAACGGGTCTTGGTGAACAAACCATAGATATTGTTGTTGAAATCTACACACCATGGTCAACGTCTTCTGTAACAGGGGTCGCAATATCCTGTCCTACTGTTGTGGTAAGCCGTTCTAACTCTAGTTTCCAAGGACCTTGGAACGAGTCTCACGACTAA

Genome Context

Tertiary structure

PDB ID

b77469021321a46b0b2b0bd6509b9214cf7bd0ed8347d8f1d4d0bc4f75395aec

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,7320

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence