Protein

View in Explore

Genbank accession

QYA57225.1 [GenBank]

Protein name

central tail fiber J

RBP type

Evidence Phold

Probability 1,00

Evidence RBPdetect

Probability 0,65

Evidence RBPdetect2

Probability 0,96

Protein sequence

MDQPDNMKIIEKATGKVVRGAKGGGGSVHTPKEDPDSLTSLAVVRMLLALGEGEFESFGTDDLKKRVMLNGTPIMNADGTYNFNDVVIDYRPGTSGQSHIAGMPAVESETGVGVDLKATNEWTQALTNTSIDAVRVRIGFPTLLQQKSNGDRVGSRIDYTIFIRNLSGGELWKKDFSAIGKTTTLYERDHRIDLPPSQTGWIVAVRRNTADSTDSNLVNPTKIQAYTEIVDLKLSYPNTALLYVEFNAKLFQSIPKVSIKAKGRKIRVPQNYDPITRTYNGSWDGSFKWAWSNNPAWVFFDCATEPRFALGNKINASMLDKWELYRIAQRCDQLVPDGRGGEEPRYLCDVYIQGREQAWTVLKDLAAIFAGMTFWGGGMLNVLSDRPGDVKQVLTRANVVNGKFQRHGGSGRNRRSVANVSWDDPANHYQTNVAVTPMIELVNRYGWTEPLELSAIGCTRLGEAQRRGKNALITNVTDGTTDFSIGMEGIEFMPGDIIGIADDTFSGGQFGGRVVRANGARSVILDRPVNEVTKANDWILFRQATDPDVSRFQIASISADRKTITVTTDILKGVNPFTPWVVDTQAIAITQHRVISVTWNEQDNTFDCVVLKHDPSKYDAVDLGAHLDDRPTTLIPPGFMEVPKNIQITSYEMLVQGTRQTVLRTTWDKVKGAVVYDAQWRRDNNDWINVPSTSTEGFEVQGIFSGDYWVRVRATNSSGVSSPWGEAVKTGITGREGAVPVPQGLKATSQNWGIKWNWLAGRQADTSDIAFTELEHSVKGLSGYGPFTLLTTVAFPADSFVQDGLAFGQYIRVRARYVDRLGNKSDWSAVVEGNANEDAGDYLAGITDDLLTSEDGKELMNQINTMPEAVYESMLTDYKTLLDVKAGEGNQVARIQIAYNVAVEANEAVAQLETLVGSRIDDAEAAIHTLQTAQASIEQSFAQYQQTVSAKFGDVQASFDEQGNLIDAQGNRITQQGVRIDDQGRLIDAQGNRIAQAEAAISQNQTAIANANQALATYKTQVAAQFNQQSAAIEQKMTSQFTATGGSAIYSLKAGVTYNGVYYDAGMTLSTIANGSGVKTRVAFKADQFIIAHPTTGGLFAAFAVVGNDVFIDTARIRAASISFAQISDTLQSSNFASGQNGWRLLKNGTFEINSASGNGRLLIQNNQILVYDASGRLRVRFGLW

Physico‐chemical properties

protein length:	1185 AA
molecular weight:	129744,84990 Da
isoelectric point:	5,50306
aromaticity:	0,08692
hydropathy:	-0,30262

Domains

Domains [InterPro]

DC_0014
STR
1–1185

DC_0014

IPR053171
Unmapped
15–866

IPR053171 Coil IPR015406

IPR055385
ATT
106–231

IPR055385 IPR032876 IPR013783

QYA57225.1

1 1185

Architecture

STR

ATT

STR

ATT

STR

STR 1-105 | ATT 106-231 | STR 232-354 | ATT 355-516 | STR 517-1185

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0014	STR	DC_0014	1	1185	Novel HMM	DC_0014	Central	Low	Positional only	830 proteins / 830 hits
IPR053171	Unmapped	-	15	866	InterPro	Viral Tip Attachment Protein	-	-	-	-
IPR055385	ATT	DC_0360	106	231	InterPro cluster	Tip attachment protein J, HDII-ins2 domain	N-terminal	High	Text match	1136 proteins / 1139 hits
IPR032876	ATT	DC_0307	355	516	InterPro cluster	Tip attachment protein J	Central	Medium	Text match	1111 proteins / 1112 hits
IPR013783	STR	IPR013783	637	728	Merged direct domain	Immunoglobulin-like fold	Central	Low	Positional only	144 proteins / 144 hits
Coil	Unmapped	-	994	1014	Coils	Coil	-	-	-	-
IPR015406	RBD	DC_0135	1032	1167	InterPro cluster	Tip attachment protein J, central straight fiber domain	C-terminal	High	Text match	1265 proteins / 1266 hits

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Escherichia phage KW1E_UTAR [NCBI]	2861289	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	No host information

Coding sequence (CDS)

Genbank protein accession

QYA57225.1 [NCBI]

Genbank nucleotide accession

MZ506873.1 [NCBI]

CDS location

range 32695 -> 36252
strand +

CDS

ATGGACCAGCCTGACAACATGAAGATCATCGAAAAGGCTACCGGGAAAGTAGTGCGCGGCGCGAAGGGTGGTGGCGGAAGCGTTCACACGCCAAAGGAAGACCCGGACAGCCTGACAAGCCTGGCTGTCGTTCGTATGCTTCTGGCCCTTGGGGAAGGTGAGTTCGAATCGTTCGGCACTGATGACCTGAAGAAGCGCGTCATGCTGAACGGTACGCCGATCATGAACGCTGACGGGACCTATAACTTCAATGACGTCGTGATCGACTACCGCCCAGGAACATCTGGTCAATCCCACATTGCCGGGATGCCAGCGGTCGAGTCTGAAACGGGTGTCGGCGTGGACCTGAAGGCCACGAACGAATGGACCCAGGCCCTGACAAACACGTCAATCGACGCTGTTCGCGTTCGAATCGGATTCCCCACCCTTCTACAGCAGAAGTCAAACGGGGACCGTGTAGGCTCGCGCATCGACTACACGATCTTTATCCGCAACCTGTCCGGCGGTGAGCTGTGGAAGAAGGACTTCAGCGCGATCGGCAAGACTACAACGCTGTATGAACGCGACCATCGAATCGACCTTCCACCATCACAGACAGGGTGGATTGTGGCTGTGCGACGTAACACGGCAGATAGCACAGACAGCAACCTGGTTAACCCGACTAAAATCCAGGCTTACACAGAGATCGTGGACCTTAAGCTGTCCTACCCTAACACCGCGCTTTTGTACGTGGAGTTTAACGCGAAGCTTTTCCAGTCCATCCCGAAAGTGTCCATTAAGGCGAAGGGCCGCAAAATCCGCGTACCTCAGAACTATGACCCGATCACGCGGACGTATAACGGTTCGTGGGACGGCTCGTTCAAGTGGGCGTGGAGCAATAACCCGGCGTGGGTCTTCTTCGACTGCGCAACGGAACCGCGCTTCGCTCTGGGTAATAAGATTAACGCGTCCATGCTGGATAAGTGGGAACTGTACCGCATCGCGCAGCGTTGCGATCAGCTTGTCCCAGACGGTCGTGGCGGAGAGGAACCGCGCTACCTGTGCGACGTCTATATCCAGGGGCGTGAACAAGCCTGGACCGTCCTGAAGGACCTGGCGGCTATCTTCGCCGGAATGACGTTCTGGGGTGGCGGAATGCTGAACGTGCTTTCCGATCGTCCTGGCGATGTTAAGCAGGTGCTTACCCGCGCAAACGTGGTGAACGGTAAATTCCAGCGCCACGGCGGAAGCGGGCGAAACCGTCGCAGCGTGGCTAACGTGTCATGGGATGACCCGGCGAACCATTACCAGACGAACGTGGCTGTCACGCCTATGATTGAGCTTGTGAACCGCTACGGATGGACTGAACCACTGGAACTGTCGGCGATCGGCTGTACTCGCTTGGGCGAAGCGCAGCGTCGCGGCAAGAACGCGCTTATCACCAACGTGACCGACGGGACCACGGACTTCAGCATCGGCATGGAAGGGATCGAATTTATGCCGGGCGACATCATCGGCATCGCCGACGATACCTTCAGCGGCGGACAGTTCGGCGGACGTGTCGTTCGCGCAAATGGAGCGCGCTCTGTCATCCTCGATCGACCAGTGAACGAAGTTACGAAGGCGAACGACTGGATCCTGTTCCGACAGGCCACAGACCCGGACGTTTCCCGCTTCCAGATCGCGTCCATTTCTGCTGACCGGAAGACCATCACCGTGACGACTGACATCCTGAAAGGCGTAAACCCGTTCACGCCGTGGGTCGTCGACACTCAGGCGATCGCCATTACCCAGCATCGCGTGATCTCCGTTACCTGGAACGAGCAGGACAACACGTTCGACTGTGTGGTTCTGAAACATGACCCGTCAAAATATGACGCGGTTGACTTGGGCGCTCACCTGGATGACAGGCCGACCACCCTGATCCCGCCGGGATTCATGGAAGTGCCGAAGAACATCCAGATCACCAGTTACGAAATGCTCGTTCAGGGTACGCGTCAAACCGTCCTGCGAACCACTTGGGACAAGGTGAAGGGCGCGGTGGTGTACGATGCTCAGTGGCGTCGCGACAATAACGACTGGATTAACGTTCCGTCCACGTCCACAGAAGGATTCGAGGTTCAAGGGATCTTCTCTGGCGATTACTGGGTTCGCGTTCGTGCGACAAACAGTTCTGGCGTGTCATCCCCGTGGGGGGAGGCAGTCAAGACCGGAATCACTGGTCGCGAAGGTGCTGTTCCTGTTCCGCAAGGTCTGAAGGCTACCAGTCAGAACTGGGGCATCAAATGGAACTGGCTAGCAGGTCGACAGGCTGACACGTCTGACATCGCGTTCACCGAACTGGAACACTCAGTCAAGGGACTGTCCGGCTATGGCCCGTTCACGCTCCTGACGACCGTGGCCTTCCCTGCTGACTCGTTCGTTCAGGATGGTCTTGCCTTCGGTCAGTATATCCGCGTCCGCGCGCGTTACGTTGACCGCTTGGGGAATAAGTCAGACTGGTCGGCAGTGGTTGAGGGTAACGCTAACGAAGACGCTGGCGACTACCTAGCTGGAATTACCGACGACCTGCTGACGTCGGAAGACGGCAAGGAGTTAATGAACCAGATTAACACCATGCCGGAAGCGGTCTATGAATCCATGCTGACCGACTATAAGACCCTTCTGGACGTGAAGGCTGGGGAAGGTAATCAGGTCGCCAGAATCCAAATCGCCTACAACGTGGCAGTGGAAGCGAACGAGGCAGTCGCGCAGCTTGAAACGCTGGTGGGTTCACGTATCGACGACGCTGAAGCGGCTATTCACACACTACAGACCGCCCAGGCATCAATTGAGCAGTCATTCGCGCAGTATCAGCAGACGGTTAGCGCGAAATTCGGTGACGTTCAGGCGTCATTCGATGAACAGGGCAACCTGATCGACGCACAGGGGAATCGCATCACTCAGCAGGGCGTCAGAATTGACGATCAGGGCCGACTGATTGACGCGCAGGGTAACAGGATCGCGCAAGCTGAAGCGGCTATCAGCCAGAACCAGACGGCGATCGCGAACGCTAACCAGGCTCTTGCTACTTACAAGACTCAGGTGGCGGCCCAGTTTAACCAGCAGTCGGCAGCGATTGAGCAGAAGATGACGTCTCAGTTCACGGCGACAGGCGGTTCAGCGATCTACAGCCTGAAGGCTGGCGTGACCTATAACGGCGTTTACTATGACGCTGGTATGACGCTGTCAACCATCGCCAACGGCTCAGGAGTGAAGACCCGCGTAGCGTTCAAGGCTGACCAGTTTATCATCGCACACCCTACAACTGGCGGCCTGTTCGCGGCGTTCGCCGTGGTGGGGAACGATGTGTTCATTGATACGGCACGAATCAGGGCGGCGTCCATTTCGTTCGCACAGATCTCCGACACGCTTCAGTCGTCGAACTTTGCGTCCGGTCAGAACGGGTGGAGACTGCTGAAGAACGGCACGTTCGAAATTAACAGCGCCAGCGGTAACGGTCGCCTGTTAATCCAAAATAACCAGATCCTTGTTTACGATGCATCTGGTCGCCTTCGTGTTCGTTTTGGTCTGTGGTAA

Genome Context

Tertiary structure

PDB ID

b2cab9c7e092bb88c2a841bd1d06db6e6306e49590d507a3d6f5e66cce06c8f9

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,7679

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence