Protein

View in Explore

Genbank accession

YAO55072.1 [GenBank]

Protein name

tail fiber protein

RBP type

Evidence GenBank

Probability 1,00

Evidence RBPdetect

Probability 0,60

Evidence RBPdetect2

Probability 0,94

Protein sequence

MAITKIILQQMVTMDQNSVTASKYPKYTIVLGNTISSITAAELTSAIESSKASAAAAKQSEINAKQSELNAKDSENEAEISAASSQQSATQSASSATASANSAKAAKTSETNAKASETAAKTSETNAKASETAAKTSETNANSSKTAAAASASAAKTSETNAAASASAAKTSEINAKASETAAANSAKAAKTSETNAAASAKTSETNAAASAQSASDSKASRDEAGTFATQATNAATAARESQTSANNSANIASQAVTTIQGLKDTAVSAASQAETSAQQASTHAGAASSSAAAAKTDANKAKVEADRAKAEADRASANSYTISFSGGAGWFKLATVTMPQSTSTVSIKMVGGKGYNAGSPQQADITELVLRAGNGKPKGLSGSLWRRTTEGFSSMAWINTSGDVYDVYVEIGNYATAVNLQVNYTTNASVVLHSQPQYYATKPEGLTTCTIYDLYNPLLPPPDDGTFLKKAQNLSDLPDKSQARTNLDLDRFRQFVNAGETQVKCADGTKQIFIKNTGDWGAWDEELKRHIALPITQGGTGSLSISEAKTNLQIPSVGAGDWMEIAAPAGVEAGKYYPIVINAQRAGLYLSGFFIDIQTRSSSGEDPMNCCTFNGFIRTGGWSDRKDAGYGYYNRYEPNELALKCILVSSKDSEDNIAVYVEGRAFPVKMRIPQFCTATAVASASTYGKVTFAWGTSNPATDSVGVTTLFDFSLNRAGFYQASAPTGNYYIGNGERIVLSNGMSVGDELTLTTPKITFSDTVAAGNGFIADGTSVSNATFYSRYRVGDTVYGAEFRASENAAQVIVRDPAGTSHQFFNFNLNGTFSPPNGLLTSTGTDWNGQKNTINKFYGIAGSDNAPENAIYGGVHVGFSGNYATQFAGRNSKFWVRSIEAGENKEWLKLITATLAPKIPTDARDGFISDASADTSWAPSNGGGFQSSYAENRIMQSWVDGAGRLYSRFLTTNQPTTSKTVVPWKSAAMLELDNRFTGNNTFIGALESTGDITCARLFSKGTLHTESGGIELYHPSPFIDFHFNKAASNYQARIINDAANQLTFDCQSVRTLRDFTAHGLVRGCNNDAFVAWPVSDPSASHGQIKMAPRFQSRFNSTGSDERGAARVSVWFEEYVGYNHRGVVEVSGYGAQTQYWHFRSDGAIWGSTKGDVAWAGTSDLRYKDNVVDYDGLQSLENIKAMNLIKFTYKDDDRKRERRGVAAQQIMEIDPCYVKKSEGSYIDANGEQVNIEKLVLDTNPLLMDALCAIKVLSAQVGELKEENTALRAGTANREEQVTALESEVSDLKKQIADLTLVVNSLLANRAQ

Physico‐chemical properties

protein length:	1318 AA
molecular weight:	140107,99900 Da
isoelectric point:	5,74889
aromaticity:	0,08270
hydropathy:	-0,37936

Domains

Domains [InterPro]

DC_0608
ATT
2–183

DC_0608 DC_2005 DC_0590

Coil
Unmapped
57–77

Coil DC_0701 Coil DC_1205 IPR030392 Coil

IPR030392
CHP
1170–1225

IPR030392

YAO55072.1

1 1318

Architecture

ATT

STR

ATT 2-183 | STR 184-239 | STR 276-1318

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0608	ATT	DC_0608	2	183	Novel HMM	DC_0608	N-terminal	Low	Positional only	308 proteins / 308 hits
Coil	Unmapped	-	57	77	Coils	Coil	-	-	-	-
DC_0701	STR	DC_0701	165	239	Novel HMM	DC_0701	Central	Low	Positional only	6 proteins / 6 hits
DC_2005	STR	DC_2005	276	527	Novel HMM	DC_2005	Central	Low	Positional only	76 proteins / 76 hits
Coil	Unmapped	-	292	319	Coils	Coil	-	-	-	-
DC_1205	STR	DC_1205	464	695	Novel HMM	DC_1205	Central	Low	Positional only	89 proteins / 89 hits
DC_0590	STR	DC_0590	664	1318	Novel HMM	DC_0590	Central	Low	Positional only	55 proteins / 55 hits
IPR030392	CHP	DC_0088	1170	1274	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits
IPR030392	CHP	DC_0088	1170	1225	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits
Coil	Unmapped	-	1281	1315	Coils	Coil	-	-	-	-

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Salmonella phage vB_CECAV_033 [NCBI]	3456260	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Salmonella typhimurium [NCBI]	90371	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales

Coding sequence (CDS)

Genbank protein accession

YAO55072.1 [NCBI]

Genbank nucleotide accession

PX061015.1 [NCBI]

CDS location

range 85269 -> 89225
strand -

CDS

ATGGCTATAACTAAAATAATTTTACAACAAATGGTCACTATGGACCAAAATAGTGTAACTGCAAGTAAATACCCTAAATACACTATAGTTCTTGGGAATACAATCAGCTCTATTACTGCTGCAGAGTTAACCTCTGCTATAGAGTCTTCTAAAGCATCCGCTGCAGCAGCTAAGCAATCTGAGATTAATGCTAAACAGTCAGAATTAAATGCTAAAGACTCTGAGAATGAAGCAGAAATTTCTGCAGCGTCTTCCCAGCAATCTGCAACTCAGTCTGCTTCTTCTGCTACTGCTTCTGCTAATAGTGCTAAAGCTGCTAAGACTTCTGAGACCAATGCAAAAGCTAGCGAGACAGCTGCAAAAACTTCAGAAACTAACGCAAAAGCTAGTGAAACCGCTGCTAAGACTTCTGAGACCAATGCTAATAGTAGTAAAACTGCTGCGGCTGCTTCCGCATCGGCTGCTAAAACTTCAGAAACTAACGCTGCTGCATCTGCTTCCGCGGCTAAAACTTCTGAAATTAACGCAAAAGCTAGTGAAACTGCTGCTGCTAATAGTGCCAAAGCTGCTAAAACTTCAGAGACTAATGCTGCAGCTTCAGCAAAAACTTCAGAGACTAATGCTGCAGCTTCAGCACAATCCGCATCAGACTCTAAAGCATCTAGAGATGAAGCCGGGACATTTGCTACTCAAGCGACTAATGCTGCTACTGCTGCCAGAGAATCTCAAACATCTGCCAATAATTCAGCAAATATTGCTTCGCAGGCTGTAACAACTATACAAGGATTAAAAGATACTGCTGTTTCGGCCGCTTCTCAAGCAGAAACGTCTGCCCAACAAGCTAGTACACATGCTGGTGCGGCATCCAGTAGTGCTGCCGCAGCGAAGACTGATGCAAATAAAGCAAAGGTTGAGGCAGATAGAGCAAAGGCTGAGGCAGATAGAGCATCCGCCAATTCTTACACCATCTCATTTTCTGGTGGTGCTGGCTGGTTTAAGCTAGCAACAGTTACTATGCCACAATCGACCTCTACAGTATCTATTAAAATGGTTGGTGGTAAAGGGTATAATGCTGGTTCGCCTCAGCAGGCGGATATAACGGAGCTCGTACTAAGAGCTGGTAACGGTAAGCCTAAAGGTTTGTCCGGCTCCCTATGGAGACGTACTACTGAAGGGTTTAGTTCTATGGCGTGGATAAATACATCAGGAGATGTGTATGATGTATATGTAGAAATTGGTAACTATGCTACTGCGGTTAATTTACAAGTAAATTATACCACTAATGCTTCAGTTGTACTGCATTCACAGCCACAATATTATGCTACTAAGCCAGAGGGGCTAACTACTTGTACAATATATGATTTGTATAATCCCCTTTTACCACCTCCAGATGATGGTACTTTCTTAAAGAAAGCTCAGAATCTCTCTGATCTACCTGATAAGTCCCAAGCAAGAACAAATCTTGATTTAGACAGATTTAGACAATTTGTAAATGCTGGAGAAACACAAGTTAAGTGTGCTGATGGAACCAAACAGATTTTTATTAAAAATACTGGAGATTGGGGGGCTTGGGATGAAGAATTAAAAAGACACATAGCTCTACCTATAACTCAGGGTGGTACTGGGAGCTTATCTATATCTGAGGCCAAAACAAATCTTCAGATACCTTCTGTAGGTGCTGGAGATTGGATGGAAATTGCAGCTCCTGCTGGTGTTGAAGCTGGGAAATATTACCCAATTGTAATTAACGCACAACGTGCGGGTTTATATCTTTCTGGTTTCTTTATAGATATACAAACTAGAAGCTCCAGCGGGGAAGATCCTATGAACTGTTGTACGTTTAACGGGTTCATAAGAACAGGTGGTTGGTCGGATAGGAAAGACGCTGGCTATGGATACTATAACAGATATGAACCTAATGAGCTTGCTTTAAAATGCATATTGGTATCCAGTAAGGATTCTGAAGACAATATAGCTGTATATGTAGAAGGTAGAGCATTCCCGGTGAAAATGCGCATACCTCAATTTTGCACAGCTACGGCAGTCGCTTCAGCCTCTACATATGGTAAAGTGACATTTGCTTGGGGTACATCCAATCCTGCCACAGATTCAGTTGGGGTAACCACCCTATTTGATTTCTCTTTAAATAGAGCTGGTTTTTATCAAGCATCAGCTCCTACAGGAAACTATTACATAGGAAATGGTGAGCGTATAGTTCTTTCTAATGGGATGTCCGTAGGGGATGAATTAACCTTAACCACACCTAAGATTACTTTCAGTGACACAGTAGCAGCGGGTAACGGTTTTATTGCGGATGGGACGTCTGTATCCAATGCTACTTTTTATAGTCGTTATCGTGTCGGGGATACTGTTTACGGTGCGGAGTTCCGGGCCAGTGAGAATGCAGCCCAAGTTATTGTCAGAGATCCGGCTGGTACTAGCCATCAATTCTTTAACTTTAACCTCAACGGAACATTCAGTCCCCCAAATGGTTTATTGACTTCCACTGGTACGGACTGGAATGGGCAAAAGAATACTATCAATAAATTCTATGGGATTGCAGGAAGTGACAATGCTCCGGAAAATGCTATATATGGTGGAGTTCATGTAGGATTTAGTGGGAATTATGCTACCCAATTTGCTGGCCGTAACTCCAAGTTTTGGGTAAGAAGTATTGAAGCGGGAGAAAATAAAGAATGGTTAAAGCTTATTACTGCTACATTAGCTCCTAAAATTCCTACGGATGCACGGGATGGTTTCATCAGTGATGCTTCTGCGGATACCTCCTGGGCACCTAGCAACGGCGGGGGTTTCCAGTCTAGTTATGCGGAAAATCGCATTATGCAGAGCTGGGTTGATGGTGCTGGAAGACTCTACAGTAGATTTCTAACAACTAATCAGCCTACAACCTCAAAAACGGTTGTTCCCTGGAAAAGTGCTGCAATGCTGGAGCTGGATAACAGATTTACTGGTAATAACACCTTTATTGGTGCTCTTGAATCGACCGGGGATATAACTTGCGCAAGGTTGTTTAGTAAGGGGACGTTACATACAGAAAGCGGAGGAATTGAGCTTTATCATCCCTCACCGTTTATTGACTTTCACTTTAATAAGGCAGCAAGCAATTACCAGGCAAGGATTATCAACGACGCTGCTAATCAGCTAACTTTTGATTGTCAAAGTGTTCGCACGTTGCGTGACTTTACAGCGCATGGACTTGTAAGGGGTTGTAACAATGATGCATTCGTCGCATGGCCCGTTAGCGATCCGTCTGCCAGCCATGGTCAGATCAAGATGGCGCCTAGGTTCCAATCTCGATTTAATAGCACAGGATCAGACGAACGTGGAGCTGCAAGGGTTTCTGTGTGGTTTGAGGAGTATGTTGGCTATAACCATCGTGGTGTTGTAGAAGTCAGTGGCTATGGTGCTCAGACTCAATACTGGCACTTTAGAAGTGATGGTGCTATCTGGGGTTCTACTAAGGGGGACGTTGCGTGGGCTGGAACTTCTGATTTACGTTATAAAGATAACGTGGTTGATTACGATGGCTTGCAGTCCCTAGAAAACATCAAGGCGATGAACCTGATTAAGTTCACTTACAAGGATGATGATCGCAAGCGTGAGCGTCGAGGTGTTGCAGCACAGCAAATCATGGAAATTGATCCTTGCTATGTCAAAAAGAGCGAAGGCTCTTACATTGACGCCAACGGTGAACAAGTAAACATTGAAAAGCTTGTGTTAGATACAAATCCACTTTTGATGGATGCTCTTTGTGCAATCAAGGTGCTATCTGCCCAAGTAGGGGAGTTGAAAGAGGAAAATACTGCCTTACGTGCTGGCACCGCTAACAGGGAGGAGCAAGTCACAGCTCTAGAATCAGAAGTATCTGATCTTAAAAAGCAAATTGCAGACCTAACATTAGTAGTTAATTCTCTACTAGCAAATAGGGCACAGTAA

Genome Context

Tertiary structure

PDB ID

307d71bd047fac5191a81b3f797c49c6dc7860215718caad150ddef687cf48ca

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,7349

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence