Protein

View in Explore

Genbank accession

XUK83003.1 [GenBank]

Protein name

tail fiber protein proximal subunit

RBP type

Evidence RBPdetect

Probability 0,60

Evidence RBPdetect2

Probability 0,85

Protein sequence

MVDIKRKFRAEDGLDAGGDKIVNVALADRTVGTDGVNVDFLVQENTVQNYDETRAYTKDFIVLYDNRFYQALNDIPAPAGPFSLAKWKATRTDAEWITVQGGDFQLSVGNSIAVDTSAGTDINFTLPQNPLDGDTVILSDIGGRVGYVKVQITAEAQSIVNFRGQQVRSVLMTHPKSKMVFIFSNRLWQMYVSDYERNAVTVTPATPYQAQPNDFIIRRFTSAAPINITLPRNANNGDIINLVDLDKLNPLYHTIVKTYDDTTSIREAGVHVAEGRNTAEAFFVYDSANSLWRVWEGDQKSRLRIVRNDTDLRPNEEVLVFGTNNDTISTVNLTLPTDILSGDTVKISLNYMRKGQTVKIKAAEGDTIASSISLLQFPKRSEYPPDAQWVSVSELEFNGDTSYVPVLELSYIEDYSSETKYWVVQQNTVTVERVDASSNNTRARLGVIALASQEQANVDLENAPGKELAITPETLANRTATETRRGIARIATTAQVNQNTDFAFQDDLIISPKKLNERTATETRRGVAEVATQDETNAGTDDTTIITPKKLDARQGSEVLSGIVKYTSTTGTTAATIRGNAGTNVYNKAVDNLTISPKALDQYKATPTQQGAVILAIESEVIAGESQAGWANAVVTPETLHKKTSTDGRIGLIEIATQAETNAGTDYTRAVTPKTLNDRRATEGLSGIAEIATQVEFDTGTDDTRISTPLKIKTHFDSSDRTSVNSDSGLIEEGTLWNHYTLDISKANETQRGTLRVATQAESNAGTLDDVLITPKKLLGTKSTETSEGVIKVATQAETVTGTSANTAVSPKNLKWIVQSEPSWTATTAIRGFVKTSSGSITFVGNDTVGSTQNLELYEKNSYAVSPYELNRVLANYLPLKAKAADSNLLDGLDSLQFIRRDIDQTVNGSLSLTKQTNLSAPLVSTSTASFGSEASVTRRLTLNDSSGSEIIFTKGTQSLSNKENFVVRAWGNSATDGARDTVFEAGDETGYHFYSQRAADNRVSFNINGTLYSTGIVSTNGLNVTGVSTFTGPISATGEIVSSSPIAFRAINGNYGVMLYNAGNSSYIALTNSGDQTGTFNNLRPITINNATGLVRLDNGVQITSGATITTGGLTVNNRIISNGVKTATVYTDKPTASTVGFWSIDINDSAVYSQFPGYWTRDNKGNRDQEIKYPGTLTQFGNSLDSLYQDWICYPTGANGGSIRYTRTWQKNKDAWTSFAMVFDSGNPPSPSDVGAIPSDNAVIGNLTIRDFLQLGNVRIVPDPVNKTVKFIWVE

Physico‐chemical properties

protein length:	1277 AA
molecular weight:	138684,23280 Da
isoelectric point:	5,04892
aromaticity:	0,07596
hydropathy:	-0,34299

Domains

Domains [InterPro]

DC_1986
ATT
15–128

DC_1986 DC_1209

IPR048390
ATT
969–1089

IPR048390 IPR048391

XUK83003.1

1 1277

Architecture

ATT

STR

ATT

STR

ATT

STR

ATT 15-128 | STR 343-968 | ATT 969-1089 | STR 1090-1135 | ATT 1136-1225 | STR 1226-1260 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_1986	ATT	DC_1986	15	128	Novel HMM	DC_1986	N-terminal	Low	Positional only	693 proteins / 693 hits
DC_1209	STR	DC_1209	343	1260	Novel HMM	DC_1209	Central	Low	Positional only	904 proteins / 904 hits
IPR048390	ATT	DC_0836	969	1089	InterPro cluster	Long-tail fiber proximal subunit, trimerization domain	C-terminal	Medium	Text match	656 proteins / 656 hits
IPR048391	ATT	DC_0875	1136	1225	InterPro cluster	Long-tail fiber proximal subunit domain	C-terminal	Medium	Text match	795 proteins / 796 hits

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Escherichia phage NHEP36 [NCBI]	3420452	Viruses >
Host	Escherichia coli [NCBI]	562	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales

Coding sequence (CDS)

Genbank protein accession

XUK83003.1 [NCBI]

Genbank nucleotide accession

PQ511151 [NCBI]

CDS location

range 81437 -> 85270
strand -

CDS

ATGGTTGACATCAAACGTAAGTTCAGGGCCGAAGATGGTCTTGACGCAGGCGGTGATAAGATAGTTAACGTTGCGCTTGCTGACCGCACAGTTGGCACCGATGGCGTGAACGTTGACTTTTTGGTGCAAGAAAACACCGTACAGAATTATGACGAGACGCGCGCGTATACAAAAGATTTTATTGTTCTTTATGATAATCGTTTTTATCAAGCTTTAAACGATATTCCAGCTCCGGCAGGCCCTTTCTCTTTGGCTAAATGGAAGGCAACTCGTACAGATGCAGAATGGATTACAGTTCAAGGCGGAGATTTCCAATTATCAGTAGGTAACTCTATTGCGGTTGATACTTCAGCTGGTACTGATATTAATTTCACTTTGCCTCAAAATCCTTTAGATGGCGATACAGTTATTTTGTCTGATATTGGTGGTAGAGTAGGCTATGTAAAAGTTCAAATTACTGCAGAGGCTCAAAGTATTGTAAACTTTAGAGGACAACAGGTTCGTTCAGTTTTAATGACGCACCCAAAATCTAAAATGGTCTTCATTTTTAGCAACCGCCTATGGCAAATGTATGTTTCTGATTACGAACGTAATGCAGTCACAGTAACTCCTGCTACGCCATATCAAGCACAACCTAACGATTTTATCATTCGACGTTTTACATCAGCCGCTCCTATTAATATTACATTGCCTCGTAATGCTAATAATGGCGATATTATTAATTTAGTGGATTTAGACAAATTAAACCCGTTATATCACACAATTGTTAAAACTTACGATGATACAACTTCTATACGAGAAGCTGGTGTTCATGTAGCGGAAGGACGTAATACTGCGGAAGCATTCTTTGTTTATGATTCTGCCAATAGTTTATGGCGTGTTTGGGAAGGTGACCAGAAATCTCGTTTACGTATAGTTCGTAATGATACTGATTTACGCCCTAATGAAGAAGTTCTTGTTTTTGGAACTAATAATGATACAATCTCGACGGTAAATCTTACTTTGCCTACAGATATTTTGTCTGGCGATACTGTTAAAATATCGTTGAATTATATGCGTAAAGGGCAAACTGTAAAAATTAAAGCTGCTGAAGGCGATACAATTGCTAGCAGTATTTCTTTATTACAGTTCCCAAAACGTTCGGAGTATCCACCTGATGCACAATGGGTTTCTGTTAGTGAGCTGGAATTTAATGGTGATACTTCGTATGTACCTGTACTTGAGTTATCTTATATAGAAGATTATTCATCTGAAACAAAATATTGGGTAGTTCAACAAAACACCGTAACCGTCGAACGAGTCGATGCATCGAGCAATAACACCCGAGCTCGTTTAGGTGTTATTGCTCTTGCTTCTCAAGAGCAAGCAAATGTCGATTTAGAAAATGCTCCTGGTAAAGAACTGGCTATTACTCCGGAAACATTAGCAAATCGTACAGCAACTGAAACCCGTCGCGGTATTGCTCGTATTGCAACAACTGCACAAGTTAACCAGAATACCGATTTTGCATTCCAAGATGACTTGATTATTTCTCCTAAGAAATTGAACGAACGTACAGCAACTGAAACCCGTAGAGGTGTTGCTGAAGTTGCAACTCAGGATGAAACTAATGCTGGAACAGATGACACCACTATTATTACTCCTAAGAAATTGGATGCCCGTCAAGGTTCTGAAGTTTTATCTGGTATTGTAAAATACACATCTACGACTGGTACTACAGCTGCTACTATTCGCGGTAATGCTGGGACTAACGTTTATAACAAAGCCGTAGATAATTTAACTATTTCTCCAAAGGCTCTTGACCAATATAAAGCCACCCCTACTCAGCAGGGTGCAGTAATTCTTGCTATTGAAAGTGAAGTTATCGCTGGCGAATCACAAGCCGGTTGGGCTAATGCTGTAGTGACCCCTGAAACTCTGCATAAGAAAACTTCTACTGATGGACGTATTGGTTTAATTGAAATTGCTACGCAAGCAGAAACTAATGCTGGGACTGATTATACACGTGCAGTAACGCCTAAGACGTTAAATGATAGGAGAGCGACGGAAGGATTATCCGGCATAGCCGAAATTGCTACGCAAGTTGAATTTGATACTGGAACTGATGATACTCGTATCTCGACTCCACTGAAAATTAAAACTCATTTTGATTCTTCTGACCGTACCAGTGTTAATTCTGATTCCGGACTTATTGAAGAAGGAACCTTGTGGAACCATTATACTCTTGATATTTCTAAAGCAAATGAAACACAACGCGGTACACTTCGCGTAGCGACCCAGGCAGAATCTAATGCAGGAACTTTAGATGATGTTCTTATTACTCCTAAAAAGCTTTTAGGGACTAAGTCCACTGAAACGTCTGAAGGCGTGATTAAGGTTGCTACTCAGGCTGAAACTGTAACAGGAACTTCTGCTAATACTGCTGTATCACCTAAGAATTTAAAATGGATTGTTCAATCAGAACCATCATGGACTGCTACTACGGCAATTCGTGGATTCGTTAAAACTTCATCTGGTTCAATTACATTCGTTGGTAATGATACAGTCGGTTCTACACAGAACTTAGAGCTATACGAGAAAAATAGCTATGCAGTATCACCGTATGAATTAAACCGTGTATTAGCAAATTACTTGCCATTAAAAGCTAAAGCAGCTGATAGTAATTTGTTAGATGGTCTAGATTCTCTTCAGTTCATCCGTAGAGACATCGACCAGACGGTTAATGGTTCTTTAAGTCTTACTAAACAGACCAACCTGAGTGCTCCTTTAGTATCTACAAGCACTGCTTCTTTTGGTTCCGAAGCATCTGTTACTCGTAGATTAACTCTTAATGATTCTAGCGGTTCTGAAATAATTTTCACTAAAGGAACCCAATCTCTTAGTAATAAAGAGAATTTCGTTGTTAGAGCATGGGGTAATAGCGCTACAGATGGTGCCCGCGATACAGTATTTGAAGCTGGTGACGAAACCGGATACCATTTCTATTCTCAGCGCGCTGCTGATAATAGAGTATCATTTAATATTAATGGAACACTTTATTCAACAGGTATTGTTTCTACAAATGGATTAAATGTTACAGGTGTTTCTACCTTTACAGGGCCTATTAGTGCTACAGGCGAAATTGTTTCTAGTTCTCCTATTGCATTCAGAGCTATTAATGGTAACTATGGTGTTATGCTTTATAATGCTGGTAACAGTTCTTATATTGCATTAACTAACTCGGGTGACCAGACCGGGACGTTTAATAACTTACGCCCGATCACGATTAACAATGCCACAGGATTAGTTCGTCTTGACAACGGTGTTCAAATCACAAGTGGTGCAACAATAACTACCGGTGGGTTAACTGTAAATAACAGAATTATTTCTAACGGGGTTAAAACTGCCACGGTTTATACCGATAAACCAACAGCTTCTACTGTTGGTTTTTGGTCTATTGACATTAACGATTCTGCTGTATATAGCCAATTCCCTGGATACTGGACGCGTGATAACAAAGGTAACCGTGACCAAGAAATTAAATATCCTGGTACTTTGACTCAATTCGGCAATAGCTTAGATTCGCTTTATCAGGATTGGATTTGTTATCCTACAGGTGCAAATGGTGGTAGCATTCGATATACTCGTACCTGGCAGAAAAATAAAGATGCTTGGACTTCATTTGCAATGGTATTTGATAGTGGCAACCCACCTTCACCTAGTGATGTCGGTGCTATCCCATCTGATAATGCTGTTATTGGAAACCTTACTATTCGAGACTTCTTACAATTAGGAAATGTGAGAATTGTTCCAGACCCGGTTAACAAAACAGTTAAATTTATATGGGTTGAATAA

Genome Context

Tertiary structure

PDB ID

6767589a22297a676e8c3c78504de272007e840ef715502d9b3622da6ac7b7b8

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,2711

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence