Protein

View in Explore

Genbank accession

XHG84563.1 [GenBank]

Protein name

tail fiber protein

RBP type

Evidence GenBank

Probability 1,00

Evidence RBPdetect

Probability 0,64

Protein sequence

MASRKEMMGMGVDVLRALGLEAGLNFEPGLSKSKMVLQLEQHQASGWMDVNSQLLHASAEGGFDHMQGFTGYEEESISDAARVAQSLAGAGYTETFHHIMSGGKSHHVEAVHGYMAKLGVSADDVWLHMPKPNPELPAQDFNLLKGYLNNHWDDYQDIMPPLAGHYAGDIMGEYATNKGHVGDSYNHLSSMYLNKAAYNNPHAYEKDAALVATRLASAMGGQFLEVGYAAATGAKVGYHSILPQLGSDIVRGVQHPREALNAAGLPLGSMGSAVGSGRGDYSLVASLLGRAEGQDEASKAIRSEVSSTLKSLAGSYKGGGEFGMNPHRHETSEHDLLLDSATRYVGIEDARSGYANLDDTSYNRNNIAAIIENNYDRMDAQAAQAPSGVANPDLRMPRRSEIGTAWSADLNEPTDWNAARVRRESAAIANLDAAHANFRDVADGGPSGSTVRFHNFQQGSQEWHDFRSQYDITGSTVGSMLGSNSYTRPWAEMIDRIGLQRGDGSKNAFTERMFAMGHKREDEARIRVSERLGQEIQQVGSITNDQYPGMMYSPDGLIGDDALWEHKAPERAGKFADLLAGDHPDYMDQIQMGMLVSGRNRTLFSQTIGSETRDQWIDQDPSWYGRNKTRLDSIRGRLAAGREFVASNPDLDQEALIKGARSVMQGEGIWRDVSQRSNRGFSATAGTDADPFIGRGGSTYNDAAQPSSNYIPNFVTSAGNGLVPVGGNGAETGMALAVKEGILGAQEELKQRHAQAGAASGGVAGLLGSDMPDADFADSTGSGGIRGFFQRMFGGGSGGAGGNGGGSGGASGWMDDFGGSLYGGLRSGNLRGLQNGTLDAIESLPMVGGILRGTIGAMQAGGEGIATMSNYRGIAEDSGMTSGVAFAAQTQGLEMMGLNANQAGAINQTIHSVYNRMQNGDPDAAVQIAVQTRGLITPADLQSSGGDATKIAALIRQRGEERGWSQSRIAGAMEMAGLDGMARVATRSEATMDQSRRLVDARSAEDVSGANSNWENAQRNRALASTDYSVPRYSFESLGGAGESLSGSMVQAAAGAERAFRAGGDMIDLVRNLESGGQDFDAHGNPVTSSSGAKYSMQVLPSTARDPGYGIRPAANDSPEEYNRVGREKLDAMMKRYGGDWRKANAAYTDGEGTVDSAIKQYGNDWLSHMPSQAQKRVRDMERAGFNGGNANSFRDAGSNGQQNLNVTVNINATVNDKSTRASVTNPYSGEVVTINSNHGSVAQRR

Physico‐chemical properties

protein length:	1246 AA
molecular weight:	132563,59110 Da
isoelectric point:	5,38910
aromaticity:	0,06822
hydropathy:	-0,52006

Domains

Domains [InterPro]

DC_0169
ATT
1–417

DC_0169 IPR051703 DC_0159 G3DSA:1.10.530.10 DC_1262

IPR011604
STR
447–640

IPR011604 cd00254

IPR011335
Unmapped
452–614

IPR011335 IPR023346

IPR019080
STR
462–599

IPR019080 IPR008258

XHG84563.1

1 1246

Architecture

ATT

STR

RBD

STR

RBD

ATT 1-417 | STR 447-640 | STR 646-1063 | RBD 1065-1085 | STR 1086-1171 | RBD 1172-1246

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0169	ATT	DC_0169	1	417	Novel HMM	DC_0169	N-terminal	Low	Positional only	46 proteins / 46 hits
IPR051703	Unmapped	-	424	600	InterPro	NF-kappa-B Signaling Regulator	-	-	-	-
IPR011604	STR	IPR011604	447	640	Merged direct domain	PD-(D/E)XK endonuclease-like domain superfamily	Central	Low	Positional only	46 proteins / 46 hits
IPR011335	Unmapped	-	452	614	InterPro	Restriction endonuclease type II-like	-	-	-	-
IPR019080	STR	DC_0765	462	599	InterPro cluster	YqaJ viral recombinase	Central	Low	Positional only	44 proteins / 44 hits
DC_0159	STR	DC_0159	646	1063	Novel HMM	DC_0159	Central	Low	Positional only	48 proteins / 48 hits
G3DSA:1.10.530.10	RBD	G3DSA:1.10.530.10	1065	1184	Merged direct domain	G3DSA:1.10.530.10	C-terminal	Low	Positional only	95 proteins / 95 hits
cd00254	ENZ	DC_0010	1074	1162	InterPro cluster	cd00254	C-terminal	High	Text match	100 proteins / 142 hits
IPR023346	STR	IPR023346	1086	1171	Merged direct domain	Lysozyme-like domain superfamily	Central	Low	Positional only	29 proteins / 29 hits
IPR008258	ENZ	DC_0010	1087	1164	InterPro cluster	Transglycosylase SLT domain 1	C-terminal	High	Text match	100 proteins / 142 hits
DC_1262	RBD	DC_1262	1185	1246	Novel HMM	DC_1262	C-terminal	Low	Positional only	6 proteins / 6 hits

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Erwinia phage Fifi44 [NCBI]	2876597	Uroviricota > Caudoviricetes > Chaseviridae > Fifivirus > Fifivirus fifi44
Host	No host information

Coding sequence (CDS)

Genbank protein accession

XHG84563.1 [NCBI]

Genbank nucleotide accession

PQ051110.1 [NCBI]

CDS location

range 10931 -> 14671
strand +

CDS

ATGGCTAGCAGAAAAGAAATGATGGGCATGGGCGTGGATGTTCTCCGCGCTCTTGGTCTTGAGGCCGGATTGAATTTTGAGCCCGGACTCTCGAAGTCCAAAATGGTTTTACAGCTGGAACAGCATCAGGCTTCCGGTTGGATGGACGTCAATAGCCAATTACTACACGCAAGTGCAGAAGGTGGCTTTGACCACATGCAAGGCTTCACCGGTTATGAAGAAGAATCCATTTCCGATGCAGCGCGTGTTGCACAGTCATTAGCTGGTGCAGGATATACCGAAACTTTCCATCATATTATGTCTGGTGGTAAGTCTCATCATGTAGAAGCTGTTCATGGCTACATGGCAAAACTTGGTGTTTCAGCCGATGATGTTTGGCTGCATATGCCAAAACCAAATCCTGAATTACCTGCGCAAGATTTCAATTTATTAAAAGGTTATTTAAATAACCATTGGGATGATTACCAAGACATTATGCCACCACTTGCTGGGCATTATGCTGGTGATATTATGGGTGAGTATGCTACGAATAAAGGCCATGTTGGCGATTCGTACAACCACCTTTCATCCATGTATTTAAACAAAGCTGCTTACAACAATCCACACGCATATGAGAAAGATGCTGCCCTTGTTGCAACGCGTTTGGCTTCGGCGATGGGAGGTCAATTCCTTGAAGTTGGTTATGCTGCTGCCACTGGTGCAAAGGTTGGGTATCATTCCATCTTGCCTCAGCTTGGTTCTGATATTGTGCGTGGTGTTCAACATCCTCGCGAAGCTCTCAATGCTGCTGGTTTGCCTCTTGGCTCAATGGGCTCTGCTGTTGGTAGTGGTCGTGGCGATTATTCTCTTGTCGCTTCTCTGCTGGGACGTGCGGAAGGACAGGATGAAGCGTCAAAAGCAATCCGAAGTGAAGTAAGTAGTACGCTGAAAAGTTTGGCAGGCTCATATAAAGGTGGTGGCGAGTTTGGAATGAATCCACATCGTCATGAAACATCTGAGCATGACTTACTTCTCGATTCTGCAACTCGTTATGTTGGTATTGAAGATGCACGTTCTGGTTATGCAAACCTTGACGACACTTCATACAACAGAAATAACATTGCAGCAATAATTGAAAACAACTATGACCGCATGGATGCTCAAGCTGCACAAGCTCCATCTGGTGTTGCCAATCCTGATTTAAGAATGCCACGTCGTTCTGAGATTGGCACTGCATGGTCTGCTGATTTAAATGAACCAACCGACTGGAATGCTGCTCGTGTTCGTCGTGAAAGTGCTGCCATTGCAAACTTGGATGCTGCTCATGCAAACTTCCGTGATGTTGCTGATGGTGGTCCAAGTGGTTCAACTGTTCGATTCCATAATTTCCAACAAGGTTCTCAGGAATGGCACGACTTCCGTAGTCAATATGACATAACTGGTTCCACTGTTGGCTCGATGTTGGGTAGTAATTCATATACTCGACCTTGGGCAGAAATGATTGACCGCATTGGATTGCAGCGCGGTGATGGAAGTAAGAACGCATTCACAGAAAGAATGTTTGCGATGGGCCACAAGCGAGAAGATGAAGCTCGTATTCGTGTCTCAGAAAGATTAGGTCAAGAAATCCAACAAGTTGGCTCAATCACCAATGACCAGTATCCGGGAATGATGTATTCTCCAGATGGTTTAATTGGCGATGACGCATTGTGGGAGCATAAAGCTCCTGAACGTGCTGGCAAGTTTGCAGATTTGCTTGCAGGTGACCATCCAGACTACATGGACCAGATTCAAATGGGCATGTTGGTTTCTGGAAGGAACCGAACTTTATTCTCGCAGACAATTGGAAGTGAAACTCGCGACCAATGGATTGACCAAGACCCAAGTTGGTATGGCAGAAACAAAACTCGACTCGATTCTATTCGTGGTCGTCTTGCTGCCGGTCGTGAATTTGTTGCAAGCAATCCAGACCTTGACCAAGAAGCGTTAATCAAAGGTGCTCGTTCTGTAATGCAGGGCGAAGGCATCTGGCGTGATGTTTCTCAACGTTCCAATCGTGGTTTCTCTGCAACTGCTGGTACTGACGCTGACCCATTCATTGGGCGCGGCGGTTCAACCTACAATGACGCTGCTCAACCGTCTTCAAACTATATTCCGAACTTTGTGACCAGTGCCGGTAATGGCCTTGTGCCAGTGGGCGGAAATGGGGCTGAGACGGGCATGGCGCTTGCCGTCAAAGAAGGCATACTAGGTGCTCAGGAGGAGCTAAAACAGCGCCACGCTCAGGCTGGTGCAGCCTCTGGCGGTGTTGCTGGCTTGCTTGGCTCTGATATGCCAGACGCCGATTTTGCCGACTCAACTGGCTCCGGTGGTATTCGTGGATTCTTCCAACGAATGTTTGGTGGTGGCTCAGGCGGCGCAGGCGGCAACGGTGGCGGCTCTGGCGGTGCAAGTGGGTGGATGGATGACTTTGGCGGCTCGCTCTATGGTGGCCTCCGTAGCGGCAATTTGCGTGGGTTGCAAAATGGCACATTAGATGCAATCGAAAGTCTGCCGATGGTTGGCGGAATTCTTCGAGGAACTATTGGAGCTATGCAAGCTGGTGGTGAAGGCATTGCAACAATGTCAAACTACCGTGGTATTGCAGAAGATTCAGGCATGACTTCTGGTGTTGCATTTGCAGCACAGACTCAGGGTTTGGAAATGATGGGCTTGAATGCAAATCAAGCCGGTGCAATAAATCAAACAATTCATTCTGTATACAACCGTATGCAAAATGGAGACCCTGATGCTGCTGTTCAAATTGCAGTGCAAACCCGTGGATTGATTACTCCTGCCGACCTTCAAAGTTCTGGTGGTGATGCAACCAAGATAGCTGCACTTATTCGTCAACGTGGCGAAGAACGTGGCTGGAGTCAGTCTCGAATTGCTGGCGCTATGGAAATGGCTGGCCTTGATGGTATGGCTCGTGTTGCTACCAGAAGTGAAGCAACGATGGACCAATCTCGTCGCCTGGTTGATGCTCGTTCTGCTGAAGATGTTTCTGGTGCAAATTCCAATTGGGAAAATGCACAACGCAATCGTGCTCTTGCTTCCACAGATTATTCTGTTCCTCGTTATTCATTCGAAAGTTTGGGTGGTGCTGGTGAGAGTTTATCTGGAAGTATGGTGCAGGCTGCGGCGGGTGCTGAACGTGCCTTCCGTGCTGGCGGAGACATGATTGACTTGGTTCGCAATCTGGAATCAGGTGGTCAAGACTTCGATGCTCATGGTAATCCAGTTACTTCATCGTCTGGTGCGAAGTACTCAATGCAGGTTCTTCCTTCTACAGCCCGTGACCCAGGTTACGGCATTCGTCCAGCGGCAAATGATTCTCCAGAAGAATATAACCGTGTTGGTCGTGAGAAGTTAGATGCAATGATGAAACGTTACGGTGGCGATTGGCGTAAAGCTAATGCTGCATACACCGATGGCGAAGGAACTGTTGATAGTGCAATCAAGCAATATGGAAACGATTGGTTGAGTCATATGCCGTCTCAAGCACAGAAACGTGTAAGAGACATGGAACGTGCTGGATTCAATGGTGGTAACGCAAATTCATTCAGGGATGCTGGCTCAAATGGTCAACAGAATCTGAATGTAACTGTGAACATCAATGCAACTGTTAATGACAAAAGCACTCGTGCTTCTGTTACTAACCCGTACAGTGGTGAAGTTGTTACAATCAACTCAAATCACGGTTCTGTTGCACAGCGTCGATGA

Genome Context

Tertiary structure

PDB ID

5daabea7b28b219c77202d41a380046d512a81e901f43203cc2df2927a0f1d2c

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,4508

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence