Protein

View in Explore

Genbank accession

QZA70943.1 [GenBank]

Protein name

tail fiber protein

RBP type

Evidence Phold

Probability 1,00

Protein sequence

MAENVKVDYEDLGDLDLDFDFDFSDDASQKKKGKGGAIREFAAGLWTGAKEEVFTKGTPQRIIRSLLPVSFSPAFDAKDRAARFKDDLYDKVKSNTRNSVNDIKDLTLDALSMYGGKLPDKVLKQIEVWAENKDIDYSVSSTKPSDPSLEDGLETSDSDDYVTMLQQSTLQASQLAVSLHKESMAQTAAVATKQMSLSADSLAFMQGIHRMTARTVGFNEQFTANYQRKSLELQYRSYKLQLSIGKMHERYYKRSLEAMSGLVKNTGLTDFEKMSHGASAREMIRKRALGGLGGGVSQFGNRLFDNVFNVVDQRSQDVNYRASGGIAAARAAMMGAQQARMMGRSLGARDYGQMAGQGLAAMLPMLMSTIARPALAKNDKLNRMGHDLSYYSNAAPGLINGWLRNRQSFDENYDPSAQGNKWYSRIQKRVVNPFLNNTLFQMPASMGNRTRLNNPGVKDLTEPAIYDQMSRRSLVEVIPGLLTKQLAQQTAIANKMGADVTGVKEVHFNHIQGGFTSQKRANVDLRSSIFNRNEFSSAAGSFNTMVDTLDPNNELSPNARVALAMRFAKDAEAGDGFNVNSYLKSSGWGTANKDAVQEITEFLHKRFDTREATGKAKAFGEFQIGDAPELAQMRNNLSNIMQAQSQYMPNVEQSLNTMANSGSRAQLKDMGVIKRVNGQDVFNHEMYWEMMQKFISNPNYRPDREGEDENERGSNVDPGAELGAMGREAMANFKRGVTDQFGNLRGKLTRDQEEAIRDQLAQARANGVDAYNVVKRQLTARYGDVAVGRIVRRLDNSFGQRFTDKINGFSVDGAAASAGNAARAAGQGASDLFGKIKGASLDTSGVKQALMDAASNGKEALRQATTELQRRFGRQAVEEAAEEIAKAGDVVKSSSDVLGSRVAAAVSRTRAGVSSAMDEATESASETAAIVQAQLDNNAILREVVGVLASVRDATAATKDATIAQVTGNPDILKDGITERASWLRGLGKRMGESKAGRIARFSRTVFKHLPNINTPVMTVAKWATIGPAVVGFKATRGLWNMLRDKKRGDAADPDHDGVRNNSVFDLLRRRKQQKLEQDEAKRAHNADDNGKEKEKPTTLFGLVAGLFSSVTGLVSGIKEFGILGGLAKFLGLGWVGDLIGGLGKILAGKKAIDAASDIMDDLGDGDEGDDRRSRRRGRRTGGRGGRGRGGLIRRLAGGTARGVKRLGAGIGRRTAGALRAGVGGNLKTLVKGGGIVTAGLSAFEAYSAYKEGDDAGAAEAVGSGVGGILGGAAMGAAIGSVVPVVGTAIGAVAGGAIGALGGGAIGRSLYGWFNDPGLLQQMRLRQYGVPDNDTDHVSAILKLEAALEPYVKTTDDGYASLDPKAPIAKLASGFVDDPNDRDQVESFAGWFLHRFKPVFLTHKAVAKQVLPSQSFMDLDKSTDEAAKYEIAKRAQQFDDSADHPYTFTGRVFPDLNATDRKQTEALVKDVVDRLRVKASKMTTGKSTSVFATGMSEVASKRELSGDMVKAINPTGDIPGLNTVGHKESSWFTGDRTVVSAGDILGGLLPKSGQPMDDLTALRMKVYGLPTLDVDRVSTLLQLELVMANKVKFTDSGATFDGKASDIYRLVAASFGLNPSSQWSYKSWEPWFTRRFLPAYLSFAGTVYTQTGDTRPTLAVPKMPPELKFAAATAMANAKYTDGVNAISVWTIKTSPWSTGEMNDDASIIQNHLNNLKAQVKQAQYSAEAVKGGVQQNKDGTTEKEWRKDSSGNMVNNQVKTSTGQVYTSQRQVTTYNPETGRIETAYGGGAGQGAGGASGGVDNTGKVGPIKLGPGAQEGARILIRQAVKAGITDKNEIAMLLAQTHLESGGFSKLEENLRYKAETLMKLWPNRFPSLAAAQQLATAGPVAIANAIYGGRMGNDKPGDGWKYRGRGFMQLTGKANYAAASKGMGVDLVSDPDKLSTDPEMAAKSALWYWKSRGGIEDAAKKGDLNTVTKLINGGTHGLAERGQLFKQYTDLVGTGKFDDIISGKDTSAGAQTDDASTAQTSVQQGGPDSPALSGAKTAAELTAPGASAANAAAAAPVTPPSGQGDAPALKSTTGPSVSATVSAGSSTPNAKDSTASAIDNQASTTPPPGAATTPTLNTPPQMQPTQAQVPNAPQVVAATPAPAQPVMPKESVAALSGSKDHLSSIDDKMTSLVDVLRQFIEMQMQAMSKPAAATQQPASGTGAPAVDFRRKYGNQ

Physico‐chemical properties

protein length:	2225 AA
molecular weight:	237638,49490 Da
isoelectric point:	9,23659
aromaticity:	0,06472
hydropathy:	-0,42894

Domains

Domains [InterPro]

DC_0337
STR
1–1909

DC_0337 DC_0824

IPR052354
Unmapped
1806–1990

IPR052354

G3DSA:1.10.530.10
RBD
1824–2003

G3DSA:1.10.530.10

IPR023346
STR
1831–2005

IPR023346

cd00325
ENZ
1834–2010

cd00325

IPR000726
ENZ
1908–1961

IPR000726

QZA70943.1

1 2225

Architecture

STR

RBD

STR 1-2010 | RBD 2011-2225

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0337	STR	DC_0337	1	1909	Novel HMM	DC_0337	Central	Low	Positional only	32 proteins / 32 hits
IPR052354	Unmapped	-	1806	1990	InterPro	Bacterial Cell Wall Dynamics Protein	-	-	-	-
G3DSA:1.10.530.10	RBD	G3DSA:1.10.530.10	1824	2003	Merged direct domain	G3DSA:1.10.530.10	C-terminal	Low	Positional only	95 proteins / 95 hits
IPR023346	STR	IPR023346	1831	2005	Merged direct domain	Lysozyme-like domain superfamily	Central	Low	Positional only	29 proteins / 29 hits
cd00325	ENZ	DC_0654	1834	2010	InterPro cluster	chitinase_GH19	C-terminal	High	Text match	13 proteins / 13 hits
IPR000726	ENZ	DC_0328	1908	1961	InterPro cluster	Glycoside hydrolase, family 19, catalytic	C-terminal	High	Text match	27 proteins / 27 hits
DC_0824	RBD	DC_0824	2011	2225	Novel HMM	DC_0824	C-terminal	Low	Positional only	10 proteins / 10 hits

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Erwinia phage AH06 [NCBI]	2869570	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	No host information

Coding sequence (CDS)

Genbank protein accession

QZA70943.1 [NCBI]

Genbank nucleotide accession

MZ501268.1 [NCBI]

CDS location

range 122424 -> 129101
strand -

CDS

ATGGCCGAAAATGTCAAAGTTGATTACGAAGACCTAGGTGATCTTGACCTGGACTTTGACTTCGATTTCAGTGACGACGCCAGTCAGAAGAAGAAGGGTAAGGGCGGGGCTATTCGTGAGTTCGCCGCGGGCCTGTGGACAGGCGCCAAGGAAGAAGTGTTCACCAAAGGCACACCTCAGCGCATCATCCGCTCTCTTCTACCGGTCTCGTTTTCGCCTGCGTTTGATGCAAAAGATCGCGCGGCTAGATTTAAAGATGACCTATACGATAAAGTTAAAAGTAATACGCGTAACTCAGTCAATGACATCAAAGACCTTACGCTTGATGCTTTATCGATGTATGGTGGCAAACTCCCAGATAAAGTTCTGAAACAAATTGAAGTCTGGGCTGAGAACAAAGACATTGATTATTCCGTGTCGAGCACCAAACCGAGTGACCCGAGTCTGGAAGACGGGCTTGAGACAAGTGACAGTGACGACTATGTCACTATGCTTCAGCAGTCTACTTTGCAAGCCAGTCAGTTGGCGGTCTCTTTACATAAAGAGAGCATGGCACAGACCGCAGCAGTCGCCACCAAGCAGATGAGTTTGTCTGCCGATAGCCTGGCCTTCATGCAAGGTATCCACCGCATGACTGCCCGTACGGTTGGTTTCAATGAACAGTTCACCGCAAACTACCAACGCAAGTCGTTAGAGCTGCAGTACCGTTCTTACAAGTTGCAACTCTCTATTGGTAAGATGCATGAGCGGTATTACAAACGTTCATTAGAAGCCATGTCAGGTCTGGTGAAGAACACCGGCTTAACAGACTTCGAGAAAATGTCCCACGGGGCATCTGCACGTGAGATGATTCGTAAACGTGCACTCGGTGGTTTGGGTGGCGGGGTCTCTCAGTTTGGTAACCGTCTGTTTGATAACGTCTTCAATGTTGTCGATCAACGTAGCCAGGATGTGAACTACCGCGCCAGTGGTGGTATCGCCGCTGCCCGTGCGGCAATGATGGGTGCACAGCAAGCCCGTATGATGGGTCGCTCGTTAGGGGCACGTGACTACGGTCAGATGGCGGGGCAAGGTTTAGCGGCGATGCTGCCGATGCTGATGTCGACCATCGCCCGTCCAGCACTGGCAAAGAACGATAAACTGAACCGCATGGGTCATGACCTGAGTTATTACTCGAATGCGGCACCAGGGTTAATCAACGGCTGGTTGCGTAATCGTCAATCATTCGATGAGAACTACGACCCAAGTGCACAGGGTAATAAATGGTACAGTCGTATTCAGAAACGTGTGGTCAACCCGTTCTTGAATAACACCCTGTTCCAGATGCCGGCTTCAATGGGTAACCGGACGCGCCTGAACAACCCAGGTGTTAAGGATCTGACTGAGCCGGCTATCTACGACCAGATGTCTCGTCGTTCATTGGTAGAAGTCATCCCAGGATTACTCACCAAACAACTTGCCCAACAAACGGCGATTGCCAATAAGATGGGTGCGGATGTGACGGGTGTGAAAGAAGTTCACTTCAATCACATCCAAGGTGGGTTCACCTCACAGAAACGCGCCAATGTTGATCTGCGCTCGTCTATCTTTAACCGCAATGAGTTCTCGTCTGCCGCTGGGTCATTCAACACCATGGTAGACACACTCGACCCAAACAACGAGCTTTCACCAAATGCCCGTGTGGCCTTAGCAATGCGTTTTGCTAAAGACGCCGAAGCCGGTGATGGGTTTAATGTTAACAGCTACCTGAAGTCCAGTGGCTGGGGTACAGCGAATAAGGATGCGGTTCAGGAGATTACCGAGTTCCTGCATAAGCGCTTTGATACGCGTGAAGCAACCGGTAAAGCCAAAGCCTTTGGTGAATTCCAAATCGGTGATGCGCCTGAACTAGCACAGATGCGTAACAACCTCTCGAACATCATGCAAGCCCAGTCTCAGTACATGCCAAATGTCGAGCAGTCATTGAACACCATGGCTAACAGTGGCAGTCGTGCACAACTCAAAGACATGGGTGTCATCAAACGCGTCAATGGTCAAGATGTCTTTAACCATGAGATGTATTGGGAGATGATGCAGAAGTTCATTTCCAATCCTAACTATCGCCCTGATCGTGAAGGAGAGGATGAGAACGAACGCGGCAGTAATGTCGACCCGGGTGCTGAGTTGGGTGCAATGGGTCGTGAGGCCATGGCCAACTTCAAACGGGGTGTGACGGATCAGTTTGGTAACCTGCGTGGTAAACTTACTCGTGATCAAGAGGAGGCAATCCGTGATCAATTGGCACAAGCTCGGGCAAATGGGGTTGATGCTTATAACGTGGTCAAGCGTCAACTTACTGCTCGCTACGGCGATGTGGCTGTGGGTCGTATTGTCCGCCGTTTGGATAACAGCTTTGGTCAGCGATTTACCGATAAGATAAACGGCTTCTCTGTTGATGGCGCTGCTGCTTCAGCAGGCAACGCTGCCCGTGCAGCCGGTCAAGGTGCATCGGATCTCTTTGGTAAAATCAAAGGCGCATCGCTCGATACCTCAGGTGTGAAACAAGCACTGATGGATGCGGCGAGTAACGGTAAAGAAGCATTACGTCAAGCCACCACAGAACTGCAACGTCGCTTTGGTCGTCAGGCCGTAGAAGAAGCTGCAGAAGAGATCGCTAAAGCCGGGGATGTTGTTAAGTCCTCTAGTGATGTCCTTGGGTCTCGTGTTGCTGCTGCTGTCTCCAGAACCCGTGCTGGGGTTTCTTCAGCAATGGATGAAGCAACAGAGTCTGCTTCAGAGACCGCCGCTATCGTACAAGCCCAGCTTGACAACAACGCGATACTGCGTGAGGTCGTTGGGGTGTTGGCATCGGTACGTGATGCAACCGCTGCAACAAAAGATGCGACCATTGCTCAGGTGACCGGTAACCCGGATATCTTGAAAGACGGGATCACTGAACGTGCCAGTTGGTTACGTGGGTTAGGTAAACGCATGGGGGAGAGCAAAGCAGGTCGTATTGCGCGCTTCTCTCGTACGGTATTCAAACACTTACCTAACATTAACACACCGGTGATGACCGTGGCTAAATGGGCAACCATCGGTCCTGCGGTTGTTGGCTTTAAAGCAACCCGTGGATTGTGGAACATGCTGCGTGATAAGAAACGTGGTGATGCTGCTGATCCTGATCATGATGGTGTGCGTAACAACTCGGTGTTCGATCTCCTGCGTCGCCGTAAGCAACAGAAGCTGGAACAAGACGAAGCCAAGCGTGCACACAACGCAGATGACAACGGAAAAGAGAAAGAGAAACCTACCACCCTGTTTGGGTTAGTGGCAGGACTGTTCTCGTCCGTGACTGGGTTGGTCTCGGGGATTAAGGAGTTTGGGATCCTCGGGGGATTGGCTAAGTTCTTGGGTCTTGGTTGGGTCGGTGATCTGATTGGTGGTCTGGGTAAAATCTTGGCCGGTAAGAAAGCCATTGATGCGGCCTCAGACATCATGGATGATCTCGGCGATGGAGATGAAGGTGATGATCGTCGCAGTCGTCGACGGGGTCGCCGTACCGGTGGGCGTGGCGGCCGTGGTCGTGGTGGGTTGATTCGTCGTCTGGCTGGCGGGACTGCTCGCGGTGTCAAAAGACTGGGTGCTGGGATTGGTCGTCGTACTGCAGGTGCATTGCGTGCAGGTGTCGGCGGTAATTTGAAAACCTTGGTCAAAGGTGGCGGAATTGTCACAGCCGGTCTTTCTGCTTTTGAGGCTTACAGTGCTTATAAAGAAGGAGACGATGCCGGTGCAGCTGAAGCAGTAGGTTCAGGTGTTGGCGGTATTCTGGGTGGCGCTGCAATGGGTGCGGCTATCGGTTCAGTTGTGCCGGTTGTCGGAACCGCCATCGGTGCTGTTGCCGGGGGTGCGATTGGTGCGCTCGGTGGTGGTGCGATTGGTCGTTCCTTATACGGCTGGTTCAATGACCCTGGGTTACTCCAGCAAATGCGTCTTCGTCAGTACGGTGTACCAGACAATGATACCGATCATGTCTCGGCTATCCTGAAACTTGAAGCAGCATTAGAACCGTATGTCAAGACTACTGATGATGGTTACGCCTCATTGGATCCAAAGGCCCCGATTGCGAAACTGGCATCTGGCTTCGTTGATGATCCTAATGACCGTGATCAGGTGGAGTCATTCGCAGGTTGGTTCCTCCATCGTTTCAAACCGGTCTTCCTGACACACAAAGCCGTGGCCAAGCAAGTTCTACCAAGCCAATCATTCATGGACCTTGATAAGTCAACGGATGAGGCTGCGAAGTATGAGATTGCTAAACGCGCACAACAGTTCGATGATTCTGCTGACCACCCATACACCTTTACCGGACGTGTGTTCCCGGACCTGAATGCAACTGATCGCAAACAGACCGAAGCACTGGTAAAAGATGTGGTCGATCGTTTACGGGTGAAAGCCTCGAAGATGACGACGGGTAAATCCACCTCAGTGTTTGCCACTGGGATGAGTGAAGTGGCGTCTAAGCGTGAGCTTAGTGGCGACATGGTCAAAGCGATCAACCCAACCGGTGACATCCCTGGGTTGAACACCGTGGGGCACAAAGAGTCATCGTGGTTCACTGGTGATCGAACCGTGGTTAGTGCAGGAGACATCTTAGGCGGGTTGTTACCGAAGTCTGGTCAACCGATGGATGACCTGACTGCCTTGCGTATGAAAGTCTATGGCTTGCCTACGCTTGACGTGGATCGTGTTTCAACGCTCCTGCAGTTAGAACTGGTGATGGCGAACAAAGTGAAGTTCACGGACAGCGGTGCGACGTTTGATGGTAAAGCATCTGACATCTACCGTTTAGTGGCTGCTTCCTTTGGATTGAATCCATCCAGTCAGTGGTCGTACAAATCCTGGGAGCCGTGGTTCACTCGTCGCTTCTTGCCAGCGTACTTGTCCTTTGCAGGAACAGTCTACACGCAAACGGGCGATACCCGACCAACCTTAGCTGTGCCGAAGATGCCACCGGAACTGAAGTTTGCTGCTGCAACTGCAATGGCAAATGCGAAGTACACTGATGGGGTTAATGCGATCTCTGTCTGGACTATCAAGACATCTCCGTGGTCTACGGGTGAGATGAATGATGATGCTTCAATTATTCAAAACCATCTGAATAACTTGAAAGCCCAGGTGAAGCAAGCGCAGTATTCGGCTGAAGCAGTGAAAGGCGGTGTTCAGCAAAACAAAGACGGCACCACTGAGAAAGAGTGGCGTAAAGACTCGTCAGGTAACATGGTGAATAACCAAGTGAAGACGAGTACTGGTCAAGTCTATACCTCTCAGCGACAGGTCACTACCTACAACCCAGAAACAGGCCGTATTGAAACAGCGTACGGTGGTGGTGCGGGTCAAGGTGCTGGCGGAGCAAGCGGAGGGGTTGACAATACCGGTAAGGTCGGTCCAATCAAGTTAGGACCAGGTGCACAAGAGGGTGCGCGTATCTTAATCCGTCAGGCTGTGAAAGCGGGGATAACGGATAAGAACGAGATTGCCATGCTCTTGGCACAAACCCACTTGGAGTCCGGTGGCTTTAGTAAGCTTGAGGAGAACCTGCGTTACAAAGCAGAGACCCTCATGAAACTCTGGCCGAATCGTTTCCCAAGTCTTGCAGCAGCACAACAGCTGGCAACAGCGGGTCCTGTCGCAATTGCGAATGCCATCTACGGCGGACGCATGGGGAATGATAAACCGGGGGATGGTTGGAAGTACCGTGGGCGTGGCTTCATGCAGCTGACCGGTAAAGCCAACTACGCCGCAGCCAGTAAAGGAATGGGGGTCGACCTGGTCTCTGATCCAGATAAGCTCTCAACAGATCCTGAGATGGCTGCCAAGTCGGCATTGTGGTATTGGAAGTCCCGTGGCGGGATTGAAGATGCAGCGAAGAAAGGGGATCTGAATACGGTTACCAAACTGATCAATGGCGGGACACACGGTCTTGCTGAACGCGGTCAGTTGTTTAAACAGTATACGGATCTGGTTGGGACAGGTAAGTTTGATGACATCATCTCTGGTAAGGATACCTCTGCCGGGGCACAAACGGATGATGCGTCAACTGCTCAAACGAGTGTGCAGCAAGGCGGTCCAGATTCACCTGCGTTGTCCGGGGCGAAGACGGCAGCTGAACTCACTGCACCAGGTGCCTCTGCAGCTAACGCTGCGGCAGCGGCTCCGGTTACCCCGCCGTCAGGTCAGGGTGATGCACCGGCTCTGAAGAGTACCACAGGACCAAGTGTTAGCGCGACCGTCAGTGCAGGATCAAGTACACCGAATGCAAAAGACTCCACCGCATCGGCAATCGACAATCAGGCATCGACGACACCACCTCCGGGTGCAGCAACGACACCAACCCTGAATACCCCACCACAGATGCAACCGACCCAGGCGCAAGTTCCTAATGCCCCTCAGGTTGTTGCAGCTACCCCTGCTCCAGCTCAACCGGTCATGCCGAAAGAGTCTGTGGCTGCCCTGTCTGGTAGCAAGGACCATCTGTCGTCCATTGATGATAAGATGACTTCTTTGGTTGATGTGTTGAGGCAATTCATTGAAATGCAAATGCAGGCAATGAGTAAGCCTGCAGCAGCAACACAACAACCGGCTAGCGGGACAGGCGCACCTGCCGTAGACTTCCGTCGTAAGTACGGTAATCAGTAA

Genome Context

Tertiary structure

PDB ID

3771a0cd2c26a12c5c1672a66ab840b04a23ddae0f264dd7dade3faf524d33a7

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,4198

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence