Protein

View in Explore

Genbank accession

QKN86080.1 [GenBank]

Protein name

tail fiber protein

RBP type

Evidence Phold

Probability 1,00

Protein sequence

MSTIWPEGKRDQVILKGMPKPAADAYEGYQSAAAAAKDIYAHTKGELVKTERTLKMQARQLGPTMKKYLPDAVTKRIDKWSKSDQLDYQNYDPNQALMDRELGDVFSGVPKDADEQRQLQDRMVEDKLRDSIKEMRADAMHQTMIGMAKDINLLTGLSRGVFLNIERKKLELQYRTLFAIQDIVKMKQSEFDRNTPALEAIVKNTALPDYAKEDFSEVRWANVKRQAAEWMNPLRYADGFMDMIRENTKKKISGIFGEGRGLLESVLGMGVEDDFGMSDSSSLTAERRKTNARDKATAWGSGFLAKKLLGPQIEKLQKWTREEMEKNPEVMKRLQKGAFTFGNLSSISNSAIAGETQGPLADLFRVLNELGIVQPLNREKAFLDERNGETLSRSAKFDRKAYLSLVEVIPAWLAEINKSVRRGYGEHADLEYDITSRGFVDRKVVGNRVRKAVANDEQRLRLQNSINSTVDFVDRGKTLSQKDRQHLADYIESRASQGRAFDVEAILKDPMHLHRYMPGNAAERIKEALQGHSDSLVGGSNELSNELARKISTVQSSITQRQAIIDEAVNIYGERALRDAGIFNYDAKSDTFGVDKDLSDPYTLFNDLAMGKTRSGRALTREQEIQRKLQNGSALGDYLRRMNQGVNGGADDTSLPPALRGGGKGRGMSPRQLAAVLYGETSTNFVELLSQRNRGEEAPRNNFDGIIEAIRGNNNSDTLQKILEHVRSMDEEGVLLASLAGGAGSGDEEMGPPRPGGGSGGGKRRRIIIGEDGLIRRWGGVLFDTAAGIGGFAKRGVKGAWNKLNQFGGWARGKVAGMGGGEGPGFLTRMRGLISGSVRGGFEAVSSFGKGLLGIRDVYDDHGNVVLQGARLEAGEYYQVIDGKMVQLKTLDDIKLGSDIVDSAGNLILAAADLAAAGKLRYYKGGKIQALTQGLASKIGLGFNKVAKLPKRFLDFLSPKAGSIVGKIKDWLNEIPEGEEKTRLQKAFNRVTSLPGKVLGFAKRGVDRLKDMITDNPLTRWWKGRKDGGGGGFSLFSSTGKKTNHILIRIYKLLNQRLPGDPEDESWTEEMEKGVGGGGSTIGRAVRGAYDRAKASLSERFGGRWSRTKAFFGRGRDRLRGWFSGFRGRAGDMLDGYRGARHDIATRYEVERRLAGRDDDVAEFYRSHLNAKGGLSGRKVYGDAKEDLETARDAAGRVINKGKNAAKSAGARLFERLDRMIGLQEMSWFNTMRESVSRAGGDDGIIRTMFAKFGKRNKPPEGDEKRDYLNFFKRWREKRKEKKEKAQGSKGKSGGLWDMVKSLPIIGPIVSILGTVGNILGSITKWGVLKPVGLLGKAAWNVGKFAVTRLAAPAVSAVATAASAVVTAVGWPAILIGGAIAAAGYAAYRIATTTYTQYLDKMRLAQYGFRDYDKWSSDDGAKARYLEDALREYVSYAEDGQASLRGLSGKDVQKLAEGFGINVEEKGEMLAFQAFMLQRFIPIYLRWITALKSMPNSIQLADVGDAKKVSKEDMLTLFNKMKMTKDAKAFSSLTDPRKVNQGFFSKAWDVVTFTPKEFLSGEEVMEVQNEVERAIKSRMDDKKARKYGMAPAVEGIKSAGVDEAINKLGQLDNERNKNLAKVEGWEDGTEQVQIQVDWNAVLDQKDMNAMESVRWKTYGFTTIDNATRTLITVFEKNVIKDIDVKTASYKGDWKKAIASMVPDAIGTPKEDRLKRWFFDRFLPVFMTYLVGVKRYLPTADPLNLKLTGGYLYEISLMMSTAYSLKGGIRQSVWEVNINPLGGEANTNPSSIKAELETLKLLSKEADLAVRNMIKAIRNNGKRARWKDRNKNRSSLEVTDEDEEDSNISSGDSLSSDGARASGYIPSGTSGGVPGNLGQVVDAVGGVRNYAAMTTGSSSINLSDVKDGDYKSLAEKYPIEMLGRKGALNVPNIKALITDAANMMGVPPAVALAMAKAESGFNYTAKNPYASASGLFQFIDGTWDGMMKGYSRKFGIPRVNQMDPWANAILGVQFIRDNIQQAQRDLGGKAPPPAVAYLYHFLGAGGGKKFLEAWKRNPNMAASSAPGITSAILRGNANVFYSNGRIRSVDGVIQELNRRMGAISANEVAADPSKTKDMVAGLSPNSPTNPAAAMGAPAANDPSLSPADNLPADNANRRDDALTQKGAMAAQDAMATAAGNVGPAAPTPTTGGSGTSDASTTAETVASQAAAEGLSATDVAKVKAGAEAQVNAAARPVAAPTSDATASTPTLNGDPIDVQQLKVLIQSRDYLKEIRDILKSNPRAANDTRGGSIQQAANVAPPGSAARRQEITQPTPSLNVSRKAS

Physico‐chemical properties

protein length:	2324 AA
molecular weight:	253565,66800 Da
isoelectric point:	9,49260
aromaticity:	0,07229
hydropathy:	-0,48021

Domains

Domains [InterPro]

DC_0124
STR
1–2025

DC_0124 DC_0301

G3DSA:1.10.530.10
RBD
1927–2101

G3DSA:1.10.530.10

IPR023346
STR
1933–2021

IPR023346

IPR008258
ENZ
1935–2023

IPR008258

cd00254
ENZ
1947–2025

cd00254

QKN86080.1

1 2324

Architecture

STR

RBD

STR 1-2025 | RBD 2026-2101 | RBD 2103-2324

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0124	STR	DC_0124	1	2025	Novel HMM	DC_0124	Central	Low	Positional only	152 proteins / 152 hits
G3DSA:1.10.530.10	RBD	G3DSA:1.10.530.10	1927	2101	Merged direct domain	G3DSA:1.10.530.10	C-terminal	Low	Positional only	95 proteins / 95 hits
IPR023346	STR	IPR023346	1933	2021	Merged direct domain	Lysozyme-like domain superfamily	Central	Low	Positional only	29 proteins / 29 hits
IPR008258	ENZ	DC_0010	1935	2023	InterPro cluster	Transglycosylase SLT domain 1	C-terminal	High	Text match	100 proteins / 142 hits
cd00254	ENZ	DC_0010	1947	2025	InterPro cluster	cd00254	C-terminal	High	Text match	100 proteins / 142 hits
DC_0301	RBD	DC_0301	2103	2324	Novel HMM	DC_0301	C-terminal	Low	Positional only	30 proteins / 30 hits

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Escherichia phage vB_EcoM_EC001 [NCBI]	2739754	Uroviricota > Caudoviricetes > Chimalliviridae > Seoulvirus SPN3US >
Host	Escherichia coli [NCBI]	562	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales

Coding sequence (CDS)

Genbank protein accession

QKN86080.1 [NCBI]

Genbank nucleotide accession

MN445185.1 [NCBI]

CDS location

range 204748 -> 211722
strand -

CDS

TTGTCAACTATCTGGCCAGAAGGGAAACGCGACCAAGTTATCCTCAAGGGGATGCCTAAGCCGGCAGCTGATGCATACGAGGGCTATCAGTCAGCGGCAGCTGCAGCAAAGGACATTTACGCCCATACGAAAGGGGAGCTTGTGAAGACCGAGCGCACGCTGAAGATGCAAGCGCGCCAACTCGGTCCGACGATGAAGAAATACTTGCCGGATGCAGTTACTAAGCGCATCGACAAGTGGTCAAAATCTGACCAGTTAGATTACCAGAACTACGATCCGAATCAGGCATTGATGGATCGTGAACTGGGCGACGTATTCTCAGGTGTGCCAAAGGATGCCGATGAACAACGTCAGCTGCAGGACCGCATGGTAGAGGATAAGCTCCGCGACAGCATCAAAGAGATGCGTGCGGATGCAATGCACCAAACCATGATTGGGATGGCGAAAGACATTAACCTGCTAACCGGGTTAAGCCGTGGGGTATTCTTAAACATCGAGCGTAAGAAACTCGAACTGCAATACCGTACCCTGTTTGCCATCCAAGACATCGTGAAGATGAAGCAGTCGGAGTTCGATCGTAATACGCCTGCTTTAGAAGCCATCGTGAAGAACACGGCATTGCCGGATTACGCGAAGGAAGATTTCTCAGAAGTCCGTTGGGCGAACGTTAAACGCCAGGCTGCGGAATGGATGAACCCGTTGCGTTATGCTGACGGGTTTATGGACATGATTCGCGAAAATACCAAGAAGAAGATTTCTGGTATATTTGGCGAAGGTCGTGGTTTGTTAGAGTCTGTTCTCGGCATGGGTGTTGAAGACGATTTCGGCATGAGCGACAGCTCTTCGTTGACTGCTGAACGTCGCAAAACAAATGCTCGTGATAAAGCAACTGCGTGGGGTAGCGGATTCCTTGCGAAGAAACTACTCGGCCCACAAATCGAGAAACTCCAGAAATGGACTCGTGAGGAGATGGAGAAAAATCCAGAGGTCATGAAACGCCTGCAGAAAGGCGCGTTCACCTTTGGTAATCTTTCCTCTATCTCGAACTCAGCTATCGCAGGCGAAACGCAAGGGCCGTTGGCGGATTTGTTCCGGGTATTGAATGAACTCGGTATTGTCCAACCGCTAAACCGCGAGAAAGCCTTCCTTGACGAGCGTAATGGCGAAACGTTAAGCCGTTCGGCGAAGTTTGACCGTAAAGCATATCTTAGCCTGGTTGAAGTTATTCCTGCCTGGCTGGCAGAGATTAACAAATCTGTCCGTCGTGGCTATGGCGAACATGCCGACCTGGAATATGACATCACCAGCCGTGGTTTCGTAGACCGCAAAGTGGTCGGTAACCGCGTACGCAAGGCGGTTGCAAACGATGAACAACGCCTGCGTCTCCAAAATTCCATTAACAGCACTGTGGATTTTGTTGACCGCGGCAAAACGCTCTCGCAGAAGGATCGACAGCATCTCGCCGACTATATCGAGTCGCGAGCCTCGCAGGGCCGCGCATTCGACGTAGAAGCGATTCTGAAAGACCCGATGCATCTTCATCGGTATATGCCAGGAAACGCCGCAGAACGCATTAAGGAAGCGTTACAGGGGCATTCTGATAGCTTGGTCGGCGGTAGCAACGAATTAAGTAACGAGCTGGCCCGCAAAATCTCCACAGTGCAGTCATCTATCACCCAACGTCAGGCAATTATCGACGAGGCGGTGAATATTTACGGTGAGCGAGCATTGCGCGATGCGGGTATCTTTAACTACGACGCGAAGAGTGACACTTTCGGCGTGGATAAAGACCTGTCCGATCCCTATACCTTGTTTAATGACTTGGCAATGGGTAAGACACGCAGCGGTCGTGCGTTGACTCGTGAGCAGGAGATTCAACGTAAGCTGCAAAACGGTTCGGCGTTAGGCGACTATCTGCGCCGAATGAACCAAGGGGTAAATGGTGGTGCCGATGACACGTCGTTGCCGCCGGCTTTACGTGGCGGTGGTAAAGGCCGCGGAATGTCGCCTCGGCAGTTAGCCGCAGTTCTCTACGGTGAAACCTCGACTAACTTTGTTGAATTGTTGAGTCAACGTAACCGCGGCGAAGAAGCGCCACGGAATAACTTTGACGGCATCATCGAAGCGATTCGGGGTAATAACAACAGTGACACCCTCCAGAAAATTCTGGAACACGTCAGAAGTATGGACGAAGAAGGGGTTCTCCTGGCTTCGTTAGCAGGGGGTGCTGGTTCTGGTGACGAAGAGATGGGACCACCTCGTCCTGGTGGTGGTAGCGGTGGCGGTAAACGCCGTCGTATTATCATCGGTGAAGATGGGCTTATTCGTCGTTGGGGTGGTGTGTTGTTCGACACCGCAGCAGGAATCGGTGGCTTTGCGAAACGTGGTGTTAAGGGTGCCTGGAATAAACTGAACCAGTTCGGTGGCTGGGCACGCGGTAAAGTCGCAGGAATGGGTGGCGGAGAAGGTCCTGGTTTCTTAACCCGGATGCGTGGCCTTATCAGCGGTAGTGTCCGTGGTGGCTTTGAAGCGGTAAGCTCTTTCGGTAAAGGACTACTGGGTATCCGTGACGTTTACGATGACCACGGTAATGTTGTTCTGCAAGGTGCACGTCTGGAAGCTGGAGAATACTATCAGGTCATTGATGGTAAAATGGTTCAGCTGAAAACGCTGGACGACATCAAGCTGGGGAGTGATATTGTTGACTCCGCAGGTAATCTGATATTAGCAGCCGCTGACTTAGCCGCTGCGGGTAAACTCCGCTACTATAAAGGCGGGAAAATCCAAGCACTGACCCAAGGTCTGGCCAGTAAGATTGGCTTAGGCTTTAATAAGGTGGCTAAGCTACCGAAAAGGTTCCTGGATTTCCTGTCACCGAAAGCGGGCAGCATCGTTGGTAAGATTAAGGACTGGCTGAACGAGATTCCGGAAGGCGAAGAAAAGACACGTCTCCAGAAAGCGTTCAACCGTGTAACGAGCTTACCGGGTAAAGTGCTCGGTTTTGCGAAACGTGGTGTCGATCGTCTGAAAGACATGATTACCGACAACCCACTGACGCGTTGGTGGAAAGGCCGTAAAGATGGTGGGGGCGGTGGTTTCAGTCTCTTCTCATCAACCGGCAAGAAAACCAACCACATCCTTATCCGTATCTATAAACTGTTGAACCAACGTTTACCGGGAGATCCGGAAGACGAAAGTTGGACAGAGGAAATGGAGAAGGGCGTCGGGGGTGGCGGTAGTACGATCGGTCGTGCAGTACGCGGGGCGTATGATCGCGCGAAAGCGTCACTGTCTGAACGTTTTGGTGGACGTTGGTCAAGAACAAAAGCGTTCTTTGGTCGTGGACGTGACCGCCTGCGTGGTTGGTTCAGTGGTTTCCGAGGCCGGGCTGGGGATATGCTCGATGGATATCGTGGAGCACGACACGACATTGCTACACGTTACGAAGTTGAACGTCGGTTGGCTGGACGCGACGATGATGTTGCTGAGTTTTATCGCAGCCATTTGAACGCGAAAGGTGGCCTTTCTGGCCGTAAAGTCTACGGCGATGCGAAGGAAGACCTTGAGACCGCCCGTGATGCAGCAGGGAGGGTTATTAACAAAGGGAAGAATGCCGCCAAGTCTGCAGGCGCAAGGTTATTCGAACGCTTGGACCGAATGATTGGCTTGCAAGAGATGTCATGGTTTAACACCATGCGCGAATCAGTATCCCGTGCAGGTGGTGACGATGGCATTATTCGCACCATGTTTGCGAAGTTCGGTAAACGTAACAAGCCGCCTGAAGGTGATGAAAAACGCGATTACCTTAACTTCTTCAAACGTTGGCGTGAGAAACGTAAGGAGAAGAAAGAGAAAGCGCAGGGCTCCAAAGGGAAATCTGGCGGTCTGTGGGATATGGTGAAAAGCTTACCTATCATCGGTCCCATCGTCAGTATCTTGGGAACTGTGGGTAATATACTCGGTTCTATCACGAAATGGGGCGTGTTAAAACCAGTAGGTCTTTTAGGTAAGGCTGCGTGGAATGTCGGTAAGTTCGCAGTAACCCGTTTGGCGGCACCCGCGGTGTCCGCTGTGGCAACTGCGGCATCTGCCGTCGTGACTGCGGTGGGTTGGCCGGCAATTCTTATCGGTGGTGCGATCGCTGCGGCTGGTTACGCCGCGTACAGGATTGCAACGACTACCTATACCCAGTACCTGGATAAGATGCGTTTAGCTCAGTACGGTTTCCGTGATTACGATAAGTGGTCGTCGGACGACGGGGCGAAAGCGCGTTACTTAGAAGACGCATTGCGTGAGTATGTGTCTTACGCGGAAGATGGCCAAGCCAGTCTCCGCGGGCTAAGTGGAAAAGACGTTCAGAAGCTAGCTGAAGGGTTCGGTATTAACGTTGAGGAAAAAGGCGAGATGTTGGCCTTCCAAGCGTTTATGCTTCAGCGCTTTATTCCGATTTATCTCCGCTGGATTACGGCACTGAAGTCAATGCCGAACAGTATCCAGTTGGCTGACGTCGGCGATGCGAAGAAAGTATCGAAAGAGGACATGCTGACTCTCTTCAACAAAATGAAGATGACTAAGGATGCAAAAGCGTTCTCTTCGTTAACAGACCCACGCAAAGTCAACCAAGGTTTCTTCTCGAAAGCTTGGGACGTTGTAACCTTTACACCGAAGGAGTTCTTGAGCGGTGAAGAGGTTATGGAAGTGCAGAATGAAGTCGAGCGTGCAATCAAGTCCAGAATGGACGATAAGAAAGCACGTAAGTACGGAATGGCACCGGCCGTGGAGGGGATTAAGTCCGCGGGCGTTGATGAAGCTATCAACAAACTTGGACAGTTGGATAACGAACGTAATAAAAATCTGGCGAAGGTAGAGGGTTGGGAAGACGGAACAGAGCAGGTTCAGATTCAGGTAGACTGGAATGCGGTGCTCGACCAGAAAGACATGAATGCGATGGAATCGGTGCGTTGGAAGACTTACGGCTTTACCACCATCGATAACGCCACCCGCACGTTGATCACGGTATTCGAGAAGAACGTCATCAAAGACATTGACGTGAAAACCGCAAGCTACAAAGGAGATTGGAAGAAAGCAATCGCCTCGATGGTTCCAGACGCTATCGGTACACCGAAAGAAGATCGTTTGAAGCGGTGGTTCTTTGACCGTTTCTTACCGGTATTCATGACGTATTTGGTTGGGGTGAAGCGTTACCTGCCAACAGCCGATCCGCTGAACTTGAAGCTGACTGGTGGTTACCTGTACGAAATCAGCTTGATGATGTCAACAGCCTACAGCTTGAAAGGTGGTATAAGACAGTCGGTGTGGGAAGTGAATATCAACCCATTAGGGGGTGAGGCTAACACGAACCCATCGTCTATTAAAGCCGAGCTGGAAACGCTGAAGCTGTTGTCAAAAGAAGCTGACCTTGCCGTGCGTAACATGATTAAAGCCATTAGAAATAATGGCAAGCGTGCGCGCTGGAAGGATCGTAACAAGAACCGCAGTTCTCTGGAAGTCACCGATGAAGATGAAGAAGACTCGAACATCAGTTCGGGAGATTCTTTGTCATCTGACGGTGCTCGCGCCTCAGGCTACATTCCATCGGGTACGAGTGGTGGTGTGCCGGGTAACTTGGGTCAAGTCGTCGATGCGGTTGGTGGTGTGCGGAACTACGCTGCAATGACCACTGGTTCGTCTTCGATTAACCTGAGTGATGTGAAAGACGGTGATTATAAGTCACTGGCTGAAAAATACCCGATAGAAATGTTGGGTAGAAAGGGTGCGTTGAACGTTCCGAATATCAAAGCATTGATTACCGATGCGGCGAACATGATGGGCGTGCCACCTGCAGTGGCGTTAGCAATGGCTAAGGCGGAGTCCGGATTTAACTACACCGCTAAAAACCCGTATGCTTCGGCGTCTGGGTTGTTCCAGTTTATTGACGGTACGTGGGACGGGATGATGAAGGGGTATTCGCGGAAGTTCGGTATTCCGCGTGTTAACCAGATGGACCCGTGGGCGAATGCTATATTGGGTGTACAGTTCATTCGTGACAACATCCAACAAGCACAGCGTGACCTGGGTGGTAAAGCACCACCTCCAGCCGTGGCTTATCTGTATCACTTCCTGGGTGCGGGCGGCGGTAAGAAATTCCTGGAAGCATGGAAGCGTAATCCGAATATGGCGGCATCGAGTGCTCCTGGGATTACATCCGCAATATTGAGAGGGAATGCCAACGTCTTCTACAGCAACGGTCGTATACGTAGCGTGGATGGGGTTATTCAGGAACTGAACCGCCGTATGGGCGCAATTTCTGCCAACGAAGTCGCTGCCGATCCGAGTAAGACGAAGGATATGGTTGCAGGCTTGTCGCCTAATTCACCAACCAACCCGGCAGCAGCAATGGGTGCACCGGCCGCTAATGATCCGAGTCTGTCGCCAGCAGATAACCTGCCGGCAGATAATGCTAATCGTCGTGATGACGCATTGACGCAGAAAGGGGCCATGGCGGCACAAGATGCAATGGCTACCGCCGCAGGTAATGTAGGACCAGCAGCACCTACACCAACTACAGGTGGTTCCGGAACATCCGATGCCTCAACAACAGCCGAAACCGTAGCGTCGCAAGCTGCAGCAGAAGGATTGTCTGCAACGGATGTTGCTAAAGTGAAAGCAGGCGCGGAAGCGCAGGTTAACGCAGCAGCTCGTCCAGTTGCCGCCCCAACTTCTGATGCTACAGCATCGACGCCAACGCTGAATGGTGACCCGATAGATGTTCAGCAGCTCAAGGTACTGATTCAGTCTCGCGATTACTTGAAAGAGATTCGTGATATTTTGAAATCAAATCCGAGAGCGGCAAACGACACACGGGGTGGTAGTATCCAGCAAGCGGCAAATGTGGCTCCTCCGGGCTCAGCTGCACGCAGGCAGGAAATAACCCAACCGACACCGTCGTTAAACGTAAGTCGGAAAGCAAGCTAA

Genome Context

Tertiary structure

PDB ID

4aa3fc971e6a54cfadbf1fe3a313f19e78c80b8ce640f16505121500a9cd3120

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,4699

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence