Protein

View in Explore

Genbank accession

WFG41753.1 [GenBank]

Protein name

tail fiber protein

RBP type

Evidence Phold

Probability 1,00

Protein sequence

MAKRGKDGFDDIDLDRLDDWDDFGEPPRPKDEKKRSPILSTLNVARKSALSTIWPEGKRDQVILKGMPKPAADAYEGYQSAAAAAKDIYAHTKGELEKTERTLKMQARQLGPTMKKYLPDAVTKRFDKWSKSDQLDYQNYDPNQALMDRELGDVFSGVPKDADEQRQLQDRMVEDKLRDSIKEMRADAMHQTMIGMAKDINLLTGLSRGVFLNIERKKLELQYRTLFAIQDIVKMKQSEFDRNTPALEAIVKNTALPDYAKEDFSEVRWANVKRQAAEWMNPLRYADGFMDMIRENTKKKISGIFGEGRGLLESVLGMGVEDDFGMSDSSSLTAERRKTNARDKATAWGSGFLAKKLLGPQIEKLQKWTREEMEKNPEVMKRLQKGAFTFGNLSSISNSAIAGETQGPLADLFRVLNELGIVQPLNREKAFLDERNGETLSRSAKFDRKAYLSIVEVIPAWLAEINKSVRRGYGEHADLEYDITSRGFVDRKVVGNRVRKAVANDEQRLRLQNSINSTVDFVDRGKTLSQKDRQHLADYIESRASQGRAFDVEAILKDPMHLHRYMPGNSAERIKEALQGHSDSLVGGSNELSNELARKISTVQSSITQRQAIIDEAVNIYGERALRDAGIFNYDAKSDTFGVDKDLSDPYTLFNDLAMGKTRSGRALTRDQEIQRKLQNGSALGDYLRRMNQGASGGADDTSLPPALRGGGKGRGMSPRQLAAVLYGETSTNFVELLSQRNRGEEAPRNNFDGIIEAIRGNNNSDTLQKILEHVRSMDEEGVLLASLAGGAGSGDEEMGPPRPGGGGGGGKRRRIIIGEDGLIRRWGGVLFDTATGIGGFAKRGVKGAWNKLNQFGGWARGKIAGMGGGEGPGFLTRMRGLISGSVRGGFEAVSSFGKGLLGIRDIYDDHGNVVLQGARLEAGEYYQVIDGKMVQLKTLDDIKLGSDIVDSAGNLVLAAADLAAAGKLRYYKGGKIQALTQGLASKIGLGFNKVAKLPKRFLDFLSPKAGSIVGKIKDWLNEIPEGEEKTRLQKAFNRVTSLPGKVLGFAKRGVDRLKDMITDNPLTRWWKGRKDGGGGGFSLFSSTGKKTNHILIRIYKLLNQRLPGDPEDESWTEEMEKGVGGGGSKIGRAVRGAFDRAKSSLSERFGGRWSRTKAFFGRGRDRLRGWFSGFRGRAGDMLDGYRGARHDIATRYEVERRLAGRSDDVADFYRSHLNAKGGISGRKVYGDAKDDLETARDAAGRVINKGKNAAKSAGARLFERLDRMIGLQEMSWFNTMRESVSRAGGDDGIIRTMFAKFGKRNKPPESDEKRDYFNFFKRWREKRKEKKEKAQGSKGKSGGLWDMVKGLPIIGPIVSILGTVGSILGSITKWGVLKPVGLLGKAAWNVGKFAVTRLAAPAVSAVATAASAVVTAVGWPAILIGGAIAAAGYAAYKIATTTYTQYLDKMRLAQYGFRDYDKWSSDDGAKARYLEDALREYVSYAEDGQASLRGLSGKDVQKLAEGFGINVEEKGEMLAFQAFMLQRFIPIYLRWITALKSMPNSIQLADVGDAKKVSKEDMLTLFNKMKMTKDAKAFSSLTDPRKVNQGFFSKAWDVVTFTPKEFLSGEEVMEVQNEVERAIKFRMDDKKARKYGMAPAVEGIKSAGVDEAINKLGQLDNERNKNLAKVEGWEDGTEQVQIQVDWNAVLDQKDMNAMESVRWKTYGFTTIDNATRTLITVFEKNVIKDIDVKTASYKGDWKKAIASMVPDAIGTPKEDRLKRWFFDRFLPVFMTYLVGVKRYLPTADPLNLKLTGGYLYEISLMMSTAYSLKGGIRQSVWEVNINPLGGDANTNPSSIKAELETLKLLSKEADLAVRNMIKAIKNNGKRARWKDRNKNRSSLEVTGEDEEDSNISSGDSLSSDGARASGYIPSGTSGGVPGNLGQVVDAVGGVRNYAAMTTGSSSINLSDVKDGDYKSLAEKYPIEMLGRKGALNVPNIKALITDAANMMGVPPAVALAMAKAESGFNYTAKNPYASASGLFQFVNGTWDGMMKGYSRKFGIPRVNQMDPWANAILGVQFIRDNIQQAQRDLGGKAPPPAVAYLYHFLGAGGGKKFLEAWKRNPNMAASSAPGITSAILRGNANVFYSNGRIRSVDGVIQELNRRMGAISANEVAADPSKTKDMVAGLSPNSPTNPAAAMGAPAANDPSLSPADNLPADNANRRDDALTQKGAMAAQDAMATAAGNVGPAAPTPTTGGTGTSDASTTAETVASQAAAEGFSATDVAKVKAGAEAQVNAAARPVAAPTSDATASTPTLNGDPIDVQQLKVLIQSRDYLKEIRDILKSNPRAANDTRGGSIQQAANVAPPGSAARRQEITQPTPSLNVSRKAS

Physico‐chemical properties

protein length:	2373 AA
molecular weight:	259113,76540 Da
isoelectric point:	9,49350
aromaticity:	0,07375
hydropathy:	-0,49663

Domains

Domains [InterPro]

DC_0124
STR
1–2078

DC_0124 DC_0301

G3DSA:1.10.530.10
RBD
1976–2150

G3DSA:1.10.530.10

IPR023346
STR
1982–2070

IPR023346

IPR008258
ENZ
1984–2072

IPR008258

cd00254
ENZ
1996–2074

cd00254

WFG41753.1

1 2373

Architecture

STR

RBD

STR 1-2078 | RBD 2079-2150 | RBD 2152-2373

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0124	STR	DC_0124	1	2078	Novel HMM	DC_0124	Central	Low	Positional only	152 proteins / 152 hits
G3DSA:1.10.530.10	RBD	G3DSA:1.10.530.10	1976	2150	Merged direct domain	G3DSA:1.10.530.10	C-terminal	Low	Positional only	95 proteins / 95 hits
IPR023346	STR	IPR023346	1982	2070	Merged direct domain	Lysozyme-like domain superfamily	Central	Low	Positional only	29 proteins / 29 hits
IPR008258	ENZ	DC_0010	1984	2072	InterPro cluster	Transglycosylase SLT domain 1	C-terminal	High	Text match	100 proteins / 142 hits
cd00254	ENZ	DC_0010	1996	2074	InterPro cluster	cd00254	C-terminal	High	Text match	100 proteins / 142 hits
DC_0301	RBD	DC_0301	2152	2373	Novel HMM	DC_0301	C-terminal	Low	Positional only	30 proteins / 30 hits

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Salmonella phage MET_P1_082_240 [NCBI]	3032418	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	No host information

Coding sequence (CDS)

Genbank protein accession

WFG41753.1 [NCBI]

Genbank nucleotide accession

OQ383623.1 [NCBI]

CDS location

range 214929 -> 222050
strand +

CDS

ATGGCAAAAAGAGGCAAAGACGGTTTCGATGATATCGATTTAGATAGACTCGACGACTGGGATGATTTCGGTGAACCACCCCGTCCCAAAGACGAGAAAAAACGAAGCCCGATACTCAGTACCCTGAATGTTGCCAGGAAGTCGGCGTTGTCAACTATCTGGCCAGAAGGGAAACGCGACCAAGTTATCCTCAAGGGGATGCCTAAGCCGGCAGCTGATGCATACGAGGGTTATCAGTCAGCGGCAGCTGCAGCAAAGGACATTTACGCCCATACGAAAGGGGAGCTTGAGAAGACCGAGCGCACGCTGAAGATGCAAGCGCGTCAACTCGGTCCGACAATGAAGAAATACTTGCCGGATGCAGTTACTAAACGCTTCGACAAGTGGTCAAAATCTGACCAGTTAGATTACCAGAACTACGATCCGAATCAGGCATTGATGGATCGTGAACTGGGCGACGTATTCTCAGGTGTGCCAAAGGACGCCGATGAGCAACGTCAGCTGCAGGATCGGATGGTAGAGGACAAGCTCCGTGACAGCATCAAAGAGATGCGCGCGGATGCAATGCACCAAACCATGATTGGGATGGCGAAAGATATTAACCTGTTAACCGGGTTAAGCCGTGGGGTATTCTTAAACATCGAGCGTAAGAAGCTCGAATTGCAATACCGCACCCTGTTCGCCATTCAAGACATCGTGAAGATGAAGCAGTCGGAGTTCGATCGTAACACGCCTGCTTTAGAAGCCATCGTGAAGAACACGGCACTGCCGGATTACGCGAAGGAAGATTTCTCAGAAGTCCGTTGGGCGAACGTTAAACGCCAGGCTGCGGAATGGATGAACCCATTGCGTTATGCTGACGGGTTTATGGACATGATTCGCGAAAATACCAAGAAGAAAATTTCTGGTATATTTGGCGAAGGTCGTGGTTTGTTAGAGTCTGTTCTCGGCATGGGTGTTGAAGACGATTTCGGCATGAGCGACAGCTCTTCGTTGACTGCCGAACGTCGCAAAACAAATGCTCGCGATAAAGCAACTGCGTGGGGTAGCGGATTCCTTGCGAAGAAACTACTCGGTCCACAAATCGAGAAACTCCAGAAATGGACTCGTGAGGAGATGGAGAAAAATCCAGAGGTCATGAAACGCCTGCAGAAAGGCGCGTTCACCTTTGGTAATCTTTCCTCTATCTCGAACTCAGCTATCGCAGGCGAAACGCAAGGACCGTTGGCGGATTTGTTCCGGGTATTGAATGAACTCGGTATTGTCCAACCGTTAAACCGCGAGAAAGCTTTCCTTGATGAGCGTAATGGCGAAACGTTAAGCCGTTCGGCGAAGTTTGACCGTAAAGCGTATCTTAGCATAGTTGAAGTTATTCCTGCCTGGCTGGCAGAGATTAACAAATCTGTTCGTCGTGGCTATGGCGAACATGCCGACCTGGAATACGACATCACCAGTCGTGGTTTCGTAGACCGCAAAGTGGTCGGTAATCGTGTACGAAAAGCGGTTGCAAATGATGAGCAGCGTCTGCGTCTTCAGAATTCCATTAATAGCACTGTGGATTTTGTTGACCGTGGCAAAACACTCTCGCAGAAGGATCGTCAGCATCTTGCCGACTATATTGAGTCGCGTGCCTCGCAGGGCCGTGCATTCGACGTAGAAGCAATTTTGAAAGACCCGATGCATCTTCATCGGTATATGCCAGGAAACTCTGCAGAACGCATTAAGGAAGCGTTACAGGGGCATTCTGATAGCCTGGTCGGTGGTAGCAACGAATTAAGTAACGAACTAGCTCGCAAAATCTCCACAGTGCAGTCATCTATCACCCAACGTCAGGCAATTATCGACGAGGCGGTGAATATTTACGGCGAGCGAGCACTGCGTGATGCGGGTATCTTTAACTACGACGCGAAGAGTGACACCTTCGGCGTGGATAAAGACCTGTCCGATCCCTATACCTTGTTTAATGACTTGGCAATGGGTAAGACACGCAGCGGGCGTGCATTGACTCGTGACCAGGAGATTCAACGTAAGCTGCAAAATGGTTCGGCGTTAGGCGACTATCTGCGCCGAATGAACCAAGGGGCAAGTGGTGGTGCCGATGACACGTCGTTACCGCCGGCTTTACGTGGCGGTGGTAAAGGTCGTGGAATGTCGCCTCGGCAGTTAGCCGCAGTTCTCTACGGTGAAACCTCGACTAACTTTGTTGAGTTGCTGAGTCAACGTAACCGTGGCGAAGAAGCACCACGGAATAACTTTGACGGTATCATCGAAGCGATTCGGGGTAACAACAACAGTGACACCCTCCAGAAAATTCTGGAACACGTCAGAAGCATGGACGAAGAAGGGGTTCTCCTGGCTTCGTTAGCAGGGGGTGCTGGTTCTGGCGATGAAGAAATGGGTCCACCTCGCCCTGGCGGTGGTGGCGGTGGTGGTAAACGCCGTCGTATTATCATCGGTGAGGATGGGCTTATTCGTCGTTGGGGTGGTGTGTTGTTCGACACCGCAACAGGAATCGGTGGCTTTGCAAAACGTGGTGTTAAGGGTGCCTGGAATAAACTGAACCAGTTCGGTGGCTGGGCACGCGGTAAGATCGCAGGGATGGGAGGTGGCGAAGGTCCTGGTTTCTTAACCCGGATGCGTGGCCTTATCAGTGGTAGTGTCCGTGGGGGCTTTGAAGCAGTAAGCTCTTTCGGTAAAGGACTACTGGGTATCCGCGACATTTACGATGACCACGGTAACGTTGTTCTGCAGGGCGCTCGCCTGGAAGCTGGGGAATATTATCAGGTTATTGATGGTAAGATGGTTCAGTTGAAAACACTGGACGACATCAAACTGGGGAGCGACATTGTTGACTCCGCAGGTAATCTGGTATTAGCGGCCGCTGACCTAGCCGCTGCCGGTAAACTCCGCTACTATAAAGGCGGGAAAATCCAAGCACTGACCCAAGGTCTGGCTAGTAAGATTGGTTTAGGCTTTAATAAGGTGGCTAAGCTACCGAAACGGTTCCTGGATTTCCTGTCACCAAAAGCGGGCAGCATCGTTGGTAAGATTAAGGACTGGCTGAACGAAATTCCGGAAGGCGAAGAAAAAACACGTCTCCAGAAAGCGTTCAATCGCGTAACGAGCTTGCCGGGTAAAGTGCTCGGCTTTGCGAAGCGTGGTGTTGACCGTCTGAAAGACATGATTACCGACAACCCACTAACGCGTTGGTGGAAAGGCCGTAAAGATGGTGGGGGTGGTGGTTTCAGTCTCTTCTCATCAACCGGCAAGAAAACCAACCACATCCTTATCCGTATCTATAAACTGTTGAACCAACGTTTACCGGGCGATCCGGAAGACGAAAGTTGGACAGAAGAAATGGAGAAAGGTGTCGGTGGGGGCGGAAGTAAGATTGGCCGTGCTGTACGTGGTGCGTTCGATCGTGCGAAATCATCGTTGTCTGAGCGATTCGGTGGTCGTTGGTCAAGAACAAAAGCGTTCTTTGGCCGTGGCCGCGATCGGTTACGTGGTTGGTTCAGTGGTTTTCGAGGCCGTGCGGGGGATATGCTCGATGGTTATCGCGGAGCACGACACGACATTGCTACACGCTACGAAGTTGAACGTCGATTAGCGGGCCGCAGTGATGACGTCGCCGATTTCTATCGCAGCCATTTGAACGCGAAAGGTGGCATTTCTGGCCGTAAAGTGTACGGTGATGCAAAGGATGACCTTGAAACTGCCCGCGATGCGGCAGGTCGTGTTATCAACAAAGGGAAGAACGCAGCCAAGTCCGCAGGTGCAAGGTTATTCGAACGTTTAGACCGAATGATTGGGCTGCAAGAGATGTCGTGGTTTAACACCATGCGCGAATCTGTATCTCGTGCAGGTGGTGACGATGGCATTATTCGCACCATGTTTGCGAAGTTCGGTAAACGTAATAAGCCACCTGAAAGTGACGAAAAACGCGACTACTTTAACTTCTTCAAACGTTGGCGTGAGAAACGTAAGGAGAAGAAAGAGAAAGCGCAGGGTTCCAAAGGGAAATCCGGCGGTCTGTGGGATATGGTGAAAGGTTTACCTATCATCGGTCCTATCGTCAGTATCCTGGGAACTGTGGGGAGCATACTCGGCTCTATCACGAAATGGGGCGTGTTAAAACCCGTAGGTCTTTTAGGTAAGGCTGCGTGGAACGTTGGTAAGTTCGCAGTAACCCGTTTGGCGGCACCCGCGGTGTCCGCTGTGGCAACTGCAGCGTCTGCCGTCGTGACCGCAGTGGGTTGGCCGGCAATCCTCATCGGTGGTGCGATCGCCGCGGCAGGTTACGCCGCGTACAAGATTGCAACGACTACCTATACCCAGTACCTGGATAAGATGCGTTTAGCTCAGTACGGTTTCCGTGATTACGATAAGTGGTCGTCGGACGACGGGGCGAAGGCGCGTTACTTAGAAGACGCATTGCGTGAGTATGTGTCTTACGCGGAAGATGGTCAAGCCAGTCTCCGCGGACTAAGTGGAAAAGACGTTCAGAAGTTAGCTGAAGGGTTCGGTATCAACGTCGAGGAAAAAGGCGAGATGTTGGCCTTCCAGGCGTTCATGCTTCAGCGCTTCATTCCGATATATCTCCGCTGGATTACGGCACTGAAGTCAATGCCGAACAGTATCCAGTTGGCTGACGTCGGCGATGCGAAGAAAGTATCGAAAGAGGACATGCTGACACTCTTCAACAAAATGAAGATGACTAAGGATGCAAAAGCGTTCTCTTCGTTAACAGACCCACGCAAAGTCAACCAAGGCTTCTTCTCGAAAGCCTGGGACGTTGTAACCTTTACACCGAAGGAGTTTTTGAGCGGTGAAGAGGTTATGGAAGTGCAGAATGAAGTCGAGCGTGCGATCAAGTTCAGAATGGACGATAAGAAAGCACGTAAGTACGGAATGGCACCGGCCGTGGAGGGGATTAAGTCCGCGGGCGTTGATGAAGCTATCAACAAGCTCGGCCAGCTGGATAACGAACGTAACAAAAATCTGGCGAAGGTAGAGGGTTGGGAAGACGGAACAGAGCAGGTTCAGATTCAGGTAGACTGGAACGCGGTACTTGACCAGAAAGACATGAATGCGATGGAGTCGGTACGTTGGAAGACTTATGGTTTTACCACCATCGACAACGCCACACGCACGTTGATTACGGTATTCGAGAAAAACGTCATCAAAGACATTGACGTGAAAACCGCAAGCTACAAAGGCGACTGGAAGAAAGCTATCGCTTCGATGGTTCCAGACGCTATCGGCACACCGAAAGAAGATCGTTTGAAGCGGTGGTTCTTTGACCGTTTCTTACCGGTATTCATGACGTACTTGGTTGGGGTGAAACGCTACCTGCCAACAGCCGATCCGCTGAACTTGAAACTGACCGGCGGTTACCTGTACGAAATCAGTTTGATGATGTCAACAGCCTACAGCTTGAAAGGCGGTATAAGACAGTCGGTGTGGGAAGTGAACATCAACCCATTAGGGGGCGATGCTAACACTAATCCGTCGTCTATTAAAGCCGAACTGGAAACGCTGAAGCTGTTGTCAAAAGAAGCTGACCTTGCCGTGCGTAACATGATTAAAGCCATTAAAAATAATGGCAAGCGTGCACGCTGGAAGGATCGTAACAAGAACCGCAGTTCTCTGGAAGTCACCGGTGAAGATGAAGAAGACTCGAACATCAGTTCGGGAGATTCTTTGTCATCCGACGGTGCTCGCGCCTCAGGCTACATTCCATCGGGCACGAGTGGCGGTGTGCCGGGTAACTTAGGTCAAGTCGTCGATGCGGTCGGTGGTGTGCGGAACTACGCTGCAATGACCACTGGTTCGTCTTCGATTAACCTGAGTGATGTGAAAGACGGTGATTATAAGTCACTGGCTGAAAAATACCCGATAGAAATGTTGGGTAGAAAGGGTGCGTTGAACGTTCCGAATATCAAAGCATTGATTACCGATGCAGCGAACATGATGGGCGTGCCACCTGCAGTGGCGTTAGCAATGGCTAAGGCGGAGTCCGGTTTTAACTACACCGCTAAAAACCCGTATGCTTCGGCGTCTGGGTTGTTCCAGTTTGTTAACGGCACGTGGGACGGGATGATGAAGGGGTATTCGCGGAAGTTTGGTATTCCGCGTGTTAACCAAATGGACCCGTGGGCGAATGCTATATTGGGTGTACAGTTCATTCGTGACAACATCCAACAAGCACAGCGTGACCTGGGTGGTAAAGCACCACCTCCAGCCGTGGCTTATCTGTACCACTTCTTGGGTGCAGGCGGCGGTAAGAAATTCCTGGAAGCATGGAAGCGTAATCCGAATATGGCGGCATCGAGTGCTCCTGGGATTACATCCGCAATACTGAGAGGGAATGCCAACGTTTTCTACAGCAACGGTCGTATACGTAGCGTAGACGGGGTTATTCAGGAACTGAACCGCCGCATGGGCGCAATTTCCGCCAACGAAGTCGCTGCCGATCCGAGCAAGACGAAGGATATGGTTGCAGGATTGTCGCCTAACTCACCAACCAACCCGGCAGCAGCAATGGGTGCACCGGCCGCTAATGACCCGAGTCTGTCGCCAGCAGATAACCTGCCGGCAGATAATGCTAATCGTCGTGATGATGCATTGACGCAGAAAGGGGCCATGGCGGCACAAGATGCAATGGCTACCGCCGCAGGCAATGTGGGACCAGCAGCGCCTACACCAACTACAGGTGGTACCGGAACATCCGATGCCTCAACAACTGCTGAGACTGTAGCGTCGCAAGCTGCAGCAGAAGGATTCTCTGCGACGGATGTTGCTAAAGTGAAAGCAGGCGCGGAAGCGCAGGTTAACGCAGCAGCACGTCCAGTTGCCGCTCCAACTTCTGATGCCACAGCATCGACGCCAACATTGAATGGTGACCCGATAGATGTTCAGCAGCTCAAGGTACTGATTCAATCTCGCGATTACTTGAAAGAGATTCGTGATATTTTGAAATCAAATCCAAGAGCGGCAAACGACACGCGTGGTGGTAGTATCCAGCAAGCGGCAAATGTGGCTCCTCCGGGCTCAGCTGCACGTAGGCAGGAGATAACCCAACCGACGCCGTCTTTAAACGTAAGTCGGAAAGCAAGCTAA

Genome Context

Tertiary structure

PDB ID

3bfc41fcd1a402353d76d2826343d14c9584f6c0ddb95ea609c5f62175c5ea75

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,4441

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence