Protein

View in Explore

Genbank accession

XAN61542.1 [GenBank]

Protein name

tail fiber protein

RBP type

Evidence Phold

Probability 1,00

Protein sequence

MAKRGKDGFDDIDLDRLDDWDDFGEPPRPKDEKKRSPILSTLNVARKSALSTIWPEGKRDQVILKGMPKPAADAYEGYQSAAAAAKDIYAHTKGELEKTERTLKMQARQLGPTMKKYLPDAVTKRFDKWSKSDQLDYQNYDPNQALMDRELGDVFSGVPKDADEQRQLQDRMVEDKLRDSIKEMRADAMHQTMIGMAKDINLLTGLSRGVFLNIERKKLELQYRTLFAIQDIVKMKQSEFDRNTPALEAIVKNTALPDYAKEDFSEVRWANVKRQAAEWMNPLRYADGFMDMIRENTKKKISGIFGEGRGLLESVLGMGVEDDFGMSDSSSLTAERRKTNARDKATAWGSGFLAKKLLGPQIEKLQKWTREEMEKNPEVMKRLQKGAFTFGNLSSISNSAIAGETQGPLADLFRVLNELGIVQPLNREKAFLDERNGETLSRSAKFDRKAYLSLVEVIPAWLAEINKSVRRGYGEHADLEYDITSRGFVDRKVVGNRVRKAVANDEQRLRLQNSINSTVDFVDRGKTLSQKDRQHLADYIESRASQGRAFDVEAILKDPMHLHRYMPGNSAERIKEALQGHSDSLTGGSNELSNELARKISTVQSSITQRQAIIDEAVNIYGERALRDAGIFNYDAKSDTFGVDKDLSDPYTLFNDLAMGKTRSGRALTRDQEIQRKLQNGSALGDYLRRMNQGASGGADDTSLPPALRGGGKGRGMSPRQLAAVLYGETSTNFVELLSQRNRGEEAPRNNFDGIIEAIRGNNNSDTLQKILEHVRSMDEEGVLLASLAGGAGSGDEEMGPPRPGGGSGGGKRRRIIIGEDGLIRRWGGVLFDTAAGIGGFAKRGVKGAWNKLNQFGGWARGKVAGMGGGEGPGFLTRMRGLISGSVRGGFEAVSSFGKGLLGIRDIYDDHGNVVLQGARLEAGEYYQVIDGKMVQLKTLDDIKLGSDIVDSAGNLVLAAADLAAAGKLRYYKGGKIQALTQGLASKIGLGFNKVAKLPKRFLDFLSPKAGSIVGKIKDWLNEIPEGEEKTRLQKAFNRVTSLPGKVLGFAKRGVDRLKDMITDNPLTRWWKGRKDGGGGGFSLFSSTGKKTNHILIRIYKLLNQRLPGDPEDESWTEEMEKGVGGGGSTIGRAVRGAYDRAKASLSERFGGRWSRTKAFFGRGRDRLRGWFSGFRGRAGDMLDGYRGARHDIATRYEVERRLAGRDDDVAEFYRSHLNAKGGLSGRKVYGDAKEDLETARDAAGRVINKGKNAAKSAGARLFERLDRMIGLQEMSWFNTMRESVSRAGGDDGIIRTMFAKFGKRNKPPEGDEKRDYFNFFKRWREKRKEKKEKAQGSKGKSGGLWDMVKGLPIIGPIVSILGTVGNILGSITKWGVLKPVGLLGKAAWNVGKFAVTRLAAPAVSAVATAASAVVTAVGWPAILIGGAIAAAGYAAYKIATTTYTQYLDKMRLAQYGFRDYDKWSSDDGAKARYLEDALREYVSYAEDGQASLRGLSGKDVQKLAEGFGINVEEKGEMLAFQAFMLQRFIPIYLRWITALKSMPNSIQLADVGDAKKVSKEDMQTLFNKMKMTKDAKAFSSLTDPRKVNQGFFSKAWDVVTFTPKEFLSGEEVMEVQNEVERAIKFRMDDKKARKYGMAPAVEGIKSAGVDEAINKLGQLDNERNKNLAKVEGWEDGTEQVQIQVDWNAVLDQKDMNAMESVRWKTYGFTTIDNATRTLITVFEKNVIKDIDVKTASYKGDWKKAIASMVPDAIGTPKEDRLKRWFFDRFLPVFMTYLVGVKRYLPTADPLNLKLTGGYLYEISLMMSTAYSLKGGIRQSVWEVNINPLGGDANTNPSSIKAELETLKLLSKEADLAVRNMIKAIKNNGKRARWKDRNKNRSSLEVTGEDEEDSNISSGDSLSSDGARASGYIPSGTSGGVPGNLGQVVDAVGGVRNYAAMTTGSSSINLSDVKDGDYKSLAEKYPIEMLGRKGALNVPNIKALITDAANMMGVPPAVALAMAKAESGFNYTAKNPYASASGLFQFVNGTWDGMMKGYSRKFGIPRVNQMDPWANAILGVQFIRDNIQQAQRDLGGKAPPPAVAYLYHFLGAGGGKKFLEAWKRNPNMAASSAPGITSAILRGNANVFYSNGRIRSVDGVIQELNRRMGAISANEVAADPSKTKDMVAGLSPNSPTNPAAAMGAPAANDPSLSPADNLPADNANRRDDALTQKGAMAAQDAMATAAGNVGPAAPTPTTGGTGTSDASTTAETVASQAAAEGLSATDVAKVKAGAEAQVNAAARPVAAPTSDATASTPTLNGDPIDVQQLKVLIQSRDYLKEIRDILKSNPRAANDTRGGSIQQAANVPPPGSAARRQEITQPTPSLNVSRKAS

Physico‐chemical properties

protein length:	2373 AA
molecular weight:	259134,69860 Da
isoelectric point:	9,47371
aromaticity:	0,07332
hydropathy:	-0,50400

Domains

Domains [InterPro]

DC_0124
STR
1–2073

DC_0124 DC_0301

G3DSA:1.10.530.10
RBD
1976–2150

G3DSA:1.10.530.10

IPR023346
STR
1982–2070

IPR023346

IPR008258
ENZ
1984–2072

IPR008258

cd00254
ENZ
1996–2074

cd00254

XAN61542.1

1 2373

Architecture

STR

RBD

STR 1-2073 | RBD 2074-2150 | RBD 2152-2373

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0124	STR	DC_0124	1	2073	Novel HMM	DC_0124	Central	Low	Positional only	152 proteins / 152 hits
G3DSA:1.10.530.10	RBD	G3DSA:1.10.530.10	1976	2150	Merged direct domain	G3DSA:1.10.530.10	C-terminal	Low	Positional only	95 proteins / 95 hits
IPR023346	STR	IPR023346	1982	2070	Merged direct domain	Lysozyme-like domain superfamily	Central	Low	Positional only	29 proteins / 29 hits
IPR008258	ENZ	DC_0010	1984	2072	InterPro cluster	Transglycosylase SLT domain 1	C-terminal	High	Text match	100 proteins / 142 hits
cd00254	ENZ	DC_0010	1996	2074	InterPro cluster	cd00254	C-terminal	High	Text match	100 proteins / 142 hits
DC_0301	RBD	DC_0301	2152	2373	Novel HMM	DC_0301	C-terminal	Low	Positional only	30 proteins / 30 hits

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Salmonella phage 1252 [NCBI]	2999047	Viruses > unclassified bacterial viruses >
Host	Salmonella enteritidis [NCBI]	149539	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales

Coding sequence (CDS)

Genbank protein accession

XAN61542.1 [NCBI]

Genbank nucleotide accession

PP695294.1 [NCBI]

CDS location

range 157530 -> 164651
strand -

CDS

ATGGCAAAAAGAGGCAAAGACGGTTTCGATGATATCGATTTAGATAGACTCGACGACTGGGATGATTTCGGTGAACCACCCCGTCCCAAAGACGAGAAAAAACGAAGCCCGATACTCAGTACCCTGAATGTTGCCAGGAAGTCGGCGTTGTCAACTATCTGGCCAGAAGGGAAACGCGACCAAGTTATCCTCAAGGGGATGCCTAAGCCGGCAGCTGATGCATACGAGGGCTATCAGTCAGCGGCAGCTGCAGCAAAGGACATTTACGCCCATACGAAAGGGGAGCTTGAGAAGACCGAGCGCACGCTGAAGATGCAAGCGCGTCAACTCGGTCCGACAATGAAGAAATACTTGCCGGATGCAGTTACTAAACGCTTCGACAAGTGGTCAAAATCTGACCAGTTAGATTACCAGAACTACGATCCGAATCAGGCATTGATGGATCGTGAACTGGGCGACGTATTCTCAGGTGTGCCAAAGGACGCCGATGAGCAACGTCAGCTGCAGGATCGCATGGTAGAGGACAAGCTCCGTGACAGCATCAAAGAGATGCGCGCGGATGCAATGCACCAAACCATGATTGGGATGGCGAAAGATATTAACCTGTTAACCGGGTTAAGCCGTGGGGTATTCTTAAACATCGAGCGTAAGAAGCTCGAATTGCAATACCGCACCCTGTTCGCCATTCAAGACATCGTGAAGATGAAGCAGTCGGAGTTCGATCGTAACACGCCTGCTTTAGAAGCCATCGTGAAGAACACGGCACTGCCGGATTACGCGAAGGAAGATTTCTCAGAAGTCCGTTGGGCGAACGTTAAACGCCAGGCTGCGGAATGGATGAACCCATTGCGTTATGCTGACGGGTTTATGGACATGATTCGCGAAAATACCAAGAAGAAAATTTCTGGTATATTTGGCGAAGGTCGTGGTTTGTTAGAGTCTGTTCTCGGCATGGGTGTTGAAGACGATTTCGGCATGAGCGACAGCTCTTCGTTGACTGCCGAACGTCGCAAAACAAATGCTCGCGATAAAGCAACTGCATGGGGTAGCGGATTCCTTGCGAAGAAACTACTCGGCCCACAAATCGAGAAACTCCAGAAATGGACTCGTGAGGAGATGGAGAAAAATCCAGAGGTCATGAAACGCCTGCAGAAGGGCGCGTTCACCTTTGGTAATCTTTCCTCTATCTCGAACTCAGCTATCGCAGGCGAAACGCAAGGACCGTTGGCGGATTTGTTCCGGGTACTGAATGAACTCGGTATTGTCCAACCGTTAAACCGTGAGAAAGCCTTCCTCGATGAGCGTAATGGCGAAACGTTAAGTCGCTCGGCGAAGTTTGACCGTAAAGCGTATCTTAGCCTGGTTGAAGTTATTCCTGCCTGGCTGGCAGAGATTAACAAATCTGTTCGTCGTGGCTATGGCGAACATGCCGATCTGGAATACGACATCACCAGTCGCGGTTTCGTAGACCGCAAAGTGGTCGGTAACCGTGTACGCAAAGCGGTTGCAAACGATGAGCAGCGCCTGCGTCTCCAAAATTCCATTAACAGCACTGTGGATTTTGTTGACCGTGGCAAAACGCTCTCGCAGAAGGATCGACAGCATCTTGCCGACTATATCGAGTCACGTGCCTCGCAGGGCCGCGCATTCGACGTAGAAGCGATTCTGAAAGACCCGATGCATCTTCATCGGTATATGCCAGGAAACTCTGCAGAACGCATTAAGGAAGCGTTACAGGGGCATTCAGACAGTCTTACTGGTGGTAGCAACGAATTAAGTAACGAACTGGCTCGCAAAATCTCCACAGTGCAGTCATCTATCACCCAACGTCAGGCAATTATCGACGAGGCGGTGAATATTTACGGCGAGCGAGCGTTGCGTGATGCGGGTATCTTTAACTACGACGCGAAGAGTGACACCTTCGGCGTGGATAAAGACCTGTCCGATCCCTATACCTTGTTTAATGACTTGGCGATGGGTAAGACACGCAGCGGGCGTGCATTGACTCGTGACCAGGAGATTCAACGTAAGCTGCAAAATGGTTCGGCGTTAGGCGACTATCTGCGCCGAATGAACCAAGGGGCAAGTGGTGGTGCCGATGACACGTCGTTACCGCCGGCTTTACGTGGCGGTGGTAAAGGCCGCGGAATGTCGCCTCGGCAGCTAGCCGCGGTTCTCTACGGTGAAACCTCGACTAACTTTGTTGAATTGTTGAGTCAACGTAACCGTGGCGAAGAAGCACCACGGAATAACTTTGACGGTATCATCGAAGCGATTCGGGGTAACAACAACAGTGACACCCTCCAGAAAATTCTGGAACACGTCAGAAGTATGGACGAAGAAGGGGTTCTCCTGGCTTCGTTAGCAGGGGGTGCTGGTTCTGGCGATGAAGAAATGGGCCCGCCTCGCCCTGGCGGTGGTAGCGGTGGCGGTAAACGCCGTCGTATTATCATCGGTGAGGATGGGCTTATTCGTCGTTGGGGTGGTGTGTTGTTCGACACCGCAGCAGGAATCGGTGGCTTTGCGAAACGTGGTGTTAAGGGTGCCTGGAATAAACTGAACCAGTTCGGTGGCTGGGCACGCGGTAAAGTCGCAGGAATGGGTGGCGGAGAAGGTCCTGGTTTCTTAACCCGGATGCGTGGCCTTATCAGCGGTAGTGTCCGTGGGGGCTTTGAAGCAGTAAGCTCTTTCGGTAAAGGACTACTGGGTATCCGCGACATTTACGATGACCACGGTAATGTTGTTCTGCAGGGCGCACGCCTGGAAGCTGGGGAATACTACCAGGTTATTGATGGTAAGATGGTTCAGTTGAAAACACTGGACGACATCAAACTGGGGAGTGATATTGTTGACTCCGCAGGTAATCTGGTATTAGCGGCCGCTGACTTAGCCGCAGCCGGTAAACTCCGCTACTATAAAGGCGGGAAAATCCAAGCGCTGACCCAAGGTCTGGCCAGTAAGATTGGTTTAGGCTTTAATAAGGTGGCTAAGCTACCGAAACGGTTCCTGGATTTCCTGTCACCAAAAGCGGGCAGCATCGTTGGTAAGATTAAGGACTGGCTGAACGAGATTCCGGAAGGCGAAGAAAAGACACGTCTCCAGAAAGCGTTCAACCGTGTAACGAGCTTACCGGGTAAAGTGCTCGGTTTTGCGAAACGTGGTGTCGATCGTCTGAAAGACATGATTACCGACAACCCACTGACGCGTTGGTGGAAAGGCCGTAAAGATGGTGGGGGTGGTGGTTTCAGTCTCTTCTCATCAACCGGCAAGAAAACCAACCACATCCTTATCCGTATCTATAAACTGTTGAACCAACGTTTACCGGGAGATCCGGAAGACGAAAGTTGGACAGAGGAAATGGAGAAGGGCGTCGGGGGTGGCGGTAGTACGATCGGTCGTGCAGTACGCGGGGCGTATGATCGTGCGAAAGCGTCATTGTCTGAACGTTTTGGTGGACGTTGGTCAAGAACAAAAGCGTTCTTTGGTCGTGGACGTGACCGCCTGCGTGGTTGGTTCAGTGGTTTCCGAGGCCGGGCTGGGGATATGCTCGATGGATATCGTGGAGCACGACACGACATTGCTACACGTTACGAAGTTGAACGTCGGTTGGCTGGACGCGATGACGATGTTGCTGAGTTTTATCGCAGCCATTTGAACGCGAAAGGTGGCCTTTCTGGCCGTAAAGTCTACGGCGATGCGAAGGAAGACCTTGAGACCGCCCGTGATGCAGCAGGGAGGGTTATCAACAAAGGGAAGAATGCCGCCAAGTCAGCAGGTGCAAGGTTATTCGAACGCTTGGACCGAATGATTGGCTTGCAAGAGATGTCGTGGTTTAACACCATGCGCGAATCAGTATCCCGTGCAGGTGGCGACGATGGCATTATTCGTACCATGTTTGCGAAGTTCGGTAAACGTAACAAGCCGCCTGAAGGTGATGAAAAACGCGACTACTTTAACTTCTTCAAACGTTGGCGTGAGAAACGTAAGGAGAAGAAAGAGAAAGCGCAGGGCTCCAAAGGGAAATCTGGCGGTCTGTGGGATATGGTGAAAGGCTTACCTATCATCGGTCCCATCGTCAGTATCTTGGGAACTGTGGGTAATATACTCGGTTCTATCACGAAATGGGGCGTGTTAAAACCCGTAGGTCTTTTAGGTAAGGCTGCGTGGAACGTTGGTAAGTTCGCAGTAACCCGTTTGGCGGCACCCGCGGTGTCCGCTGTGGCAACTGCGGCATCTGCCGTCGTGACAGCAGTGGGCTGGCCGGCAATTCTTATCGGTGGCGCGATCGCTGCGGCAGGTTACGCCGCGTACAAGATCGCAACGACTACCTATACCCAGTACCTGGATAAGATGCGTTTAGCTCAGTACGGTTTCCGTGATTACGATAAGTGGTCGTCGGACGACGGGGCGAAGGCGCGTTACTTAGAAGACGCATTGCGTGAGTATGTGTCTTACGCGGAAGATGGCCAAGCCAGTCTCCGCGGACTAAGTGGAAAAGACGTTCAGAAGTTAGCTGAAGGGTTCGGTATCAACGTTGAGGAAAAAGGCGAGATGTTGGCCTTCCAAGCGTTTATGCTTCAGCGCTTCATTCCGATTTATCTCCGCTGGATTACGGCACTGAAATCGATGCCGAACAGTATCCAGTTGGCTGACGTCGGCGATGCGAAGAAAGTATCGAAAGAGGACATGCAGACACTCTTCAACAAAATGAAGATGACTAAGGATGCAAAAGCGTTCTCTTCGTTAACTGACCCACGCAAAGTCAACCAAGGTTTCTTCTCGAAAGCTTGGGACGTTGTAACCTTTACACCGAAGGAGTTTTTGAGCGGTGAAGAGGTTATGGAAGTGCAGAATGAAGTTGAGCGTGCAATCAAGTTCAGAATGGACGATAAGAAAGCACGTAAGTACGGAATGGCACCGGCTGTAGAGGGGATTAAGTCCGCGGGCGTTGATGAAGCTATCAACAAACTTGGACAGTTGGATAACGAACGTAATAAAAATCTGGCGAAGGTAGAGGGTTGGGAAGACGGAACAGAGCAGGTTCAGATTCAGGTAGACTGGAATGCGGTGCTCGACCAGAAAGACATGAATGCGATGGAGTCGGTACGTTGGAAGACTTATGGTTTTACCACCATCGACAACGCCACACGCACGTTGATTACGGTATTCGAGAAAAACGTCATCAAAGACATTGACGTGAAAACCGCAAGCTACAAAGGTGATTGGAAGAAAGCAATCGCCTCAATGGTTCCAGACGCTATCGGCACACCGAAAGAAGATCGTTTGAAGCGGTGGTTCTTTGACCGTTTCTTACCGGTATTCATGACGTACTTGGTTGGGGTGAAACGCTACCTGCCAACAGCTGATCCGCTGAACTTGAAACTGACCGGCGGTTACCTGTACGAAATCAGTTTGATGATGTCAACAGCTTATAGCTTGAAGGGCGGTATAAGACAGTCGGTGTGGGAAGTGAATATCAACCCATTAGGGGGCGATGCTAACACGAACCCGTCGTCTATCAAAGCCGAGCTGGAAACGCTGAAGCTGTTATCAAAAGAAGCTGACCTTGCCGTGCGTAACATGATTAAAGCCATTAAAAATAATGGCAAGCGTGCACGCTGGAAGGATCGTAACAAGAACCGCAGTTCTCTGGAAGTCACCGGTGAAGATGAAGAAGACTCGAACATCAGTTCGGGAGATTCTTTGTCATCTGACGGTGCTCGCGCCTCAGGCTACATTCCATCGGGCACGAGTGGCGGTGTGCCGGGTAACTTAGGTCAAGTCGTCGATGCGGTTGGTGGTGTGCGGAACTACGCTGCAATGACCACTGGTTCGTCTTCGATTAACCTGAGTGATGTGAAAGACGGTGATTATAAGTCACTGGCTGAAAAATACCCGATAGAAATGTTGGGTAGAAAGGGTGCGTTGAACGTTCCGAATATCAAAGCATTGATTACCGATGCAGCGAACATGATGGGCGTGCCACCTGCAGTGGCGTTAGCAATGGCTAAGGCGGAGTCCGGATTTAACTACACCGCTAAAAACCCGTATGCTTCGGCATCTGGGTTGTTCCAGTTTGTTAACGGCACGTGGGACGGGATGATGAAGGGGTATTCGCGGAAGTTTGGTATTCCGCGTGTTAACCAGATGGACCCGTGGGCGAATGCTATTTTGGGTGTACAGTTCATTCGTGACAACATCCAACAAGCACAACGTGACCTGGGTGGTAAAGCACCACCTCCAGCCGTGGCTTATCTGTACCACTTCCTGGGTGCAGGCGGCGGTAAGAAATTCCTGGAAGCATGGAAGCGTAATCCGAATATGGCGGCATCAAGTGCTCCTGGGATTACATCTGCAATACTGAGAGGGAATGCCAACGTCTTCTACAGCAACGGTCGTATACGTAGCGTAGACGGGGTTATTCAGGAACTGAACCGCCGCATGGGTGCAATTTCCGCCAACGAAGTCGCTGCCGATCCGAGCAAGACGAAGGATATGGTTGCAGGCTTGTCGCCTAATTCACCAACCAACCCGGCAGCAGCAATGGGTGCACCGGCCGCTAATGACCCGAGTCTGTCGCCAGCAGATAACCTGCCAGCAGATAATGCTAATCGTCGTGATGACGCATTGACGCAGAAAGGGGCCATGGCGGCACAAGATGCAATGGCTACCGCCGCAGGTAATGTAGGACCAGCAGCACCTACACCAACCACAGGCGGTACCGGAACATCCGATGCCTCAACAACGGCCGAAACCGTAGCGTCGCAAGCTGCAGCAGAAGGATTGTCTGCGACGGATGTTGCTAAAGTGAAAGCAGGCGCGGAAGCGCAGGTTAACGCAGCAGCTCGTCCAGTTGCCGCTCCAACTTCTGATGCTACAGCATCGACGCCAACGCTGAATGGTGACCCGATAGATGTTCAGCAGCTCAAGGTACTGATTCAGTCTCGCGATTACTTGAAAGAGATTCGTGATATTTTGAAATCAAATCCAAGAGCGGCAAACGACACACGGGGTGGTAGTATCCAGCAAGCGGCAAATGTGCCTCCTCCTGGCTCAGCTGCACGTAGGCAGGAAATAACCCAACCGACACCGTCGTTAAACGTAAGTCGGAAAGCAAGCTAA

Genome Context

Tertiary structure

PDB ID

36f312ab7fa16fd2322abaf6fbf4b4ac1b9a09b7a589e7603e11d386d8b14d6d

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,4635

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence