Protein
View in Explore- UniProt accession
- A0AAE9VY70 [UniProt]
- Protein name
- Tail fiber protein
- RBP type
-
TFTFTFTF
- Protein sequence
-
MAEYKLSELNSIDTVRSEDLLHLRIIKRSDMLGDEDRKMTYANFLASFKLERFLQLTGGDMTGNLGIVKLRYGGKDLLDPTGSSEVILGDTAKTFRINASALRLTVNDATRSATVYHTLNKPSPNELGMRTNTENDARYAMKETENTFLARQIININGVGLTLKSVLPDGGAYIEARDSNNALRFTVGNLTSGTDVTLVNSKGATLTLGTNSVSVDKNFEINGQVQPNNWNNLDARFFTQTAADQRFARLNASNHFVGVNNFNGKTYVIADSNALNLRATTENAALFMRGYNSAGTGTWYVGQPDGTQSEIVLANQMTNVNLKIATEFSFNKAINVTGQVKPSDFSNFDTRYVPSSLTNVLARTNAANVFTNPQTIVTTDAAFTLQSGTANSPLYIVGANADGNRRWYVGNGEGSRPNSLFLYNYSSGGVQLEIADTFMFNRSVLVTGQVQPTDWTNFDTRYYTQSAANSRYMLSGVSGTGTEVGDATGIAWNAKTGLYSVTNSTGGSTHLVYQMYLGVGASTPTAQFKFNYKNTGIYYRTARDEFGFEEAWAKIYTDKDKPTPSELGAYTKAEVDQRIASAVTDATDLKKVYPVGIVTFFASNVNPNTAFPGTTWTYLTEGANRTIRIGSENGSDVKGLGGADTVALSVGHIPAHTHGFSGTTSWFDYGTKYTDGQGAHDHDRGNMEISGNFGWFRSDNNSFYVADGAFAMSGSQGGHSWTGSNFTYGAPVNFYASRTWTGRTSWVGAHAHGVGIGGHNHTFSGNTGATGSGAAFSVLNTYIKLMAWVRTA
- Physico‐chemical
properties -
protein length: 792 AA molecular weight: 85781,80350 Da isoelectric point: 6,72112 aromaticity: 0,10859 hydropathy: -0,35467
Domains
Domains [InterPro]
DC_1993
STR
115–359
STR
115–359
G3DSA:6.20.80.10
STR
158–217
STR
158–217
IPR048388
ATT
168–246
ATT
168–246
1
792
Architecture
STR 115-167 | ATT 168-246 | STR 247-271 | ATT 272-357 | STR 358-382 | ATT 383-474 | STR 475-788 |
Legend:
ATT
STR
RBD
CBM
LEC
ENZ
CHP
LNK
TAS
TTP
UNK
Unmapped
Taxonomy
| Name | Taxonomy ID | Lineage | |
|---|---|---|---|
| Phage |
Shigella phage SFPB [NCBI] |
3017292 | Uroviricota > Caudoviricetes > Andersonviridae > Mooglevirus > Mooglevirus SFPB |
| Host |
Shigella flexneri [NCBI] |
623 | cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales |
Coding sequence (CDS)
Coding sequence (CDS)
Genbank protein accession
WBF69585.1
[NCBI]
Genbank nucleotide accession
OQ031072
[NCBI]
CDS location
range 14797 -> 17175
strand +
strand +
CDS
ATGGCTGAATATAAGCTAAGTGAGCTAAACAGTATTGATACAGTTCGCTCAGAAGATTTACTTCACCTAAGAATTATCAAAAGGTCTGATATGCTAGGTGATGAAGACCGTAAAATGACCTATGCAAATTTCCTTGCCTCTTTCAAACTAGAAAGATTCTTACAACTAACTGGTGGGGATATGACAGGGAATCTTGGCATCGTCAAATTAAGATACGGTGGAAAAGACTTATTAGACCCAACAGGTTCTTCTGAGGTTATTCTCGGTGACACTGCCAAGACCTTTAGAATTAATGCGAGTGCTTTAAGATTAACTGTAAACGATGCCACAAGGTCTGCAACAGTTTATCACACACTTAATAAACCATCTCCTAATGAATTAGGTATGAGAACTAATACTGAAAATGATGCAAGATATGCTATGAAGGAAACTGAAAATACTTTCTTGGCAAGACAAATCATTAATATCAACGGTGTTGGTCTAACACTTAAAAGTGTCTTACCAGATGGTGGAGCATATATTGAAGCAAGAGATTCAAATAATGCTTTGAGATTCACAGTTGGTAACTTGACTTCTGGTACTGATGTTACATTAGTTAATAGTAAGGGTGCTACGTTGACTCTTGGCACAAACTCTGTTAGTGTTGATAAGAATTTTGAAATCAATGGGCAGGTCCAGCCTAATAACTGGAATAACCTTGATGCAAGATTCTTTACACAGACTGCTGCTGACCAGAGATTTGCAAGACTTAATGCAAGTAATCACTTTGTTGGTGTTAATAACTTCAATGGTAAGACTTATGTTATTGCAGATAGTAATGCACTTAACTTAAGAGCGACTACAGAGAATGCTGCATTGTTTATGCGTGGTTATAACAGTGCTGGGACAGGAACTTGGTATGTAGGTCAACCAGATGGTACGCAGTCTGAGATTGTTTTAGCAAACCAGATGACAAATGTTAACTTGAAAATTGCTACAGAGTTTTCATTTAACAAAGCTATCAATGTAACTGGTCAGGTGAAACCAAGTGACTTTTCTAACTTTGATACAAGATATGTTCCAAGCTCTTTAACGAACGTTCTTGCAAGAACTAATGCTGCAAACGTTTTTACTAACCCACAAACTATTGTTACTACAGATGCGGCTTTCACATTGCAAAGTGGGACAGCTAATTCACCACTGTATATTGTTGGTGCTAATGCAGACGGAAACAGACGTTGGTATGTTGGTAACGGTGAAGGTAGTAGACCAAATTCTCTATTTCTATACAACTACTCAAGCGGTGGTGTACAGTTAGAAATTGCTGATACTTTCATGTTCAATAGAAGCGTATTAGTAACTGGTCAGGTTCAGCCTACAGATTGGACAAACTTTGATACAAGATACTACACACAATCTGCTGCAAACTCAAGGTATATGCTATCTGGTGTATCTGGAACGGGAACCGAAGTTGGTGATGCAACAGGTATTGCTTGGAATGCAAAAACAGGTTTGTACAGTGTTACAAATTCAACTGGTGGGTCTACTCACTTAGTTTACCAAATGTACCTTGGAGTTGGCGCATCTACACCAACTGCACAGTTTAAATTTAACTACAAGAATACTGGAATCTATTATAGAACAGCAAGGGATGAGTTTGGTTTTGAAGAGGCTTGGGCTAAAATCTACACCGACAAAGACAAACCTACACCCTCTGAACTTGGTGCTTACACCAAGGCTGAAGTGGACCAACGTATTGCTTCCGCTGTAACTGATGCTACAGACCTTAAGAAAGTGTATCCGGTTGGTATTGTGACGTTCTTTGCTTCTAATGTCAACCCAAATACAGCTTTCCCAGGCACTACTTGGACTTACTTAACTGAGGGTGCAAACAGAACTATTAGGATTGGTTCTGAAAATGGTTCTGATGTGAAGGGTCTTGGTGGTGCTGATACGGTTGCATTAAGTGTTGGTCATATCCCTGCACACACTCACGGCTTCTCTGGAACAACTTCTTGGTTTGACTATGGAACTAAGTACACAGATGGTCAGGGTGCTCACGACCATGACAGAGGTAATATGGAAATCTCTGGTAACTTTGGATGGTTTAGAAGTGATAATAACTCGTTCTACGTTGCAGACGGTGCTTTTGCAATGAGTGGTAGCCAAGGTGGGCATAGCTGGACAGGTTCTAACTTCACTTATGGTGCGCCAGTTAACTTCTATGCTTCCAGAACTTGGACAGGTAGAACTAGTTGGGTAGGTGCTCATGCTCACGGTGTAGGTATTGGTGGACACAACCACACATTCAGTGGTAACACTGGGGCAACTGGTTCTGGTGCAGCATTCAGTGTTCTTAACACTTACATTAAACTAATGGCTTGGGTAAGAACTGCATAA
Genome Context
Genome Context
Tertiary structure
PDB ID
abde0f237a4b012182238118050403a279539ec5a39f96fb79d573da25abcd6c
Model Confidence
Very high
pLDDT > 90
pLDDT > 90
High
90 > pLDDT > 70
90 > pLDDT > 70
Low
70 > pLDDT > 50
70 > pLDDT > 50
Very low
pLDDT < 50
pLDDT < 50