Protein

Genbank accession
YP_010076863.1 [GenBank]
Protein name
long tail fiber protein distal subunit
RBP type
TSP
Evidence DepoScope
Probability 1,00
TSP
Evidence RBPdetect
Probability 0,86
TF
Evidence RBPdetect2
Probability 0,94
Protein sequence
MATLKQIQFKRSKTAGQRPAASVLAEGELAINLKDRVLFTKDDQGNIIDLGFAKGGSIDGNVIHKGNYNQTGDYTLNGTFTQTGNFNLTGIARVTRDIIAAGQIMTEGGELITKSSGTAHVRFHDSADRERGIIFSPANDGLTTQVVNIRVQDYKAGSESTFAFNGNGLFSSPEVFGWKSVSTPVIYTNKVITNKKVKDDYDIYSTADNVPLSESTTAINHLRVMRNAVGSGIFHEVKDNDGITWYSGDGLDVYLWSFTWSGGIKSSHSISIGLTPGPKDYSILGPSSIALGDNDTGFKWHQDGYYFSVNNGTKTFLFSPSETTSLRKFVAGYSTNGTDLTTPPTENYALATVVTYHDNNAFGDGQTLLGYYQGGNYHHYFRGKGTTNINTHGGLLVTPGNIDVIGGSVNIDGRNNASTAMFKGNTTGSSSVDNMTISVWGNTFTNPSVGNRKNVMEISDATSWMSYIQRLTTGEVEMNVNGSFESSGVTAGNRGVHTTGEISSGAVNALRIWNADYGAIFRRSEGSLHIIPTAYGEGKYGDIGPLRPFSMALDTGKVTIPDLQSSYNTFAANGYIKFVGHGAGAGGYDIQYAQAAPIFQEIDDDAVSKYYPIVKQKFLNGKAVWSLGTEISSGTFVIHHLKEDGSQGHTSRFNQDGTVNFPDNVSVGGGEATIARNGNIWSDIWKTFTSAGDVTNIRDAIATRVAKEGDTMTGRLTLSAGNDALVLTAGAGASSHIRSDVGGTGNWYIGKGGGDNGLSFYSYITQAGVNITNNGEIALSPQGQGAFNFNRDRLHINGTQWVAHKSGAFGDQWSLEAPIFIDFGSVSNDCYYPIIKGKSAITNEGYISGVDFGMRRITNNWAQGIIRVGNQENGSDPQAVYEFHHNGTLYVPNMVKTGARLSAGGGDPVWTGPCLVIGDNDTGLVHGGDGRINMVANGVHIASWSSAYHLHEGLWDTTGALWTEQGRAIISFGHLIQQSDAYSTFVRDVYVRSDIRVKKDLVKFENASQKLSKINGYTYMQKRGLDEEGNQKWEPNAGLIAQEVQAILPELVEGDPDGEALLRLNYNGVIGLNTAAINEHTAEIAELKSEIEELKALVKSLLK
Physico‐chemical
properties
protein length:1103 AA
molecular weight: 118806,26370 Da
isoelectric point:5,74826
aromaticity:0,09610
hydropathy:-0,32575

Domains

Domains [InterPro]
Legend: Pfam SMART CDD TIGRFAM HAMAP SUPFAM PRINTS Gene3D PANTHER Other

Taxonomy

  Name Taxonomy ID Lineage
Phage Shigella phage SH7
[NCBI]
1913049 Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host No host information

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
YP_010076863.1 [NCBI]
Genbank nucleotide accession
NC_054942 [NCBI]
CDS location
range 151546 -> 154857
strand +
CDS
ATGGCTACTTTAAAACAAATACAATTTAAAAGAAGCAAAACGGCAGGTCAACGTCCAGCTGCTTCAGTATTAGCCGAAGGTGAATTGGCTATAAACTTAAAAGATCGTGTACTTTTTACTAAAGATGATCAAGGAAATATTATTGACTTAGGTTTTGCTAAAGGCGGTAGTATTGACGGGAATGTTATTCATAAAGGCAATTATAACCAAACTGGCGATTATACTTTAAACGGTACATTCACCCAGACTGGTAATTTTAATTTAACCGGTATTGCTCGAGTAACTCGTGATATTATTGCTGCTGGGCAGATTATGACTGAAGGCGGAGAACTTATTACAAAAAGTTCAGGAACGGCACACGTTCGTTTTCATGATTCCGCCGACCGTGAACGCGGTATTATTTTTTCTCCTGCTAATGACGGTTTAACTACACAGGTAGTTAACATCAGAGTTCAAGATTACAAAGCTGGTTCAGAAAGCACTTTCGCTTTTAATGGAAATGGTTTGTTTTCTTCACCAGAAGTTTTTGGGTGGAAATCTGTATCAACTCCGGTAATTTATACCAATAAAGTTATCACCAATAAAAAAGTTAAAGATGATTATGACATCTATTCGACGGCAGACAATGTTCCATTGTCTGAAAGCACTACTGCTATTAATCATCTTCGTGTTATGCGTAATGCAGTTGGTTCTGGTATTTTCCATGAAGTTAAAGATAATGATGGAATAACATGGTATAGTGGAGATGGATTAGACGTTTATCTTTGGTCATTTACTTGGAGCGGCGGAATTAAATCAAGTCACTCAATTTCCATCGGTTTAACACCCGGACCTAAGGATTACTCAATATTAGGACCGTCTAGTATCGCTTTAGGAGATAATGATACTGGATTTAAATGGCATCAAGACGGATATTATTTCAGTGTTAACAATGGCACAAAAACGTTTTTATTTAGTCCCAGCGAAACAACTAGCCTAAGAAAATTTGTAGCTGGATATTCTACTAACGGAACCGATTTAACTACTCCTCCAACTGAAAATTATGCTCTTGCTACTGTAGTGACATACCATGATAATAACGCGTTTGGGGATGGTCAGACTCTTTTAGGATATTATCAAGGCGGTAACTATCATCACTATTTCCGCGGTAAAGGTACCACAAACATTAATACTCACGGTGGTTTGTTAGTTACTCCTGGTAATATTGATGTTATTGGCGGTTCTGTTAATATCGATGGTAGAAATAATGCTTCTACAGCGATGTTTAAAGGTAACACAACAGGTAGTAGTTCTGTGGATAACATGACAATTTCCGTTTGGGGCAATACGTTTACTAATCCTAGTGTAGGTAATCGTAAAAACGTCATGGAAATTTCTGATGCAACTAGCTGGATGAGTTATATTCAAAGACTTACAACAGGTGAAGTAGAAATGAACGTTAACGGTTCATTTGAATCATCTGGTGTTACTGCTGGAAATAGAGGAGTTCACACAACGGGCGAAATTTCATCTGGGGCTGTGAATGCGCTTCGTATTTGGAACGCAGATTATGGAGCTATTTTTAGACGTTCAGAAGGCAGTCTTCATATTATTCCAACTGCTTACGGTGAAGGTAAATATGGCGATATCGGTCCACTTCGCCCGTTTAGTATGGCTTTAGATACCGGTAAAGTTACTATTCCAGATTTACAATCAAGTTACAATACGTTTGCTGCTAACGGTTATATTAAATTTGTTGGTCATGGAGCGGGTGCCGGCGGTTATGACATTCAATATGCTCAAGCGGCTCCTATTTTCCAGGAAATTGATGATGATGCTGTAAGCAAATATTATCCTATTGTTAAACAGAAGTTTTTAAATGGTAAAGCTGTTTGGTCTTTAGGTACTGAAATTAGTTCAGGTACATTCGTTATTCATCATCTGAAAGAAGATGGTTCACAAGGCCATACGTCTCGTTTTAATCAAGACGGTACTGTTAACTTCCCAGATAACGTTTCTGTCGGCGGCGGTGAAGCTACTATTGCTCGCAATGGTAATATCTGGTCTGATATCTGGAAAACGTTTACTTCAGCAGGCGACGTAACTAATATTCGCGATGCAATAGCTACTCGTGTTGCTAAAGAAGGTGATACGATGACCGGTAGGTTGACTTTATCTGCTGGAAATGATGCCCTTGTTTTAACTGCAGGCGCGGGTGCTTCATCGCACATCCGTAGTGATGTAGGTGGTACAGGTAACTGGTATATAGGCAAAGGCGGCGGCGACAATGGTCTAAGTTTTTACAGTTACATTACACAAGCCGGTGTGAACATAACAAATAACGGCGAAATAGCGCTTTCTCCTCAAGGACAAGGAGCGTTTAATTTTAATAGAGACCGCCTTCATATAAACGGTACACAATGGGTTGCGCATAAATCTGGCGCCTTTGGTGACCAATGGAGTTTAGAAGCTCCGATATTTATAGATTTTGGTAGTGTCAGTAATGACTGCTATTATCCTATTATTAAAGGAAAATCTGCTATTACTAATGAAGGATACATATCTGGTGTTGATTTTGGTATGCGTCGTATCACTAATAACTGGGCGCAAGGTATTATTCGTGTAGGTAACCAGGAAAACGGTTCTGACCCACAAGCTGTATATGAATTTCACCATAACGGAACTCTGTATGTTCCTAACATGGTTAAAACTGGAGCAAGATTATCAGCTGGCGGCGGCGACCCGGTGTGGACTGGGCCATGTCTTGTTATTGGTGATAATGATACTGGTTTAGTCCATGGCGGTGATGGCCGAATCAATATGGTTGCCAATGGTGTTCATATTGCTTCATGGTCATCTGCTTATCATCTCCATGAAGGTCTTTGGGATACTACTGGTGCTTTGTGGACTGAGCAAGGAAGAGCTATTATTTCTTTTGGTCATTTAATCCAACAGAGTGATGCCTATTCTACATTTGTCCGTGATGTTTATGTCCGTTCTGATATTCGCGTTAAAAAAGACCTCGTTAAATTTGAAAATGCTTCTCAGAAGCTTTCTAAAATTAACGGTTACACTTATATGCAGAAGCGAGGCCTGGATGAGGAAGGTAATCAGAAATGGGAACCTAACGCTGGTTTAATTGCTCAAGAAGTTCAAGCTATTTTACCAGAATTAGTTGAAGGCGACCCTGATGGTGAAGCTTTACTTCGTTTGAACTATAACGGTGTAATTGGTTTAAATACAGCTGCAATCAATGAGCATACTGCAGAAATTGCGGAACTTAAATCAGAAATTGAAGAACTTAAAGCATTAGTTAAATCATTGTTAAAATAA

Gene Ontology

No Gene Ontology terms available.

Enzymatic activity

No enzymatic activity data available.

Tertiary structure

PDB ID
f0850df02886089c46b03246e0628eb3a305798b42d25506438f52f021805894
ESMFold
Source ESMFold
Method ESMFold
Resolution 0,5282
Evidence 0,5282

Literature

Title Authors Date PMID Source
Characterization of two polyvalent phages infecting Enterobacteriaceae Hamdi,S., Rousseau,G.M., Labrie,S.J., Tremblay,D.M., Kourda,R.S., Slama,K.B. and Moineau,S. GenBank