Protein

Genbank accession
YP_013395997.1 [GenBank]
Protein name
structural component of the tail fiber
RBP type
TF
Evidence UniProt/TrEMBL
Probability 1,00
TF
Evidence GenBank
Probability 1,00
TF
Evidence Phold
Probability 1,00
Protein sequence
MAGGRRFQAGLGSEHKRLYKEGQQINTLLLAQVIQVNYKYNTVDLLALQHKEVFQNSYANEGRFSARLPMEFGGRNLAGQPYGQVNPIAVGTVVLVGFINSDKDMPIVISVYNNNDVNKQLSRTRFANADPTDMALAGQMYQKFSLYPSLTYDSIDGDGNRVVTFSGKSFIAFDTKDMQNSPMTDASYGSRYEDLGTSYYNDGELIEPMKGRAPNVLFKHQGILDDDNKPDTHNFMIHINPDGTYRTSMMDTEQDWRTMFEMTPEGKIRLRRQGDTVRLNDGFEIGELGINEEGIVYLRNGDMDLEVREDGIYSQGKLITENINLDDIYEKLANVTFEINKTNESLQILTEKSELQDGKIVNLETEITIVAGKVESKVSATEVQDMIDSSIVDMTDAIKKAQEDADRANKVISDMASDNRLAPSEKLELLKEWDTIKNEYPTYLAQAELYEVDSTTYTAKYKALETFVTPLLEDMEATSVVDGSIMRKTFSAYYTERINLLNAITKGLKDGLEEAMKKASQASVDATQALADSAQAQIDANNAKQLIADIASDGKLTASEKYQLKKEWDVIVKEYPTTIAQATKYKVNTDNYTAKYKALETFVTPLFANMDETSVVNGEQLRAVFSDYYAVKITLLKEITDIARDELTDYGNRITVAETKITQTSEAITLMASRVETVENDVKTNTAQLKVQADLISQKVTASEVKDAIDNAIDNMSIGGSNLFVIKTQTAGLLNENNGTVGTAVDKSVVSNYIKVTAKMPYVASLYGNTGTNSIIIAWYDTSKTFISGQAVADSGDFHKTYVAPENAVYARLSYKKADTVKMKFEVGTKPTDYSPSWDDIKGDQTALEEYIKQVEEQAKQAQQEAENAKNEAENANSAIADMSNDNMLTANEKQQILLQWEEIKTEYPINLDQATKFGVSATQYTTAYNALKTYLDPLLADMTTTSVIVGSTMRSTFNTYYDRRTTLLNRVAELAKQVADQAKDTADKVDDDLNNIGGYNYIGFSSGDHMYPRLMIKNIGYYYVPSMGSAEFVDDMVCLKPKTTEKKVQYEIGSSSANISGVGLANYRMKEVKTGQWLTASANLKVVGTGKAYITIFTLENGSWQFSLSDMVTASQGVTRVVAQRKVTDQTQGVFIRISGDIIDEVHFGNTQLEVGIRSTPWKKSDIDIQEDINNVADDIKDYIGARSDNLITNGFGELGNNTNIGGIFDGADRIVGKGSFRQEEGNKSLLFSEHIVIDNKKVYNFDYYMHTLKGVGRSYAMIAPYDVDGKRITFPSLGGRNYNSITPVKFTKLAKPLKVGDTEVFVEDASLWNGQAPQDYQRSIIMWGYKNSFGYTYPDGTYSQLMQMKTYDIGAVDTTANKITLNKPWAVANPNSSDGIFPVGHTLSPTSDGSTYLYLNGHVNIQVPTTYTKYSHLISGSSEFANTTLIPVETGSIQLGFLLNRDTTGEKSWLNGLRLRDYTDTYKLNDDVRETQENVDKAQADADKANQSIADLSNDNLVTPNEKLDLKKEWEIIVAEKPKNDAQADKFGVSKVAYGTAYTALDTYLKPILASTTTNSAIVGQTMRDTFKAYYTARTDLLNTIASKAKELADNAQDTADNIAVGTRNLLIGTQDFSKGKYPGNANVTITDEKLFGNAVMKNDYTTGTGYSDMYQMTTSIIPTGTQYTLSFYAKADLEGTKMSCYFYNPNTTTSSVNSQGGKLSSSDGRTVFVLSTEWTKYWVTWTQTQADKPKSVIIGRKTGGEEPNSAFYMSSPMMVEGNKPQTWMKAPEDIETAINGKEGAWVYSPTAPTNPAVGLVWVDSSKTPNQPKRWVGGETGWVALTPEEVKDLPWGEDGSSLADWVAQAEQKISSDAIISTVLGSEDFTGIFDSKANTEDLNNLASYDDLDAMQAEYERLLKEGIAGIDFSPYVTNTELEQLKDSFTFSVQQAGGVNMLKNSLGFSGTDFWQASSGIDTTQNEQLSKLGFGSGFMINRVQNATLAQTIELPEAKQGLQYALSFYMNVATFGDVTDFQCGAHIYEEGVLKYTVGVTDATQEIPSDYHLYKLVFEPESPNTVIELFVTNGAQATVIISGVMYNIGNIALKWQPYPSEIYNTNVKIDINGITVKNNQTDGYTMITPQEFSGYARVNGEMERIFTLNGQVTEVKMLQAEKRITMEPISVFAMNSKETNTIGWAFVAFGEVAHSAIASSTQ
Physico‐chemical
properties
protein length:2198 AA
molecular weight: 243278,22230 Da
isoelectric point:4,78564
aromaticity:0,09236
hydropathy:-0,41915

Domains

Domains [InterPro]
YP_013395997.1
1 2198
Legend: Pfam SMART CDD TIGRFAM HAMAP SUPFAM PRINTS Gene3D PANTHER Other

Taxonomy

  Name Taxonomy ID Lineage
Phage Enterococcus phage PEf771
[NCBI]
2601638 Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host No host information

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
YP_013395997.1 [NCBI]
Genbank nucleotide accession
NC_129615.1 [NCBI]
CDS location
range 30798 -> 37394
strand -
CDS
TTGGCAGGAGGACGTAGATTTCAGGCAGGGTTAGGTTCCGAACATAAAAGATTATACAAAGAAGGACAACAAATTAATACTTTGTTGCTAGCCCAAGTTATCCAAGTTAATTATAAATACAATACAGTTGATTTACTAGCATTACAGCATAAAGAAGTTTTCCAAAACTCCTATGCCAATGAAGGTAGATTTTCTGCTCGTTTACCAATGGAATTTGGTGGACGAAACCTTGCAGGACAACCATATGGTCAAGTAAACCCTATTGCCGTTGGTACTGTTGTCCTAGTAGGTTTTATTAACTCTGATAAAGACATGCCGATTGTTATTAGTGTATACAATAACAACGATGTAAATAAACAATTATCCCGTACACGTTTTGCTAATGCAGACCCTACAGATATGGCTTTAGCGGGACAAATGTATCAAAAATTTAGTTTGTACCCATCTTTAACTTACGATAGTATTGATGGGGATGGTAACCGAGTAGTTACATTCTCTGGTAAATCATTTATTGCATTCGATACAAAAGATATGCAAAACTCTCCAATGACAGATGCTAGTTATGGTTCTCGTTATGAAGACCTAGGAACCTCTTACTATAATGATGGAGAACTAATTGAGCCGATGAAAGGTCGAGCACCTAATGTGTTGTTCAAGCACCAAGGGATTCTTGACGATGATAATAAACCAGATACACATAATTTCATGATTCACATTAACCCAGATGGAACATACCGTACATCTATGATGGATACGGAACAAGACTGGCGGACAATGTTTGAGATGACACCGGAGGGTAAAATCCGTTTACGTAGACAAGGGGATACTGTACGTCTAAACGATGGTTTTGAAATTGGTGAACTAGGTATTAATGAAGAAGGTATCGTTTATTTACGTAATGGGGACATGGACTTAGAAGTTCGTGAAGATGGTATCTATTCCCAAGGTAAACTAATCACAGAAAATATCAATCTTGATGATATTTATGAGAAATTAGCTAATGTTACTTTTGAAATTAATAAGACAAATGAGTCCTTACAAATTTTAACTGAGAAATCAGAGCTACAAGATGGTAAGATTGTAAATCTAGAAACAGAGATTACAATTGTAGCTGGAAAAGTAGAATCTAAAGTAAGTGCAACAGAAGTACAAGACATGATTGATAGCTCTATTGTAGACATGACGGATGCTATTAAAAAAGCCCAAGAAGATGCAGATAGAGCAAATAAAGTTATTTCTGATATGGCTAGTGATAACCGTTTAGCTCCTAGTGAGAAGCTAGAATTACTAAAAGAGTGGGACACTATCAAGAATGAATACCCAACTTATTTAGCACAAGCTGAACTATACGAAGTAGATAGTACAACTTATACTGCTAAGTACAAAGCTTTAGAAACATTTGTTACTCCTTTATTGGAAGACATGGAAGCTACTAGTGTAGTAGATGGTTCTATTATGCGTAAAACATTTAGTGCATATTACACAGAACGAATCAATTTACTAAATGCAATCACTAAAGGGTTAAAAGATGGTTTAGAAGAGGCAATGAAGAAAGCTTCTCAGGCTTCTGTAGATGCTACACAAGCTTTAGCTGATTCTGCACAGGCACAAATTGATGCAAACAATGCAAAACAATTGATTGCAGATATTGCTAGTGACGGTAAGCTGACTGCTTCTGAAAAGTACCAATTGAAAAAAGAATGGGATGTTATTGTTAAGGAGTATCCTACAACAATTGCCCAAGCAACAAAGTACAAAGTAAATACAGATAACTATACTGCTAAGTATAAAGCTTTAGAAACATTTGTCACTCCTTTGTTTGCGAATATGGATGAAACAAGCGTAGTTAACGGGGAACAACTACGTGCAGTATTTTCTGATTACTATGCTGTAAAGATTACTTTATTAAAAGAAATCACAGATATTGCTCGTGATGAATTGACTGATTATGGTAACCGTATTACTGTAGCAGAAACAAAAATCACACAAACATCCGAAGCTATTACGTTAATGGCTTCCAGAGTGGAAACTGTTGAAAATGATGTTAAAACAAACACAGCGCAATTGAAAGTGCAAGCAGACTTAATTAGTCAGAAAGTAACTGCTAGTGAAGTAAAAGATGCTATTGATAATGCAATTGATAACATGTCTATTGGTGGTTCTAACTTGTTTGTAATCAAAACGCAAACAGCAGGACTATTGAATGAAAATAATGGTACTGTAGGAACAGCCGTAGATAAATCTGTAGTATCTAACTATATCAAGGTAACAGCTAAAATGCCTTATGTAGCTTCTTTATATGGAAACACAGGGACAAACAGTATTATCATTGCATGGTATGACACAAGCAAAACGTTTATCTCTGGTCAAGCTGTAGCTGATTCTGGTGATTTCCATAAAACTTATGTTGCACCAGAAAACGCAGTATATGCTCGTTTAAGTTATAAAAAAGCTGACACTGTTAAAATGAAATTTGAAGTAGGTACGAAGCCAACTGATTACAGCCCGTCATGGGATGATATTAAAGGTGACCAGACTGCTTTAGAGGAATACATTAAACAGGTAGAGGAACAAGCTAAACAAGCACAACAAGAAGCAGAAAACGCTAAGAATGAAGCAGAAAACGCAAATAGTGCTATTGCTGATATGTCTAATGACAATATGTTAACAGCAAATGAGAAACAACAAATTTTACTACAATGGGAAGAAATTAAAACGGAATATCCAATTAATTTAGACCAAGCAACTAAATTTGGTGTTTCTGCTACGCAGTATACAACAGCGTACAATGCTCTAAAAACATATTTAGACCCATTATTAGCAGATATGACAACAACTTCTGTAATTGTTGGTTCTACTATGCGCAGTACATTTAATACTTACTACGACCGTAGAACAACATTGCTTAATCGTGTAGCTGAACTAGCTAAACAAGTAGCTGACCAAGCTAAGGATACAGCAGACAAAGTAGACGATGACTTAAACAACATTGGTGGGTACAACTACATCGGATTCTCTTCCGGAGACCATATGTATCCTCGTTTAATGATTAAGAACATTGGTTACTACTATGTACCTTCTATGGGGAGTGCAGAATTTGTAGATGACATGGTATGTTTAAAGCCAAAAACAACAGAAAAGAAAGTTCAGTATGAAATTGGCTCCTCATCAGCTAACATATCCGGTGTTGGTTTAGCAAATTATCGGATGAAAGAAGTTAAAACAGGTCAATGGTTGACTGCTTCTGCAAACTTAAAAGTTGTTGGTACTGGTAAAGCATATATTACTATCTTTACTTTAGAGAACGGCTCTTGGCAATTTTCACTAAGTGATATGGTTACAGCAAGTCAAGGAGTAACTCGTGTAGTAGCTCAAAGAAAAGTGACAGACCAAACACAAGGGGTATTCATACGCATCAGTGGAGATATTATTGATGAAGTTCATTTTGGTAATACACAACTTGAAGTTGGTATTCGCTCTACCCCTTGGAAGAAATCAGATATTGACATTCAAGAAGACATCAACAATGTTGCGGACGATATTAAAGATTATATTGGTGCTCGTTCTGATAACTTAATCACAAATGGTTTTGGTGAATTAGGGAACAATACGAACATTGGTGGTATCTTTGATGGTGCTGATAGGATTGTAGGTAAAGGTTCCTTCCGTCAAGAAGAAGGAAACAAATCACTATTATTCAGTGAACACATTGTTATTGACAATAAGAAAGTTTATAACTTTGATTACTACATGCACACATTAAAAGGTGTTGGTAGAAGTTACGCAATGATTGCCCCGTATGACGTAGACGGGAAACGTATCACATTTCCTTCTCTCGGGGGACGAAACTACAACTCTATTACCCCTGTTAAATTTACAAAACTAGCAAAACCACTTAAAGTCGGAGATACAGAGGTTTTTGTAGAAGATGCTAGTCTATGGAACGGACAGGCACCGCAAGACTACCAACGTAGTATTATCATGTGGGGTTATAAAAACTCGTTCGGCTATACTTATCCCGATGGAACGTATAGTCAGTTAATGCAGATGAAGACATATGATATTGGTGCAGTTGACACCACAGCTAACAAGATTACGTTAAACAAGCCATGGGCAGTTGCAAACCCAAATAGTTCAGATGGGATTTTCCCAGTAGGGCATACACTTAGCCCAACTTCTGACGGTTCCACATATCTATATTTGAATGGTCACGTAAATATACAAGTACCTACTACGTACACCAAGTACAGCCATTTGATTAGTGGCTCTTCTGAGTTTGCTAATACAACGCTTATCCCAGTAGAAACAGGTTCTATCCAACTTGGATTCTTGTTGAACCGTGATACAACAGGTGAAAAATCTTGGCTAAACGGTTTACGTCTACGTGATTATACAGATACGTATAAGCTAAACGATGACGTTAGAGAAACACAAGAAAATGTGGATAAAGCCCAAGCAGATGCAGATAAAGCTAACCAGTCAATTGCTGATTTATCTAATGATAATTTAGTTACTCCTAACGAGAAACTAGATTTGAAAAAAGAGTGGGAAATCATTGTTGCTGAAAAACCTAAGAATGATGCTCAGGCAGATAAATTCGGAGTAAGTAAAGTAGCTTACGGTACTGCGTATACTGCTCTAGATACGTATTTAAAACCCATCTTAGCAAGCACAACAACGAACTCTGCGATTGTTGGACAAACTATGCGGGATACGTTTAAGGCGTATTACACGGCTCGTACAGACCTGTTAAACACTATTGCATCTAAAGCTAAGGAATTGGCTGATAATGCACAAGATACCGCAGATAATATAGCTGTCGGTACTCGTAACCTTTTAATCGGAACACAGGACTTTTCCAAAGGTAAATATCCGGGTAATGCTAACGTTACCATTACAGATGAAAAGCTGTTTGGAAATGCAGTAATGAAGAACGATTACACTACAGGTACCGGATATTCAGATATGTACCAAATGACGACCTCAATTATTCCAACAGGAACTCAGTATACATTATCGTTTTATGCAAAGGCAGACCTAGAAGGAACTAAAATGTCTTGTTACTTCTACAACCCAAATACTACGACAAGTAGTGTAAACAGTCAAGGTGGCAAACTTAGTTCTAGTGACGGTCGTACTGTATTTGTTTTAAGTACAGAATGGACTAAATACTGGGTAACTTGGACACAGACACAGGCAGACAAGCCTAAGTCAGTAATTATTGGTCGTAAGACTGGTGGGGAAGAACCTAACTCTGCTTTCTATATGTCTTCTCCTATGATGGTAGAGGGGAACAAACCACAAACGTGGATGAAAGCCCCAGAAGACATTGAAACAGCTATAAACGGTAAAGAAGGTGCTTGGGTTTACTCTCCAACAGCACCAACAAATCCGGCTGTTGGTTTAGTCTGGGTAGACTCTTCTAAAACTCCGAACCAACCAAAACGTTGGGTTGGTGGAGAAACTGGATGGGTTGCCTTAACCCCAGAAGAAGTAAAAGATTTACCTTGGGGTGAAGATGGTTCTAGTCTTGCTGACTGGGTAGCACAAGCAGAGCAAAAGATTTCTTCTGATGCAATCATTAGTACTGTACTAGGTTCTGAGGACTTTACCGGTATTTTTGACTCCAAAGCAAATACAGAAGACTTAAATAACCTTGCTTCTTACGATGACTTAGATGCTATGCAAGCTGAGTATGAACGTCTGTTAAAAGAAGGGATTGCAGGAATTGACTTCTCACCATATGTAACTAACACAGAGCTAGAACAATTGAAAGATAGCTTCACTTTCTCTGTTCAACAAGCCGGTGGGGTTAATATGTTGAAAAACTCTCTAGGATTCTCTGGGACAGACTTCTGGCAAGCCTCTTCTGGTATAGATACTACTCAGAATGAACAGTTGTCTAAATTAGGATTTGGTTCCGGATTTATGATAAACCGAGTTCAAAATGCAACACTAGCTCAGACAATCGAATTACCAGAAGCAAAACAAGGTTTGCAGTATGCTTTATCCTTCTACATGAATGTAGCTACTTTTGGAGATGTCACTGATTTCCAATGTGGGGCACATATCTACGAAGAAGGTGTGTTGAAGTATACTGTTGGGGTAACAGATGCTACACAAGAAATCCCAAGTGACTATCACTTGTATAAACTTGTATTTGAACCAGAGTCTCCGAATACTGTCATTGAATTATTTGTTACAAATGGTGCACAGGCAACTGTAATCATTTCAGGGGTTATGTACAATATCGGTAACATTGCGTTGAAATGGCAACCATACCCAAGTGAAATCTATAACACGAACGTTAAGATTGATATTAATGGTATTACTGTTAAAAACAATCAGACAGATGGTTATACAATGATTACTCCGCAAGAGTTTTCAGGTTACGCAAGGGTTAACGGGGAGATGGAACGTATCTTTACCCTAAATGGTCAGGTAACAGAGGTTAAGATGTTACAAGCAGAGAAGCGTATTACAATGGAACCTATTTCCGTGTTTGCGATGAACTCTAAAGAAACCAATACAATTGGTTGGGCGTTTGTTGCTTTCGGAGAGGTTGCACATTCTGCCATAGCATCTAGTACACAATAG

Gene Ontology

No Gene Ontology terms available.

Enzymatic activity

No enzymatic activity data available.

Tertiary structure

PDB ID
88a426fa03a9d9a5d255c4e7c394f12cf2ee20fe9d056466ae024cdbaa1163e1
ColabFold
Source ColabFold
Method ColabFold
Resolution 0,7267
Evidence 0,7267

Literature

Title Authors Date PMID Source
Characteristics and whole genome analysis of the Enterococcus faecalis phage PEf771 Xiang,Y., Ji,X., Wei,Y., Song,F., Li,W. and Yang,X. 2020-09 GenBank