Protein

Genbank accession
AGH26531.1 [GenBank]
Protein name
hypothetical protein
RBP type
TSP
Evidence DepoScope
Probability 1,00
Protein sequence
MARTVPGTGADIEPIFDEVFGVRAVRVVNGGSGYTQADPPRLTVTGCGTPTREAILYPIIDEDSGQIIHVRVLDRGLGYDPLRVQIIPEQETPNVVNSFNFTRIFQSHPNSSTTATFGTTGTPAKLTDRLTIVSDNHPKPSQVYANERQPGGSGDLVDRNFNQTFIYRGGKDVPNPGTREFQRNKSLGILANGGLLHTPEWGNNVGGAPINFAIDTVKYDYVKNTSANDTIIHNNVHYYQTSKTIDEFDDANGVFEWGNQEVFTWKVKVEFDNVMFNVTNVDETLGQVEVGRIVDEVGGTGRGIISKIVKDSQNVVVRIYLRSLTGDAFSQDDLCLGSNGFSFKINGAPITFPNGIFYIEFGEEAHEFGAFTPGVYYFSPENIKVQKNYVIIWDQSDASNQQGNAPHPMRFSTTADGTLNGGTLYYNSTGSSGAYAADYEASLQPIFIMNADETQKIYYYCGNHRYMSGYAGDEGYMILDTSAEEEDEVNMNNYYVEGFFGTAAAGTLDYSRYANGHSRIIGMSFDGYPIYGPYGKIGNTIAREKSGYRLRTVPELQGARPIVTTSGTVTYAVTMSNNKFLFDGASPTFLTLDRGKTYIFNQLDSSNAPSNHIFISPTDDGWHAGLVGDTNYLFSGQGVEYWIDGSQRPYQTYVSLFNTATTQREVRFTVPVDSPGLLYLFAYVTAGAGLRLVTRGYQLGDLVNDYIFDESPAWSSTASFVQYDTVRNAGYIYEATASISAGGTAPTHTSGTTNNWKYLDVVGTLDYYNGRFSTTPEYPNGTYAYYMTEDASGAPKYPYAIGPKYYGVPLFEGDTVPPLTTNFPEGAEAEVVLSTTNAGQLDYIRMTKFGDNYFGPAQARILGGQGTGALGSPVVQTVTGLSLLNPGRNYATPPTLIFEGGGGQGAQGAAEIDILGKVTNVNIVNPGEFYQEPPYILITGGGGIGAKAIATIDQGAITGITVTEPGVGYTSVPNVIFTKLVQLKRKTRARQAFNSSAIYLTGLIKSVTANDANIYVDSTDAYPGSGSIILNRETISYTSKSAGKFTGLTRGVNFNYDQRVILDPGQNDSNGVSLYKFTVGDRVIRRVENQNNKVAKVYDWDPNTRELLVTFEVDELAFIDGGRAATEDAIVQFDGGVADSSAAGVLPHVILTTAGSTIDLLTEPLSVLQDRSFEDIIPTGAPDGIPDLSNANTTYANQISLDGGIYNSLYGIEETQGGQNTTLFQVGDNIKDGDIPFKFATITTAGGLSEGVEHTALINITLDQTTGNGQNFSTNEIVSGSVSGVQATVVSWIPSTGVLQVKDVIPFNTNNINVGIAGYLYEFSSKNTITDFVITNPGTNYTAAPTVAIENTGDIQATGTVVMTPQGDQVASITINNGGYGIPQTVDGTYALHPTVTFTNNASDTTGSGAAAQAVLGGELINGNGGASYRIKSIEYSAIVRSK
Physico‐chemical
properties
protein length:1443 AA
molecular weight: 155356,06730 Da
isoelectric point:4,66179
aromaticity:0,10603
hydropathy:-0,24401

Domains

Domains [InterPro]
AGH26531.1
1 1443
Legend: Pfam SMART CDD TIGRFAM HAMAP SUPFAM PRINTS Gene3D PANTHER Other

Taxonomy

  Name Taxonomy ID Lineage
Phage Cyanophage P-RSM3
[NCBI]
536446 Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host No host information

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
AGH26531.1 [NCBI]
Genbank nucleotide accession
HQ634176 [NCBI]
CDS location
range 1557 -> 5888
strand -
CDS
ATGGCAAGAACCGTTCCTGGTACTGGTGCCGACATTGAACCTATTTTTGACGAAGTATTTGGTGTACGTGCGGTAAGAGTTGTAAATGGTGGATCTGGATATACACAGGCAGACCCACCACGACTTACTGTGACTGGTTGTGGAACTCCAACACGAGAAGCAATATTATATCCAATAATAGATGAAGACTCAGGACAAATTATTCACGTTCGTGTTCTTGATAGAGGTTTAGGTTATGATCCATTAAGAGTACAAATTATTCCTGAACAGGAAACTCCTAATGTTGTAAATTCTTTTAATTTTACAAGGATATTTCAATCTCATCCAAATAGTTCTACCACTGCAACATTTGGGACTACTGGAACTCCAGCTAAGTTAACAGATAGATTAACTATTGTATCAGATAATCATCCTAAACCATCACAGGTTTATGCTAATGAAAGGCAACCTGGTGGTTCAGGAGATCTTGTAGATAGAAACTTTAATCAAACCTTTATATACAGAGGTGGTAAGGATGTTCCTAATCCAGGTACTAGAGAGTTTCAAAGAAATAAATCACTCGGTATATTAGCAAATGGTGGTCTTTTACATACACCAGAATGGGGTAATAACGTTGGTGGAGCACCTATAAACTTTGCTATTGATACAGTCAAATATGACTATGTAAAAAATACCAGTGCAAATGATACTATAATTCATAATAACGTACATTATTATCAGACAAGTAAAACTATAGATGAATTTGATGATGCCAACGGTGTATTTGAATGGGGTAATCAAGAAGTATTCACATGGAAAGTTAAGGTAGAATTTGATAATGTGATGTTTAATGTCACTAATGTAGATGAAACATTAGGACAAGTAGAAGTTGGTAGAATAGTTGATGAAGTTGGTGGGACAGGTAGAGGTATAATTTCAAAAATAGTAAAAGACAGTCAAAATGTTGTAGTAAGAATATATCTAAGAAGTCTTACAGGAGATGCTTTCTCACAAGATGATCTATGTCTAGGATCTAATGGATTTTCATTTAAAATAAATGGTGCACCAATAACATTCCCAAATGGTATTTTTTATATTGAGTTTGGTGAAGAGGCACATGAGTTTGGTGCTTTTACACCAGGTGTATATTACTTCTCTCCAGAAAATATTAAAGTACAAAAGAATTATGTAATTATATGGGATCAATCTGACGCTTCTAATCAGCAAGGTAATGCACCACACCCTATGCGGTTCTCTACAACTGCTGATGGCACATTAAATGGTGGAACATTATATTACAATAGTACAGGTTCTTCTGGTGCATATGCTGCAGATTACGAAGCTTCATTACAACCAATATTCATAATGAATGCGGATGAAACGCAAAAAATATATTACTATTGTGGTAATCATCGTTATATGTCTGGATATGCAGGTGATGAAGGATATATGATTCTTGATACCTCTGCTGAGGAAGAAGATGAAGTAAATATGAACAACTATTATGTTGAAGGATTTTTTGGGACTGCTGCAGCAGGAACATTAGATTATTCAAGATATGCAAATGGACATTCTAGAATCATAGGTATGTCATTTGATGGTTATCCTATTTACGGACCTTATGGAAAAATTGGTAATACTATTGCAAGAGAAAAATCAGGTTATAGACTGAGAACAGTTCCTGAACTACAAGGTGCTAGACCTATAGTCACTACATCTGGTACAGTGACTTATGCTGTGACAATGTCAAATAATAAATTTTTATTTGATGGAGCATCTCCTACATTCTTAACTTTAGACAGAGGAAAAACATATATCTTTAATCAATTAGATTCATCTAATGCTCCATCTAATCATATCTTTATATCTCCAACAGATGATGGTTGGCATGCAGGTTTAGTTGGTGATACAAATTATCTCTTTTCGGGACAGGGAGTAGAATATTGGATTGATGGTTCACAAAGACCATATCAAACTTATGTAAGTTTGTTTAATACTGCTACTACACAAAGAGAAGTGCGTTTTACAGTTCCTGTAGATTCACCTGGTCTTTTATATCTCTTTGCTTATGTGACTGCAGGTGCAGGATTAAGATTAGTCACTAGAGGTTATCAATTAGGAGATCTTGTAAATGATTATATTTTCGATGAATCACCTGCATGGTCAAGTACAGCGAGTTTTGTTCAGTATGATACTGTAAGAAACGCAGGGTATATCTATGAAGCGACTGCATCGATAAGTGCAGGTGGTACTGCACCTACACATACAAGTGGTACTACAAATAACTGGAAATACTTAGATGTTGTAGGAACTTTAGATTATTATAATGGTAGATTTTCTACCACACCAGAGTATCCAAATGGAACTTATGCATATTATATGACTGAGGATGCTTCAGGTGCTCCAAAATATCCTTATGCTATAGGTCCCAAATATTATGGTGTGCCTTTATTTGAAGGTGATACTGTTCCTCCTTTAACAACTAATTTCCCAGAGGGTGCTGAGGCAGAAGTTGTTCTAAGCACAACTAATGCAGGACAACTTGATTATATTAGAATGACTAAGTTTGGTGATAATTACTTCGGTCCTGCACAAGCAAGAATTTTAGGTGGTCAAGGTACTGGTGCTTTGGGCAGTCCTGTAGTGCAGACAGTGACAGGTTTATCACTATTAAATCCAGGTAGAAATTATGCTACTCCTCCAACACTTATCTTTGAAGGTGGTGGTGGACAGGGTGCACAAGGTGCTGCTGAAATAGACATCTTAGGAAAAGTCACAAATGTCAATATTGTAAATCCAGGTGAATTTTATCAAGAACCTCCTTATATTCTTATCACTGGTGGTGGAGGTATCGGTGCAAAAGCAATAGCAACTATTGATCAAGGTGCTATTACAGGTATAACTGTTACTGAACCAGGCGTAGGATATACTTCTGTACCTAATGTTATCTTTACAAAATTAGTACAATTAAAACGTAAGACAAGAGCAAGACAAGCATTCAACTCTTCTGCAATTTACTTGACTGGATTAATCAAGAGTGTCACTGCTAATGATGCAAACATATATGTTGACTCTACTGATGCATATCCTGGTTCTGGATCTATTATTCTTAATAGAGAGACAATAAGTTATACTTCTAAATCTGCAGGTAAATTTACTGGTTTAACTCGTGGTGTAAACTTTAATTATGATCAAAGAGTTATATTAGATCCTGGTCAAAATGATTCTAACGGTGTATCACTTTACAAATTTACTGTAGGTGATAGAGTTATTAGAAGAGTTGAAAATCAAAATAATAAAGTTGCTAAAGTATATGATTGGGATCCAAATACAAGAGAACTACTTGTCACATTTGAAGTTGATGAACTAGCATTTATTGATGGTGGTAGAGCAGCGACTGAAGATGCTATTGTACAATTTGATGGTGGTGTTGCAGATAGTTCTGCTGCAGGTGTATTACCACATGTAATTCTTACAACTGCAGGTTCTACCATAGATTTATTAACTGAACCTTTATCTGTATTACAAGATAGATCTTTTGAAGATATTATACCAACTGGTGCACCTGATGGTATTCCAGATTTGAGTAATGCTAATACTACATACGCTAATCAAATATCATTAGATGGTGGTATATACAATTCACTCTATGGTATTGAAGAAACACAGGGTGGACAAAATACCACTCTATTCCAAGTTGGTGATAACATCAAAGATGGAGATATACCATTTAAGTTTGCAACAATTACCACTGCAGGTGGATTATCTGAGGGTGTTGAGCATACTGCATTGATCAATATAACATTAGATCAAACAACTGGTAATGGTCAGAACTTCTCTACTAATGAGATAGTTAGTGGTTCTGTGTCTGGTGTACAAGCAACTGTTGTTTCTTGGATACCTTCAACAGGTGTATTACAAGTTAAGGATGTTATACCTTTCAATACCAATAATATAAATGTTGGTATTGCAGGTTATCTTTATGAGTTTTCATCAAAGAATACCATTACTGATTTCGTTATAACTAATCCTGGCACTAACTATACTGCTGCTCCTACTGTAGCAATAGAGAACACAGGTGATATACAAGCAACTGGTACTGTGGTTATGACTCCTCAAGGAGACCAAGTTGCATCAATTACTATCAATAATGGTGGATATGGTATTCCACAAACTGTAGATGGAACATATGCCTTACATCCTACAGTCACATTCACTAATAATGCCAGTGATACAACTGGATCTGGTGCAGCTGCTCAGGCAGTTTTAGGTGGAGAACTCATCAACGGAAATGGCGGTGCCTCTTATAGAATTAAGAGTATCGAATATTCTGCAATAGTTCGATCGAAATAG

Gene Ontology

No Gene Ontology terms available.

Enzymatic activity

No enzymatic activity data available.

Tertiary structure

PDB ID
ba4f02c5da635ba9b83265696b7b5254ce1ed427600d781f389695e9a01e9c26
ESMFold
Source ESMFold
Method ESMFold
Resolution 0,4345
Evidence 0,4345

Literature

Title Authors Date PMID Source
The Genome Sequence of Cyanophage P-RSM3 Henn,M.R., Sullivan,M.S., Osburne,M.S., Levin,J., Malboeuf,C., Casali,M., Russ,C., Lennon,N., Chapman,S.B., Erlich,R., Young,S.K., Yandava,C., Zeng,Q., Alvarado,L., Anderson,S., Berlin,A., Chen,Z., Freedman,E., Gellesch,M., Goldberg,J., Green,L., Griggs,A., Gujja,S., Heilman,E.R., Heiman,D., Hollinger,A., Howarth,C., Larson,L., Mehta,T., Pearson,M., Roberts,A., Ryan,E., Saif,S., Shea,T., Shenoy,N., Sisk,P., Stolte,C., Sykes,S., White,J., Yu,Q., Coleman,M.L., Huang,K.H., Weigele,P.R., DeFrancesco,A.S., Kern,S.E., Thompson,L.R., Fu,R., Hombeck,B., Chisholm,S.W., Haas,B., Nusbaum,C. and Birren,B. 2011-09-23 GenBank