Protein

Genbank accession
AGN12298.1 [GenBank]
Protein name
hypothetical protein
RBP type
TSP
Evidence DepoScope
Probability 1,00
TSP
Evidence RBPdetect
Probability 0,86
TSP
Evidence RBPdetect2
Probability 0,89
TF
Evidence GenBank
Probability 1,00
TF
Evidence Phold
Probability 1,00
Protein sequence
MAEFRLGRLKFNWRSDWTISTAYVIDDIIKYGANTYVCKKNHTSAGAEESFYSTDLTLNWSLHTEGIVNKGSWAANYWYKVNDIFKYGNTQYRVTTGFTSGATFDEAATTTNVVEYLQSFNYEDTWSNSTQYQDGDVVTYGGYTYVAKSVNTNKAPSYNLTNDWDIITTGFSVVGYYSTTTDYKQGDVVQYGGYTYVAITTSTNTIPTTPANWTLVTKGVSWKGNWDSTVKYELGDAVKRLSNSYIGVATVGSLNEDPSTDGTSTYWSMLAEGAANNVMTTQGDMVYYTTGSARLPKGTNGQVLAMSSGGVPNWESNSVTHPVFYVTEEGSDTNDGSNISRAFASVRHACAKAAETGNPCSVYVKAGTYSETLPIVVPPFVSIVGDNLRTSRVKPGVHYAHTFISGLTGSITADSGGPFTAGSGTTYDSATGDLVLEIGTHSLTTSNTIGINGNSLTFTCSQDSHATQHTYPRPKDPVYNKTDIAIIATTGTTITVRVGKGNASRHQDLVLASAPSSVSYGSSIFNGAGTKCAVILDSDYAEKKIQIRWLSGGEWTTSDEWENGGTDIGITSVTTRPNEESTMFMLSNATMLKDLLMEDMTGFSPAGIVTTISCSIAGSKVTGSELFPDLVGTTVTGSGVSTGTKVSGFIDAQTLEVDIVQNLGATDLTFTAQQYDPNNAHIKGTFCALNPESRVIKSPYVSNCSAKSVRGIGAVVDGGVHRQFVDGSATPSNKSIVFDSFTNIHDEGMAFWITDGAVAETVSCFTYYNHISYAATRGGRLRSLVGNSSWGKYGVVSSGFSPLEKAREGEIEGLVLQYDVDSMSGSGFQVGERIRGNTSGAWGYINSVQGTTQEKIYYSVISEGPVGVGTGFGPGETITAMTSGTTAPLLNNTSANEGQAGRILVLSGLGTSPTLEVNGSIEFITGLGNGGYNSDNITGADPFTFVISGVSQTGPTGKGNVQIDRAQWSTTGAAHTGGSTTFVKYPVNIGASFTLLTPAAAGDTTLSTSTISGFNPGEYCLSPTNELCKIVSFPTANSMSVQRAQDGAGAAVAYSIGDIFTSIGTTSFVTSAEVNKDFTGVSTDFRATISNRFEDAVGAYMKIDDEFTKVTGVTTDTYGTTTVTLVEEKAAKSFDEQDIKIRYIFSQARLTGHDFLQVGTGGTYTTNWPDVPSQDPVQTQEITEDFPGRVFYVSTDEQGNFRVGKYFRVNQATGAATLNANSFDLSGLTSIRLGSIGAQLGAQVNEFSTDGTMAQNSNEKVPTQAAVRTYVATRDAEHLVMAQNAANLGIATALAHANAGIATLRTDANTEFRSGVQVSEFFVGQI
Physico‐chemical
properties
protein length:1326 AA
molecular weight: 140948,79910 Da
isoelectric point:4,89102
aromaticity:0,09804
hydropathy:-0,20943

Domains

Domains [InterPro]
Legend: Pfam SMART CDD TIGRFAM HAMAP SUPFAM PRINTS Gene3D PANTHER Other

Taxonomy

  Name Taxonomy ID Lineage
Phage Prochlorococcus phage P-SSM5
[NCBI]
536454 Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host No host information

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
AGN12298.1 [NCBI]
Genbank nucleotide accession
HQ632825 [NCBI]
CDS location
range 107781 -> 111761
strand -
CDS
ATGGCTGAATTTAGACTTGGCAGATTAAAATTTAACTGGCGTAGTGACTGGACTATAAGTACTGCGTATGTTATAGATGACATCATAAAGTATGGTGCAAATACTTATGTTTGTAAGAAGAATCACACTTCTGCTGGTGCTGAAGAATCTTTTTATAGCACAGATCTAACACTTAATTGGTCCTTACATACCGAAGGAATTGTTAATAAGGGAAGTTGGGCAGCAAATTATTGGTATAAAGTAAACGATATATTCAAATACGGTAATACTCAATATAGAGTAACTACTGGATTTACTTCTGGTGCTACTTTTGATGAAGCTGCTACTACTACAAATGTAGTTGAGTATTTACAATCATTTAATTATGAAGATACTTGGAGTAATTCAACACAGTATCAGGATGGAGATGTTGTAACTTACGGTGGATACACTTACGTTGCAAAGAGCGTTAATACAAATAAAGCACCTTCATATAATTTAACGAATGATTGGGATATTATAACTACAGGATTTAGTGTAGTTGGTTATTATTCTACAACAACAGATTATAAGCAAGGTGATGTGGTTCAATATGGTGGATACACCTATGTTGCAATTACAACTAGTACAAATACTATCCCAACAACACCAGCAAATTGGACCTTAGTTACTAAAGGTGTTTCTTGGAAAGGTAACTGGGATTCCACTGTAAAGTATGAATTAGGAGATGCTGTAAAGAGATTAAGTAATAGTTATATTGGTGTTGCTACTGTTGGTAGTTTAAACGAAGATCCTTCAACTGACGGTACAAGTACTTATTGGAGTATGTTGGCTGAGGGTGCTGCCAACAATGTGATGACCACTCAAGGTGATATGGTCTATTACACCACTGGTTCTGCTAGATTACCTAAAGGAACTAATGGTCAGGTACTCGCTATGAGTTCTGGTGGTGTACCTAATTGGGAATCTAATAGTGTAACACATCCAGTTTTCTATGTAACAGAAGAAGGAAGTGATACTAATGATGGTTCAAATATCAGTAGAGCATTTGCCTCAGTAAGACATGCTTGTGCAAAAGCAGCTGAAACAGGAAATCCTTGTTCAGTTTATGTAAAAGCAGGAACATATTCAGAAACACTTCCAATTGTAGTGCCACCATTTGTATCTATTGTTGGAGATAACTTAAGAACATCTAGGGTTAAACCAGGTGTTCATTATGCACATACCTTTATAAGTGGTCTTACTGGTAGTATTACGGCAGATTCTGGTGGTCCTTTTACTGCTGGTAGTGGAACAACCTACGATTCTGCAACAGGAGACCTTGTATTAGAAATTGGAACACATAGTTTAACTACTTCTAATACTATTGGTATTAATGGTAATTCATTAACATTTACTTGTTCACAGGATAGTCATGCTACTCAGCATACTTATCCAAGACCAAAGGATCCAGTTTACAATAAAACTGATATAGCAATTATTGCAACAACTGGAACTACAATTACAGTTAGAGTTGGTAAAGGAAATGCATCTAGGCATCAAGATCTAGTATTAGCATCTGCTCCTTCTTCTGTTTCATATGGTTCTTCAATCTTTAATGGTGCTGGAACTAAATGTGCTGTTATCTTAGATTCAGATTACGCTGAGAAGAAGATACAAATCAGATGGCTTTCTGGTGGAGAATGGACAACATCAGACGAGTGGGAAAATGGTGGAACAGATATAGGTATTACTTCGGTTACTACAAGACCGAATGAAGAATCAACAATGTTTATGTTAAGCAACGCAACGATGCTTAAAGACTTGTTGATGGAAGATATGACTGGTTTCAGTCCAGCAGGTATCGTTACAACTATAAGTTGTAGTATTGCTGGATCAAAAGTAACTGGTAGTGAGTTATTCCCAGACTTAGTTGGTACAACTGTAACTGGTTCTGGTGTTTCAACTGGAACAAAGGTTAGTGGATTTATTGATGCACAAACATTAGAAGTTGATATAGTTCAAAATCTTGGTGCAACTGATCTTACATTTACAGCACAACAGTATGATCCTAATAACGCACATATTAAAGGAACCTTTTGTGCTTTAAACCCAGAAAGTAGAGTTATTAAATCACCATACGTATCAAACTGTTCTGCAAAATCAGTTAGAGGTATTGGTGCAGTCGTAGATGGTGGGGTTCATAGACAATTTGTTGATGGATCAGCAACACCTTCTAACAAATCTATCGTGTTTGACTCATTCACAAATATTCATGATGAGGGAATGGCATTCTGGATTACAGATGGTGCTGTGGCAGAAACAGTTTCTTGTTTCACATACTATAACCATATAAGTTATGCTGCTACTCGTGGTGGAAGACTTAGATCTCTTGTTGGAAATAGTTCTTGGGGTAAGTATGGTGTTGTAAGTTCTGGATTCAGTCCACTTGAAAAAGCAAGAGAAGGTGAGATTGAAGGATTAGTTCTTCAATATGATGTAGATAGTATGAGTGGATCTGGTTTCCAAGTTGGAGAAAGAATTAGAGGTAACACTTCTGGTGCTTGGGGTTATATTAACTCAGTACAAGGAACTACTCAAGAGAAAATATATTATTCAGTAATTAGTGAAGGTCCAGTTGGAGTTGGAACAGGATTTGGACCTGGTGAAACCATTACTGCTATGACTTCAGGAACAACTGCTCCACTTCTTAATAATACAAGTGCAAACGAGGGTCAAGCTGGTCGTATTCTTGTTCTTAGTGGATTAGGAACATCACCAACCCTTGAAGTTAATGGTAGTATTGAATTTATTACTGGATTGGGTAACGGTGGATATAATAGCGATAATATTACTGGTGCTGATCCATTTACCTTTGTGATCTCTGGTGTGAGTCAGACAGGTCCTACTGGTAAGGGTAATGTACAGATTGACAGAGCACAGTGGTCTACTACTGGTGCAGCACATACAGGTGGAAGTACAACGTTTGTTAAGTATCCAGTTAATATTGGTGCTTCATTTACTCTGCTAACTCCTGCTGCTGCTGGCGATACTACTCTCAGTACGAGTACTATTAGTGGATTCAATCCAGGTGAATATTGTTTATCACCAACTAATGAACTTTGTAAGATTGTTAGTTTCCCAACTGCAAACTCTATGAGTGTTCAGAGAGCACAAGATGGTGCTGGTGCTGCTGTTGCATATAGTATTGGTGACATCTTTACTTCAATTGGAACAACTAGTTTTGTTACTTCAGCAGAAGTTAATAAAGATTTTACTGGTGTTTCTACTGACTTTAGAGCAACGATTTCAAATAGATTTGAGGATGCTGTTGGTGCTTATATGAAGATTGATGATGAATTTACAAAAGTAACTGGTGTTACTACTGATACTTACGGTACTACTACAGTAACTCTTGTTGAAGAAAAGGCTGCTAAATCCTTTGATGAACAGGATATTAAGATCCGCTACATCTTCAGTCAGGCAAGATTAACTGGACATGACTTCTTACAAGTAGGAACTGGTGGAACATACACAACTAATTGGCCTGATGTTCCTTCACAAGATCCAGTTCAGACACAGGAAATTACAGAAGACTTCCCAGGAAGGGTATTCTATGTTTCTACTGATGAACAAGGTAACTTTAGGGTTGGTAAGTACTTCCGTGTTAACCAGGCAACTGGTGCTGCAACGTTGAATGCTAACAGTTTCGATCTATCTGGTTTGACCTCAATTCGATTGGGTTCAATCGGTGCTCAGTTAGGTGCTCAAGTTAATGAGTTCTCAACTGATGGAACTATGGCACAAAATAGTAATGAGAAAGTGCCAACACAGGCTGCGGTTAGAACTTATGTTGCTACTAGAGATGCAGAGCATCTTGTAATGGCACAAAACGCAGCAAACTTGGGTATAGCAACTGCATTAGCACACGCTAACGCTGGTATAGCAACTTTAAGAACTGATGCAAACACTGAGTTCAGATCAGGAGTTCAGGTATCTGAATTCTTTGTTGGGCAAATCTAA

Gene Ontology

No Gene Ontology terms available.

Enzymatic activity

No enzymatic activity data available.

Tertiary structure

PDB ID
d655e42804646218586c0c3e535b17b491a27eae77a7532a41ce95f32b6cb883
ESMFold
Source ESMFold
Method ESMFold
Resolution 0,5551
Evidence 0,5551

Literature

Title Authors Date PMID Source
The Genome Sequence of Prochlorococcus phage P-SSM5 Henn,M.R., Sullivan,M.S., Osburne,M.S., Levin,J., Malboeuf,C., Casali,M., Russ,C., Lennon,N., Chapman,S.B., Erlich,R., Young,S.K., Yandava,C., Zeng,Q., Alvarado,L., Anderson,S., Berlin,A., Chen,Z., Freedman,E., Gellesch,M., Goldberg,J., Green,L., Griggs,A., Gujja,S., Heilman,E.R., Heiman,D., Hollinger,A., Howarth,C., Larson,L., Mehta,T., Pearson,M., Roberts,A., Ryan,E., Saif,S., Shea,T., Shenoy,N., Sisk,P., Stolte,C., Sykes,S., White,J., Yu,Q., Coleman,M.L., Huang,K.H., Weigele,P.R., DeFrancesco,A.S., Kern,S.E., Thompson,L.R., Fu,R., Hombeck,B., Chisholm,S.W., Haas,B., Nusbaum,C. and Birren,B. 2011-09-23 GenBank