Protein

Genbank accession
AGR48553.1 [GenBank]
Protein name
tail protein
RBP type
TF
Evidence RBPdetect
Probability 0,74
TF
Evidence GenBank
Probability 1,00
TF
Evidence Phold
Probability 1,00
Protein sequence
MSKHCGLEANQKATDNEPKKRIRWNKSQRTLIEKLTADKHRKLRQSRRTADIYGDEVSAAQSQKLAEIEEVLIRSAGDVISLDRGQYDKWASLVSAKLGWRRGNPLNPSLNYSQAGEVREALKDARRVAQNLINDASHIRMLDGIKRFDDIYRQIMKPLGMTTDDARALFNETIEIGSIPKNNKIYGNSEGVRLINSLRHSDYIERAKGYGLNDEAIETLLRAATDVHSVFDEMRVIAEATGHNIEELQNLGYFPRIATRDFNIRLRKALETDTALADVIMSEGVEQVKALNPLSSVWQKSRKFNYFVPDDLEVASKLLNTSSDEIAEMLLNPREWMEFLTSSVSSSQIETMTELGVMSKLPMTSREVFEQLVDQYELPYKHINEMFKLDPHVAAEEYARVLRQAVGNSAMLKTVVKDGLAAGWAVPEKMLKDLSPKERANFVPLSFQKLDQFMSPEQLEAAGKVYVHRVVSDQWRSMLEISMSANKLGAFASAWSHLSTFLNKSVLASRNVLYVGTNFLSGFVLTNAVGANVFTVPHAMMDISNYLAKGLDAFDGTKPFAKIGGEWISKREFFKQFLLKRGSDITPGTVSTTSSGGDANPFTSFKSIGALADVRSAKRALEYLWSYSSSFGDPVRGTKGAAEYVGSLLNEATDNFFSPFAKMASFLDTMYKWNAYTSLVERQGAAELANTIAQGMTLEPISRIGRKFDNWRDLSRHIDDYFFTFDDPGTTTKVISKYVRPFANWSMQSTPAMLRAALRSPQKFSAYAKLLQLYNRGNNDDEPLNQSQLTDWQDDEYPVILQRDALQTGDGNGGLLVLFPHTFDPITDTLNVIDNAGRTVNILFGNKYGGNERDNRNSVTGKKDGLTSMLTELFNDTYWAKPAGLLLGIDSFTGQKIDASKYNNYLGFEMHPLAEALLGMYTPLDAINRTNLFDTFGRREYKDYRDRTVVEEKPGLFGGQRTNSDAQSLAWETAVKNGNWSALALMTMGARVRLIDTARNTQMTLDEIKTGIDELQKANVNAARQLTLNPEKLSESERNKRTERLTESLTAEYQMKYDYARLINYMKAKRIPPKRLLFEMQQRSVNVSDLEPVGGKQRLQLESDFRRRIEEINK
Physico‐chemical
properties
protein length:1114 AA
molecular weight: 125691,88360 Da
isoelectric point:8,03523
aromaticity:0,08977
hydropathy:-0,46876

Domains

Domains [InterPro]
AGR48553.1
1 1114
Legend: Pfam SMART CDD TIGRFAM HAMAP SUPFAM PRINTS Gene3D PANTHER Other

Taxonomy

  Name Taxonomy ID Lineage
Phage Anabaena phage A-4L
[NCBI]
1357732 Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host Anabaena variabilis
[NCBI]
1172 Bacteria > Cyanobacteria > Nostocales > Nostocaceae > Anabaena >

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
AGR48553.1 [NCBI]
Genbank nucleotide accession
KF356198 [NCBI]
CDS location
range 16766 -> 20110
strand -
CDS
ATGAGTAAACATTGCGGCTTAGAAGCTAACCAAAAAGCAACAGATAACGAACCAAAAAAACGTATACGATGGAATAAGTCACAGCGTACACTTATCGAGAAGTTAACAGCAGATAAACATCGTAAACTACGCCAGTCTCGTAGAACTGCTGACATATATGGTGATGAAGTCTCAGCCGCACAGTCTCAGAAGCTAGCAGAAATAGAAGAAGTACTAATACGTTCGGCTGGTGATGTTATCAGTCTCGACCGTGGACAGTACGATAAATGGGCATCACTCGTTAGCGCCAAATTAGGATGGAGACGGGGCAACCCTCTTAACCCATCACTAAACTACAGTCAAGCTGGTGAAGTACGAGAGGCTTTAAAAGATGCACGTCGTGTTGCACAGAACCTAATTAACGATGCCTCACATATACGAATGTTGGATGGTATCAAACGTTTCGATGACATTTACCGTCAGATAATGAAACCGCTAGGTATGACAACTGATGATGCACGGGCATTATTTAACGAGACTATTGAGATAGGAAGCATACCAAAGAACAACAAAATATATGGCAACAGTGAGGGTGTACGTCTCATTAACTCACTACGCCACAGTGACTACATCGAACGTGCTAAAGGGTACGGTTTGAATGATGAAGCCATTGAGACACTACTAAGGGCAGCAACAGACGTACATTCTGTGTTCGATGAGATGAGGGTCATAGCTGAGGCAACTGGACACAACATAGAAGAACTACAGAACCTTGGTTATTTCCCGCGTATAGCAACTCGTGACTTTAACATCCGACTGCGTAAAGCATTGGAGACTGACACAGCGTTAGCCGATGTAATTATGAGTGAGGGAGTAGAGCAAGTCAAGGCTCTCAACCCGTTAAGTAGTGTTTGGCAGAAGTCACGGAAGTTTAACTACTTCGTACCAGATGACCTAGAAGTTGCATCTAAGTTGCTAAACACATCATCGGACGAGATAGCCGAGATGCTTCTTAACCCTCGTGAATGGATGGAGTTCTTAACCAGTTCTGTCAGTTCATCACAGATAGAAACGATGACAGAGTTAGGTGTTATGTCCAAGTTGCCAATGACATCCCGCGAAGTGTTCGAGCAATTGGTAGACCAATACGAACTACCATACAAACACATTAACGAGATGTTCAAACTTGACCCACACGTAGCGGCTGAGGAATATGCCCGTGTACTGCGTCAAGCTGTGGGAAACAGTGCAATGCTCAAGACGGTAGTAAAGGATGGCTTGGCGGCTGGCTGGGCTGTGCCTGAGAAGATGTTAAAAGACCTGTCACCCAAGGAACGTGCTAATTTTGTACCCCTATCTTTCCAGAAGCTTGACCAGTTCATGTCACCTGAACAACTAGAGGCGGCTGGTAAGGTTTATGTTCACCGTGTAGTGTCTGACCAGTGGCGCTCAATGCTGGAAATATCCATGAGTGCTAACAAACTCGGTGCGTTTGCGTCGGCATGGTCACACCTATCTACATTCCTAAATAAGTCGGTGCTGGCATCCCGTAACGTTCTGTATGTTGGTACTAACTTTCTCAGTGGTTTCGTGTTGACTAATGCCGTTGGTGCTAACGTGTTTACCGTTCCTCACGCAATGATGGACATAAGTAATTACCTAGCTAAAGGCTTAGATGCGTTCGATGGTACTAAACCATTTGCAAAGATAGGTGGTGAATGGATAAGCAAGCGTGAGTTTTTCAAACAGTTTCTACTGAAGCGTGGTAGTGACATAACCCCTGGTACTGTTAGCACTACGTCAAGTGGTGGTGATGCTAACCCGTTTACATCGTTCAAGAGTATTGGCGCTTTGGCTGACGTTCGTAGTGCCAAACGTGCGCTAGAGTATCTATGGTCTTACAGTTCTAGTTTCGGTGACCCTGTGCGCGGTACTAAAGGTGCAGCAGAATATGTAGGTTCATTGCTAAACGAAGCAACCGACAACTTCTTTAGCCCGTTCGCTAAGATGGCATCGTTCCTAGATACCATGTACAAATGGAATGCGTACACGTCACTGGTTGAGAGACAAGGCGCGGCTGAGTTAGCCAACACAATAGCTCAGGGTATGACACTAGAACCTATCAGTCGTATTGGGCGTAAGTTTGATAATTGGCGCGACCTTAGCCGTCATATTGATGACTACTTCTTTACGTTCGATGACCCTGGTACAACAACCAAAGTTATCAGTAAATATGTACGTCCGTTCGCTAACTGGTCTATGCAGTCAACACCTGCTATGTTACGTGCGGCGTTACGTTCACCTCAGAAATTCAGTGCATACGCCAAACTACTCCAACTATATAACCGTGGTAATAATGACGATGAACCACTAAACCAGTCACAGTTAACCGACTGGCAAGACGATGAGTATCCAGTTATCCTACAACGTGACGCACTGCAAACAGGAGATGGTAACGGTGGTTTATTGGTGCTATTTCCCCATACGTTTGACCCTATCACCGATACTCTAAACGTGATAGATAACGCTGGACGTACCGTTAATATCTTGTTTGGTAATAAGTATGGCGGTAATGAACGAGATAACCGAAACAGTGTGACCGGTAAAAAGGATGGTTTAACCAGTATGCTAACCGAGTTATTTAACGATACATATTGGGCTAAACCCGCAGGCTTATTGTTAGGTATCGACTCATTCACAGGACAGAAGATAGACGCTAGCAAGTATAACAACTACCTCGGTTTTGAGATGCACCCACTAGCTGAAGCGTTGTTAGGAATGTACACACCTCTCGACGCTATTAACCGTACTAACCTGTTTGATACCTTTGGGCGACGTGAATACAAAGACTACCGCGACAGAACAGTAGTAGAAGAGAAACCAGGGTTATTTGGTGGTCAACGTACTAATAGTGATGCTCAGTCGTTAGCGTGGGAAACAGCAGTCAAGAACGGTAATTGGTCGGCTCTCGCCTTAATGACTATGGGTGCTAGAGTCAGGCTCATTGATACCGCACGTAATACCCAGATGACACTCGACGAAATAAAGACGGGTATTGATGAACTCCAAAAAGCTAACGTTAACGCTGCACGACAACTAACACTAAACCCAGAGAAGCTTAGTGAGTCAGAGCGTAACAAACGGACTGAGAGGTTAACCGAGTCACTAACCGCAGAATACCAGATGAAGTATGACTACGCTCGTTTAATTAACTACATGAAAGCTAAACGAATACCACCTAAACGTCTACTGTTTGAGATGCAACAACGCTCGGTTAATGTCAGTGACCTAGAGCCAGTCGGAGGTAAGCAACGGTTACAGCTAGAGTCAGACTTTAGGCGACGTATTGAGGAAATTAATAAATGA

Gene Ontology

No Gene Ontology terms available.

Enzymatic activity

No enzymatic activity data available.

Tertiary structure

PDB ID
9K3A
PDB
Source PDB
Method EM
Resolution 1,0000
Evidence 1,0000
PDB ID
942a9c2524029e0bfa58bf60ea6dad4e04bfc77b9600ee6b734dd48fb7f5c45d
ESMFold
Source ESMFold
Method ESMFold
Resolution 0,5528
Evidence 0,5528

Literature

No literature entries available.