Genbank accession
AIX32999.1 [GenBank]
Protein name
collagen triple helix repeat protein
RBP type
TF
Evidence RBPdetect2
Probability 0,87
Protein sequence
MASIQFPANPKVGDTYYDVDTNITYTWEGEYWFATGPGTGIGATGATGAQGNQGSSGEKGEPGTRGIKGDTGSTGSTGPTGPGGFIGLTGATGPQGSPGGATGATGNIGPLGTTGATGPDGASGATGIQGPIGTPGGATGATGLAGPPGNVGATGPLGPNGTPGGATGPLGPVGSTGATGAGATGSDGATGSTGIQGLQGSPGGATGATGIDGLLGPIGATGTTGATGVDGPIGATGTTGATGETGDTGSTGAAGPTGIPGATGFTGPEGATGSKGDEGSTGSTGPQGSPGGATGATGVDGPVGSTGATAATGATGPDGPTGPAGPTGLLGATGATGDDGSTGATGATGFGATGADGATGSTGSTGPDGPLGSTGATGIAGGVSHVWSPDVSILTANNSFLFTHDVDEDIKVLKISKFSSTFTNEEALLNSFAIGDSLRLTSGPATFQYTVRANGGLTVSSGVDVFMLLVSDGFLASGSGTLNGSTVVLQRPTSSTFATFNFGVSTINWPTTDGDVTIDYPFLVNNGPRYVAFNQKDLLGRDDEQFFFEPLVSTDLNSFQFQVKTTNFFKSEIEGGYYYSDIDAYVYLTDITELYSDPSNPVTSVGSPWNVQVVGIASAIPGVAGSPGGATGATGPAGPPSGATGATGDLGPIGPGGPTGPVGVNGSPGSPGGATGATGADGPEGATGSTGATGAFVTGSNLVAGIITATTFDGDATSSDKIKTNRSSSAAVNYLTFVSDDNTGGAVSETLKTNLNVSFIPSSGDFIASRITASNNFYLGGTEVNSSASELNVLVGVTDFLDEDNMASDSPTAIPSQQSVKRYVDANAFSGITTVSILVGAGSSDVYFASSIVPTTNESIDLGSIDYKFRDLYLSDTTIYTNTGELSVGLNTTAPTAKVVLGPALQTIVQQSTDFDDFKIRIAAQSWGG
Physico‐chemical
properties
protein length:929 AA
molecular weight: 89690,94010 Da
isoelectric point:4,05003
aromaticity:0,06781
hydropathy:-0,09688

Domains

Domains [InterPro]
IPR050149
Unmapped
42–379
DC_1341
STR
247–328
AIX32999.1
1 929
Architecture
STR
STR
STR 1-99 | STR 187-853 |
Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Taxonomy

  Name Taxonomy ID Lineage
Phage Synechococcus phage ACG-2014f
[NCBI]
1493511 Uroviricota > Caudoviricetes > Pantevenvirales > Atlauavirus > Atlauavirus tusconc8
Host Synechococcus sp. WH 7803
[NCBI]
32051 Bacteria > Cyanobacteria > Oscillatoriophycideae > Chroococcales > Synechococcus >

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
AIX32999.1 [NCBI]
Genbank nucleotide accession
KJ019106 [NCBI]
CDS location
range 13518 -> 16307
strand +
CDS
ATGGCAAGCATTCAATTCCCAGCAAATCCGAAAGTTGGTGATACTTACTACGACGTAGATACAAATATAACTTACACCTGGGAGGGTGAATACTGGTTTGCAACAGGACCAGGCACAGGTATTGGTGCCACTGGAGCAACTGGAGCACAAGGAAATCAAGGTTCTAGTGGTGAAAAGGGTGAGCCAGGAACTCGCGGAATTAAAGGAGATACTGGATCTACTGGTTCTACCGGTCCCACAGGTCCTGGTGGTTTTATTGGATTAACAGGTGCAACTGGTCCTCAAGGTTCTCCCGGTGGTGCTACCGGTGCTACAGGTAATATTGGTCCTTTAGGAACTACTGGTGCAACTGGTCCTGATGGTGCTAGTGGTGCTACAGGTATTCAGGGTCCTATTGGTACTCCAGGTGGTGCAACTGGCGCTACTGGTTTAGCTGGTCCTCCAGGAAATGTTGGTGCTACTGGTCCTCTCGGTCCTAATGGTACTCCAGGTGGTGCTACTGGTCCTCTTGGTCCTGTTGGTTCTACTGGAGCCACTGGTGCTGGTGCTACTGGCTCTGATGGTGCTACTGGTTCTACAGGTATTCAGGGACTACAAGGTTCCCCAGGTGGTGCAACTGGTGCTACTGGTATTGATGGTTTACTAGGTCCTATTGGTGCCACAGGTACTACAGGAGCTACCGGTGTTGATGGTCCTATTGGTGCCACAGGTACTACAGGTGCCACAGGTGAGACAGGTGATACAGGTTCAACCGGTGCTGCTGGACCTACCGGTATTCCTGGAGCCACTGGTTTCACAGGTCCTGAAGGTGCTACGGGTTCCAAAGGTGATGAAGGTTCTACAGGTAGTACAGGTCCTCAAGGTTCTCCAGGTGGTGCCACTGGTGCTACTGGTGTTGATGGTCCTGTAGGTTCTACAGGTGCCACAGCTGCTACTGGTGCCACTGGTCCTGACGGTCCTACCGGTCCCGCAGGTCCTACAGGTTTATTAGGTGCCACTGGTGCTACTGGTGATGATGGTTCTACCGGAGCCACTGGTGCTACTGGTTTTGGTGCTACAGGTGCTGATGGTGCTACTGGTTCTACAGGTTCTACAGGTCCTGATGGTCCTCTTGGTTCTACTGGTGCCACTGGTATTGCAGGTGGTGTGAGTCATGTATGGTCACCAGATGTTTCTATCCTAACCGCCAACAACTCTTTCCTATTCACCCATGATGTAGACGAAGATATTAAGGTTCTAAAGATATCCAAGTTTAGTTCAACATTCACCAATGAGGAGGCACTACTTAATAGTTTTGCAATCGGTGATTCACTTAGACTAACATCAGGTCCAGCAACATTCCAATATACTGTTAGAGCCAATGGTGGACTCACAGTATCATCTGGTGTTGACGTGTTTATGTTACTCGTCAGTGATGGTTTCTTAGCATCTGGTAGTGGAACACTCAATGGTTCAACAGTTGTTCTTCAACGTCCCACATCATCCACCTTCGCTACATTTAACTTCGGTGTATCCACTATCAACTGGCCTACTACTGATGGTGATGTAACTATTGACTATCCATTCCTAGTAAACAATGGTCCTAGGTATGTTGCATTCAATCAGAAGGATCTACTAGGTAGGGATGATGAGCAGTTCTTCTTTGAACCTTTAGTATCTACAGACCTAAACTCATTCCAGTTCCAGGTTAAGACTACTAACTTCTTCAAATCAGAAATTGAAGGTGGTTACTACTATAGTGATATTGATGCCTATGTGTATCTAACTGATATCACCGAACTATATTCAGATCCAAGTAATCCAGTAACCAGTGTGGGTTCACCTTGGAATGTTCAGGTTGTAGGTATTGCCTCCGCCATTCCTGGTGTTGCTGGTTCTCCAGGTGGTGCAACCGGTGCTACTGGTCCTGCAGGTCCTCCAAGTGGTGCAACTGGTGCTACAGGTGATCTTGGTCCTATTGGTCCCGGTGGTCCTACTGGTCCCGTTGGTGTTAACGGATCCCCAGGTTCACCCGGTGGTGCCACTGGTGCCACTGGTGCTGATGGTCCTGAAGGTGCTACTGGTTCTACAGGTGCAACAGGTGCATTCGTCACTGGTAGTAATCTTGTAGCTGGTATTATCACAGCCACCACATTCGATGGTGATGCTACATCATCTGATAAGATTAAGACTAATCGGTCCAGCAGTGCGGCTGTTAACTATCTAACTTTCGTTTCTGATGATAACACTGGTGGTGCCGTTAGTGAAACCCTCAAGACAAACTTGAATGTAAGTTTCATTCCTTCTTCTGGTGATTTTATCGCTAGTAGGATTACAGCAAGTAACAACTTCTACCTGGGTGGTACTGAGGTCAATTCTTCAGCATCTGAACTAAATGTGTTGGTTGGTGTTACTGACTTCTTAGATGAAGATAATATGGCATCCGATAGTCCTACGGCTATCCCATCACAACAATCAGTTAAGAGGTATGTTGACGCTAACGCTTTCTCTGGTATTACTACAGTTAGTATCCTAGTGGGCGCTGGTTCTAGTGATGTATACTTCGCAAGTTCTATTGTTCCAACTACTAATGAGTCCATTGACTTGGGTAGTATTGACTATAAGTTCAGAGACCTCTACCTATCAGACACAACCATATATACTAACACTGGTGAACTTAGTGTAGGTTTGAATACCACAGCACCAACCGCAAAGGTTGTTCTTGGTCCAGCACTACAAACAATTGTTCAACAGTCCACTGATTTTGATGACTTTAAGATCAGAATTGCGGCACAAAGTTGGGGTGGATAA

Genome Context

Genome Context

Tertiary structure

PDB ID
bb419c4667e6789de4fde50ffb60b677a5438b181b6ca3a432ff409b3dae8d13
ESMFold
Source ESMFold
Method ESMFold
Resolution 0,4648
Oligomeric State monomer
Model Confidence
Very high
pLDDT > 90
High
90 > pLDDT > 70
Low
70 > pLDDT > 50
Very low
pLDDT < 50

Literature

Title Authors Date PMID Source
Ecological redundancy of diverse viral populations within a natural community Gregory,A.C., LaButti,K., Copeland,A., Woyke,T. and Sullivan,M.B. 2015-03-20 GenBank