Protein

Genbank accession
CAB5214297.1 [GenBank]
Protein name
Collagen triple helix repeat
RBP type
TF
Evidence RBPdetect
Probability 0,65
Protein sequence
PLFFIRNNSSIYNSSNPNPDLQGFWSGFGIDDLGDSNNNTGLNMYGYDGDGKVVTQIYGSGDSVMMWGWTGTDPIPANRFVDFPNENVNIKNGNLRVTGSFGITGQMTTDNGISMINTGATLNTYRIASQGSNDLKIDVNTPGNLRINSVTTAVTGSIDITGNYYINGVPFSGSTGTSGTSGTSGVAGSSGTSGGTGSSGTSGTSGINGTSGSSGTSGTSGVVDYTSVITTGSISSVQSITGSLNISGSGNSSIKQTYVFVSGALQVTSDGNINIISSSYINRFNGDIQNSFKSNLNTFSGNTEVTGTLVTTGDITSSGGALVSNASAGNEGGEIRLALAQSGQTLTGSITFDVFNNKVRLFETAGTNRGGYWDISTLAAGVGTNLAAGGGGSAFPFTGSAVITGSLAITGSVVGAVNSLSISSQTASLNLNNGDFFTLQLVSGSATHINPSNIKPGQTVNILLNTTGSGTVTWPANVVRQPASGSQYVPTTTTGKDIISLVSFDGSNLYLTSVKNLS
Physico‐chemical
properties
protein length:518 AA
molecular weight: 52491,63140 Da
isoelectric point:4,59585
aromaticity:0,07336
hydropathy:-0,08475

Domains

Domains [InterPro]
CAB5214297.1
1 518
Legend: Pfam SMART CDD TIGRFAM HAMAP SUPFAM PRINTS Gene3D PANTHER Other

Taxonomy

  Name Taxonomy ID Lineage
Phage uncultured Caudovirales phage
[NCBI]
2100421 Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host No host information

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
CAB5214297.1 [NCBI]
Genbank nucleotide accession
LR798242 [NCBI]
CDS location
range 34320 -> 35876
strand -
CDS
CCATTATTCTTTATTAGAAACAATAGTTCAATATATAACTCGTCAAATCCTAATCCTGATTTACAAGGTTTTTGGAGTGGGTTTGGTATTGATGATTTAGGTGATAGTAATAATAATACAGGTCTTAATATGTATGGTTATGATGGTGATGGTAAAGTTGTAACTCAAATATACGGTTCAGGTGATAGTGTTATGATGTGGGGTTGGACTGGTACTGACCCAATACCAGCAAATAGATTTGTTGATTTTCCTAATGAAAATGTTAATATTAAAAATGGTAATTTAAGAGTTACAGGTTCATTTGGTATTACAGGTCAAATGACTACCGATAATGGTATTAGTATGATTAATACTGGTGCTACTTTAAACACATATCGTATTGCTAGCCAAGGAAGTAATGATTTAAAAATTGATGTTAATACACCAGGTAATTTAAGAATTAATTCAGTAACAACAGCAGTAACTGGTTCAATAGATATAACAGGAAACTATTACATTAATGGTGTTCCATTTAGTGGTAGTACTGGAACTTCAGGTACAAGTGGAACTAGTGGGGTTGCGGGGTCATCAGGTACAAGTGGTGGAACAGGTTCAAGTGGAACAAGTGGTACATCAGGAATTAACGGTACGAGTGGTTCATCTGGAACATCAGGAACAAGTGGTGTAGTTGATTATACAAGTGTTATTACCACAGGTTCAATTTCATCAGTACAATCAATCACTGGTTCATTAAACATATCTGGTTCAGGTAATTCAAGTATTAAACAAACTTATGTATTTGTAAGTGGTGCACTTCAAGTTACTTCCGATGGTAATATAAACATTATTAGTTCATCATATATAAACAGATTTAATGGTGATATACAAAACTCATTTAAATCTAACTTAAACACTTTCTCAGGTAATACAGAAGTTACTGGTACATTAGTTACAACAGGTGATATTACATCATCAGGTGGTGCATTAGTATCAAACGCAAGTGCTGGTAATGAAGGTGGTGAAATTAGATTAGCATTGGCACAATCAGGACAAACTTTAACAGGTTCAATTACTTTTGATGTGTTTAATAATAAAGTTAGATTATTTGAAACGGCAGGAACTAATAGAGGAGGATATTGGGATATATCAACATTAGCGGCAGGAGTTGGAACAAACTTAGCTGCAGGTGGTGGAGGTTCTGCATTTCCATTCACAGGTTCAGCGGTAATAACTGGTTCGTTGGCAATAACAGGTTCAGTTGTAGGTGCGGTGAATAGTTTATCTATCTCGTCACAAACGGCCTCATTGAATTTAAACAATGGTGACTTTTTTACATTACAATTAGTATCAGGTTCAGCAACACATATCAACCCTTCTAATATTAAACCAGGTCAAACTGTTAATATATTATTAAACACAACAGGTTCAGGAACAGTAACTTGGCCAGCGAATGTTGTAAGACAACCAGCATCAGGTTCACAATATGTTCCAACAACCACAACAGGTAAAGACATAATTAGTTTAGTTAGTTTTGATGGTTCAAACCTATACTTAACTTCAGTTAAAAACTTATCTTAA

Gene Ontology

No Gene Ontology terms available.

Enzymatic activity

No enzymatic activity data available.

Tertiary structure

PDB ID
aa25820c99ed15793c6f316a4551960d90ca8693750d7b23f59b5addcebc25b5
ESMFold
Source ESMFold
Method ESMFold
Resolution 0,5516
Evidence 0,5516

Literature

No literature entries available.