Protein

View in Explore

UniProt accession

A0A8S5UID5 [UniProt]

Protein name

Collagen alpha 1(VIII) chain protein

RBP type

Evidence RBPdetect

Probability 0,89

Protein sequence

MYFQITNAARDALASNPSIRPTSYKLGTGTGYVPTASDTDIHGTLVSTGLLSPGDVINGNVLRYSILLPKDLTFLQQFGEVGLYTSTNMLFALAVADVPVTKDNSYAMRIDAYLSSVDANYEMWLDVAETSNAFHMGTLQSVDMLPSASDALPSAYIVKQGLIESFRAYTSGNGLWGFDEYASDGGTYPVTQPSVLSVTVNGATYTGPRVLDVNNPPIIEFVTGYLFSLCRKVTSIIDSGSSVTLNWDTPLIQAPVAGDTVVVFNRVPKSITAGPGITITRGANGQMVISAAQGSVSVWRNGIGAPANTVGNNGDYYLDDGNGNVYAKSAGVYSIVANIAGPQGVAGAAGAAGATGPQGPKGDAGIAGAPGANGNTIWNGTGAPSNTLGAPGDFYLQTDTSVLWGPKTTAWPSSGVPLQAPMKTYAVSLFVEGTTNVPNEVLMVHCAAAAFTIPVSLPGSNVKALSPAANNSVFIIKKNGTQIGVATFAIGSTTALLGSSVPVSFAVGDILEVDGPNTPDPSLANIGFTIVGTLN

Physico‐chemical properties

protein length:	535 AA
molecular weight:	55005,17310 Da
isoelectric point:	4,57698
aromaticity:	0,08224
hydropathy:	0,15626

Domains

Domains [InterPro]

No domain annotations available.

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

No domain annotations available.

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Myoviridae sp. ctu2j3 [NCBI]	2825197	Uroviricota > Caudoviricetes >
Host	No host information

Coding sequence (CDS)

Genbank protein accession

DAF94158.1 [NCBI]

Genbank nucleotide accession

BK016090 [NCBI]

CDS location

range 175812 -> 177419
strand -

CDS

ATGTATTTCCAGATAACGAATGCGGCACGTGATGCGCTGGCATCGAATCCCTCAATCAGACCTACTAGCTACAAGCTGGGCACTGGTACTGGATATGTGCCTACAGCCAGTGATACCGACATACACGGAACTCTGGTATCAACAGGACTCCTTAGTCCCGGCGACGTGATAAACGGTAACGTGCTTCGGTACTCCATTCTTCTTCCTAAGGATTTGACATTCCTTCAGCAGTTCGGAGAAGTTGGGCTGTACACCAGCACTAACATGCTGTTTGCACTAGCTGTGGCGGATGTGCCGGTCACTAAGGACAACTCGTATGCTATGCGTATAGACGCGTACCTGTCTTCGGTTGACGCAAACTACGAGATGTGGCTCGATGTGGCTGAGACCAGCAACGCATTCCACATGGGTACGCTTCAGTCTGTTGACATGCTGCCCAGCGCCAGTGACGCATTGCCGTCCGCGTATATCGTTAAGCAGGGGCTCATTGAATCATTCCGCGCCTATACCTCGGGGAACGGCCTATGGGGTTTTGATGAGTACGCGTCAGATGGCGGCACGTACCCAGTTACGCAGCCGAGTGTCTTGTCAGTCACGGTGAACGGTGCTACCTATACGGGACCACGCGTTCTAGACGTGAACAACCCGCCGATCATAGAGTTTGTGACCGGCTATTTGTTTAGTCTGTGCCGTAAGGTGACCAGTATCATTGATTCGGGTTCCTCAGTAACTCTGAATTGGGATACACCGTTGATTCAGGCACCTGTGGCGGGTGACACTGTAGTTGTGTTCAACCGAGTCCCGAAATCTATAACAGCGGGCCCGGGCATCACCATCACGCGGGGGGCTAATGGTCAGATGGTGATATCTGCCGCTCAGGGCAGTGTGAGTGTGTGGCGCAACGGTATAGGGGCACCTGCCAACACAGTAGGAAATAATGGGGATTACTATCTAGATGACGGTAACGGAAACGTGTACGCGAAGTCGGCCGGAGTCTATTCGATAGTCGCTAACATAGCAGGTCCCCAAGGCGTCGCTGGAGCCGCAGGTGCCGCGGGCGCTACGGGTCCGCAAGGTCCTAAAGGTGATGCTGGTATAGCGGGTGCGCCGGGCGCGAATGGCAACACTATATGGAACGGGACTGGTGCTCCGTCAAACACACTCGGCGCACCCGGCGACTTCTATTTGCAGACCGATACTTCGGTGCTATGGGGTCCTAAAACAACGGCATGGCCATCGTCTGGTGTACCGCTACAGGCACCAATGAAGACGTACGCAGTGTCGCTATTTGTTGAAGGCACAACAAACGTGCCCAATGAAGTTCTTATGGTGCACTGTGCAGCTGCCGCATTCACTATACCTGTAAGCCTTCCGGGTTCTAATGTCAAGGCCCTGAGTCCAGCTGCCAATAACTCGGTGTTCATCATCAAGAAGAACGGGACTCAGATAGGGGTAGCCACATTTGCCATTGGGTCTACTACTGCACTTCTTGGATCATCGGTTCCGGTGTCCTTTGCCGTGGGTGATATTCTAGAAGTGGACGGGCCAAACACACCCGACCCCTCGCTAGCTAACATCGGATTCACCATTGTGGGTACGCTGAATTGA

Genbank protein accession

DAF94253.1 [NCBI]

Genbank nucleotide accession

BK016090 [NCBI]

CDS location

range 256060 -> 257667
strand +

CDS

ATGTATTTCCAGATAACGAATGCGGCACGTGATGCGCTGGCATCGAATCCCTCAATCAGACCTACTAGCTACAAGCTGGGCACTGGTACTGGATATGTGCCTACAGCCAGTGATACCGACATACACGGAACTCTGGTATCAACAGGACTCCTTAGTCCCGGCGACGTGATAAACGGTAACGTGCTTCGGTACTCCATTCTTCTTCCTAAGGATTTGACATTCCTTCAGCAGTTCGGAGAAGTTGGGCTGTACACCAGCACTAACATGCTGTTTGCACTAGCTGTGGCGGATGTGCCGGTCACTAAGGACAACTCGTATGCTATGCGTATAGACGCGTACCTGTCTTCGGTTGACGCAAACTACGAGATGTGGCTCGATGTGGCTGAGACCAGCAACGCATTCCACATGGGTACGCTTCAGTCTGTTGACATGCTGCCCAGCGCCAGTGACGCATTGCCGTCCGCGTATATCGTTAAGCAGGGGCTCATTGAATCATTCCGCGCCTATACCTCGGGGAACGGCCTATGGGGTTTTGATGAGTACGCGTCAGATGGCGGCACGTACCCAGTTACGCAGCCGAGTGTCTTGTCAGTCACGGTGAACGGTGCTACCTATACGGGACCACGCGTTCTAGACGTGAACAACCCGCCGATCATAGAGTTTGTGACCGGCTATTTGTTTAGTCTGTGCCGTAAGGTGACCAGTATCATTGATTCGGGTTCCTCAGTAACTCTGAATTGGGATACACCGTTGATTCAGGCACCTGTGGCGGGTGACACTGTAGTTGTGTTCAACCGAGTCCCGAAATCTATAACAGCGGGCCCGGGCATCACCATCACGCGGGGGGCTAATGGTCAGATGGTGATATCTGCCGCTCAGGGCAGTGTGAGTGTGTGGCGCAACGGTATAGGGGCACCTGCCAACACAGTAGGAAATAATGGGGATTACTATCTAGATGACGGTAACGGAAACGTGTACGCGAAGTCGGCCGGAGTCTATTCGATAGTCGCTAACATAGCAGGTCCCCAAGGCGTCGCTGGAGCCGCAGGTGCCGCGGGCGCTACGGGTCCGCAAGGTCCTAAAGGTGATGCTGGTATAGCGGGTGCGCCGGGCGCGAATGGCAACACTATATGGAACGGGACTGGTGCTCCGTCAAACACACTCGGCGCACCCGGCGACTTCTATTTGCAGACCGATACTTCGGTGCTATGGGGTCCTAAAACAACGGCATGGCCATCGTCTGGTGTACCGCTACAGGCACCAATGAAGACGTACGCAGTGTCGCTATTTGTTGAAGGCACAACAAACGTGCCCAATGAAGTTCTTATGGTGCACTGTGCAGCTGCCGCATTCACTATACCTGTAAGCCTTCCGGGTTCTAATGTCAAGGCCCTGAGTCCAGCTGCCAATAACTCGGTGTTCATCATCAAGAAGAACGGGACTCAGATAGGGGTAGCCACATTTGCCATTGGGTCTACTACTGCACTTCTTGGATCATCGGTTCCGGTGTCCTTTGCCGTGGGTGATATTCTAGAAGTGGACGGGCCAAACACACCCGACCCCTCGCTAGCTAACATCGGATTCACCATTGTGGGTACGCTGAATTGA

Genome Context

Tertiary structure

PDB ID

bfe36e4d12619d4b30916cb9570c8dbb1329a1822cf12f33df1da349b67bf63e

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,8496

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence