Genbank accession
CAB5194614.1 [GenBank]
Protein name
Collagen triple helix repeat
RBP type
TF
Evidence RBPdetect
Probability 0,90
TF
Evidence RBPdetect2
Probability 0,88
Protein sequence
MDIKKLTQEVLLKNMTPEQQMAVLDSVQASVKEAKAVQKQKIAENVDLVLQALKRIEADMIKRVDGSAQVVEDRVKTIKDGKDGKNGIDGKAGRDGKDGKNGADGRNGKDGLNGVSGERGQDGVGVQNAHIDFDGSLIIALTNGQELNVGEVVPFDVAEKIRVIGNGGGTSQFVIDTLADLQTQINNVAGGLAYKGTWNASTNSPTIVSSTGTNGWYYVVGTAGSTNLNGVTDWQVGDWAIFNGSTWQKIDQTNLVTSVAGRTGDITLTSTDVGLGNVDNKSSATVRGEITSSNVTTALGFTPYNSTNPAGYTTNTGTVTSVAASAGTGISVSGSPIIGSGTLTITNTAPDQTVALTAGTGISVSGTYPNFTVTNTSPSSGGTVTSVTGTSPIVSSGGNTPAISLAASYGDTQNPYASKTANYILAAPNGSSGAPTFRAIVAADIPTLNQNTTGSAAKWTTTRTLSFTGDVTGSGSVDGSANVATGLTLASGSVTQAKLAANVAGNGPAFSAYKSANQTISQNTTTKVTFDTESYDTNNNFASSTFTPTIAGYYQVSAAVDFQGTFNHSYFLNVMIYKNGANIKSTLASFTFGNGGENTILSNPPPIYMNGTTDYLELYVYSYDYSAAGSVTVNGGALYTIFGAYLVKAA
Physico‐chemical
properties
protein length:650 AA
molecular weight: 66822,78800 Da
isoelectric point:4,95951
aromaticity:0,07231
hydropathy:-0,17323

Domains

Domains [InterPro]
DC_0646
STR
101–337
IPR008983
RBD
508–647
CAB5194614.1
1 650
Architecture
ATT
STR
RBD
ATT 2-75 | STR 81-337 | RBD 480-650
Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Taxonomy

  Name Taxonomy ID Lineage
Phage uncultured Caudovirales phage
[NCBI]
2100421 Uroviricota > Caudoviricetes > Peduoviridae > Maltschvirus maltsch >
Host No host information

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
CAB5194614.1 [NCBI]
Genbank nucleotide accession
LR798224 [NCBI]
CDS location
range 12477 -> 14429
strand -
CDS
ATGGACATTAAGAAGCTTACCCAAGAAGTTCTCCTTAAAAACATGACTCCAGAGCAGCAAATGGCTGTTTTGGACAGTGTACAAGCCTCCGTTAAAGAGGCTAAAGCCGTTCAGAAGCAGAAAATTGCTGAGAATGTGGACTTAGTGCTCCAAGCGTTGAAGCGTATCGAAGCTGACATGATTAAACGTGTCGATGGTAGTGCTCAAGTCGTTGAAGACCGTGTAAAGACCATCAAAGACGGTAAAGATGGTAAGAATGGTATCGACGGCAAGGCTGGACGTGATGGTAAAGACGGTAAGAACGGTGCTGATGGTCGTAATGGCAAAGATGGCCTCAATGGTGTCTCAGGTGAACGAGGTCAAGATGGTGTTGGCGTTCAAAACGCTCACATTGACTTTGATGGTAGCCTTATTATTGCTCTCACTAACGGTCAAGAGTTAAATGTTGGTGAAGTAGTTCCTTTTGACGTAGCTGAGAAGATCAGAGTCATCGGTAACGGCGGTGGTACATCTCAGTTTGTCATTGATACCCTTGCTGACCTTCAAACACAGATCAACAACGTAGCTGGTGGCTTAGCTTATAAAGGTACATGGAACGCTTCTACTAACTCTCCTACCATTGTTTCAAGCACAGGAACTAATGGCTGGTATTACGTTGTAGGTACAGCGGGTTCAACTAACCTAAACGGTGTAACTGATTGGCAAGTAGGCGACTGGGCTATCTTTAACGGCTCCACATGGCAAAAGATTGACCAAACTAACTTGGTTACCTCAGTTGCTGGACGTACAGGAGATATTACTCTTACTTCCACCGATGTAGGTTTAGGTAACGTAGATAACAAGTCCAGTGCTACGGTTCGAGGTGAAATTACCTCGTCTAACGTCACTACAGCCTTAGGTTTCACACCTTATAACTCTACTAACCCTGCTGGCTACACGACTAACACAGGCACTGTAACCTCAGTTGCAGCCTCAGCAGGTACAGGTATTTCAGTCTCAGGTAGCCCTATTATAGGCTCAGGTACACTGACGATTACCAACACTGCTCCAGACCAGACAGTAGCTTTGACAGCTGGTACAGGAATCTCTGTGTCGGGAACATATCCTAACTTTACAGTTACTAACACAAGTCCTTCATCAGGTGGCACTGTCACATCAGTTACAGGAACATCTCCTATTGTCTCCAGTGGTGGTAATACACCAGCTATTAGTCTTGCAGCAAGCTATGGAGATACACAAAACCCATATGCAAGCAAAACAGCTAACTACATCTTAGCTGCTCCTAACGGTTCTTCAGGTGCTCCTACATTCCGAGCTATCGTTGCAGCTGATATTCCTACTCTGAATCAGAACACTACAGGATCAGCAGCAAAATGGACAACGACTCGCACTTTAAGTTTTACAGGTGATGTAACAGGCTCTGGTTCTGTAGATGGTTCAGCAAACGTAGCTACAGGATTAACACTTGCGTCAGGTAGCGTTACTCAGGCTAAGTTGGCTGCTAACGTGGCTGGTAATGGCCCTGCGTTTAGTGCTTATAAAAGTGCAAACCAAACAATTTCACAAAACACGACTACAAAGGTAACTTTTGATACCGAGAGTTACGATACAAACAACAACTTTGCATCGTCCACATTTACACCAACTATTGCTGGATACTATCAAGTTAGCGCTGCTGTTGATTTTCAAGGCACGTTTAATCATTCTTATTTTCTCAATGTAATGATTTACAAAAACGGGGCAAATATAAAATCTACTTTGGCTTCTTTTACCTTTGGTAACGGCGGTGAAAATACCATTTTAAGTAACCCGCCACCAATTTACATGAACGGCACAACTGACTACCTTGAGTTGTATGTTTATAGTTACGATTACTCAGCGGCTGGTTCAGTTACTGTTAATGGGGGCGCTCTTTACACAATTTTTGGCGCTTATCTTGTGAAAGCAGCATGA

Genome Context

Genome Context

Tertiary structure

PDB ID
fea46c4142bc7cb092a54bf8f481a666dfaea9b9c04fe89928aee401e27689d7
ESMFold
Source ESMFold
Method ESMFold
Resolution 0,6834
Oligomeric State monomer
Model Confidence
Very high
pLDDT > 90
High
90 > pLDDT > 70
Low
70 > pLDDT > 50
Very low
pLDDT < 50