Protein

View in Explore

Genbank accession

AOO14726.1 [GenBank]

Protein name

hypothetical protein

RBP type

Evidence RBPdetect2

Probability 0,93

Protein sequence

MANRIQLRRGGSQEWRNANPTLAQGEVGIDLDSGRIKIGDGSTAWNSLAYERPVESVANTANSLVQRDADGNFQAGTITGTVIGNASTASRLANVRQIQLTQDIVASGTFDGSQNLNLAAELQEIPTLPHFGADPAQGTYTSVTVDAKGRIINAANPSTIQDYNLDGVVEGQSAQPYDNDLSAVSGLTGTGISIRIGDGNWTTRSILSTAGQVVVSNGSGTAGNPQIDLATTTVVDGDYNTESLTSVIANGPAGEPFGTETVNAVKFTVDDRGRLQSATNVPIATATEGSKYANYDAGTSYSRYAIIQNASKVYQAYESVSAGAGAPAHTSGDSGGWRYLAAEATEQKGLASFAQEDFDVDSNGHVTIAALGVDNLQLQNNRVSFADGNTKEDFELDQELTATTGYRGFNYLNYIKVNDTSGNLLFGANNTGDSGAGELDVNVRSYFSDPNIDLDGAVDQIVSKYGDGHWTVSHVQNVATPRNLNILATNSGSGSANIVITSDDTVQISASDAAGKVWVEDYRFQENYIATTNATLNIDPGDDRAVTGTVRVWGDLQVDGTTTTVNSTTLQVDDPIITLGGDTDPVADDNLDRGIEFRYYDSQARRGFFGYDDSYTDLGGHSGGYAFYYNATNTAEVFSGTDAGVLAGNLKLTTNTNSTTNTTGDLVVAGGAGIGQDVNIGGSVDIDTNLTVHGTTLHDDNIVIQGASKVLQLNNGTGTTRVELQSTTGNASFYGVVDITNNLNINTNKFNVVAATGNTAIAGTLNVEGITTITDAVDLNSTLNVASSVHFEATDEPTFALNGGTGLWEIQSADYGSFRFDGGGYIAGDFMFDSDVVINGTILQRESSTEVFNEQNFLRVRRKFESGSVQVLTPSYASHSSSNARIFGGAGIGTSLHIGGTSASEGLFIGKKVNSDTVKFSVLGASGNTDIQGTLNVEGASVIDDTLNVTGAVDLDSTLNVDADATFQSNVTINGDNLLFTIEAQNGTDAFTVDSDNGNTIIAGTLDVDDATQITNTLNVTNGVDFDQTLNVDGAVDFNSTLVVDGQTTIYNSIYLNASNEEFAIQNGSGVDKFTVDSDNGNTIISGTVDISGATGITNSLTTSGVNTFTNSTQQTLTGSYSADGAFRLTGGAGIGKNLAVSGDTRVYGATELTGALDLNNSADISGIVTITNTSDITSYGDASVSLVTAGGLRVNKNAYVGGDFYVYDNGNSRAAFSVDNSTGNGEFHNNLIVGGDLTVNGTTTTVNSTTVTIDDPVFTLGGDTAPGSDDNKDRGIEFRYHTGSTAALGFFGYDDSASEFVFLTASTNSSEVFTGTDGNLRANQLHLTGSGTTLDVDADAIINGDLTVDDQIISTVTGKPPLVVASNSKVNNLNADLLDGLTTSSTDTTGTSVVSRSNGDFSANQITVNNGIGALAGIQGNATTADELRTARTVTIDGVVNATVSFDGSQNVTLTTTFDDADMDGLAAMAGTGFVSRTAANTYAQRTLITSPASGSGITVTQGDGVAGNPTINILSATTNAANNLVLRDGSGSFASNQITMVTSTVSGNATIGGTLGVTGITSLTDLLNADGGIAVDGTNFTVDGTTGAVSTASTLNADAAVTFGSTLGVTSNATIGGTLGVTGTVTASANLDVTVDATVGGTLGVTGITTLSNNLTVTGISAFTGAITATNGVVGNITGQVSDISNHDTDALTEGSTNIYYTNERVDDRVAALISGGTGITATYNDAGNLLTLSATQADISTDLITEGSTNLFTTAARTRTHFTYGTGIEHDGSGALSVTQVDIDTDNVTEGSVNLFTTAARTRTHFTYGTGIEHDGSGALSVTQADIDTDNVTEGSTNIFYTEARFDASLAGKSTNNLTEGTNLYYTDVRAEASFDTKIAAADTDALSEGSTNLYYTDARADARVANATGAALDLSSKSTADLAEDTNLYFTDARADARVDVGFAAKSTTDLAEGTNQYYTEARVQDKLDNAFAQLQAMLTNLATTTTLTLNLSGDPTPGAVVTTGSISASGLGGFTAGTAVATTSDGAGTGLTVDTTVDASGAITAVAANAGGTDYLIGETITLTNPNLGGAATFDFASLVGGSNYVTATGLTTTSSGSGNNLTVDITASAGVITNITVNVAGDGYSIGDTITIVQPVGSDPLGPGAGGTIDLSTVFTNATFALSDITTMEVGATVTGSTSGTTGVITALAASAITVDTVDGFFKVGEVVSANDVTTLTVQSFA

Physico‐chemical properties

protein length:	2228 AA
molecular weight:	228305,28410 Da
isoelectric point:	4,05003
aromaticity:	0,06373
hydropathy:	-0,10615

Domains

Domains [InterPro]

DC_1619
ATT
1–478

DC_1619 DC_1607 DC_0029 DC_0029

SSF69349
STR
4–241

SSF69349 DC_1607 DC_0029 DC_0029

IPR041352
ATT
5–43

IPR041352

AOO14726.1

1 2228

Architecture

ATT

STR

RBD

ATT 1-478 | STR 479-946 | STR 1098-1572 | RBD 1809-2228

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_1619	ATT	DC_1619	1	478	Novel HMM	DC_1619	N-terminal	Low	Positional only	123 proteins / 123 hits
SSF69349	STR	SSF69349	4	241	Merged direct domain	SSF69349	Central	Low	Positional only	153 proteins / 153 hits
IPR041352	ATT	DC_0533	5	43	InterPro cluster	Major tropism determinant, N-terminal domain	Central	Medium	Text match	295 proteins / 296 hits
DC_1607	STR	DC_1607	337	946	Novel HMM	DC_1607	Central	Low	Positional only	159 proteins / 159 hits
DC_1607	STR	DC_1607	1098	1572	Novel HMM	DC_1607	Central	Low	Positional only	159 proteins / 159 hits
DC_0029	RBD	DC_0029	1809	1881	Novel HMM	DC_0029	C-terminal	Low	Positional only	131 proteins / 131 hits
DC_0029	RBD	DC_0029	1873	1928	Novel HMM	DC_0029	C-terminal	Low	Positional only	131 proteins / 131 hits
DC_0029	RBD	DC_0029	1914	2081	Novel HMM	DC_0029	C-terminal	Low	Positional only	131 proteins / 131 hits
DC_0029	RBD	DC_0029	2068	2228	Novel HMM	DC_0029	C-terminal	Low	Positional only	131 proteins / 131 hits

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Cyanophage S-RIM14 [NCBI]	1278423	Uroviricota > Caudoviricetes > Pantevenvirales > Ahtivirus > Ahtivirus sagseatwo
Host	Synechococcus [NCBI]	1129	cellular organisms > Bacteria > Bacillati > Cyanobacteriota/Melainabacteria group > Cyanobacteriota > Cyanophyceae

Coding sequence (CDS)

Genbank protein accession

AOO14726.1 [NCBI]

Genbank nucleotide accession

KX349305 [NCBI]

CDS location

range 96012 -> 102698
strand +

CDS

ATGGCAAATAGAATCCAACTTAGAAGAGGCGGTTCACAGGAATGGAGAAACGCTAACCCAACACTAGCGCAAGGTGAGGTAGGTATTGACCTAGACTCTGGTCGTATCAAAATTGGTGATGGTTCCACTGCATGGAACTCACTGGCGTATGAACGTCCTGTAGAATCTGTTGCTAACACTGCAAATTCCCTCGTACAAAGAGACGCTGATGGTAACTTCCAAGCGGGTACGATTACAGGAACTGTTATTGGTAATGCCTCTACTGCATCTCGTCTAGCAAATGTTAGACAGATTCAACTTACTCAAGATATTGTTGCCTCTGGTACTTTTGACGGTTCTCAAAACCTCAACCTTGCTGCAGAACTGCAAGAGATCCCCACGCTGCCTCACTTTGGTGCGGATCCTGCACAAGGTACATACACCAGCGTTACTGTGGACGCAAAGGGTAGAATTATCAATGCCGCAAACCCATCTACTATTCAAGACTATAACTTAGATGGTGTTGTAGAAGGTCAGTCTGCACAACCTTATGATAATGACCTCAGTGCAGTTTCAGGTCTGACTGGTACTGGTATCAGTATTCGTATTGGTGATGGTAACTGGACTACTAGGAGTATTCTATCTACTGCTGGTCAAGTTGTTGTCAGTAATGGTTCTGGTACTGCAGGTAACCCACAAATTGACTTAGCAACTACAACAGTTGTTGATGGTGATTACAACACAGAATCCCTAACGTCAGTAATTGCTAACGGTCCAGCAGGTGAACCTTTCGGTACAGAGACCGTAAACGCAGTCAAATTTACTGTTGACGACAGGGGTCGTTTGCAGAGTGCTACAAATGTACCTATTGCTACTGCTACAGAAGGTAGTAAGTATGCTAACTATGATGCAGGTACTTCTTACTCTAGATATGCAATCATTCAGAATGCATCAAAGGTTTATCAAGCGTATGAATCAGTTAGTGCTGGTGCTGGTGCTCCTGCTCATACCAGTGGCGATTCTGGAGGATGGCGCTACCTCGCGGCTGAAGCGACAGAGCAGAAGGGACTGGCTAGTTTTGCACAGGAAGATTTCGATGTTGACAGTAACGGGCATGTAACTATTGCTGCCCTAGGCGTAGATAATTTACAATTACAAAATAATAGAGTTTCTTTTGCGGATGGAAATACAAAAGAAGATTTTGAACTGGATCAAGAACTCACTGCAACCACTGGATACCGAGGATTCAATTACCTCAACTATATCAAAGTCAATGATACAAGCGGCAATTTACTTTTTGGCGCTAATAATACAGGCGATAGTGGCGCTGGTGAACTTGATGTCAACGTCCGTTCCTATTTTTCTGATCCTAATATTGATCTTGATGGAGCAGTCGATCAGATCGTTAGTAAGTATGGCGATGGTCACTGGACCGTAAGTCATGTTCAAAATGTCGCGACTCCCAGAAACCTCAATATTCTTGCAACGAACTCTGGTTCAGGAAGTGCAAATATTGTAATTACATCTGATGACACTGTACAGATTAGTGCATCAGATGCAGCAGGTAAAGTTTGGGTAGAAGACTATAGATTCCAAGAAAATTATATTGCTACAACCAATGCCACTCTCAACATTGATCCTGGTGATGATAGGGCGGTTACTGGAACCGTCAGAGTTTGGGGTGATCTTCAGGTTGACGGCACCACGACGACAGTCAACTCTACTACCCTTCAAGTTGACGACCCAATCATTACTCTTGGTGGTGATACTGATCCAGTTGCTGACGATAATCTTGATCGTGGTATTGAGTTTAGATACTATGATTCTCAAGCGCGTCGAGGCTTCTTTGGTTACGATGATTCGTATACTGATCTCGGAGGACACTCTGGTGGATATGCATTCTACTACAATGCTACCAACACTGCAGAAGTCTTTAGCGGTACTGATGCAGGTGTCTTAGCAGGTAACCTAAAACTTACTACTAATACTAACTCCACTACTAATACAACGGGTGACCTTGTGGTTGCTGGTGGTGCTGGTATTGGACAAGATGTGAATATTGGTGGTAGCGTTGATATCGATACCAACCTGACTGTTCATGGCACGACTCTCCATGATGACAACATTGTCATCCAAGGTGCTTCTAAGGTTCTGCAACTGAACAATGGCACTGGTACAACTCGTGTTGAACTGCAGAGCACTACAGGTAATGCATCATTCTATGGTGTTGTTGATATTACTAACAACCTGAACATCAACACTAATAAGTTCAACGTTGTTGCTGCTACTGGTAATACTGCTATTGCAGGTACGCTGAATGTTGAAGGTATCACTACAATTACTGATGCTGTTGATCTCAATAGCACACTAAATGTTGCTAGTTCTGTGCATTTTGAAGCAACTGATGAACCCACATTTGCATTGAATGGTGGCACTGGTCTTTGGGAAATTCAATCCGCTGACTATGGTTCATTCCGATTTGATGGTGGTGGATATATTGCTGGCGACTTTATGTTCGACAGCGACGTTGTTATCAACGGTACTATTCTCCAGAGAGAATCATCTACTGAGGTCTTCAACGAGCAAAACTTCCTGAGAGTTCGTCGTAAGTTTGAATCTGGATCTGTTCAGGTTCTAACCCCTAGTTATGCTTCACATTCTAGCTCAAACGCTAGAATCTTTGGTGGTGCTGGTATCGGCACTAGTCTCCACATCGGGGGCACAAGTGCTAGCGAAGGTCTGTTTATTGGTAAGAAAGTCAATAGCGATACTGTCAAGTTCTCTGTCTTAGGTGCATCTGGTAATACTGATATTCAAGGCACACTGAATGTTGAGGGTGCATCTGTTATTGATGATACTCTGAATGTAACTGGTGCAGTTGATCTTGACAGCACTCTGAACGTTGATGCTGATGCAACATTCCAAAGCAATGTTACAATCAATGGTGACAATTTACTGTTTACCATTGAGGCACAGAATGGCACTGATGCATTTACAGTAGACTCTGACAATGGCAATACAATCATTGCTGGTACATTAGATGTAGATGATGCAACACAAATCACAAACACCCTCAACGTCACTAACGGCGTTGACTTTGATCAAACTCTCAATGTTGATGGTGCCGTTGACTTCAATAGCACTTTGGTTGTGGATGGTCAAACAACAATTTACAACTCCATTTACCTGAATGCTTCCAATGAGGAGTTTGCTATTCAGAACGGTTCTGGTGTAGACAAGTTCACTGTAGATAGTGACAATGGCAATACTATAATCTCTGGCACTGTTGATATTAGTGGTGCTACAGGTATTACAAATAGCCTGACTACATCAGGTGTCAATACATTTACAAATTCTACTCAACAAACCCTCACTGGTTCATACAGTGCAGATGGTGCATTCCGTTTGACAGGTGGTGCTGGTATTGGCAAGAATCTTGCAGTTAGTGGTGACACTAGAGTCTATGGTGCTACCGAACTTACAGGTGCTCTTGATCTCAATAACTCTGCAGATATTTCTGGTATTGTTACTATTACTAATACCAGTGACATTACCTCTTATGGTGATGCATCTGTCTCTCTAGTCACCGCTGGTGGTCTAAGAGTCAACAAGAATGCATACGTTGGTGGTGACTTCTACGTCTATGACAACGGAAATTCTCGTGCTGCATTTAGTGTAGACAACAGCACTGGTAATGGCGAGTTTCATAACAATCTAATTGTTGGTGGTGATCTAACGGTCAACGGTACAACTACTACCGTCAACAGCACTACCGTCACAATTGATGACCCCGTATTTACTCTTGGTGGTGACACTGCTCCTGGTTCCGATGACAACAAAGATCGTGGTATTGAGTTCCGTTATCACACGGGTTCTACCGCTGCTCTTGGTTTCTTCGGTTATGACGATTCTGCTTCGGAGTTTGTCTTCCTTACTGCATCTACAAATTCAAGTGAAGTATTCACTGGTACAGATGGAAACCTGAGAGCAAATCAGTTACATCTGACAGGTAGTGGAACAACTCTCGATGTTGATGCTGATGCAATTATCAATGGTGATCTGACTGTTGATGATCAAATTATTTCTACCGTAACTGGTAAACCACCTTTGGTTGTTGCATCAAACTCTAAGGTCAATAACCTGAATGCTGACTTGCTAGATGGTCTGACCACAAGCAGCACTGATACAACTGGTACTTCTGTTGTTAGTAGAAGTAATGGTGACTTCTCTGCTAATCAGATCACTGTAAACAATGGTATCGGTGCTCTTGCTGGTATCCAAGGTAACGCAACAACTGCGGATGAACTTCGCACTGCTCGTACCGTCACAATTGATGGTGTCGTCAATGCAACAGTCTCCTTTGATGGTTCTCAGAACGTAACTCTGACAACTACATTTGATGATGCAGACATGGATGGTCTGGCAGCGATGGCAGGAACAGGTTTCGTCAGCAGAACTGCTGCCAATACCTATGCTCAGCGTACGCTGATTACTTCTCCTGCATCTGGATCTGGTATTACTGTCACTCAAGGTGATGGTGTTGCTGGTAATCCAACGATCAATATTCTGTCTGCTACTACCAACGCTGCAAACAACTTGGTCCTGAGAGATGGAAGCGGTAGTTTTGCTTCTAATCAGATCACTATGGTGACCTCCACAGTGAGCGGAAACGCTACGATTGGTGGAACACTCGGTGTAACTGGTATAACGTCCCTCACAGACCTCCTGAACGCCGATGGTGGCATTGCAGTTGACGGTACTAACTTCACTGTAGATGGTACAACAGGTGCCGTTTCTACTGCTAGCACACTGAATGCTGATGCTGCAGTAACTTTCGGCAGCACACTGGGAGTTACTTCTAACGCAACTATCGGTGGCACACTGGGTGTTACTGGAACTGTAACTGCTAGCGCAAACCTAGATGTAACAGTCGATGCAACTGTCGGCGGTACTCTGGGTGTCACGGGTATTACAACTCTAAGTAACAACCTGACAGTAACTGGAATCTCTGCATTCACTGGTGCTATTACAGCAACTAATGGTGTTGTTGGTAACATCACTGGTCAAGTATCTGATATCAGCAATCATGATACGGATGCACTGACCGAAGGTTCTACTAATATCTACTACACAAATGAGAGAGTAGATGATCGCGTTGCTGCATTGATCTCTGGTGGTACAGGTATTACTGCTACCTATAACGATGCTGGTAACCTCCTGACCTTGAGTGCTACTCAAGCAGACATCTCCACTGATCTTATTACTGAAGGTTCCACGAATCTCTTTACTACTGCTGCTAGAACTCGTACACACTTTACATACGGTACAGGCATTGAGCATGATGGATCTGGTGCTCTTTCTGTAACACAAGTAGACATCGATACTGACAATGTAACTGAAGGTTCTGTCAATCTGTTTACCACTGCTGCAAGAACCAGAACCCACTTCACATATGGTACTGGTATTGAGCATGATGGTTCAGGTGCTCTGAGTGTTACTCAGGCAGACATTGATACTGATAATGTAACTGAAGGTTCTACAAATATCTTCTACACAGAGGCACGCTTTGATGCAAGTCTCGCAGGTAAGTCTACTAATAATCTGACAGAGGGTACTAACCTCTACTATACTGATGTACGTGCCGAGGCATCTTTTGATACCAAGATTGCTGCTGCTGACACTGATGCATTGAGTGAGGGTTCTACTAACCTTTACTACACCGATGCTCGTGCTGATGCAAGAGTTGCTAATGCAACTGGTGCTGCTCTTGACCTTAGCAGTAAGTCTACTGCTGACTTGGCAGAGGATACCAACCTTTACTTTACTGATGCTCGTGCTGATGCAAGAGTCGATGTAGGATTTGCTGCTAAGTCAACTACTGATCTTGCTGAAGGTACTAATCAATATTATACCGAGGCAAGAGTACAAGATAAACTGGATAATGCATTCGCTCAACTACAAGCAATGCTTACCAACCTTGCAACTACTACCACTCTTACATTGAACCTCTCTGGCGACCCTACACCTGGTGCAGTGGTTACTACTGGTTCTATCAGTGCTAGTGGTCTTGGTGGTTTCACTGCTGGAACTGCTGTTGCTACCACCTCTGATGGTGCTGGTACTGGATTGACTGTTGATACTACAGTTGATGCTTCTGGTGCTATCACTGCAGTCGCTGCTAACGCAGGTGGCACTGATTATCTGATCGGTGAAACAATTACCCTTACCAACCCTAATCTGGGCGGTGCTGCAACATTCGACTTTGCTTCGTTGGTTGGTGGATCTAACTACGTTACCGCAACTGGTTTGACAACTACTTCATCAGGTTCTGGAAATAATCTCACCGTAGACATCACCGCATCTGCTGGTGTTATTACCAACATTACTGTAAATGTAGCAGGAGATGGTTACTCAATTGGTGACACTATTACTATTGTTCAACCTGTTGGTTCCGATCCATTAGGTCCTGGTGCTGGTGGTACTATTGATCTTTCAACAGTATTCACCAATGCAACCTTTGCACTTTCTGATATCACAACGATGGAAGTTGGTGCAACTGTCACGGGTTCTACCAGTGGCACCACAGGTGTTATCACCGCTCTCGCTGCTAGTGCTATTACCGTCGATACCGTTGATGGATTCTTCAAAGTTGGAGAAGTCGTCAGTGCTAATGATGTTACTACTTTGACTGTCCAATCATTCGCTTGA

Genome Context

Tertiary structure

PDB ID

af35c418c670b6c5d0ad9903799502cac0bcdcda21bf97a41797dc74452041da

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,4836

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence