Protein

View in Explore

Genbank accession

YP_010672510.1 [GenBank]

Protein name

hypothetical protein

RBP type

TSP

Evidence DepoScope

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,81

TSP

Evidence RBPdetect2

Probability 0,93

Protein sequence

MYSSKVEHKTNELTKTLFGSPKESKSYVDTIGKAVNQRPFNPVKDAWDHLNPPANVLDPSLPNIFGGVGPFPWNGEPNVGQYGWTEEEIEKVQLIMDYMEELRKIIEELQRLSEGDTSHILPIYNDIVRMYYEIIKRNIEINTSYEDIKRMYDEIMGLIAELRHGYRPYKDIYELLESDAPQHGEIVHTRGYHFEGGNGAASYNVWDLDEYRKMIDNEEWLPDASYETINGKEHYAGGNHMLKNNKVAILRYTTLWAGQCGLENPVDDESDYFDKYRNHDFGIQKAVDFAKLELSTNKSDHAVNDEKGPHAQLGVGVRRNIVLHVEQGSYVITKTIWVPANVLICGGNEWGGVQCVNWIPLKKHFGGTLNNYIRAFMFIFNGNRYHKPTPSVPMGSTPHEQIYVSTYVGGMSSCVFSNYETAYEKKPSGEIDWYKPNYLKGIKGCMVFGGATFTNITGDRMATAFHRPGIDWLDFYCDGWEIYNYKCNAPIENETYQFDFNGSGDVIRIEGCQFPVNHPPEDKSQPFPDGEYPFNGPIKACVLHNWASWDIRAPGQGGSQEMVGYVGAAMQVSRTINGLFHCVGYREVSFDACHFEFGQVHFNGGNGSITNCYFSKVKGADYPSIKMTKGQFGGDGHTVHIMNCEFHRGFNGAHLPVEKNQFDVVVDQFYTVRIIGCYQGWDAAGSANQEVGITVGYYTDYSEDLVKALPGWNRWSAYLSRESTICRNKIVPTEKVVFWNGFEGVQDVTCVESGTPLYWDLEYEKTYYYYAQYLADVGDETSPPDFIPLGKTQRERNILDPNGEDTGERYEASVYMKKPATVTDHVGNSRFTYYRPIISFYGESDTLDEGTIRLYRGTEPYQYTHYIDLPLMSRSTVDDFGSTCFGREWKVNPLPVDPNVNLDKRVRNIFPVTGNFLTNYKLLMKGGAPLTEKIEGVKDYYGRPITQYYGNGTWKYDSGVNVQIAENRHAAAAFEGIPETVTVFNRPFADDVYCSLPVTGSWNWDGSARMSIMPGTVARIIRTKDTNSGKFHRLWIQEDIPLDDPNSKRSYKPIRKMLEGEILICYYDEKDVLIEGTKDQFKKVGSWVAMTGADLRDYVNPYQYREYLSEDPQKFYLMMDFTTSERVQEVFAIFDFPTTGEQYVRVTNDSPLGTKLTIVKSAKLTNAIVLLLENPGGTNSGNIILEQKDATFTLMKQSGGWKLTGVSGGAIQKVESLDGKQYAELSPEAGIMEQYWYYNQPLTTSGGDPTYILRFTLGDQRVQPRLKQGMKVKVSRTLAAVSANPMAPNNIMIRQDNNQTGEQKILANLVDTGNSAEFVYNGTEWILSSLIGEKKASTRYVTVAESAYTVRASDSSGIETIIHMAAGGNRTVTLENSMAVGTKVTIGINGDNKYACYVYDSGGGGAIAQIFGGPGGSLVGATFIKMYNGAGKGSWMVV

Physico‐chemical properties

protein length:	1438 AA
molecular weight:	161786,88870 Da
isoelectric point:	5,41172
aromaticity:	0,12100
hydropathy:	-0,45869

Domains

Domains [InterPro]

Coil
Unmapped
95–115

Coil DC_1893

YP_010672510.1

1 1438

Architecture

STR

STR 282-709 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
Coil	Unmapped	-	95	115	Coils	Coil	-	-	-	-
DC_1893	STR	DC_1893	282	709	Novel HMM	DC_1893	Central	Low	Positional only	9 proteins / 9 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

YP_010672510.1

1 1438

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	264	264	0,9598
Central domain	265	934	671	0,9875
C-terminal	935	1438	503	0,5753

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-264

Central
265-934

C-terminal
935-1438

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Aeromonas phage BUCT695 [NCBI]	2908630	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Aeromonas veronii [NCBI]	654	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Aeromonadales

Coding sequence (CDS)

Genbank protein accession

YP_010672510.1 [NCBI]

Genbank nucleotide accession

NC_070977 [NCBI]

CDS location

range 69528 -> 73844
strand -

CDS

ATGTATTCGAGTAAGGTAGAACATAAAACTAATGAATTAACAAAAACTCTTTTTGGTTCTCCAAAAGAGTCTAAGAGTTATGTGGATACGATTGGTAAAGCTGTTAATCAAAGACCATTCAATCCAGTGAAAGATGCTTGGGATCATCTCAATCCACCTGCTAACGTACTTGATCCATCACTTCCAAACATCTTTGGTGGTGTAGGCCCTTTCCCTTGGAATGGTGAACCTAACGTTGGTCAATATGGTTGGACTGAAGAAGAGATTGAGAAAGTTCAACTCATTATGGATTATATGGAAGAACTTCGTAAAATCATCGAAGAACTTCAACGACTGAGTGAAGGTGATACCTCTCATATCCTCCCAATCTATAATGACATTGTTCGGATGTATTATGAAATCATCAAACGCAATATTGAGATCAATACTTCATACGAAGACATTAAGCGAATGTATGATGAGATTATGGGTCTTATCGCTGAACTTCGTCATGGTTATCGTCCTTATAAAGATATTTATGAACTCCTAGAATCTGATGCCCCACAACATGGTGAGATTGTTCACACTCGTGGTTATCACTTTGAAGGTGGTAATGGTGCAGCATCTTATAATGTTTGGGATCTTGATGAATATCGTAAGATGATTGATAACGAAGAGTGGTTGCCTGATGCATCATATGAAACTATCAACGGTAAAGAACATTACGCTGGTGGTAATCACATGCTCAAGAATAACAAGGTTGCAATCCTTCGTTACACTACTCTTTGGGCAGGTCAATGCGGTCTTGAGAACCCAGTGGATGATGAATCTGATTACTTTGATAAGTATCGTAACCATGATTTTGGTATTCAAAAAGCAGTTGATTTTGCAAAACTTGAACTCTCAACTAACAAGAGTGATCATGCCGTAAATGATGAGAAAGGCCCTCATGCTCAACTTGGTGTAGGTGTTCGTCGTAACATTGTACTTCATGTTGAACAAGGTAGCTATGTCATCACCAAGACTATCTGGGTTCCAGCTAACGTTTTGATTTGTGGTGGTAATGAATGGGGTGGTGTCCAATGTGTTAACTGGATTCCTCTGAAGAAACACTTTGGTGGTACTCTGAATAACTACATTCGTGCTTTCATGTTTATCTTCAATGGTAACAGATATCACAAACCGACTCCTAGCGTACCTATGGGTTCTACTCCACATGAACAAATTTATGTCTCTACTTATGTTGGTGGTATGTCTTCTTGTGTATTCTCCAACTATGAGACTGCATATGAAAAGAAACCAAGTGGTGAGATTGATTGGTACAAACCTAATTACCTAAAAGGTATTAAAGGTTGTATGGTGTTTGGTGGTGCTACATTTACCAATATTACTGGTGACCGAATGGCTACTGCTTTCCACCGCCCAGGTATCGACTGGCTTGATTTCTATTGTGATGGTTGGGAAATCTACAACTACAAATGTAACGCTCCTATTGAGAACGAAACTTATCAGTTTGACTTCAACGGTTCTGGTGACGTAATCAGAATTGAAGGTTGTCAGTTCCCAGTTAACCACCCACCTGAAGATAAATCTCAACCATTCCCTGATGGTGAGTACCCGTTCAATGGCCCAATCAAAGCTTGTGTTCTTCACAACTGGGCATCATGGGATATCAGAGCCCCAGGTCAAGGTGGTTCTCAAGAAATGGTTGGTTACGTTGGTGCTGCGATGCAAGTTAGTCGTACAATCAACGGCTTGTTCCACTGTGTTGGTTATCGTGAAGTTTCGTTTGATGCATGTCACTTTGAATTTGGTCAAGTCCACTTCAATGGTGGCAATGGTTCCATCACAAACTGCTACTTCTCAAAAGTCAAAGGTGCTGATTACCCTTCTATCAAAATGACAAAAGGTCAATTTGGTGGTGACGGTCATACAGTTCATATTATGAATTGTGAATTCCACCGTGGTTTTAATGGTGCTCACCTTCCTGTAGAAAAGAATCAATTTGACGTTGTTGTAGATCAGTTCTATACAGTGAGGATTATTGGTTGTTATCAAGGCTGGGATGCTGCTGGTTCTGCTAACCAAGAAGTCGGTATTACCGTTGGTTACTATACTGATTATTCTGAAGACTTGGTTAAAGCTCTCCCAGGTTGGAATCGTTGGAGTGCATACCTCTCTCGTGAATCTACAATCTGCCGTAATAAGATTGTTCCAACTGAGAAGGTTGTTTTCTGGAACGGTTTTGAAGGTGTTCAAGATGTTACTTGTGTTGAATCAGGTACACCGTTATATTGGGATCTTGAATATGAGAAGACATATTATTACTACGCTCAGTATCTTGCTGATGTTGGTGATGAGACAAGTCCTCCTGATTTTATCCCTCTAGGTAAAACTCAACGTGAACGTAATATCCTTGACCCAAATGGTGAAGATACTGGTGAACGTTATGAAGCATCTGTCTACATGAAGAAGCCTGCTACGGTGACAGATCATGTTGGTAACTCTCGATTCACTTATTACAGACCGATCATTTCGTTCTATGGTGAATCAGATACTTTGGATGAGGGTACAATTAGATTGTATCGTGGTACTGAACCATATCAGTATACTCACTACATTGATCTTCCATTGATGAGTCGTTCAACTGTTGATGACTTCGGTTCAACTTGCTTTGGTCGTGAATGGAAAGTAAACCCACTACCTGTTGACCCAAATGTTAACTTGGATAAACGAGTTCGTAACATTTTCCCTGTAACTGGTAACTTTTTAACAAATTATAAACTACTTATGAAAGGTGGTGCTCCTTTAACTGAAAAGATTGAAGGTGTTAAAGATTACTACGGTCGTCCAATTACTCAATACTACGGTAATGGTACTTGGAAGTATGATAGTGGGGTTAATGTTCAGATTGCAGAGAATCGACATGCTGCCGCTGCATTTGAAGGGATTCCTGAAACAGTTACTGTATTCAATAGACCTTTCGCTGATGACGTATATTGCAGTTTGCCAGTGACTGGATCTTGGAACTGGGATGGTAGTGCTCGTATGAGCATCATGCCTGGGACTGTTGCTAGAATTATCCGAACAAAGGATACTAATAGTGGTAAGTTCCATAGATTGTGGATTCAAGAAGATATTCCTCTTGATGATCCAAATTCTAAGAGATCATATAAACCTATTCGTAAAATGCTTGAAGGTGAAATACTTATCTGCTATTACGATGAGAAGGATGTGTTAATTGAAGGTACTAAAGATCAGTTTAAGAAGGTAGGTTCTTGGGTTGCTATGACTGGTGCTGATCTTCGTGATTATGTTAATCCATATCAATATCGTGAATACTTATCTGAAGATCCTCAGAAATTCTACCTAATGATGGATTTCACAACTTCAGAACGTGTTCAAGAGGTTTTTGCAATCTTTGACTTCCCTACAACTGGTGAACAATATGTTCGTGTAACTAATGACTCACCTTTGGGAACCAAACTCACAATTGTTAAATCTGCCAAACTAACAAACGCAATTGTTTTACTACTTGAAAACCCAGGTGGTACAAACAGTGGTAACATTATTCTTGAACAGAAAGATGCTACATTCACTCTGATGAAACAGTCTGGTGGTTGGAAACTAACTGGCGTATCTGGTGGTGCAATCCAAAAGGTTGAATCTTTGGATGGCAAGCAATATGCTGAACTATCACCTGAAGCTGGTATTATGGAGCAGTATTGGTACTATAACCAACCTTTGACAACTTCTGGTGGTGACCCAACTTATATCCTGAGATTTACTCTTGGTGATCAGCGGGTTCAACCCAGATTGAAGCAGGGTATGAAGGTTAAGGTATCAAGAACGCTTGCTGCTGTCAGTGCTAACCCAATGGCACCAAACAATATCATGATTCGTCAAGATAATAACCAAACTGGTGAGCAGAAGATTTTGGCTAATCTAGTAGATACTGGTAATTCAGCAGAGTTTGTATACAATGGTACTGAGTGGATTTTGTCATCTTTAATTGGTGAGAAAAAAGCATCAACAAGGTACGTCACTGTTGCTGAGAGTGCTTATACAGTTAGGGCTTCCGACTCTAGTGGTATTGAAACTATTATTCACATGGCAGCAGGTGGTAATAGGACTGTTACTTTGGAAAATAGTATGGCTGTTGGTACAAAAGTAACAATAGGTATTAATGGTGATAATAAATATGCTTGCTACGTCTATGACAGTGGTGGTGGTGGTGCAATAGCTCAAATATTTGGTGGGCCAGGTGGTTCTCTTGTTGGTGCAACATTTATTAAAATGTACAACGGAGCTGGTAAAGGTAGTTGGATGGTAGTATAA

Genome Context

Tertiary structure

PDB ID

cb1dabeb2e84d32f1745774ad4c31f9da0103a039b10784d70682a0bf9a1be26

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,3799

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence