Protein

View in Explore

Genbank accession

QPI14422.1 [GenBank]

Protein name

hypothetical protein

RBP type

TSP

Evidence RBPdetect

Probability 0,63

Protein sequence

MAIQSFLNFLDESKQLDEAFNSAPYELTFGKKNAGDIFFTFVDEDEKEFRIQFYTPQGLGKNVRQVFIGQKRGSTYPDAIGRFKNPMRVIASMIEATKQFMATPLGKTIDGFAINFSKKALERGTTLLPKIIRQSGLKQKLNVMDLTYTPIPDRAFVWVVRKGKDPAQVFDGPKMKGVTWDDPDKVGDVPVQNNTPDVGTGSSTEIEVNRQWYNSSDTSLELKNGRDPIRGNYVQLVSGSREVAKFFGYDFDKYPDGTEVAWSMKRGFTNQDLVGAVMTKQNKGIYDQYVFKKGGQVVLTVDVDADAPSSINPDWNISVMAKSNGIFSSVVKVVGANDVTLSSNDLAIMVKDGAMAKIARTQSIAQVTVFNKEYVGRGEVDRKIMAASDRQGMGWELKSSGKIVAYVEFGIGATAPVDMKTLPKTGSMDDLRNQGYIARILGIVDTYAPQQVGMYAGEKLSRVGAGKYRTSGGLDIQVYFWGIVNSKLSVEVVSDLSGNEQLLLEGDVKNAAFEIVSAISRAADSQFNGEVECRVVPINGAPYPIQKVSRSQGYSYVDCISFTLKIADALLNRFTLGKAVKLDLIKEFPRTTFIVRYDWRSKDTLMVQSSDGKTIFGEINTNSSDNAVITANLKAPSNAKIFGETVHGFSVAWDFQFPAGSQLQAARFVTNVTYDFDRNKANITTMLTENGRNVVNSSGYDIQLSVKSVQDALNETSQRLKDAAAQLSHLSSSNYNPNKLFLNDITVSKFGAIMFQDKDLAQSKNRTAVIDALARAKDQVAGGKNAGDLATYAGSIRDSAPNGRDLDWQVYVTNSGAVLNVDWSITFRRNTTEGAYREFKDQINRANQYLQTVYNDAKAKGYNPTEPNLMTLDSARQSDEWAMSNGDSAYSEYEQSLGGNLQIRLK

Physico‐chemical properties

protein length:	906 AA
molecular weight:	99962,47260 Da
isoelectric point:	8,27253
aromaticity:	0,09603
hydropathy:	-0,36424

Domains

Domains [InterPro]

DC_0099
STR
1–906

DC_0099

Coil
Unmapped
706–726

Coil

QPI14422.1

1 906

Architecture

STR

STR 1-906

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0099	STR	DC_0099	1	906	Novel HMM	DC_0099	Central	Low	Positional only	76 proteins / 76 hits
Coil	Unmapped	-	706	726	Coils	Coil	-	-	-	-

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

QPI14422.1

1 906

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	215	215	0,8509
Central domain	216	871	657	0,5725
C-terminal	872	906	34	0,4906

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-215

Central
216-871

C-terminal
872-906

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Salmonella phage GEC_vB_GOT [NCBI]	2777375	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Salmonella enterica [NCBI]	28901	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales

Coding sequence (CDS)

Genbank protein accession

QPI14422.1 [NCBI]

Genbank nucleotide accession

MW006476 [NCBI]

CDS location

range 59947 -> 62667
strand -

CDS

ATGGCCATCCAATCTTTCTTAAATTTCCTTGACGAGTCCAAACAATTGGACGAAGCGTTTAACTCCGCTCCATACGAATTGACTTTCGGCAAGAAAAATGCTGGTGACATTTTCTTCACGTTCGTAGACGAAGATGAAAAAGAATTCCGCATCCAATTTTATACCCCGCAGGGGCTGGGCAAGAACGTTCGTCAGGTCTTCATAGGCCAGAAACGTGGTTCAACCTATCCAGACGCAATCGGTCGTTTCAAAAACCCAATGCGTGTCATCGCATCCATGATCGAAGCGACTAAACAATTCATGGCGACACCGCTGGGTAAAACCATTGATGGGTTTGCGATTAACTTCTCCAAGAAAGCTCTAGAACGCGGAACGACGTTACTCCCAAAAATTATTCGTCAATCTGGTCTGAAGCAGAAACTCAACGTCATGGATCTGACTTATACCCCAATCCCTGACCGTGCCTTCGTATGGGTTGTGCGTAAAGGCAAGGATCCTGCTCAGGTATTTGATGGTCCGAAAATGAAAGGCGTGACTTGGGACGATCCAGACAAAGTCGGAGACGTTCCGGTTCAGAACAACACCCCTGATGTTGGGACTGGCTCCAGCACCGAGATTGAAGTAAACCGCCAATGGTATAACAGTTCTGACACTAGTCTTGAACTGAAAAATGGCCGTGACCCAATTCGCGGAAATTACGTGCAGCTGGTCAGTGGCTCACGTGAAGTGGCGAAGTTCTTTGGGTATGATTTCGACAAATATCCGGACGGCACCGAAGTGGCATGGAGCATGAAGCGGGGATTCACTAACCAGGATCTGGTCGGCGCTGTCATGACAAAACAAAATAAAGGCATCTATGATCAGTATGTGTTCAAGAAAGGTGGGCAAGTGGTTTTGACTGTTGACGTTGATGCTGATGCACCGTCTTCCATAAATCCGGACTGGAACATCTCCGTTATGGCAAAGTCCAACGGCATCTTCAGTTCTGTTGTGAAGGTGGTCGGCGCGAACGACGTGACCCTGAGTTCCAATGACCTGGCTATCATGGTCAAAGATGGCGCGATGGCGAAGATTGCCCGCACTCAGTCTATCGCACAAGTGACGGTATTCAACAAAGAATATGTCGGGCGTGGAGAAGTGGATCGCAAAATCATGGCAGCTTCTGACCGTCAGGGAATGGGATGGGAACTGAAGTCCAGCGGCAAGATTGTGGCATATGTTGAATTTGGAATAGGGGCTACTGCTCCCGTCGACATGAAAACTCTTCCAAAAACCGGTTCTATGGATGATCTGCGCAACCAGGGTTATATCGCCCGCATCTTGGGCATCGTTGATACATATGCTCCTCAGCAAGTCGGCATGTATGCTGGTGAAAAATTGTCTCGGGTTGGTGCTGGCAAATATCGAACTTCTGGCGGGTTGGATATTCAAGTCTATTTTTGGGGGATTGTCAACAGCAAACTCTCTGTAGAAGTGGTTTCTGATTTATCTGGCAATGAACAGCTGCTGCTGGAAGGCGACGTGAAAAACGCTGCTTTTGAAATCGTCAGTGCGATATCCCGTGCTGCTGATTCTCAGTTCAACGGTGAAGTGGAATGTCGTGTTGTTCCGATCAACGGTGCCCCATACCCGATTCAAAAGGTTTCCCGTTCTCAGGGTTATTCTTATGTCGATTGTATTTCGTTTACTTTGAAGATCGCCGATGCATTGTTAAATCGATTTACTCTGGGTAAGGCAGTCAAACTCGATCTGATAAAAGAGTTCCCTCGAACGACGTTTATTGTTCGTTATGACTGGCGCAGCAAAGATACTCTGATGGTCCAGTCTTCTGATGGGAAGACTATCTTCGGCGAAATCAACACAAATTCCAGTGATAACGCTGTCATCACTGCGAACCTGAAAGCCCCAAGCAATGCGAAGATATTTGGTGAAACCGTTCATGGGTTCTCTGTGGCTTGGGACTTCCAGTTCCCTGCGGGTAGCCAGCTGCAAGCCGCACGGTTCGTTACGAACGTGACTTACGACTTCGATCGTAATAAGGCCAACATCACGACCATGCTGACAGAAAATGGCCGAAATGTAGTCAATAGCAGCGGATATGACATTCAGTTATCTGTCAAGTCTGTGCAAGATGCATTGAATGAGACTTCACAACGCCTGAAAGACGCTGCGGCTCAATTGAGCCATCTCAGTTCATCAAACTATAACCCGAACAAGCTGTTCCTGAATGATATCACCGTCAGTAAGTTTGGTGCAATTATGTTCCAAGACAAAGATCTGGCACAGTCCAAAAACCGCACGGCAGTCATTGATGCTTTGGCTCGGGCGAAAGATCAGGTCGCTGGTGGTAAGAATGCAGGCGATCTGGCCACCTATGCCGGATCCATTCGTGATAGCGCTCCTAATGGACGAGATCTTGATTGGCAGGTATATGTGACCAATAGCGGCGCAGTTCTTAACGTCGATTGGAGTATCACCTTCCGTCGCAACACAACCGAAGGTGCATATCGTGAGTTCAAAGATCAGATTAACCGTGCCAACCAGTACCTGCAAACGGTTTACAACGATGCGAAGGCGAAGGGATACAACCCGACCGAACCGAATCTCATGACTTTGGATAGCGCTCGTCAATCCGACGAATGGGCTATGAGTAATGGTGATAGTGCATACAGTGAATATGAACAATCACTGGGTGGTAATCTCCAGATCCGTCTGAAATAA

Genome Context

Tertiary structure

PDB ID

c22ff1a2740a985ad70254df4e223c0da1ee39ef51c3595ec77a13c9c7f4f3c3

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,4142

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence