Protein

View in Explore

Genbank accession

WNA08978.1 [GenBank]

Protein name

hypothetical protein

RBP type

TSP

Evidence RBPdetect

Probability 0,55

Evidence RBPdetect2

Probability 0,61

Protein sequence

MVAKSFRARSGLDAAGEKVINVGKADRNTLSDGVNVDFFNEFNGIQQYDPTRGYSQDMAIIYARRIWYAKQNIASPAGAFDESKWIATRNDPKWVYSNVTTPDGSIIESGSYIMADGRFTELLYLLPDNPTEGDVITFKDCGGLVGVNSILVKSNTRQIRLRTVQSAQYRLTHPYMIATFIYNGNVWRVAETLDNRDSEIVNATGTGSFQLQSGMTVFRNSATGKITLQLPKYANDGDVITTYDADKMNSINVAVLQIYPGSGHTISDGAITGVTSVTSQKSGFGMFIFDAQNSQWKVYDADNRVRLRRIYSDLNAVPNDYVFVTANPSGTIPNVTVTLPTDVADGDRVYVSLYMMGKNQNCTIKVKDGTTDKIRTNKNMMQFPQRKDYPPDDWFSVTSLAFNSASDYLPYIEFSYLKATKEWVVANYRPIVERVDATNRSRTGVIALAAQAEVNKNLEDNPNDETAITPMTLANKTATETRRGIARLATTAEVNKLSTDTYLDDVIVTPNKLNERTATETRRGLAEIATQAETNGSTDDITIVTPKKLHNRIASPTLTGILALVATGGAPNTNTDRAQAGTGVYDHSDYQKAVTPKTLREYKATQLQSGAVWLASETEVINGTVASANIPTVVTPEMLHKKTSTDGRIGLIEIATQAETNAGTDYTRAVTPKTLNDRAATETLTGIIAIATTAEVSAGTVTDKAIVPSKLKGYLDDTSHITVATADGLTQSGTIWTTVNIGIQSATETQRGTLRVATQSETNAGTLDTVFVTPKKLHAKKATESAEGIIQVATAAETTAGTVTNKAVSPKNLKNTIQVDTSWQATDLVRGTVKLSKGLGTWSGNDVAGSTLPDDGYAAVGVAVSPYELNLTLKHYLPIGAKAVDADKLDNLDSSQFIRRDVDQTVNGALTLTRTTTVQANIDSSADATFRVMNVNGDLNVGDGSSMGKLRLNGGSSNDWSIQASLASGRIAMISTGNTSTVHLSVYKDTRGVVANVKFQAPEIQAISKVTLGNDTVITAAGSVLSMGTNNKTTKILTSDAGNIVAEESANSYKVFTEKNAQTLLNPTYVRKAGDTMSGRLTVNNSSIIIAGQAAWSTLDAVTEASRGNWTAEITASEQYNLLPGYAVPVLEPDPINPDIMIVTRYTYVKAPGTLTQFGNGTAFTYQIWAPRPTSGTGVNALAQSFWIRQMNPITGKFDGWGRMYTSNNPPTAGEIGATSAVGTTVKNMTVTDWIKVGNVKIYPDPVTQTVKFEWVA

Physico‐chemical properties

protein length:	1257 AA
molecular weight:	135461,21890 Da
isoelectric point:	6,14710
aromaticity:	0,07080
hydropathy:	-0,27351

Domains

Domains [InterPro]

DC_1946
ATT
1–201

DC_1946 DC_1209

IPR048391
ATT
1103–1205

IPR048391

WNA08978.1

1 1257

Architecture

ATT

STR

ATT

STR

ATT 1-201 | STR 347-1102 | ATT 1103-1205 | STR 1206-1244 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_1946	ATT	DC_1946	1	201	Novel HMM	DC_1946	N-terminal	Low	Positional only	273 proteins / 273 hits
DC_1209	STR	DC_1209	347	1244	Novel HMM	DC_1209	Central	Low	Positional only	904 proteins / 904 hits
IPR048391	ATT	DC_0875	1103	1205	InterPro cluster	Long-tail fiber proximal subunit domain	C-terminal	Medium	Text match	795 proteins / 796 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

WNA08978.1

1 1257

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	830	830	0,8312
Central domain	831	1029	200	0,2236
C-terminal	1030	1257	227	0,6155

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-830

Central
831-1029

C-terminal
1030-1257

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Klebsiella phage P52_1 [NCBI]	3065698	No lineage information
Host	Klebsiella pneumoniae [NCBI]	573	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales

Coding sequence (CDS)

Genbank protein accession

WNA08978.1 [NCBI]

Genbank nucleotide accession

OR256021 [NCBI]

CDS location

range 108751 -> 112524
strand +

CDS

ATGGTAGCTAAATCATTCCGCGCACGAAGTGGCCTTGATGCTGCTGGTGAAAAAGTTATCAACGTTGGGAAGGCTGATCGTAATACGCTGAGTGACGGCGTTAACGTTGACTTTTTCAATGAATTTAACGGAATCCAGCAGTATGACCCGACCCGTGGCTATTCTCAAGACATGGCGATCATTTATGCGCGTCGTATCTGGTACGCAAAACAGAATATTGCTTCCCCTGCTGGGGCTTTCGACGAATCCAAATGGATCGCAACTCGTAATGACCCGAAATGGGTTTATAGTAACGTAACCACTCCAGATGGTAGCATTATTGAATCTGGTAGTTACATTATGGCTGATGGACGCTTTACTGAACTTCTGTACCTGTTGCCGGACAACCCGACAGAGGGCGACGTAATCACGTTTAAAGATTGTGGTGGTTTAGTAGGTGTGAACAGTATCCTTGTTAAGTCTAACACCCGTCAGATCCGTTTACGTACTGTACAATCGGCACAGTATCGACTGACCCACCCGTACATGATCGCAACGTTTATCTATAACGGTAACGTATGGCGTGTTGCTGAAACTCTGGATAATCGCGATTCTGAAATCGTGAACGCAACCGGAACAGGTTCATTCCAGTTACAATCTGGCATGACAGTTTTCCGTAACAGTGCTACAGGTAAAATCACTCTCCAGTTGCCGAAATATGCAAATGATGGTGATGTGATCACAACCTATGACGCTGATAAAATGAACTCTATCAACGTAGCCGTTTTGCAGATTTATCCAGGTAGTGGACATACTATTTCCGATGGTGCAATTACTGGTGTTACTTCGGTAACTAGCCAGAAATCTGGCTTTGGTATGTTCATCTTTGATGCACAGAATAGCCAATGGAAAGTATATGATGCTGATAATCGTGTTCGTCTGCGTCGTATCTATAGTGATTTAAACGCAGTTCCTAACGATTACGTTTTTGTTACTGCAAACCCTTCTGGGACTATACCAAACGTTACTGTTACCCTTCCAACTGATGTTGCTGATGGTGATCGCGTTTACGTATCCCTTTATATGATGGGTAAAAACCAGAACTGTACAATCAAAGTTAAAGATGGTACAACGGACAAGATCCGCACCAACAAAAATATGATGCAGTTCCCGCAGCGCAAAGACTATCCGCCCGATGATTGGTTTAGCGTAACTTCATTAGCATTTAATTCTGCTAGTGATTACCTCCCGTATATCGAGTTTTCTTACCTGAAAGCTACGAAAGAATGGGTTGTTGCTAATTATCGTCCGATCGTTGAACGTGTTGACGCAACTAACAGATCGCGTACTGGTGTTATTGCTCTGGCTGCACAGGCAGAAGTAAACAAAAACTTGGAAGACAACCCGAACGACGAAACTGCTATTACTCCGATGACGTTAGCAAATAAAACTGCTACAGAAACCCGTCGTGGTATTGCACGGTTAGCAACAACTGCTGAGGTTAACAAACTTTCAACCGATACCTATTTGGATGATGTGATTGTTACTCCTAATAAGCTGAACGAAAGAACAGCGACTGAAACCCGTCGTGGATTGGCAGAAATCGCAACTCAGGCAGAAACAAACGGAAGCACCGATGATATTACGATTGTAACCCCGAAAAAGTTGCATAACCGTATTGCATCGCCGACCTTAACTGGTATCCTTGCCCTTGTTGCTACAGGTGGTGCTCCTAACACCAACACGGATCGTGCTCAGGCTGGTACTGGGGTTTATGATCATTCAGATTATCAGAAAGCGGTAACGCCTAAAACTCTTCGTGAGTATAAAGCGACTCAGTTACAATCTGGCGCTGTATGGCTGGCTTCTGAAACCGAAGTTATTAATGGTACTGTTGCAAGTGCAAACATTCCGACCGTAGTTACTCCGGAAATGCTGCACAAGAAAACCTCTACTGATGGTCGTATTGGTTTGATCGAGATTGCAACTCAGGCAGAAACAAACGCTGGTACTGATTACACGCGAGCGGTAACGCCTAAAACGCTTAACGATCGTGCTGCAACGGAAACGCTGACAGGTATCATTGCAATTGCAACCACTGCCGAAGTATCAGCAGGTACTGTAACGGATAAAGCGATCGTACCGTCTAAACTGAAAGGTTATCTGGACGATACAAGCCATATTACTGTTGCTACTGCTGACGGGTTAACTCAATCTGGGACTATCTGGACTACGGTTAACATCGGTATTCAATCAGCAACTGAAACTCAACGTGGTACTTTACGCGTTGCTACGCAGTCTGAGACGAACGCAGGGACATTAGATACAGTATTTGTTACCCCTAAGAAGTTACACGCTAAGAAAGCGACTGAGAGCGCAGAAGGTATCATTCAGGTGGCTACGGCTGCTGAAACTACCGCTGGCACCGTTACAAACAAGGCTGTTTCTCCTAAGAACTTGAAAAATACAATTCAGGTTGATACTTCATGGCAAGCTACCGATCTGGTACGCGGTACTGTGAAACTGTCTAAGGGGCTTGGTACTTGGTCTGGTAATGATGTGGCTGGTTCTACTCTTCCGGATGATGGTTATGCCGCTGTAGGTGTTGCTGTTTCTCCTTATGAATTGAACCTGACGCTGAAACATTATCTGCCGATCGGGGCTAAAGCGGTTGATGCTGATAAGCTGGATAACCTGGATTCTTCCCAGTTCATTCGTCGTGATGTTGATCAGACGGTCAACGGGGCGTTGACTCTAACGAGAACAACCACTGTACAGGCCAACATTGATTCAAGCGCTGATGCAACATTCCGCGTAATGAATGTTAATGGAGATCTGAACGTTGGTGATGGTTCGTCAATGGGTAAACTTCGTTTGAATGGTGGTTCATCTAACGACTGGTCAATTCAAGCAAGTTTAGCCTCTGGGCGTATTGCAATGATCTCAACGGGTAACACTAGCACAGTTCATCTTTCTGTGTATAAGGATACTCGTGGCGTTGTAGCTAACGTTAAATTCCAGGCTCCTGAAATTCAGGCGATTAGCAAAGTGACTCTGGGTAATGATACCGTGATCACTGCTGCTGGTTCTGTTCTATCTATGGGTACGAACAACAAGACAACTAAGATCCTGACCTCTGATGCTGGCAACATCGTAGCGGAAGAATCTGCGAACTCTTATAAAGTCTTTACTGAGAAGAACGCGCAAACCTTGCTTAACCCTACGTATGTACGCAAAGCAGGTGATACGATGTCTGGACGGTTGACAGTAAACAACAGTTCAATTATCATCGCAGGTCAAGCGGCTTGGTCAACACTGGATGCAGTAACAGAAGCATCTAGGGGTAACTGGACGGCTGAAATCACAGCATCGGAACAGTACAACTTACTTCCTGGTTACGCGGTTCCGGTTCTTGAACCAGACCCGATTAATCCGGATATCATGATTGTAACCCGTTATACCTATGTTAAAGCACCTGGTACTTTAACGCAGTTTGGTAACGGAACTGCATTCACTTATCAGATTTGGGCACCTCGTCCGACCTCTGGTACTGGTGTTAATGCGCTGGCGCAATCCTTCTGGATCCGTCAAATGAACCCAATTACGGGTAAATTTGATGGTTGGGGCCGCATGTATACCAGCAACAACCCGCCTACTGCTGGTGAGATTGGTGCAACGTCTGCTGTTGGTACTACGGTTAAAAACATGACTGTTACCGATTGGATCAAAGTTGGTAACGTTAAGATTTACCCAGATCCGGTTACTCAGACAGTTAAATTTGAGTGGGTGGCATAA

Genome Context

Tertiary structure

PDB ID

4a448e5dffdee113c76422d5a0fa1ff5b9dd5e258d53dbedcedb5aff4ec8ee4a

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,5529

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence