Protein

View in Explore

Genbank accession

QIA28513.1 [GenBank]

Protein name

tail fiber protein

RBP type

Evidence Phold

Probability 1,00

TSP

Evidence DepoScope

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,91

TSP

Evidence RBPdetect2

Probability 0,94

Protein sequence

MASITKYVKMLMRKGLKNDLTALDEAEIGLATDTKEVFVGISGGNIQLAKQDHAQLDVRSYVHLVPGYNALADVYSGDWSTAIQQAFTDASSRKNKKVFIPSANFTITKQLSLPKGVHIESTGGKLIRGYRRENGGGPFIKLLGDNVVTGLSVDGGSQSITPIDVEDGRLYTDCDCDWAEGDVTFENCTFSNTNGSNIIFSKYNLKVKNCTFGNYGDHNIYLGGRSWNDSRVPDSVIIEGCTFYQRGAVTGTLDAVKVRNGCKLLILDGNTFDLDANVFGFWSNGSWDTLSYPAKVNNKIIISNNTVFSCLDFITSGGDIAGTDDVVVTGNTVTSTRTLFRLGSSDYTTAFKKMIISDNTLRSYSLNGSISKLALINGALAGVGEIESISFNNNEMEYAFNAGIEIYGNIRTMKISGGRIKNTAVYNSGNRLIDIAPNSNAYAPTIKGHIIVSNVTLAGEVAAIFRERNDTKPVSEFKFDATVKDIIWTSQNAKKIFDVVGDKTNAITTIARDINNIFIGGTKSASSFNLLNLVKIDMFQSNGGTVTYSGDGTSTSKAIPHGLNGIPTIFSVGAANNAAGTAGIKNFTADATNITVYFNTAPVSGTNNIKLVWEAKL

Physico‐chemical properties

protein length:	617 AA
molecular weight:	66370,92800 Da
isoelectric point:	6,99650
aromaticity:	0,08914
hydropathy:	-0,11540

Domains

Domains [InterPro]

DC_0435
ATT
1–63

DC_0435 IPR012334 DC_2130

IPR011050
STR
76–430

IPR011050

QIA28513.1

1 617

Architecture

ATT

STR

RBD

ATT 1-63 | STR 68-430 | RBD 545-617

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0435	ATT	DC_0435	1	63	Novel HMM	DC_0435	N-terminal	Low	Positional only	79 proteins / 79 hits
IPR012334	STR	IPR012334	68	379	Merged direct domain	Pectin lyase fold	Central	Low	Positional only	867 proteins / 867 hits
IPR011050	STR	IPR011050	76	430	Merged direct domain	Pectin lyase fold/virulence factor	Central	Low	Positional only	572 proteins / 572 hits
DC_2130	RBD	DC_2130	545	617	Novel HMM	DC_2130	C-terminal	Low	Positional only	11 proteins / 11 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

QIA28513.1

1 617

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	68	68	0,9779
Central domain	69	530	463	0,9852
C-terminal	531	617	86	0,9675

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-68

Central
69-530

C-terminal
531-617

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Phage f2b1 [NCBI]	2708592	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Staphylococcus aureus [NCBI]	1280	cellular organisms > Bacteria > Bacillati > Bacillota > Bacilli > Bacillales

Coding sequence (CDS)

Genbank protein accession

QIA28513.1 [NCBI]

Genbank nucleotide accession

MN940411.1 [NCBI]

CDS location

range 11199 -> 13052
strand +

CDS

ATGGCAAGTATCACAAAATATGTAAAAATGCTTATGAGAAAAGGACTTAAAAATGATCTTACAGCATTAGATGAAGCTGAGATAGGTTTGGCTACTGATACTAAAGAGGTCTTTGTAGGTATTAGTGGGGGTAATATCCAGTTAGCAAAGCAAGATCACGCACAACTGGACGTAAGGAGTTACGTCCATCTAGTGCCCGGATACAATGCACTAGCAGACGTGTACTCAGGGGACTGGTCTACTGCTATTCAACAAGCTTTCACAGACGCTAGTTCTAGGAAGAACAAGAAAGTTTTTATCCCTTCTGCTAACTTTACTATAACTAAGCAGTTATCTCTCCCTAAAGGGGTTCATATTGAGTCCACCGGAGGTAAACTGATAAGAGGGTATAGACGAGAAAATGGGGGAGGTCCTTTCATTAAGCTTTTAGGGGATAACGTTGTTACCGGACTATCTGTAGATGGAGGGAGTCAAAGCATTACGCCTATAGATGTAGAAGATGGAAGACTATACACAGACTGTGACTGTGATTGGGCAGAAGGAGATGTTACTTTCGAAAATTGTACATTCTCTAACACTAACGGCTCAAACATCATTTTCTCTAAATATAACTTGAAAGTAAAAAACTGTACTTTCGGTAATTACGGAGATCACAATATTTACTTAGGAGGTCGCTCGTGGAATGACTCTCGTGTACCTGATAGTGTTATAATTGAAGGTTGTACTTTCTATCAACGTGGGGCTGTAACAGGAACGCTAGATGCAGTAAAAGTACGAAACGGGTGTAAGCTACTTATTCTTGACGGGAATACTTTTGACTTGGATGCCAACGTGTTCGGTTTCTGGAGTAACGGGTCATGGGATACTTTGTCTTACCCTGCTAAGGTAAACAATAAGATAATTATATCCAATAATACTGTTTTTTCTTGTCTAGACTTTATAACATCTGGAGGAGACATAGCAGGTACGGACGATGTGGTTGTCACTGGCAACACCGTAACGTCAACGCGTACACTTTTCAGATTAGGCTCATCTGACTACACTACAGCGTTTAAAAAGATGATTATTTCTGACAATACTTTGCGCTCGTATAGCCTTAACGGGTCAATTTCAAAGCTAGCGTTAATTAACGGAGCGTTAGCTGGGGTAGGGGAGATCGAAAGTATCTCTTTTAATAATAATGAAATGGAATATGCTTTTAATGCAGGTATTGAGATTTATGGAAACATAAGAACCATGAAAATTTCTGGGGGACGTATTAAGAATACGGCAGTATACAACTCAGGAAACCGTTTAATCGACATTGCACCAAACAGTAACGCATACGCCCCTACAATAAAAGGGCACATTATTGTCTCTAACGTAACTTTAGCCGGAGAGGTGGCAGCTATTTTTAGAGAACGGAATGACACTAAGCCAGTTTCTGAGTTTAAGTTTGATGCTACCGTTAAAGACATTATATGGACTAGTCAAAATGCAAAGAAGATTTTTGATGTTGTGGGAGATAAAACTAACGCCATAACTACTATCGCTAGAGATATTAATAACATTTTTATTGGAGGTACTAAGAGTGCTAGTAGCTTTAACTTACTCAACCTAGTAAAAATTGATATGTTCCAGTCTAACGGGGGAACTGTTACGTATAGTGGAGACGGGACTTCAACGTCTAAAGCTATCCCTCATGGGCTAAATGGAATACCTACTATATTCTCTGTAGGGGCTGCAAATAACGCTGCGGGTACAGCTGGGATAAAAAACTTCACAGCAGATGCCACAAACATAACGGTGTACTTTAACACAGCTCCTGTCTCAGGAACAAACAACATAAAATTAGTTTGGGAAGCTAAATTATAG

Genome Context

Tertiary structure

PDB ID

89bcfea37e7a8b0902a8ee048a27c296cf26da5cc4626ea25ef15c56e170bad2

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,7880

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence