Protein

View in Explore

Genbank accession

YP_009805451.1 [GenBank]

Protein name

tail fiber protein

RBP type

Evidence GenBank

Probability 1,00

Evidence Phold

Probability 1,00

Evidence RBPdetect

Probability 0,86

Evidence RBPdetect2

Probability 0,95

Protein sequence

MALKTKIIVQQILNIDDTTTTASKYPKYTVVLGNSISSITAGELTAAVEATAASAAAAKDSEIAAKDSENKAKDSENMAGIYATSSETSATQSAASAAEAKKQAGLSQKSAEASATSAEESKGFRDSAELAAQNAETSRRLAEQAKTAAQQAQTAAEAAKTGAETAKDGADAAATTAGEHAAAAKQSELNAKISETNAAGSATEAGDKAIDATTEANRAKAEADRATQIVDSKLDKVDISGFIKVYKTKAEADADVGNRVLGEKILVWNQTDSKYGWYKVAGTAEAPVLELVEIEQKLVSINNVHADDAGNVQITLPGGNPSLWLGEVTWFPYNKDSGVGYPGVLPADGREVLRVDYPDTWEAIEAGLIPSVSEAEWQAGASLYFSTGDGSTTFRLPDMMQGQAFRAPTKGEEDAGAIKEQIPYITTVNGIGPADDTGAIKLPYVAMVNGAIIPDENGNLALGNVVTKNVWNGTDGEVLLRGAFGLGGAGITLNEPDLVSFFKAMRAFGSGYYRNDTGVEGLPSYSAGFYSRVADTNSFICAGYGSAAVFVAAINDAGLDSENPIVHTNILYGTVNKPDLNGDTNGVLSVGKGGTGATTVGAAKKALEVGGVFCNDSPADAAFNSLQSPAGIHEFRLTNEGVWGVWKKGEETVAALPVGSGGTGASTVSSAKTNLEVDRVKQLEGGTHITSQDQNIVFMVQDTKNWGVYDHSENKWVSLPVEHGGTGATEPAQARKNLEAASAGINFDITQLRNLEGWPINIKNGSVITRKYHAVPSIGSYVGSEVFSAQVQLDNSVDPDTPRLEALFYSEGNYGQSLTERATIAAYRRTADGSLTATKYANLYMDSGAWNAERMHTQGYQKPWDGDSFGFFAPFQASDVISNDGGFVPIISGCTQSTGGYPMRATTGLISRGPTAWPAYVFRLRGDSNWACTYQFHMSGDIDGWGSDYNNVVFNFTYTKNAVSDINLKDNIQDVSGEESLENIEKMEFKKFTYKFDKKKNIRRGVIAQQLELIDPQYVKAIGNPETDDITLTLDTNPLLMDALAAIKVLSERNKSLETKLHEMSTVIDNINEKLDLMTRLSNLEAELDKMKGTS

Physico‐chemical properties

protein length:	1095 AA
molecular weight:	116347,67070 Da
isoelectric point:	4,79479
aromaticity:	0,07580
hydropathy:	-0,32849

Domains

Domains [InterPro]

DC_0608
ATT
2–595

DC_0608 IPR030392

DC_1590
STR
535–1095

DC_1590

IPR030392
CHP
964–1019

IPR030392 Coil

YP_009805451.1

1 1095

Architecture

ATT

STR

ATT 2-595 | STR 596-1095

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0608	ATT	DC_0608	2	595	Novel HMM	DC_0608	N-terminal	Low	Positional only	308 proteins / 308 hits
DC_1590	STR	DC_1590	535	1095	Novel HMM	DC_1590	Central	Low	Positional only	21 proteins / 21 hits
IPR030392	CHP	DC_0088	964	1061	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits
IPR030392	CHP	DC_0088	964	1019	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits
Coil	Unmapped	-	1040	1094	Coils	Coil	-	-	-	-

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Salmonella phage S131 [NCBI]	2231354	Uroviricota > Caudoviricetes > Demerecviridae > Tequintavirus > Tequintavirus S131
Host	Salmonella enterica [NCBI]	28901	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales

Coding sequence (CDS)

Genbank protein accession

YP_009805451.1 [NCBI]

Genbank nucleotide accession

NC_048009.1 [NCBI]

CDS location

range 20901 -> 24188
strand +

CDS

ATGGCACTTAAAACTAAAATTATTGTACAGCAGATTCTGAACATAGATGACACTACAACTACTGCTAGTAAGTATCCTAAATATACAGTAGTTTTAGGAAATTCTATTAGCTCTATTACTGCTGGTGAATTAACTGCTGCTGTAGAAGCCACTGCTGCTTCTGCGGCAGCAGCAAAAGATTCTGAAATTGCTGCTAAAGATTCTGAGAATAAAGCAAAAGATTCAGAAAACATGGCTGGTATCTATGCTACTTCCTCTGAAACATCTGCAACCCAATCAGCGGCATCTGCGGCCGAAGCTAAAAAACAAGCTGGTTTATCTCAGAAGAGTGCTGAAGCATCAGCTACATCGGCGGAAGAGTCTAAAGGATTTAGAGATTCTGCTGAATTAGCTGCTCAAAATGCTGAAACTAGTCGTAGACTTGCAGAACAAGCTAAAACAGCTGCGCAACAAGCTCAAACAGCTGCAGAAGCTGCTAAGACTGGTGCTGAAACAGCTAAAGATGGAGCTGATGCTGCTGCTACCACTGCTGGCGAACATGCTGCTGCTGCTAAACAATCAGAACTAAACGCTAAGATTTCTGAAACTAATGCTGCTGGTTCTGCTACTGAAGCTGGTGATAAAGCTATCGATGCTACTACTGAGGCTAATCGCGCTAAAGCAGAAGCTGATCGTGCAACTCAGATTGTTGATAGTAAACTTGATAAGGTAGATATTTCTGGTTTCATCAAAGTTTATAAGACTAAAGCAGAAGCCGATGCTGATGTTGGAAATCGTGTACTAGGGGAAAAGATCCTAGTATGGAATCAAACTGATTCAAAATATGGTTGGTATAAAGTTGCTGGTACTGCTGAAGCTCCTGTTCTAGAGTTAGTAGAAATAGAGCAAAAGCTAGTTTCTATTAACAACGTTCACGCAGATGATGCAGGTAACGTACAGATCACACTTCCTGGTGGTAACCCGTCTCTGTGGCTAGGTGAAGTTACTTGGTTCCCTTATAACAAGGATTCAGGTGTTGGTTACCCTGGTGTTCTACCTGCTGATGGCCGTGAAGTTCTTCGTGTGGACTATCCAGATACTTGGGAGGCTATTGAGGCTGGCTTAATTCCTTCTGTATCAGAAGCTGAATGGCAAGCTGGTGCGTCTCTTTACTTCTCTACTGGTGATGGCTCTACAACCTTCCGTCTACCAGATATGATGCAAGGACAGGCATTCCGTGCACCAACTAAAGGTGAAGAAGATGCTGGTGCTATCAAAGAACAAATCCCTTATATCACTACGGTGAATGGGATTGGTCCTGCTGACGATACTGGAGCTATTAAGCTACCTTACGTGGCGATGGTTAACGGAGCTATTATACCAGATGAGAACGGGAACCTAGCACTAGGTAACGTTGTTACTAAGAATGTTTGGAATGGTACTGATGGAGAAGTTCTACTTCGCGGTGCTTTTGGCTTAGGTGGTGCTGGTATTACGCTAAATGAGCCTGATCTAGTATCCTTCTTTAAAGCTATGAGAGCTTTTGGTTCTGGATATTATCGCAATGATACTGGAGTTGAGGGCTTGCCCTCGTATTCTGCAGGTTTCTACTCCAGAGTAGCAGATACTAACTCATTTATCTGTGCTGGGTATGGTAGTGCCGCAGTGTTTGTAGCTGCAATCAATGATGCTGGTTTAGATAGCGAAAACCCTATTGTTCATACTAATATTCTTTATGGTACTGTTAATAAGCCAGATCTAAATGGTGATACTAATGGAGTTCTTAGTGTTGGTAAAGGTGGTACTGGAGCTACCACAGTTGGGGCTGCTAAGAAAGCCTTAGAAGTTGGTGGAGTTTTCTGTAATGATAGTCCTGCTGATGCTGCTTTCAACTCCCTCCAGAGCCCTGCTGGTATTCATGAGTTTAGACTAACTAATGAGGGGGTATGGGGTGTATGGAAGAAGGGGGAAGAAACGGTAGCTGCGTTGCCTGTAGGCTCTGGAGGGACAGGAGCTTCTACAGTTAGTTCCGCCAAAACTAACCTAGAAGTGGATAGAGTAAAGCAGCTAGAAGGAGGAACACATATAACCTCCCAGGATCAAAATATTGTGTTTATGGTCCAAGACACTAAAAACTGGGGAGTATACGACCATTCTGAGAACAAGTGGGTATCTTTACCTGTTGAGCATGGTGGTACTGGAGCTACTGAGCCAGCTCAAGCTAGAAAAAACTTAGAGGCTGCAAGTGCTGGTATTAACTTCGATATTACTCAGCTACGTAATCTGGAAGGTTGGCCTATTAACATCAAGAATGGTAGTGTTATTACTCGTAAATATCACGCAGTTCCTTCGATTGGATCTTACGTAGGATCGGAGGTTTTTTCTGCACAAGTCCAGCTTGATAATTCGGTGGATCCAGACACACCTCGTTTAGAAGCGCTATTTTATTCTGAAGGTAATTATGGCCAATCTCTTACTGAAAGAGCTACAATAGCGGCCTATAGACGTACTGCAGACGGTTCCTTAACTGCTACTAAATACGCTAACTTGTATATGGATTCTGGGGCTTGGAATGCAGAGCGCATGCATACTCAAGGATACCAGAAACCCTGGGATGGTGATTCATTTGGTTTCTTCGCTCCTTTTCAGGCTTCTGATGTAATAAGTAATGATGGTGGGTTTGTACCTATTATTAGTGGCTGCACTCAATCTACAGGTGGCTACCCAATGAGGGCTACCACTGGATTAATATCCCGTGGCCCTACTGCTTGGCCTGCCTATGTATTTAGACTAAGAGGGGACTCTAACTGGGCATGCACCTACCAGTTCCACATGTCAGGGGATATTGACGGATGGGGGTCAGATTATAATAACGTTGTCTTTAACTTTACTTATACTAAAAACGCGGTATCTGATATCAATCTAAAAGATAATATTCAGGATGTATCAGGTGAAGAATCTCTTGAAAATATTGAAAAAATGGAGTTCAAGAAATTCACCTATAAGTTTGATAAGAAAAAGAATATTAGACGTGGTGTTATTGCACAACAATTAGAGTTGATTGATCCTCAATACGTTAAAGCTATTGGCAACCCTGAAACCGACGATATTACTTTAACTCTAGATACCAATCCATTGTTAATGGACGCTTTAGCTGCTATTAAAGTATTATCTGAAAGAAATAAGTCTCTTGAGACTAAATTACACGAGATGTCTACTGTTATTGACAACATTAACGAAAAGCTTGATTTGATGACTAGATTATCAAATTTAGAAGCAGAGTTAGACAAAATGAAAGGTACTAGTTAA

Genome Context

Tertiary structure

PDB ID

c64d85cce63d99d7f53de2d75c1d4e942db5578e2fe4c7951883b8f45b827369

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,5871

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence