Protein

View in Explore

Genbank accession

YP_009196938.1 [GenBank]

Protein name

tail fiber protein

RBP type

Evidence UniProt/TrEMBL

Probability 1,00

Evidence GenBank

Probability 1,00

Evidence Phold

Probability 1,00

Evidence RBPdetect2

Probability 0,80

Protein sequence

MEGRLKQTIRHPKMEVLVDFNGLGLDRINEWENITDYVLDISGSKEKATESVGGVTSDIVTFATDNKGNVFSNTNPKSPFYQKVKSNTKFVLKTGFKGEELKIYAAGIITKFAPSWNDKKYNVSAEDFFYLLKNTDAPKTAYQDISLEELVNVLLDTAEIPSQINRIIPKTEFNFQYFKFEEPDCFSALKKLMEISVGQAYFEGLNFVFETKLALDYELDLTVKHTIEEDDIFTFDETVEDSDIINAVSIISNPKTIYPKELVFQTPENIVQVNEEPVTFGTGTSFYIDNTHLPIINNAENPISVKNLTQGRTININSVDINTGKITIHPESLAYVAQGDLLVVSYSYQQLVLLPGQTRTYSLSLSGEVHALTDVDVAVWDATGQLPREYSTTPNKANTVSLNQFTFNQTSGLVTVVLKNNYAEGITISTLQLRGNPIKSANPLEIYVRDLPSIDEYKKQELQITNNYFTNTKLAQKIAQFIVDNRSITRKKIGVDMDGYTELELNDIAKVIENESGTNHTFYADRIDYSFSSDGGWSAKVTFTQTETEQWVYESFKGESWEKTNPGNPIDDFIFEINANMVKNGGAELHTGIADYVDAGAVGSAHYVPDYWRFTRSTGNASARIRTGGELALHADQSFEITTSNSGSGYYEQTLTGVVPSKTHSVSFIARLDGCSGVFIVEQYEGSTLLKTLSYDLPEGLKEYEFQFASESTADQFIIKFKKNAGTKGSESMIFDKVKVEEAEKASLYLEANETQTVQAGQKYDNSVIIGNNYGVSVYDANNNQRVRMGQYAPGKYGMRIDNGALEIVNGLLYEQLATDVGKKLNISENNAITSLATSMSGIDGELGTISGTIESHASLIQQNSIAISQRVLTTTYTTDKNGILQRLSDAETAIDQTAENITLLATQESFNELGEIIEANTAAINVNAQAITQRVTTSTFNQAITDTKKYADDSATAKAGTAEANAKAASEKNIWIGTSAPTDTTRKWLDTNTTIPILKYYTGGAWKKLIPTAASEVGAETPTGAQTKATAAEKNAKDYMDGMNATIQEQFTAQSSSISVLAGKIDSKVESTTYTQGIADAKSYADGKAATAESNAKGYADGKDAVIVERVETNESLISQQADKILSMVTKTEFNSLKIGGQNKVTGTDLKDISGWTRWNVGTLTLGTADSSIPKNYLKVETKDASGNNLTVASGQAIGIQHSGRTFKVIAGQKYTASMIIATSELGGILDYLYMIHKDGQGNMRLNNVDTSQFVTIHPAYSGAPSSYDFKLVYFTFTADRTDDVYLLIGGTTKRALGSTAYAWIRFYDFKVEDGDKATAWTPSTEDVKQDISTLSTAIKQTAEDIELNVVKNNKVLTSINASSEGVKIKADRLDITGLVTFNVLNSDMQSRISNADQAYADTARWKLPNTTLINGGLIAADTVTASQILVGSWENLFQNGNFEKKTAGWKDASAWSVVNSPNTAYNGNYHAKGTWGSSSSISYYDDREITVRGGETYYFEGYFRTDIATTTPTRTMLILMNDKLGNRTYIIKEETLTTSWKKFSYTFDIPSDIVSIQIGLSVKSGQPSGYATYVDNLFCKKMVDGSLIVDGSITASMIKSLNGLNVGGGQFVVDGTGNVVIGAGATLKAAKFEGLRGNTISFGDYGAKIDTSIAGVIKRTRFATNDSTYLAIDDDGRFNFVTNTNFDCYVAPASGGHYVLKLGSAMIKGLGTGGTMQVRNYDDSLYGDLAAKDLTATGNLDVWGRGTLKGTDLTIQGTTGGMLKLKGSPYAYTEFYANGTQVGFIGLEAASGQNNVMLQNNNGGEVLIKTAAVRVKFDRSVGQVVFKDQNDNGYVNVVGKEFVPNSLRERKKDIKPFTLTSTGKTALEELCETTIFNYRFLEETDVDPLRMGLIYDSAPFEVVDITGQGISLYGMAAFNFQATKELNAKLEEKINVLETTIDSLAARIAVLEGK

Physico‐chemical properties

protein length:	1956 AA
molecular weight:	213824,49630 Da
isoelectric point:	4,97338
aromaticity:	0,09254
hydropathy:	-0,30235

Domains

Domains [InterPro]

DC_0107
STR
4–548

DC_0107 G3DSA:2.60.120.260 DC_1272 DC_1035 Coil

DC_1955
STR
1080–1147

DC_1955 G3DSA:2.60.120.260

IPR008979
STR
1437–1582

IPR008979

IPR003305
CBM
1437–1560

IPR003305

YP_009196938.1

1 1956

Architecture

STR

RBD

STR

STR 4-548 | STR 579-749 | STR 1004-1147 | RBD 1207-1433 | STR 1434-1582 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0107	STR	DC_0107	4	548	Novel HMM	DC_0107	Central	Low	Positional only	42 proteins / 42 hits
G3DSA:2.60.120.260	STR	G3DSA:2.60.120.260	579	749	Merged direct domain	G3DSA:2.60.120.260	Central	Low	Positional only	264 proteins / 264 hits
DC_1272	STR	DC_1272	1004	1090	Novel HMM	DC_1272	Central	Low	Positional only	32 proteins / 32 hits
DC_1955	STR	DC_1955	1080	1147	Novel HMM	DC_1955	Central	Low	Positional only	20 proteins / 20 hits
DC_1035	RBD	DC_1035	1207	1521	Novel HMM	DC_1035	C-terminal	Low	Positional only	23 proteins / 23 hits
G3DSA:2.60.120.260	STR	G3DSA:2.60.120.260	1434	1581	Merged direct domain	G3DSA:2.60.120.260	Central	Low	Positional only	264 proteins / 264 hits
IPR008979	STR	IPR008979	1437	1582	Merged direct domain	Galactose-binding-like domain superfamily	Central	Low	Positional only	24 proteins / 24 hits
IPR003305	CBM	DC_0700	1437	1560	InterPro cluster	Carbohydrate-binding, CenC-like	C-terminal	High	Text match	15 proteins / 15 hits
Coil	Unmapped	-	1922	1956	Coils	Coil	-	-	-	-

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Bacillus phage Stills [NCBI]	1610833	Uroviricota > Caudoviricetes > Slashvirus >
Host	Bacillus megaterium [NCBI]	1404	cellular organisms > Bacteria > Bacillati > Bacillota > Bacilli > Bacillales

Coding sequence (CDS)

Genbank protein accession

YP_009196938.1 [NCBI]

Genbank nucleotide accession

NC_028777.1 [NCBI]

CDS location

range 36051 -> 41921
strand +

CDS

ATGGAAGGAAGATTAAAACAAACAATCAGACATCCTAAAATGGAGGTCTTAGTTGATTTTAATGGTTTGGGCCTGGATAGAATTAATGAGTGGGAGAATATCACTGATTACGTCCTAGATATTTCAGGTAGTAAAGAGAAAGCAACTGAATCCGTGGGCGGTGTTACTAGTGATATTGTTACATTTGCAACAGATAATAAAGGTAATGTATTTTCAAATACTAATCCTAAAAGCCCTTTTTACCAAAAGGTAAAGTCAAACACGAAGTTCGTATTAAAAACAGGATTCAAAGGTGAAGAATTAAAAATTTATGCTGCTGGTATCATTACTAAGTTCGCTCCTTCATGGAACGACAAAAAGTATAATGTTAGCGCTGAAGATTTCTTTTATTTGCTTAAAAATACTGATGCTCCTAAAACAGCTTATCAAGATATTTCGTTAGAAGAACTAGTGAACGTCCTTTTGGATACAGCTGAAATTCCTTCACAAATTAATCGGATCATACCGAAAACGGAATTCAATTTTCAGTATTTTAAATTTGAAGAACCTGATTGTTTTAGTGCGTTGAAGAAGCTCATGGAGATTTCTGTCGGTCAGGCATACTTTGAGGGGCTTAATTTTGTATTTGAAACAAAGTTAGCATTGGATTATGAATTAGATTTAACCGTGAAACACACGATTGAAGAAGATGACATTTTTACCTTTGACGAAACTGTTGAAGATTCGGATATCATCAATGCTGTTTCGATTATCTCTAATCCTAAAACGATTTACCCTAAAGAATTAGTATTCCAAACACCTGAAAATATTGTACAAGTAAATGAAGAACCTGTTACATTTGGTACTGGAACTTCTTTTTATATCGACAATACTCACTTACCAATCATCAACAATGCTGAAAATCCTATTTCAGTTAAGAACTTGACTCAAGGCCGCACAATCAATATTAATAGCGTTGATATTAACACAGGTAAAATCACAATCCATCCTGAAAGTTTAGCTTATGTTGCTCAAGGTGACTTGTTAGTTGTTTCTTATTCTTATCAGCAGCTAGTTTTACTTCCAGGTCAAACAAGAACTTACTCACTTAGTTTGTCAGGTGAAGTACACGCTTTAACAGACGTTGATGTAGCTGTTTGGGATGCAACAGGACAATTACCTAGAGAATACTCAACAACGCCAAATAAAGCAAATACAGTGTCGTTAAACCAATTCACTTTCAATCAAACTTCAGGTTTGGTTACTGTTGTTTTGAAAAATAATTACGCTGAAGGTATCACAATTTCTACGCTGCAATTACGTGGTAATCCAATTAAAAGTGCTAATCCTTTAGAGATTTATGTTCGTGATCTTCCTTCTATTGACGAATACAAGAAGCAAGAATTACAAATTACGAATAACTATTTCACAAACACTAAATTAGCTCAAAAGATTGCACAATTCATTGTTGATAATCGTTCTATCACTAGAAAGAAAATCGGTGTGGATATGGATGGTTACACTGAATTAGAACTTAATGACATCGCTAAAGTAATCGAAAATGAAAGTGGAACTAACCACACATTCTATGCTGATCGTATTGATTACTCATTTTCTTCTGATGGTGGATGGTCTGCAAAAGTAACATTCACTCAAACAGAAACGGAACAATGGGTTTATGAATCATTCAAAGGTGAATCATGGGAGAAAACAAATCCTGGAAATCCTATTGATGACTTCATTTTCGAAATCAACGCTAACATGGTTAAGAATGGTGGAGCTGAACTTCATACTGGAATTGCTGATTATGTAGATGCTGGTGCTGTTGGTTCTGCTCATTACGTTCCGGATTATTGGAGATTCACACGTTCAACAGGTAATGCTTCAGCTAGAATTCGTACCGGTGGAGAATTAGCTTTACATGCGGATCAATCTTTTGAAATTACAACATCAAATAGCGGTTCAGGTTATTACGAACAAACATTAACAGGTGTTGTTCCTAGTAAGACTCATTCAGTATCGTTTATAGCACGTTTAGATGGGTGTAGCGGCGTTTTTATTGTTGAGCAATACGAAGGTTCAACACTACTAAAAACTCTTTCGTATGACCTTCCTGAAGGCTTAAAAGAGTATGAATTCCAATTCGCTTCTGAATCTACAGCTGACCAATTTATCATTAAGTTCAAAAAGAACGCTGGTACAAAAGGTTCTGAATCAATGATCTTTGACAAAGTAAAAGTTGAAGAAGCAGAAAAGGCTAGTCTTTATTTAGAAGCTAATGAAACTCAAACTGTTCAAGCTGGACAAAAGTATGATAATTCAGTTATAATCGGTAATAACTACGGTGTATCGGTTTATGATGCTAATAATAATCAACGTGTTCGTATGGGCCAATATGCACCAGGAAAGTACGGTATGCGTATTGACAATGGAGCACTTGAAATTGTTAACGGATTATTATATGAGCAACTAGCTACTGATGTAGGTAAGAAATTAAACATCAGTGAAAATAACGCTATCACAAGTTTAGCTACTAGTATGTCAGGGATTGACGGTGAATTAGGTACAATTTCAGGTACAATCGAAAGCCATGCAAGCCTTATCCAGCAGAACTCTATAGCTATTTCACAAAGGGTTTTAACAACAACTTACACTACTGACAAAAACGGGATCTTACAACGTTTAAGTGATGCTGAAACTGCTATCGACCAAACCGCTGAAAACATTACACTATTAGCAACTCAAGAATCTTTTAATGAACTAGGTGAGATCATAGAAGCTAATACAGCTGCGATAAATGTGAATGCTCAAGCTATTACTCAACGAGTTACAACATCAACATTCAATCAGGCTATTACTGACACAAAAAAGTATGCTGATGATTCTGCTACTGCTAAAGCTGGTACTGCTGAAGCAAATGCTAAAGCTGCTTCTGAAAAGAACATTTGGATCGGAACATCAGCACCTACAGATACAACTAGAAAATGGTTAGATACAAATACAACTATTCCTATCTTGAAGTATTATACAGGTGGTGCATGGAAGAAACTGATCCCAACAGCTGCTTCAGAAGTCGGTGCTGAAACGCCAACAGGAGCACAAACTAAAGCAACAGCAGCAGAAAAGAACGCTAAAGATTATATGGATGGAATGAACGCAACTATCCAGGAGCAATTTACAGCTCAATCTTCTAGTATTAGTGTGCTTGCAGGGAAGATCGATAGCAAAGTTGAATCGACAACTTACACTCAAGGTATCGCTGATGCTAAATCTTATGCTGATGGTAAAGCTGCTACTGCTGAATCGAACGCTAAAGGTTACGCTGATGGTAAAGATGCTGTAATCGTTGAACGTGTCGAAACAAATGAATCATTAATCAGTCAACAAGCGGATAAAATTCTTTCTATGGTTACTAAAACTGAATTCAACAGTTTAAAAATCGGTGGTCAGAACAAAGTAACCGGAACTGATCTTAAAGATATTTCAGGGTGGACTAGATGGAATGTTGGTACGCTTACATTAGGTACAGCTGATTCAAGTATTCCTAAGAACTATCTGAAAGTTGAAACGAAAGATGCTTCAGGTAATAACTTAACTGTTGCAAGTGGTCAAGCGATTGGCATTCAGCATAGTGGACGTACTTTTAAAGTTATTGCTGGTCAAAAGTATACAGCTTCTATGATAATCGCTACTAGTGAATTAGGTGGTATATTAGATTACCTTTACATGATTCATAAAGATGGACAAGGTAACATGAGATTGAATAACGTTGATACAAGTCAGTTTGTAACTATTCATCCTGCTTATAGCGGCGCTCCTTCTTCTTATGATTTCAAACTAGTCTACTTCACATTTACAGCAGATCGTACAGATGATGTTTACTTGCTAATCGGTGGTACAACAAAGAGAGCTTTAGGTTCTACTGCTTATGCCTGGATTCGTTTTTATGACTTCAAGGTTGAAGATGGCGATAAAGCTACTGCTTGGACTCCTTCAACGGAAGATGTTAAACAAGATATCAGCACTTTGTCTACTGCAATCAAACAAACAGCTGAAGATATTGAACTTAATGTAGTTAAAAACAATAAAGTGTTAACATCTATCAATGCTTCTTCTGAAGGTGTTAAGATTAAAGCTGATCGACTTGATATCACTGGATTAGTAACGTTTAACGTTCTTAATTCCGATATGCAAAGTAGAATCTCCAATGCGGATCAAGCTTATGCTGATACTGCTAGATGGAAGTTACCAAACACAACTTTAATCAATGGTGGCTTAATTGCTGCTGATACAGTAACCGCTAGTCAGATTTTAGTTGGATCGTGGGAAAACTTATTCCAAAATGGTAACTTCGAAAAGAAAACCGCTGGATGGAAAGATGCTTCTGCTTGGTCAGTAGTTAATTCACCTAATACAGCTTATAACGGAAATTATCATGCTAAAGGTACGTGGGGTTCTTCTTCTTCAATCAGTTACTATGATGACCGTGAAATAACGGTTCGTGGTGGAGAAACTTATTACTTTGAAGGTTATTTCCGTACTGATATAGCAACAACGACTCCTACTCGTACAATGTTAATCCTGATGAACGATAAATTAGGGAACAGAACTTATATTATCAAAGAGGAAACGTTAACTACTTCCTGGAAGAAGTTTTCTTACACTTTTGACATTCCTTCAGATATTGTTTCAATTCAGATCGGATTAAGTGTTAAAAGTGGTCAACCTTCAGGATACGCTACTTATGTAGATAACTTATTCTGCAAAAAGATGGTTGATGGATCGTTAATCGTTGATGGTTCTATTACAGCAAGTATGATTAAATCACTTAATGGCCTGAATGTTGGTGGAGGTCAATTCGTAGTCGATGGAACAGGAAATGTTGTAATCGGTGCTGGCGCAACGTTAAAAGCTGCTAAATTCGAAGGTCTAAGAGGTAACACTATCTCTTTCGGTGATTATGGAGCTAAGATTGATACATCTATCGCTGGTGTTATCAAACGTACGCGTTTTGCGACAAACGACAGCACATATTTAGCCATTGATGATGATGGACGTTTCAACTTCGTTACAAACACAAACTTCGATTGTTATGTAGCTCCTGCAAGTGGCGGCCACTACGTACTTAAACTAGGTTCTGCTATGATTAAAGGTTTAGGTACAGGTGGGACGATGCAAGTTCGAAACTATGATGATAGCTTGTATGGTGATTTAGCTGCTAAAGATTTGACTGCAACCGGAAACCTAGATGTTTGGGGTAGAGGAACATTAAAAGGTACTGATCTAACTATCCAGGGAACAACAGGTGGTATGCTTAAATTGAAAGGTTCTCCATACGCATACACTGAATTCTATGCTAACGGAACACAAGTTGGATTCATTGGTTTAGAAGCAGCTTCAGGTCAAAATAACGTGATGCTTCAGAATAATAACGGTGGAGAAGTATTGATTAAAACTGCTGCTGTTCGTGTTAAATTTGACCGATCTGTTGGGCAAGTTGTTTTCAAAGATCAAAACGATAATGGTTACGTCAATGTTGTCGGTAAAGAATTTGTTCCTAACTCTTTAAGAGAACGTAAAAAAGATATTAAACCTTTCACATTGACATCTACAGGAAAGACAGCTTTAGAAGAACTTTGTGAGACAACAATATTTAATTACCGTTTCCTTGAAGAAACAGACGTTGATCCGCTAAGAATGGGTTTAATTTACGATTCAGCACCTTTTGAAGTTGTTGATATCACTGGACAAGGTATCAGTTTGTACGGTATGGCTGCATTTAATTTCCAGGCTACAAAAGAATTAAACGCCAAACTTGAAGAAAAAATTAATGTTTTAGAAACAACTATTGATTCTTTAGCTGCTAGAATCGCTGTTTTAGAAGGTAAATAA

Genome Context

Tertiary structure

PDB ID

0960cff36d52d994558a96e32a4a1a7a1d1b26fdef2af562bb192658532d1496

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,6664

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence