Protein

View in Explore

Genbank accession

QDH50086.1 [GenBank]

Protein name

tail fiber protein

RBP type

Evidence GenBank

Probability 1,00

Protein sequence

MVEFEPLETMRFQSQLGKEMKRKYKEGNNLVTLSLADVVKVNYKYNTVDVITVRENNSTAKNPNDNGKYSAMLPTHMSGRTANGNIYGSTTLVTVGTRVLIGFIDGQVDTPIVINIYGKTDDQQQLTRTDFTSADDSIESIQQELWNTFNLYPSMTYDNIDGRGNREVTFSGKTFLIATDRDQENMYVQDAHFDYMDLPHSRYANGELIEPESPDAPTMLFVHQSVYDNHRTTFFVKADGTFRLGSRHISGGGITYQELKPDGSYSIVKKNDTENPEEESSDLSSIEILKDGNVVLQNPKTKMEITDEGVMVNGKPIGSGGSGGGISPELENIIKQINNQFSLLKITMSEIEGGLETKVEKDTYYIDTAEIEAKIKDMKDGARKSKDNLQKSIEELVKYIANEVNTNPITDSNKLQITKLLDDIDNKKASLDAAAQMVLLDPFLTDEQKVAVKKWYDKLNSDHTALKTTVMVAIQDGNLTAQDKKDISTAAETYLNDLTSWLTEMDKAADASYEQRIVDAFENAVNYANKESLHQSAVITHLYNMVSIKVSSEQVTQQFIDLNTKIEKTQEETSTALDDFQTQIDNTVKNLPYKVEVTSSNGLIFVNGGVNSTIAAKVTKGTEDVTSTVAVADFIWTRVSNNTAGDTAWNNAHKNVGRSFNINAADVIDRATFFCDYKNPPVATGSVTIANIQDITVGNVEPTNPREGTLWYDRGTGIVWMWQQNKWVEINRFDVNIRNLLIGSRDYGAQNSNNPTDPNNSTPQGNISGAWVMSGDTSGTPPKTGVKPSPQNATNQDTWISYTQSQWGGVKYKSSKLASSGLLDVGDMVTYVCYVRTVGGTSPDKGVPIRLYVTDNRDGGTGTIGFEMKDKETDGKPVTGAPVSIRATQQWRMVWGTFPVTQLFLDTANDPNSTSKTVRVEPTSFTDVGAGGQLEIKSHMVVKGVIPSDWVPAPEDTKRDSDNTNWNMDALGSDNYLTRFERGLVKTKLADITGESLLGTQDMKTSAQLDADTWGKGQFYSLRKQARDIAVDPNQDAAYKSLTTTYDALRTYLRALKTGAGRNTVYPWDTTSDVIMDVKRTEWDKAWADYENAYASLTVVVQQKQKDYTDNRIEDVNSAIKNISKTGQHATTDLRVPTTSISAPITTIALPSFKGFTKNNLQVGGVNYAYGTANKVEVKGNGAASTNQTVKPYTIKQDGLDLINTGKFICGYYWSIAQDGNNPVQGSMYVQLGGAPWTQIAPAISFSPSNMSGVYLAERNIAQSNGSGITDLQLRLDNVVGTVTVTNFMLTTNTTLETVEYSTNPTELRADGEYLYFNRNRAIAGVTMPTFYTAKNGTPDTARSSMTIQEVFHGNGSVYDDFHWTEDGTPTKSNKFTDMLLDTGFSLAIQNQNVQLPNENGVTERYIQVQLNNFASRPMANNGTVRLANGKGLELERLASGNFTKYNQFKVDFANANMSFLVSAKEMNVAPAYQVKGEEVLFFMRGWKMFQGEPVQKTTGGVVTYTFNTYSGSDNSAPNFTPIGYVQKDQAIMNKGVLASTGEYKRPVEVAAPIRTKQTGQQWQVVYQLALPYDSTCQFTGAIDLIGDPEKVSPTVVRYTYVDWTPPFNDKDGTFMYGINLATAQEDTRYLIPVLERRIANAEQKVETDSIKSVVFSSREYELGLQDKASVADVEAKADKSDLTDLATKDELKSSEEARKRELEEAMKNIDFTPYVQKSEIEQLDRQWTAAFYSSGGMNIVKNSIGFDRSMSAKLNKETFTFWDDMINPAYQQPVNIQTNALDALGFTSGFMFNESPNTNWTAIAQVLNVIPNQPYTISYFLQKMNAGDSNYRFNILIQQTTKDNPTSDADWATINGGQLADNSSIKHSGFMPSYFEFTPTNSKVRLVLIASPKCVAQISGIMVNIGKKPIKWTMSTGENYNTNVRMNLNGIRVSQVDKDGTEIGYTVITPERFAGYYIRDGKPEEIFRLDGDETWTKKLRAENEINMGPIKILRVENPNNAGWAFISNY

Physico‐chemical properties

protein length:	2010 AA
molecular weight:	223059,44560 Da
isoelectric point:	5,06387
aromaticity:	0,09005
hydropathy:	-0,50682

Domains

Domains [InterPro]

DC_0209
STR
9–920

DC_0209 DC_0015

Coil
Unmapped
552–572

Coil Coil

QDH50086.1

1 2010

Architecture

STR

STR 9-920 | STR 955-2010

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0209	STR	DC_0209	9	920	Novel HMM	DC_0209	Central	Low	Positional only	123 proteins / 123 hits
Coil	Unmapped	-	552	572	Coils	Coil	-	-	-	-
DC_0015	STR	DC_0015	955	2010	Novel HMM	DC_0015	Central	Low	Positional only	187 proteins / 187 hits
Coil	Unmapped	-	1686	1709	Coils	Coil	-	-	-	-

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Bacillus phage ALPS [NCBI]	2589662	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	No host information

Coding sequence (CDS)

Genbank protein accession

QDH50086.1 [NCBI]

Genbank nucleotide accession

MN038179.1 [NCBI]

CDS location

range 54718 -> 60750
strand +

CDS

ATGGTAGAATTTGAACCTTTAGAAACAATGAGATTCCAATCACAACTCGGTAAAGAAATGAAACGAAAATACAAGGAGGGTAACAATCTTGTTACTCTCTCTCTTGCTGATGTCGTAAAAGTTAACTATAAATACAACACAGTTGACGTTATCACAGTAAGAGAAAACAACTCGACAGCTAAAAACCCTAACGATAACGGAAAGTACTCAGCTATGCTTCCGACTCATATGTCCGGTCGTACAGCTAACGGTAACATCTACGGTTCTACAACATTAGTAACTGTAGGTACCCGTGTCCTAATCGGATTCATCGATGGACAAGTTGACACGCCAATCGTAATTAACATATACGGTAAAACGGATGACCAACAACAATTAACACGTACAGACTTCACATCAGCTGATGATTCAATCGAGTCTATCCAGCAAGAACTCTGGAACACTTTTAATCTATATCCATCTATGACTTATGACAACATTGATGGTAGAGGTAACCGTGAAGTAACATTTTCTGGTAAGACATTCTTAATCGCAACAGACCGTGACCAAGAAAACATGTACGTACAAGATGCGCATTTCGATTACATGGACCTTCCACATTCTCGTTATGCAAACGGAGAGCTTATTGAACCAGAATCTCCTGATGCACCAACAATGCTATTCGTACACCAAAGTGTATATGACAACCATCGTACAACTTTCTTCGTGAAAGCAGATGGTACATTCCGTTTAGGTTCTCGTCATATTAGTGGTGGAGGTATTACGTACCAAGAACTAAAACCAGATGGCTCTTACTCAATCGTTAAGAAGAATGATACGGAGAATCCAGAAGAAGAATCTAGTGATTTATCTTCTATCGAAATTCTTAAGGACGGTAACGTAGTGTTACAGAATCCTAAGACGAAAATGGAGATTACTGATGAGGGCGTAATGGTTAATGGTAAGCCAATCGGTTCCGGTGGTTCTGGTGGAGGTATATCCCCTGAGTTAGAGAATATCATAAAACAGATTAATAATCAATTCTCTTTATTAAAAATTACAATGTCTGAGATTGAAGGCGGTCTTGAAACGAAAGTAGAGAAGGACACATACTACATCGACACTGCTGAGATTGAAGCTAAGATTAAAGACATGAAAGATGGCGCTCGTAAAAGTAAAGACAATCTACAAAAATCTATTGAGGAACTAGTAAAGTATATTGCTAATGAAGTTAACACGAATCCTATAACAGATTCTAACAAATTACAAATTACAAAATTACTAGATGATATAGATAACAAGAAAGCATCTTTAGACGCTGCTGCACAAATGGTACTATTAGACCCATTCTTAACTGATGAGCAGAAAGTAGCTGTTAAGAAGTGGTATGATAAGCTTAACTCTGACCATACTGCGTTGAAGACAACTGTAATGGTTGCTATACAAGATGGTAACTTAACAGCACAAGATAAAAAAGACATCTCAACTGCCGCAGAAACATATCTAAACGACCTTACTTCTTGGTTAACGGAGATGGATAAAGCAGCTGATGCTAGTTACGAACAACGTATCGTTGATGCATTCGAGAACGCAGTAAACTACGCAAACAAAGAGTCATTGCATCAAAGTGCAGTAATCACTCATCTATACAACATGGTTTCTATTAAGGTTAGTTCTGAGCAAGTGACACAGCAGTTCATTGATTTGAATACGAAGATAGAAAAGACACAAGAAGAGACATCTACAGCGTTAGACGATTTTCAAACTCAGATTGATAACACAGTTAAGAACTTACCGTACAAGGTAGAAGTGACATCATCTAATGGTTTGATATTCGTAAATGGTGGCGTTAACTCTACAATCGCAGCTAAGGTTACTAAAGGTACTGAAGATGTGACAAGTACAGTGGCTGTTGCTGATTTCATATGGACTCGCGTTTCTAACAACACAGCAGGAGATACAGCTTGGAATAACGCTCATAAAAATGTTGGTCGCTCATTCAACATTAATGCTGCTGACGTAATTGATAGAGCAACATTCTTCTGTGATTACAAGAATCCTCCAGTAGCTACAGGTAGTGTTACAATCGCGAACATCCAAGATATTACAGTAGGTAACGTTGAGCCAACAAATCCACGTGAAGGTACTTTATGGTACGACCGTGGAACAGGTATCGTGTGGATGTGGCAGCAAAACAAATGGGTGGAGATTAATAGATTCGATGTTAACATCCGTAACTTATTAATCGGTTCTCGTGACTATGGCGCACAGAACTCTAACAACCCAACAGACCCTAACAACTCGACACCTCAAGGCAACATATCAGGCGCATGGGTTATGTCAGGTGACACATCAGGAACACCACCTAAGACAGGAGTTAAACCTTCACCACAGAATGCTACGAATCAAGATACATGGATATCTTATACGCAAAGTCAATGGGGCGGAGTGAAATACAAGTCTAGTAAGCTTGCTAGCAGTGGTCTACTAGATGTTGGGGATATGGTTACTTACGTGTGTTATGTACGAACAGTAGGTGGAACTAGTCCTGATAAAGGTGTACCTATTAGATTGTATGTAACAGATAATCGCGATGGTGGGACTGGTACAATTGGTTTCGAAATGAAAGATAAAGAGACAGATGGCAAACCAGTCACTGGAGCACCTGTATCGATTAGAGCTACACAGCAGTGGAGAATGGTATGGGGGACATTCCCTGTAACTCAGTTGTTCTTAGATACAGCTAACGACCCTAACAGTACATCAAAAACTGTTCGTGTAGAACCGACAAGCTTTACCGATGTTGGAGCCGGAGGACAACTAGAAATTAAGTCACATATGGTTGTTAAAGGAGTTATTCCTTCTGACTGGGTTCCAGCTCCAGAAGATACAAAGCGTGACTCAGACAACACTAACTGGAACATGGACGCTCTTGGTAGTGATAACTATCTAACTCGTTTTGAGCGTGGATTAGTTAAAACTAAACTAGCAGACATTACAGGTGAATCACTTCTTGGAACACAGGACATGAAGACATCAGCTCAGTTAGACGCAGACACATGGGGTAAAGGTCAATTCTACTCTTTACGCAAACAAGCTAGAGACATCGCTGTGGACCCGAACCAAGATGCAGCATACAAAAGCTTAACTACAACTTACGATGCACTTAGAACGTATCTGAGAGCCCTTAAAACAGGCGCTGGTCGAAACACAGTTTACCCATGGGATACAACTTCTGATGTAATCATGGATGTTAAGCGTACAGAATGGGATAAAGCGTGGGCAGACTACGAGAATGCTTATGCATCGTTAACGGTAGTTGTGCAGCAAAAGCAGAAAGACTACACAGATAATCGTATTGAAGATGTGAATTCAGCAATCAAGAACATTAGTAAAACAGGTCAGCATGCAACAACAGACCTACGAGTTCCGACTACATCTATTTCTGCTCCGATAACAACAATCGCTTTACCAAGTTTCAAAGGATTTACGAAGAACAACTTACAGGTTGGTGGTGTGAACTACGCGTATGGAACAGCAAACAAAGTAGAGGTTAAAGGTAATGGTGCAGCTTCAACAAACCAAACAGTCAAACCGTATACGATTAAACAAGACGGTCTAGACCTAATTAATACAGGTAAGTTCATCTGTGGCTATTATTGGTCAATCGCTCAGGATGGGAACAATCCTGTACAAGGTTCGATGTATGTTCAACTAGGTGGAGCTCCTTGGACACAAATAGCACCTGCGATATCATTCTCTCCAAGTAACATGTCTGGTGTTTACTTAGCCGAGAGAAACATAGCACAAAGTAACGGCTCAGGCATAACAGACTTGCAGCTGCGTTTAGACAATGTGGTAGGTACTGTAACAGTAACTAACTTCATGCTAACAACGAACACTACACTGGAGACTGTCGAGTACTCTACAAACCCTACAGAGCTAAGAGCTGATGGTGAGTATCTTTACTTTAACCGTAACAGAGCAATCGCAGGTGTAACAATGCCTACATTCTATACAGCTAAAAATGGCACACCAGATACAGCTCGTTCGTCCATGACAATCCAAGAAGTGTTCCACGGTAACGGTTCGGTTTACGATGATTTCCATTGGACAGAGGATGGTACACCAACTAAATCTAACAAATTTACAGATATGCTGTTAGACACTGGATTCTCTCTTGCTATCCAAAACCAAAACGTCCAATTGCCTAATGAAAACGGAGTTACAGAGCGATACATCCAAGTACAGCTTAATAACTTCGCTAGTAGACCGATGGCGAATAATGGTACGGTTCGATTAGCTAATGGTAAAGGTCTAGAGTTAGAGAGATTGGCATCTGGTAACTTCACTAAGTACAACCAGTTCAAGGTTGATTTTGCTAATGCAAACATGTCCTTCCTTGTATCTGCGAAGGAAATGAACGTTGCACCCGCATACCAAGTAAAGGGCGAAGAAGTATTGTTCTTTATGCGTGGATGGAAAATGTTCCAAGGTGAGCCAGTGCAGAAAACTACAGGAGGTGTTGTAACGTACACGTTCAATACTTACTCTGGTTCCGATAACTCAGCGCCTAACTTCACTCCAATCGGTTATGTTCAAAAAGACCAAGCGATTATGAACAAAGGTGTACTCGCTTCTACAGGAGAATACAAGCGCCCAGTTGAAGTCGCGGCACCTATAAGAACAAAACAAACAGGTCAACAGTGGCAAGTTGTGTATCAGTTAGCACTACCCTATGATTCTACATGTCAGTTCACAGGAGCTATCGATTTAATCGGTGACCCAGAGAAAGTATCACCTACAGTAGTCCGTTACACGTACGTAGATTGGACACCACCGTTTAATGACAAAGACGGTACATTTATGTACGGGATTAACTTAGCAACCGCACAAGAGGACACTAGATACCTTATACCTGTTCTTGAGAGACGTATTGCTAACGCAGAGCAGAAAGTAGAGACAGACTCTATCAAGAGTGTTGTATTTAGTTCTCGTGAGTATGAGTTAGGTCTACAAGATAAAGCAAGCGTAGCTGATGTAGAAGCTAAGGCTGATAAGTCGGACCTTACCGATTTAGCGACTAAGGATGAGTTAAAGAGTAGTGAGGAGGCGCGTAAGCGTGAATTAGAAGAAGCGATGAAAAATATCGACTTCACTCCTTATGTACAGAAGTCCGAGATTGAACAGTTAGATAGACAATGGACAGCTGCATTCTACTCATCCGGTGGTATGAACATCGTAAAAAACTCTATCGGGTTTGACCGTTCGATGAGCGCTAAATTAAATAAAGAGACGTTCACTTTCTGGGACGATATGATTAACCCCGCATACCAGCAACCAGTTAACATTCAAACTAACGCATTAGACGCATTAGGGTTTACTAGCGGATTCATGTTTAACGAATCGCCTAATACTAACTGGACAGCAATAGCACAAGTGCTCAACGTTATCCCTAACCAACCGTACACGATAAGTTATTTCTTACAAAAGATGAATGCAGGGGATAGTAACTACAGGTTCAACATCCTGATACAGCAAACAACTAAGGATAATCCAACATCAGATGCGGATTGGGCTACGATTAACGGAGGTCAGCTAGCGGACAACAGTAGCATTAAACACAGCGGGTTCATGCCTTCTTACTTCGAGTTCACTCCAACAAATAGTAAGGTTAGACTTGTGTTAATTGCTTCCCCTAAATGCGTAGCACAGATTTCTGGTATAATGGTTAACATAGGAAAAAAACCTATCAAGTGGACAATGTCTACAGGGGAAAACTACAACACGAACGTTCGTATGAACTTAAATGGTATCCGCGTATCTCAGGTTGACAAGGATGGTACAGAAATTGGGTACACAGTCATCACACCGGAACGTTTTGCAGGTTATTATATCCGAGACGGTAAACCAGAAGAGATATTCCGACTCGACGGTGATGAGACTTGGACTAAAAAGTTAAGAGCCGAAAACGAGATAAACATGGGACCTATTAAGATTCTACGTGTTGAGAATCCTAACAACGCAGGATGGGCGTTTATTTCTAACTACTAG

Genome Context

Tertiary structure

PDB ID

fde6c1a2134ed7e3597bcd62112b1258a2cb6b3789267372e170afc8f3275002

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,7128

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence