Protein

UniProt accession
A0A1B1PB74 [UniProt]
Protein name
Tail fiber protein
RBP type
TF
Evidence UniProt/TrEMBL
Probability 1,00
TF
Evidence GenBank
Probability 1,00
TF
Evidence Phold
Probability 1,00
Protein sequence
MVEFEPLETMRFQSQLGKEMKRKYKEGNNLVTLSLADVVKVNYKYNTVDVITVRENNSTAKNPNDNGKYSAMLPTHMSGRTANGNIYGSTTLVTVGTRVLIGFIDGQVDTPIVINIYGKTDDQQQLTRTDFTAADDSIESIQQELWNTFNLYPSMTYENVDGRGNREVTFSGKTFLISTDRDQENMYVQDAHFDYMDLPHSRYANGELIEPESPDAPTVLYVHQSVYDNHRTTFFVKADGTFRLGSRHVNGGGITYQELKPDGSYSIVKKNDTENPEEESSDLSSIEILKDGNVVLQNPKTKMEITDEGVMVNGKPIGSGGSGGGISPELENIIKQINNQFSLLKITMSEIEGGLETKVEKDTYFIDTAEIEAKIKDMKDGARTSKDNLQKSIEALVKYIANDVNTNPITDANKLQITKLLDDIDNKKASLDGAAQMILLDPFLTDEQKVAVKKWYDKLNSDHTALKTTVMVAIQDGNLTAQDKKDISTAAETYLNDLTSWLTEMDKAADASYEQRIVDAFENAVNYANKESLHQSAVITHLYNMVSIKVSSEQVTQQFIDLNTKIEKTQEETATALDDFQTQIDNTVKNLPYKVEVTSSNGLIFVNGGVNSTLAAKITKGTEDVTSTVAVADFIWTRVSNNTAADTTWNNAHKNVGRSFNINAADVIDRATFFCDYKNPPVATGSVTIANIQDITVGNVEPTNPREGALWYDRGTGIVWMWQQNKWVEINRFDVNIRNLLIGSRDYGAQNSNNPTDPNNSTPQGNISGAWVMSGDTSGTPPKTGVKPSPQNATNQDTWISYTQSQWGGVKYKSSKLASSGLLDVGDMVTYVCYVRTVGGTSPDKGIPIRLYVTDNRDGGTGTIGFEMKDKETDGKPVTGAPVQMRATQQWKMVWGTFPVTQLFLDTANDPNSTSKHVRVEPTSFTDIGAGGQLEIKSHMVVKGVIPSDWVPAPEDTKRDSDNTNWNMDALGSDNYLTRFERGLVKTKLADITGESLLGTQDMKTSAQLDADTWGKGKFYSLRKQARDIAVDPNQDAAYKSLTTSYDALRTYLRALKTGAGRNTVYPWDTTSDVIMDVKRTEWDKAWADYENAYASLTVVVQQKQKDYTDNRIEDVNTEIKNISKTGQHATTDLRVPTTSISAPITTIALPSFKGFTKNNLQVGGVNYAYGTANKVEVKGNGAASTNQTVKPFTIKQDGLDLINTGKFICGYYWSIAQDGNNPVQGTMYVQLGGAPWTQIATPVAFSPSNMSGVYLADRNIAQSNGSGITDLQLRLDNVVGTVTVTNFMLTTNTTLETVEYSTNPTELRADGEYLYFNRNRAIAGVTMPTFYTAKNGTPDTARSSMTIQEVFHGNGSVYDDFHWTEDGTPTKTNKFADMLLDTGFSLAIQNQNVQLPNENGVTERYIQVQLNNFASRPMANNGTVRLANGKGLELERLASGNFTKYNQFKVDFANANMSFLVSAKEMNVAAAYQVKSEEVLFFMRGWKMFQGEPVQKNTGGVVTYTFNPYSGSDNSAPNFTPIGYVQKDQAIMNKGVLASTGEYKRPVEVAAPIRTKQTSQQWQVVYQLALPYDSTCQFTGAIDLIGDPEKVSPTVVRYTYVDWTPPFNDKDGTFMYGINLATAQEDTRYLIPVLERRIANAEQKVETDSIKSVVFSSREYELGLQDKASVADVEAKADKSDLTDLATKDELKSSEEARKRELEEAMKNIDFTPYVQKSEIEQLDRQWTAAFYSSGGMNIVKNSIGFDKSMSAKLNRETFTFWDDMINTAYHQPVNIQTNALDALGFTSGFMFNESPNTNWTAIAQVLNVIPNQPYTISYFLQKMNAGDSNYRFNILIQQTEKENPTSSDDWVTIQGGQISDNSSIKHSGFMPSYFEFTPTKSKVRLVLIAAPKCVAQISGIMVNIGKKPIKWTMSTGENYNTNVRMNLNGIRVSQVDKDGTEIGYTVITPERFAGYYIRDGKPEEIFRLDGDETWTKKLRAENEINMGPIKILRVENPNNAGWAFISNY
Physico‐chemical
properties
protein length:2010 AA
molecular weight: 223228,75750 Da
isoelectric point:5,09371
aromaticity:0,09005
hydropathy:-0,50468

Domains

Domains [InterPro]
A0A1B1PB74
1 2010
Legend: Pfam SMART CDD TIGRFAM HAMAP SUPFAM PRINTS Gene3D PANTHER Other

Taxonomy

  Name Taxonomy ID Lineage
Phage Bacillus phage DirtyBetty
[NCBI]
1873999 Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host No host information

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
ANT41416.1 [NCBI]
Genbank nucleotide accession
KX349903 [NCBI]
CDS location
range 55137 -> 61169
strand +
CDS
ATGGTAGAATTTGAACCTTTAGAAACAATGAGATTCCAATCACAACTCGGTAAAGAAATGAAACGTAAATACAAGGAGGGTAACAATCTTGTTACTCTCTCTCTTGCTGATGTCGTAAAAGTTAACTATAAGTATAATACAGTTGACGTTATCACGGTAAGAGAAAACAACTCTACAGCTAAAAACCCTAACGATAACGGTAAGTACTCAGCTATGCTTCCAACTCATATGTCTGGACGTACAGCTAATGGTAATATCTATGGTTCTACTACATTAGTAACTGTAGGTACGCGTGTACTAATCGGTTTCATCGATGGTCAGGTTGACACACCAATCGTAATCAACATCTACGGTAAGACCGATGACCAACAACAATTAACACGTACAGACTTCACAGCAGCAGATGATTCAATTGAGTCTATCCAGCAAGAACTGTGGAACACTTTCAATCTATATCCATCAATGACTTATGAAAATGTCGATGGTAGAGGTAACCGTGAAGTGACATTCTCTGGTAAGACGTTCTTGATTTCGACAGACCGTGACCAAGAGAACATGTACGTACAAGATGCGCATTTCGATTATATGGACCTTCCACATTCTCGTTATGCGAATGGAGAGCTTATCGAACCAGAATCTCCTGATGCACCAACAGTACTTTACGTTCACCAAAGCGTATATGACAACCATCGTACAACTTTCTTCGTGAAAGCAGACGGTACGTTCCGATTAGGTTCTCGTCATGTTAATGGTGGAGGTATTACGTACCAAGAACTAAAACCAGATGGCTCTTACTCAATCGTTAAGAAGAATGATACGGAGAATCCAGAAGAAGAATCTAGCGACCTATCTTCTATCGAAATCTTAAAGGACGGTAACGTAGTGTTACAGAATCCTAAGACGAAAATGGAGATTACTGATGAGGGTGTAATGGTTAATGGTAAGCCAATCGGTTCTGGTGGTTCTGGTGGAGGTATATCCCCTGAGTTAGAGAATATCATAAAACAGATTAATAATCAATTCTCTTTACTAAAAATTACAATGTCTGAGATTGAAGGCGGTCTTGAAACAAAAGTAGAGAAAGACACCTACTTCATCGACACTGCTGAGATTGAAGCTAAGATTAAAGACATGAAAGACGGTGCTCGTACAAGTAAAGATAATCTACAAAAATCTATTGAGGCACTAGTAAAGTATATTGCTAATGATGTTAACACAAATCCTATAACGGATGCTAACAAATTGCAAATTACGAAATTATTAGATGACATAGATAACAAGAAAGCATCTCTTGACGGTGCTGCACAGATGATACTGCTGGACCCATTCTTGACAGATGAGCAGAAAGTAGCTGTGAAGAAGTGGTACGATAAACTTAACTCTGACCACACTGCACTGAAGACGACTGTGATGGTAGCTATCCAAGATGGTAACTTAACAGCACAAGATAAAAAGGACATCTCAACTGCCGCAGAAACATACCTAAATGACCTAACTTCTTGGTTAACGGAGATGGATAAAGCAGCTGATGCTAGTTACGAACAGCGTATTGTTGATGCATTCGAGAACGCAGTGAACTACGCGAACAAAGAGTCATTACACCAAAGTGCAGTAATCACTCATCTATATAACATGGTATCTATCAAAGTTAGTTCTGAGCAAGTGACACAGCAGTTCATTGATTTGAACACGAAGATAGAAAAGACACAAGAAGAGACAGCTACAGCACTAGACGATTTCCAAACTCAGATTGATAACACAGTTAAGAACTTACCATACAAGGTAGAAGTGACATCATCTAACGGTTTGATATTCGTAAATGGTGGAGTTAACTCTACGCTAGCAGCTAAGATTACAAAAGGTACTGAAGACGTAACAAGTACAGTAGCTGTTGCTGATTTCATATGGACTCGTGTTTCTAATAACACAGCAGCGGATACAACTTGGAACAACGCTCACAAAAATGTAGGTCGCTCATTCAACATTAATGCTGCTGACGTAATTGATAGAGCAACATTCTTCTGTGACTACAAGAACCCTCCAGTAGCTACAGGTAGTGTTACAATCGCGAACATCCAAGATATCACAGTAGGTAACGTTGAGCCAACAAATCCACGTGAAGGTGCTTTATGGTACGACCGCGGAACAGGTATCGTGTGGATGTGGCAGCAAAACAAATGGGTAGAGATTAATAGATTCGATGTTAACATCCGTAACTTATTAATCGGTTCTCGTGACTATGGCGCACAGAACTCTAATAATCCAACAGACCCTAACAACTCGACACCTCAAGGTAATATATCAGGCGCATGGGTTATGTCAGGTGACACATCAGGGACGCCGCCTAAGACAGGAGTTAAACCTTCACCACAGAATGCTACGAATCAAGATACATGGATATCTTATACGCAAAGTCAATGGGGCGGAGTGAAATACAAATCTAGTAAGCTCGCTAGCAGCGGTCTATTAGATGTGGGGGATATGGTTACTTACGTGTGTTATGTACGAACAGTAGGCGGAACAAGCCCTGATAAAGGCATACCTATTAGATTATATGTAACAGATAATCGCGATGGTGGTACTGGTACAATCGGTTTCGAAATGAAAGATAAAGAGACAGACGGTAAACCAGTAACTGGAGCCCCTGTACAGATGCGCGCAACACAGCAATGGAAGATGGTATGGGGTACATTCCCTGTAACACAATTATTCCTAGATACTGCAAATGACCCAAACAGTACATCTAAGCACGTACGAGTAGAGCCGACGAGTTTCACAGACATCGGAGCCGGAGGACAACTAGAAATTAAGTCTCATATGGTTGTTAAAGGAGTTATTCCTTCTGACTGGGTTCCAGCTCCAGAAGATACAAAGCGTGACTCAGATAACACCAACTGGAACATGGATGCTCTTGGAAGCGATAACTACCTAACTCGTTTTGAGCGTGGATTAGTTAAAACTAAATTAGCAGACATTACAGGCGAGTCACTTCTTGGCACGCAGGACATGAAGACATCAGCTCAGTTAGATGCAGACACATGGGGCAAAGGTAAGTTCTACTCTTTACGTAAACAGGCTAGAGACATCGCTGTGGACCCGAACCAAGATGCAGCATACAAAAGCTTAACTACATCTTACGACGCACTTAGAACGTACCTGAGAGCTCTTAAAACAGGTGCTGGTCGAAACACAGTGTACCCATGGGATACTACCTCTGATGTAATCATGGATGTTAAGCGTACAGAATGGGACAAAGCGTGGGCAGATTACGAGAATGCTTATGCATCGTTAACAGTAGTTGTACAGCAAAAACAGAAAGACTACACAGATAATCGTATCGAAGATGTAAATACGGAAATCAAGAACATCAGTAAGACAGGTCAACACGCAACAACTGACCTACGAGTCCCTACTACATCTATTTCTGCACCGATAACAACAATCGCGTTACCTAGTTTCAAAGGTTTCACGAAAAATAACTTGCAAGTTGGTGGTGTGAACTACGCGTATGGAACAGCAAACAAGGTAGAGGTTAAAGGTAATGGCGCAGCTTCAACAAACCAGACAGTAAAACCATTTACGATTAAACAAGATGGACTAGACTTAATCAATACTGGTAAGTTCATTTGTGGGTATTACTGGTCAATCGCGCAGGATGGAAACAACCCTGTACAAGGTACAATGTATGTTCAATTAGGTGGAGCACCTTGGACACAGATAGCAACTCCTGTAGCATTCTCTCCAAGTAACATGTCAGGTGTCTACTTAGCGGATAGAAACATAGCCCAAAGTAACGGCTCAGGCATAACAGACTTGCAGTTGCGTTTAGACAATGTGGTAGGTACTGTAACAGTAACTAATTTCATGTTAACAACGAACACTACACTGGAGACTGTCGAGTACTCTACAAACCCTACAGAGTTAAGAGCTGATGGTGAGTATCTGTACTTTAACCGTAACAGAGCTATTGCAGGTGTAACAATGCCTACGTTCTACACAGCTAAGAACGGAACACCAGATACAGCTCGTTCATCCATGACAATCCAAGAAGTGTTCCACGGTAACGGTTCGGTTTATGATGACTTCCATTGGACAGAGGATGGTACACCAACTAAAACCAACAAGTTCGCAGACATGCTGTTAGATACTGGATTCTCTCTTGCTATCCAGAACCAAAACGTTCAACTTCCTAATGAGAACGGAGTTACAGAGCGATACATCCAAGTACAGCTTAATAACTTCGCTAGTAGACCGATGGCTAATAATGGTACGGTTCGATTAGCTAATGGTAAAGGTTTAGAGTTAGAAAGATTGGCATCTGGTAACTTTACTAAGTACAACCAGTTCAAAGTTGACTTTGCTAATGCGAACATGTCATTCCTCGTATCTGCTAAAGAAATGAACGTTGCAGCAGCATACCAAGTAAAGAGCGAAGAAGTGTTGTTCTTTATGCGAGGATGGAAAATGTTTCAAGGAGAGCCAGTGCAGAAAAATACAGGAGGTGTTGTAACGTACACGTTCAACCCTTATTCTGGTTCCGATAACTCAGCTCCTAACTTCACTCCAATCGGTTACGTTCAAAAGGACCAAGCGATTATGAATAAAGGAGTACTAGCTTCTACAGGAGAATACAAACGCCCAGTTGAAGTCGCTGCACCTATAAGAACAAAACAAACAAGTCAACAGTGGCAAGTTGTATATCAGTTAGCGTTACCATACGATTCTACATGTCAGTTCACAGGAGCTATCGATTTAATAGGTGACCCAGAGAAAGTATCACCTACAGTAGTCCGTTATACGTACGTAGACTGGACACCACCATTCAATGACAAAGACGGTACATTTATGTACGGTATTAACTTAGCGACTGCACAAGAGGATACTAGGTACCTTATACCTGTTCTTGAGAGACGTATTGCTAACGCAGAGCAGAAAGTAGAGACAGACTCTATCAAAAGTGTTGTATTTAGTTCTCGTGAGTATGAGTTAGGTCTACAAGATAAAGCAAGTGTAGCAGACGTGGAAGCTAAAGCAGATAAGTCAGACCTTACCGATTTAGCGACTAAGGATGAGTTAAAGAGTAGCGAGGAGGCGCGTAAGCGTGAATTAGAAGAAGCGATGAAAAATATTGACTTCACTCCTTATGTACAAAAGTCTGAGATTGAACAGTTAGACAGACAATGGACAGCTGCATTCTATTCATCCGGCGGTATGAATATCGTTAAGAACTCTATCGGGTTCGATAAATCGATGAGTGCTAAATTAAATAGAGAGACGTTCACTTTCTGGGACGATATGATTAACACAGCGTACCATCAGCCAGTTAATATCCAGACTAACGCACTAGACGCATTAGGGTTCACTAGTGGGTTCATGTTTAACGAATCACCGAACACTAACTGGACAGCAATAGCTCAAGTGCTTAATGTTATCCCTAACCAACCATACACGATAAGTTATTTCTTACAGAAGATGAATGCAGGAGACAGTAACTACAGATTCAATATCCTAATCCAGCAGACAGAGAAAGAAAACCCAACATCAAGTGATGACTGGGTGACTATCCAAGGTGGTCAAATATCGGATAACAGTAGTATTAAGCACAGTGGTTTTATGCCTTCTTACTTCGAGTTTACTCCAACAAAGAGTAAGGTTCGATTGGTGTTAATTGCCGCTCCTAAATGCGTAGCACAGATTTCTGGTATAATGGTTAACATAGGGAAAAAACCCATCAAGTGGACAATGTCTACAGGGGAGAACTACAACACGAACGTTCGTATGAACTTAAACGGTATCCGCGTATCTCAGGTTGACAAGGATGGTACAGAAATAGGGTACACAGTCATCACACCGGAACGTTTCGCAGGTTATTACATCCGAGACGGTAAACCGGAAGAGATATTCCGACTCGACGGTGATGAAACTTGGACTAAAAAGTTAAGAGCCGAAAATGAGATAAACATGGGACCGATTAAGATTCTACGTGTTGAGAATCCTAACAACGCAGGATGGGCGTTTATTTCTAACTACTAG

Gene Ontology

No Gene Ontology terms available.

Enzymatic activity

No enzymatic activity data available.

Tertiary structure

PDB ID
30557d88ae8a9ace78b41e6b7e85aaf479f6c7fe7d33a9c0e8b39575d645250c
ColabFold
Source ColabFold
Method ColabFold
Resolution 0,7002
Evidence 0,7002

Literature

No literature entries available.