Protein

View in Explore

Genbank accession

YP_009788688.1 [GenBank]

Protein name

tail fiber protein

RBP type

Evidence UniProt/TrEMBL

Probability 1,00

Evidence GenBank

Probability 1,00

Evidence RBPdetect

Probability 0,87

Evidence RBPdetect2

Probability 0,95

Protein sequence

MAFSTQRAVSDGSMTYLDISIQYQKRADIAVFYNDLPAPAGSWSWVGTTDKRIQFTNPVPNGTEVLIKRTTRIDSIINVFATGAKFTNASMDTNFQQLMYLNQEAVEGSALTDIFNDVDFHGYRLRNLGEAQNDNEAITLGQAKVQGANAWDAANAAAASRDLAAKWATQTPASVDGTNYSAKQYAINAAGSASDSATSAGNSAASAGASAGSATASAGSATASANSATLAQNWAVKMDGQVGGVDYSAKYYAGQSAASASASAGSASASGASATASANSATASGNSAAAAAASADLAAANAAAAGGFRFSGRKVVNVSGTADPTYSGCTVIGNSATPITLTMPASALANGGAVLITNWAAGALTVAVGSGATVMNPLGTTSFTLANNQWAILVGNGGSTFDIMAGAPLDSALAGYKNGPFVSFQNGVYGGLAMYRGSLATPSDINWMIYNSGEVLSFSHYPTGSGGTPDWTPFNFNPASKTLTYNGGISMTGGILNLGGNKITNVGTPTALTDVSTLGTVATLNRGIELILNGTGAIQQEFNTPILNGSNTMCFADLWYTIGSAGAAFSWNSEVGGGLGVSLWEDKAIVLTTNTPKATLAAGDYAFACQPIEGTFLQRLKYGTASARGSWVQFRAKATIPCTITLAVRNRSSTRSYCIPFNITTTAATYSAFIPGDTDTTFGNWGTATQAECYFVFTFAAGSTFTAPAANSWQSGNYLAAPGQTNMLSATTQRVSFSDVSWRDSDQLIPFVLPRRDEERRRCQRYYWSTYNAWDQRGTITQSGSVGTINYGTGTNTGVVSFGLPVTMMKVPTVLCVNASTGATGTWRCGNNTDVAWNNWTSGTNTVAVACSVIPGLNIVNGHIVCNARML

Physico‐chemical properties

protein length:	871 AA
molecular weight:	90035,83100 Da
isoelectric point:	6,03695
aromaticity:	0,09414
hydropathy:	-0,02193

Domains

Domains [InterPro]

DC_0126
ATT
2–249

DC_0126 DC_1470

IPR005604
ATT
7–111

IPR005604 DC_1213

YP_009788688.1

1 871

Architecture

ATT

STR

RBD

ATT 2-249 | STR 480-749 | RBD 750-870 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0126	ATT	DC_0126	2	249	Novel HMM	DC_0126	N-terminal	Low	Positional only	72 proteins / 72 hits
IPR005604	ATT	DC_0240	7	111	InterPro cluster	Bacteriophage T7 tail fibre protein-like, N-terminal domain	Central	Medium	Text match	1326 proteins / 1328 hits
DC_1470	STR	DC_1470	480	749	Novel HMM	DC_1470	Central	Low	Positional only	5 proteins / 5 hits
DC_1213	RBD	DC_1213	748	870	Novel HMM	DC_1213	C-terminal	Low	Positional only	4 proteins / 4 hits

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Ralstonia phage phiAp1 [NCBI]	2783867	Uroviricota > Caudoviricetes > Autographivirales > Ayakvirus > Ayakvirus Ap1
Host	Ralstonia solanacearum [NCBI]	305	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Betaproteobacteria > Burkholderiales

Coding sequence (CDS)

Genbank protein accession

YP_009788688.1 [NCBI]

Genbank nucleotide accession

NC_047800.1 [NCBI]

CDS location

range 37688 -> 40303
strand +

CDS

ATGGCATTCAGTACCCAACGGGCAGTTTCCGATGGGTCGATGACCTACCTCGACATCTCGATCCAGTATCAGAAGCGAGCAGACATTGCGGTGTTCTACAATGATCTGCCCGCTCCTGCTGGGTCGTGGTCGTGGGTGGGAACTACGGACAAGCGCATTCAGTTCACGAACCCCGTGCCCAACGGTACGGAGGTTCTGATCAAGCGCACCACCCGTATCGACTCGATCATCAACGTCTTTGCAACAGGCGCGAAGTTCACCAACGCGTCGATGGATACCAACTTCCAACAGTTGATGTATCTGAACCAAGAGGCAGTTGAGGGTTCGGCGCTGACCGACATCTTCAACGACGTGGACTTCCACGGCTACCGCCTGCGCAACTTGGGCGAAGCACAGAACGACAACGAGGCTATCACGCTCGGCCAAGCCAAGGTGCAAGGCGCGAACGCGTGGGATGCGGCAAACGCAGCAGCCGCGTCGCGTGACCTCGCAGCGAAGTGGGCAACTCAGACACCGGCATCGGTGGACGGCACGAACTACTCCGCTAAGCAGTACGCAATCAACGCAGCAGGCAGTGCATCCGACTCGGCAACGAGTGCAGGCAACTCCGCCGCGAGTGCTGGTGCATCTGCTGGCAGCGCCACGGCATCCGCAGGCTCTGCCACGGCGTCTGCCAACTCTGCTACGCTCGCGCAGAACTGGGCTGTCAAGATGGACGGCCAAGTCGGCGGTGTGGATTACTCGGCCAAGTACTACGCGGGCCAGTCCGCAGCGTCGGCATCGGCATCGGCCGGTTCGGCATCCGCATCTGGTGCAAGCGCAACGGCCTCGGCCAACAGCGCAACCGCCTCCGGTAACTCCGCAGCAGCGGCAGCAGCCAGCGCGGACCTCGCAGCAGCAAATGCTGCGGCGGCAGGCGGCTTCCGATTCTCGGGTCGTAAGGTTGTCAACGTCAGCGGCACTGCCGATCCGACGTACTCTGGCTGTACCGTTATCGGTAATTCGGCCACCCCAATCACGTTGACCATGCCAGCATCGGCGCTAGCTAACGGCGGGGCCGTGCTCATCACCAACTGGGCAGCAGGCGCACTTACAGTGGCCGTGGGCTCCGGTGCGACGGTGATGAACCCGCTGGGCACCACCAGCTTCACGCTTGCCAACAACCAGTGGGCGATCCTTGTGGGCAACGGTGGCAGCACGTTCGACATCATGGCCGGAGCCCCGCTCGACTCGGCGCTTGCTGGTTATAAGAATGGCCCATTCGTGTCGTTCCAGAACGGTGTGTATGGTGGCTTGGCGATGTACCGTGGGAGCCTAGCTACCCCGAGCGACATAAACTGGATGATCTACAACTCCGGTGAGGTGCTGAGCTTCAGCCATTACCCGACGGGCAGCGGTGGTACTCCAGACTGGACGCCGTTCAATTTCAACCCTGCATCCAAGACGCTGACGTACAACGGCGGCATCTCGATGACGGGCGGCATCCTGAACCTTGGCGGCAACAAAATCACCAATGTGGGCACGCCCACTGCGCTGACTGATGTCTCGACGCTTGGTACGGTGGCTACACTGAATCGAGGTATCGAGTTGATCCTTAACGGGACCGGCGCGATACAGCAGGAGTTCAACACCCCGATCCTGAACGGATCGAACACGATGTGCTTCGCTGACCTGTGGTACACCATCGGGTCGGCCGGCGCGGCGTTCTCTTGGAACTCTGAAGTTGGCGGCGGCCTTGGTGTATCACTGTGGGAAGACAAGGCAATCGTACTAACGACGAATACGCCCAAGGCTACGTTGGCAGCGGGTGATTACGCGTTTGCATGCCAACCTATCGAGGGAACGTTCCTTCAGCGCCTGAAGTACGGTACGGCATCTGCGCGAGGTTCATGGGTACAGTTCCGAGCCAAGGCTACCATCCCGTGCACCATCACATTGGCAGTTCGCAACCGGAGTAGCACGCGCTCGTACTGCATCCCGTTCAACATCACGACGACAGCAGCGACATACTCTGCGTTCATCCCCGGTGACACGGATACGACGTTCGGTAACTGGGGCACGGCCACCCAAGCCGAGTGCTACTTCGTATTCACGTTCGCAGCGGGTAGCACGTTCACGGCACCGGCAGCAAACTCGTGGCAGTCTGGGAACTACCTCGCGGCCCCGGGGCAGACCAACATGCTGTCTGCAACAACGCAGCGCGTCAGCTTCTCCGATGTGTCTTGGCGTGACTCAGACCAACTCATCCCATTCGTGTTACCACGCCGCGATGAGGAGCGTCGGCGCTGCCAGCGGTACTACTGGAGCACGTACAACGCGTGGGACCAACGTGGCACGATAACCCAGTCAGGCAGTGTGGGCACAATCAACTACGGAACCGGCACAAACACAGGGGTAGTGTCGTTTGGTCTTCCGGTGACAATGATGAAAGTTCCCACTGTCCTGTGCGTCAACGCTTCCACCGGCGCAACCGGTACGTGGCGATGCGGGAACAACACAGACGTGGCTTGGAACAACTGGACTAGTGGCACCAACACTGTTGCAGTCGCTTGTAGTGTCATACCCGGTCTGAACATCGTGAACGGCCACATCGTATGCAACGCACGCATGTTGTAA

Genome Context

Tertiary structure

PDB ID

1f07e342b18b83926c0a7c45054fcad69e281ee4a82d0c0e1f0eabac507694e4

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,7517

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence