Protein

View in Explore

UniProt accession

A0A5B9NA84 [UniProt]

Protein name

Tail fiber protein

RBP type

Evidence UniProt/TrEMBL

Probability 1,00

Evidence GenBank

Probability 1,00

Protein sequence

MTQVKQTSAQSAVNQAVNLLNGHEDFVERSTGLTVDPHVDHYLQNPDYVLSNNRHFIADTMAEYQPNGDATTEGQALHVLGYCHAYIATKNPVFLDKAKKAWDAYINYFYKGQPVPDFPSRYICNWIINGKEPVLADYPVNPEEPTQGGYKCVPIQFTNGVGQIPHGAPFWGEYLDSCTFAHRGHMTWDAINGSVQEIQENLDGKIDWQTVFDQYRILGTPTYEDLFLDNFTDGRNTWTGFTSTSVIPTVTGGWIKPPRVDDTNPVGIRKDGISFEGGQYETVRLRVKKTGSPVWAGAVWWVPTGGRGWDETRKFSIPEPKFDSSGVAEIAVTTGWNVNIRTMRIDTGAPLTAEEYEKNFFEIDYIGVSHKTGEGIAEPWSSLAWIDWKAYLGDTYTVKWGESNRAKTLPVQWLVVWTNNKIGMGKGPNDQLWDGDIIEENLPDSDKGMIKLEDETINGVYLVNYASKVPVDFGGYEFKRNEPWHNRPVHTPFLGGINQLGNAADAEVWFVDACYLLYRITGDEKYKTALESVFFTANEYTEIDSTDKFFRQSMSAETPFTDAISYGFSYPASTTINYSRDSEGYIVINTDQACQTFLEQQAVIFRVTDKSKLRLTYGGQTETGKTVGMSGILTIGSTKGDADSENRYKVTLPKTSDSTPKVYDIPLSQLAKETNDETGEDYLVADSRAATDYGNCTWEEVYEENVFDGRSANIIKAKLPTSDDGFIIGFWLTEEGKVDTKSIVYRADSPITVRMTDDNEWNWNWILGETYGKWVKRTLDPKNLTLAERQPNHTAEEPLPTEVKYTKVEQLNFSLEDDTATDKEFSYYCINDVPPLFEGDDGWTVLFRAALNGSEAFTAVVGDCTIIDYRHDSLAYSPGVIPFSNIYGEGTNQIGAWHGMPYPGYQYPFIYTIHVSEKYANELSNQIQFLYDSQEAYYNQVGILGPGCAAYIWNRWDNYKYGKPDTWTTYHWGDGKPWSGYQPRAYNAAARAWYELSVRGKTVPRILKEYVERWSTWLVSFAERFDGHSPNDFPIAPDQPVWIENDFTGHMCGLWLAGACYSKLAGSKVEGLDYFIDSCAGELAENFTIVDDPTKAINGAWSPDPRVSGDNGMSFGFYTGEIFRGLSLYIIYKNHGVGYNFYQDCAITDHYKASIDV

Physico‐chemical properties

protein length:	1157 AA
molecular weight:	130526,36920 Da
isoelectric point:	4,73602
aromaticity:	0,13656
hydropathy:	-0,48574

Domains

Domains [InterPro]

DC_0178
ATT
1–58

DC_0178 IPR008928 DC_0061

DC_0061
STR
124–254

DC_0061

A0A5B9NA84

1 1157

Architecture

ATT

STR

ATT 1-228 | STR 229-1157

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0178	ATT	DC_0178	1	58	Novel HMM	DC_0178	N-terminal	Low	Positional only	107 proteins / 107 hits
IPR008928	ATT	IPR008928	59	228	Merged direct domain	Six-hairpin glycosidase superfamily	N-terminal	Low	Positional only	64 proteins / 64 hits
DC_0061	STR	DC_0061	124	254	Novel HMM	DC_0061	Central	Low	Positional only	116 proteins / 116 hits
DC_0061	STR	DC_0061	252	1157	Novel HMM	DC_0061	Central	Low	Positional only	116 proteins / 116 hits

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Salmonella phage SE5 [NCBI]	2575329	Uroviricota > Caudoviricetes > Andersonviridae > Kolesnikvirus > Kolesnikvirus SE5
Host	No host information

Coding sequence (CDS)

Genbank protein accession

QEG07723.1 [NCBI]

Genbank nucleotide accession

MK770412 [NCBI]

CDS location

range 79695 -> 83168
strand +

CDS

ATGACGCAAGTTAAGCAGACATCGGCACAGAGTGCCGTTAATCAAGCTGTGAATTTGCTGAACGGTCATGAAGATTTTGTAGAGCGTAGTACGGGTCTCACTGTAGACCCACACGTTGACCACTACCTGCAAAACCCTGATTACGTTCTGTCAAACAACAGACATTTCATTGCTGACACTATGGCAGAATATCAGCCAAATGGTGACGCAACAACAGAGGGACAGGCATTACATGTCCTCGGTTACTGCCACGCATACATCGCAACAAAGAATCCTGTATTCCTTGACAAAGCGAAAAAGGCTTGGGACGCCTATATCAATTATTTCTACAAGGGTCAGCCTGTACCGGATTTTCCATCACGTTACATCTGTAACTGGATTATCAACGGTAAAGAACCTGTCCTTGCAGACTATCCAGTAAACCCCGAAGAGCCTACTCAGGGTGGCTATAAATGTGTACCTATCCAGTTTACTAACGGTGTTGGTCAGATTCCTCATGGTGCTCCTTTTTGGGGCGAATACCTTGACTCTTGTACATTTGCTCATCGTGGTCACATGACATGGGATGCGATTAATGGCTCTGTTCAGGAGATTCAAGAGAACCTTGACGGGAAGATTGATTGGCAAACTGTTTTTGACCAGTACAGAATTCTTGGGACTCCAACCTATGAAGACTTGTTCTTAGACAACTTCACAGATGGGCGTAACACTTGGACAGGGTTTACAAGCACGTCAGTTATCCCAACTGTTACAGGTGGCTGGATTAAACCCCCACGTGTTGATGACACAAACCCTGTTGGTATTCGTAAAGATGGTATCTCTTTCGAAGGTGGTCAGTATGAAACAGTTCGTCTGAGGGTTAAAAAGACGGGTTCTCCTGTTTGGGCTGGTGCTGTATGGTGGGTTCCTACTGGTGGTAGAGGTTGGGACGAAACACGTAAGTTCTCCATCCCTGAACCTAAGTTTGACTCATCAGGTGTTGCTGAGATTGCTGTGACTACTGGTTGGAACGTCAATATCCGTACAATGCGTATTGACACTGGCGCACCATTGACCGCTGAAGAGTATGAGAAGAACTTCTTCGAGATTGACTATATCGGTGTAAGTCACAAAACTGGTGAAGGTATCGCAGAACCTTGGTCATCCCTTGCGTGGATTGATTGGAAAGCCTATCTTGGCGACACTTACACTGTTAAGTGGGGCGAGTCAAATCGAGCAAAAACCCTTCCAGTTCAATGGCTTGTCGTATGGACAAACAATAAAATTGGTATGGGGAAAGGCCCGAATGACCAGTTGTGGGATGGTGACATTATCGAAGAAAATCTTCCAGACTCTGACAAAGGGATGATTAAACTCGAAGATGAGACTATCAACGGTGTATACTTAGTGAATTATGCTTCTAAAGTCCCTGTTGATTTTGGTGGGTATGAGTTCAAGAGAAATGAACCGTGGCATAACCGACCTGTACATACCCCCTTCTTGGGTGGTATCAACCAGTTAGGTAACGCTGCTGATGCTGAAGTCTGGTTTGTAGATGCTTGTTATCTTCTGTACAGAATTACTGGTGATGAGAAGTACAAGACTGCTTTAGAGAGTGTATTCTTCACTGCGAACGAATATACTGAGATTGACTCAACGGATAAATTCTTCCGTCAAAGTATGTCTGCTGAAACTCCATTCACGGATGCAATCAGCTACGGGTTCTCTTACCCTGCGAGTACAACTATCAACTACAGCCGTGACTCTGAAGGTTACATTGTAATCAACACTGACCAAGCCTGTCAGACCTTCTTAGAACAGCAAGCGGTTATCTTCCGTGTTACTGACAAGTCTAAGTTGAGATTGACTTATGGTGGTCAGACAGAAACTGGAAAGACTGTTGGTATGTCTGGAATCCTGACAATCGGTTCAACGAAAGGTGACGCAGACTCTGAAAACAGGTACAAGGTAACTCTTCCAAAGACGAGTGATTCTACTCCGAAAGTCTATGACATTCCTCTTAGTCAGCTTGCGAAAGAGACTAATGATGAAACTGGTGAGGATTATCTGGTAGCCGACTCAAGAGCAGCAACCGACTACGGAAACTGTACTTGGGAAGAAGTCTACGAAGAGAATGTCTTCGATGGTCGTTCAGCGAACATTATCAAGGCAAAACTACCAACATCTGATGACGGTTTCATTATCGGATTCTGGTTGACAGAAGAAGGTAAAGTTGATACAAAGTCTATCGTCTACCGTGCTGATTCACCAATCACTGTACGCATGACTGATGACAACGAGTGGAACTGGAACTGGATTCTTGGTGAGACTTATGGTAAGTGGGTGAAAAGAACTCTTGACCCGAAAAACCTTACACTTGCTGAGAGACAACCTAACCACACAGCAGAAGAGCCTTTACCAACTGAGGTTAAATACACCAAAGTTGAACAGTTGAACTTCTCTCTGGAGGATGATACAGCAACTGACAAAGAATTCTCTTACTACTGCATCAACGATGTTCCACCACTGTTTGAAGGTGATGACGGTTGGACAGTCCTGTTCCGTGCTGCATTGAACGGAAGTGAGGCGTTCACGGCTGTTGTTGGTGATTGCACAATCATTGATTATCGTCATGACTCACTGGCGTACAGTCCCGGCGTTATTCCGTTCTCTAACATTTATGGTGAAGGTACTAACCAGATTGGTGCTTGGCACGGTATGCCATACCCAGGCTATCAATACCCGTTCATCTACACAATTCATGTTTCAGAAAAATATGCAAATGAGCTTTCAAATCAGATTCAATTCCTGTATGATAGCCAAGAGGCATATTACAATCAGGTCGGAATTTTGGGGCCAGGCTGTGCTGCGTATATCTGGAACCGTTGGGATAACTACAAATACGGTAAGCCTGACACTTGGACAACGTATCATTGGGGTGATGGTAAGCCTTGGTCTGGTTATCAGCCAAGAGCCTATAACGCTGCTGCAAGGGCTTGGTATGAGCTTTCTGTAAGAGGGAAGACTGTTCCGAGAATCCTGAAGGAGTACGTTGAACGCTGGTCAACATGGCTTGTCTCATTTGCAGAAAGGTTTGACGGTCATTCACCAAATGACTTCCCAATTGCACCAGACCAACCAGTTTGGATTGAGAACGACTTCACAGGTCACATGTGCGGCCTTTGGTTAGCAGGTGCTTGTTACTCTAAACTTGCAGGTTCAAAAGTGGAAGGTCTCGACTACTTCATTGATTCCTGTGCAGGTGAGTTGGCAGAGAACTTCACAATCGTTGATGACCCCACAAAGGCTATTAACGGTGCATGGTCTCCAGACCCAAGAGTATCAGGTGATAATGGTATGTCTTTTGGATTTTATACTGGTGAAATTTTCCGTGGATTATCACTGTACATTATCTATAAGAATCATGGTGTTGGTTATAACTTCTACCAAGATTGTGCCATTACAGACCACTACAAAGCATCTATTGACGTTTAG

Genome Context

Gene Ontology

	Description	Category	Evidence (source)
GO:0005975	carbohydrate metabolic process	Biological Process	IEA:InterPro (UniProt)

Tertiary structure

PDB ID

d61bf928eba57d6ae7c21342f025836ce1543a40df570ac5780962700a046ace

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,5356

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Gene Ontology

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence