Protein

View in Explore

Genbank accession

UVF61145.1 [GenBank]

Protein name

minor tail protein

RBP type

Evidence RBPdetect2

Probability 0,76

Protein sequence

MSDVRRSAGWLADKLTDQDRRLSLVESRKPGLAQSSIEDGAIEEYTADGTFASSVGKQPDGSHVAFPATGPTPAAPVVPTLKASPGLVEVRWSGKFTGDAVSTLDFKHVAVHVGTTPEVDTAPNTQVATIRGELGDVAVLAAEEGMVYVCLVAWTAAGKASAPSAVGAVAVPAPANAELINESLADLDLKYDGVITEAGQLGDRLDTAETDLTASKERLTDAEEDLASAFGQLNTVDARVAAAKQAAIDAAAADATLKKEQAEAAAALEAAEIAQTKADEAEAAALAAAKTYADAQASGAGADALAAAKLDATAKADAAKAAAITAAAADATAKKEQAEANAALDAKAKADAAQAAAIAAAATTAQTKADAAKAAAIAAAATDAQTKADAARDVALAQVAQVIARGTSLTRNGDFEAGADGWSLNSGAAVETGTARSGTKALRMGPNPTVNMGVSSEWVPGSAGRTYYVEMWVRRTGTEVKAQGLGFYVQAKTAAGGTSSPIVGRVDSATISTTGWTKISVTYTVATADTVAVRFAPWIIAGNNTYHFDDFLAVDVTEAQAALTAAAAADAKAVAAQSAAGTAGSNATAALNMAGTKNSAYSSPDPATGTGTTAGDLWRQVNAGKEVIAEWQWSGSTWVKQTVSGSNVSNMDIGYLTAGAATMSQALIDKLVAGTANFQRADIVNLFATSGTLDEAVIDKLWADVVHAYKITTAMLAVGSFDNVIPDPDFTNEELQWGSAVSPYSFPATEGRTGGGALKITPNTSQTGRYSARIPASGAASYRVAVWVKSDVAIPAGGLGLYVNRKLSKSGGAGGAINILKQADGTSAGNDPIAANTWTLLQGIAPIADTWYDFAVGLYTQSSFSTGTTWFSEPTATRMNAGELTVDGTVTAKALAALIVLTSEIIAGNPNGTHARMTPNGFRVMAAGIDGGTPTEVIRLGTDTDDYLGVVNALGELVASISSSGGMTAQSLDVAGDISMGGTTLAETLDARPKGLIAWASRWTAGKYWAGATSHPYLHLTFPVEAGRAYMVRTNSIGMDGSSTSSDPLVRLHQIQGDNCTTTAPVIAQAISTSSGIATYRSSITINRILTPSSTENLSVLLAYGAARGTGKISAPGANPNFLMVEDLGLAMAQTGEWRDGTADNSTVDPTPPATVQNYDQTWNATGTRSFLGSGGTYSYNTGYMYSGLQYGTSNGDLSSMAVFPSLTTILNGATVTGVWVYVYYDFWYYGAGGDAYIGLHGQTGLTSSKPAKTYSHAVSTNWPRAAGRWIKMSSSTYDGWRTGQHRGFTLGGSGGGYERYGYAHGAKLRITWTK

Physico‐chemical properties

protein length:	1315 AA
molecular weight:	135038,46760 Da
isoelectric point:	5,02698
aromaticity:	0,07224
hydropathy:	-0,06715

Domains

Domains [InterPro]

Coil
Unmapped
205–225

Coil Coil Coil G3DSA:2.60.120.260 G3DSA:2.60.120.260 DC_2111

IPR008979
STR
407–556

IPR008979

IPR003305
CBM
409–535

IPR003305

UVF61145.1

1 1315

Architecture

STR

RBD

STR 407-556 | STR 716-881 | RBD 882-1315

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
Coil	Unmapped	-	205	225	Coils	Coil	-	-	-	-
Coil	Unmapped	-	257	284	Coils	Coil	-	-	-	-
Coil	Unmapped	-	321	341	Coils	Coil	-	-	-	-
G3DSA:2.60.120.260	STR	G3DSA:2.60.120.260	407	556	Merged direct domain	G3DSA:2.60.120.260	Central	Low	Positional only	264 proteins / 264 hits
IPR008979	STR	IPR008979	407	556	Merged direct domain	Galactose-binding-like domain superfamily	Central	Low	Positional only	24 proteins / 24 hits
IPR003305	CBM	DC_0700	409	535	InterPro cluster	Carbohydrate-binding, CenC-like	C-terminal	High	Text match	15 proteins / 15 hits
G3DSA:2.60.120.260	STR	G3DSA:2.60.120.260	716	881	Merged direct domain	G3DSA:2.60.120.260	Central	Low	Positional only	264 proteins / 264 hits
DC_2111	RBD	DC_2111	882	1315	Novel HMM	DC_2111	C-terminal	Low	Positional only	37 proteins / 37 hits

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Arthrobacter phage Aoka [NCBI]	2926081	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	No host information

Coding sequence (CDS)

Genbank protein accession

UVF61145.1 [NCBI]

Genbank nucleotide accession

ON755180 [NCBI]

CDS location

range 17080 -> 21027
strand +

CDS

ATGAGCGACGTCCGCCGCAGCGCCGGATGGCTGGCCGACAAGCTGACCGACCAGGACCGCCGGCTAAGCCTCGTCGAGTCCCGCAAGCCGGGCCTAGCGCAGTCCTCGATCGAGGACGGCGCGATCGAGGAATACACCGCGGACGGGACCTTTGCGTCCTCGGTCGGGAAGCAGCCCGACGGCTCCCATGTGGCATTCCCGGCCACCGGCCCGACGCCGGCGGCCCCGGTCGTCCCGACCCTCAAGGCCAGCCCGGGCCTGGTCGAGGTCCGCTGGTCCGGGAAATTCACCGGCGACGCGGTCTCCACCCTGGACTTTAAGCACGTCGCCGTCCACGTCGGGACCACGCCCGAGGTCGACACCGCGCCCAACACGCAGGTAGCGACGATCCGGGGCGAGCTCGGCGACGTCGCGGTCCTCGCGGCCGAGGAGGGCATGGTTTACGTCTGCCTCGTCGCCTGGACGGCCGCCGGCAAGGCCTCGGCCCCGTCCGCGGTCGGCGCGGTCGCGGTCCCGGCCCCGGCTAATGCCGAGCTGATCAACGAATCCCTCGCGGACCTCGATCTCAAGTACGACGGCGTCATTACCGAAGCCGGGCAGCTCGGCGACCGACTCGACACCGCCGAGACCGACCTCACCGCGAGCAAGGAACGCCTCACCGACGCCGAGGAGGACCTCGCCTCAGCCTTCGGCCAGCTCAACACCGTCGACGCCCGCGTAGCCGCAGCCAAACAGGCAGCGATCGACGCGGCGGCGGCCGACGCCACCCTCAAAAAGGAACAGGCCGAAGCAGCGGCGGCACTGGAAGCCGCCGAGATCGCCCAGACCAAGGCCGACGAGGCCGAGGCGGCGGCCCTGGCGGCCGCAAAGACCTACGCCGACGCCCAGGCCTCCGGCGCGGGCGCGGACGCGCTGGCGGCGGCAAAGCTGGACGCGACGGCCAAAGCGGACGCGGCGAAGGCCGCCGCGATCACGGCGGCCGCTGCGGACGCGACGGCGAAAAAGGAACAGGCCGAAGCCAACGCAGCCCTCGACGCGAAGGCGAAGGCCGACGCGGCCCAGGCCGCAGCCATCGCCGCGGCGGCCACCACGGCCCAGACCAAAGCGGACGCGGCGAAGGCGGCGGCGATCGCCGCGGCGGCCACCGACGCCCAGACCAAGGCCGACGCGGCCCGCGACGTCGCCCTCGCGCAGGTCGCTCAGGTCATCGCCCGCGGGACCAGCCTCACCCGGAACGGCGACTTCGAGGCCGGCGCGGACGGCTGGAGCCTCAACTCCGGCGCGGCCGTTGAAACGGGCACGGCCCGCTCCGGAACCAAGGCGCTACGAATGGGCCCTAACCCGACCGTGAATATGGGAGTGTCCTCGGAATGGGTCCCCGGCTCAGCGGGGCGCACTTACTACGTTGAAATGTGGGTCCGCCGCACCGGGACAGAAGTCAAGGCGCAGGGCCTGGGTTTCTACGTCCAGGCTAAAACGGCGGCGGGCGGCACTTCGAGCCCCATCGTTGGCCGGGTCGACTCCGCGACGATCAGCACGACCGGATGGACGAAAATCTCGGTCACTTACACCGTCGCCACGGCGGACACGGTCGCGGTCCGCTTCGCCCCCTGGATCATCGCCGGGAACAACACCTATCACTTCGACGACTTCCTCGCCGTCGACGTCACCGAGGCGCAGGCGGCACTCACCGCGGCGGCGGCGGCGGACGCGAAAGCGGTCGCGGCCCAGTCCGCGGCCGGGACCGCGGGGTCGAACGCTACGGCGGCGCTGAACATGGCCGGGACGAAAAACTCCGCCTATTCCAGCCCTGACCCTGCTACCGGCACCGGCACGACGGCCGGCGACCTCTGGCGGCAAGTCAACGCCGGGAAGGAGGTCATCGCCGAGTGGCAGTGGTCCGGCTCAACCTGGGTCAAGCAGACCGTCTCCGGATCCAACGTGTCGAATATGGACATCGGCTATCTCACCGCCGGCGCGGCGACGATGTCCCAGGCGCTAATCGACAAACTGGTCGCCGGGACGGCGAACTTCCAGCGGGCCGACATCGTCAATCTCTTCGCCACCTCGGGCACCCTCGACGAGGCGGTCATAGACAAGCTCTGGGCCGACGTCGTCCATGCCTACAAGATCACCACGGCGATGCTCGCGGTCGGGAGCTTCGATAACGTCATCCCGGACCCGGATTTCACTAACGAAGAGCTGCAGTGGGGATCCGCGGTCTCGCCGTACTCGTTCCCCGCGACCGAGGGACGGACCGGCGGCGGGGCGCTCAAGATCACCCCGAACACCTCCCAGACCGGCCGGTACTCCGCCCGGATCCCAGCCTCCGGCGCGGCGTCCTACCGGGTCGCCGTCTGGGTCAAATCCGACGTCGCGATCCCGGCCGGCGGCCTCGGCCTCTACGTCAACCGGAAACTGTCCAAGAGCGGCGGCGCGGGCGGCGCGATAAACATCCTCAAGCAGGCGGACGGGACCAGCGCCGGGAATGACCCGATCGCGGCGAACACCTGGACGCTGCTGCAGGGGATCGCCCCGATCGCCGATACCTGGTACGACTTCGCGGTAGGCCTCTACACGCAGAGCAGTTTCTCGACCGGGACAACATGGTTCTCCGAACCGACGGCGACCCGGATGAACGCCGGGGAGCTGACGGTCGACGGGACCGTAACCGCGAAGGCGCTCGCCGCGCTGATCGTGCTGACCAGCGAAATCATCGCGGGCAACCCGAACGGGACGCACGCCCGGATGACCCCGAACGGTTTCCGCGTGATGGCGGCCGGGATCGACGGCGGCACCCCGACCGAGGTGATCCGCCTCGGGACGGATACCGACGACTATCTCGGCGTCGTCAATGCGCTGGGGGAGCTGGTCGCGTCCATCAGTTCCTCGGGCGGCATGACCGCGCAAAGCCTGGACGTCGCCGGTGACATCTCTATGGGCGGGACCACGCTCGCGGAGACTCTCGACGCGAGGCCGAAGGGCCTGATCGCCTGGGCCAGCCGGTGGACGGCGGGCAAGTATTGGGCCGGGGCGACCTCGCACCCGTACCTACACCTGACATTCCCGGTGGAGGCGGGGCGGGCCTACATGGTTCGGACCAACTCGATCGGCATGGACGGGTCCAGCACCTCCTCGGACCCGCTCGTCCGGCTGCATCAGATCCAGGGCGACAACTGCACCACCACCGCCCCGGTGATCGCGCAGGCGATCTCTACGAGTAGCGGAATCGCCACGTACCGCTCCTCGATAACGATCAACCGCATCCTCACCCCCTCAAGCACGGAGAACCTGTCGGTCCTCCTCGCCTACGGGGCGGCCCGAGGCACTGGGAAGATCAGCGCCCCGGGAGCGAACCCGAATTTCCTCATGGTGGAAGACTTGGGGCTGGCGATGGCGCAGACGGGGGAATGGCGGGACGGCACCGCAGATAACTCCACCGTGGATCCCACCCCGCCGGCCACGGTCCAGAACTATGACCAAACGTGGAACGCCACCGGGACCCGGTCCTTCCTGGGGTCGGGCGGCACGTACAGCTATAACACCGGGTACATGTATTCGGGGCTGCAGTACGGGACCTCTAACGGCGATCTGTCCTCTATGGCCGTGTTCCCCAGCCTCACTACCATCCTCAACGGGGCCACTGTGACCGGCGTCTGGGTCTATGTGTACTACGACTTTTGGTACTACGGCGCAGGCGGGGACGCCTATATCGGCCTTCATGGGCAGACGGGACTCACCAGTTCCAAGCCGGCCAAAACCTACAGTCACGCGGTCTCAACCAACTGGCCGAGGGCGGCCGGGCGCTGGATCAAGATGTCCTCGAGTACCTATGACGGATGGCGCACCGGGCAGCACCGGGGGTTCACCCTCGGCGGAAGCGGCGGCGGCTACGAACGCTATGGGTACGCTCACGGCGCGAAGCTGCGGATCACCTGGACCAAGTAA

Genome Context

Tertiary structure

PDB ID

81c9c8bc7d06241ee6a1f02d61e5351de09473c56fc43b5d3b4960d22577b684

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,7821

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence