Protein

View in Explore

Genbank accession

ATI18888.1 [GenBank]

Protein name

minor tail protein

RBP type

Evidence RBPdetect2

Probability 0,90

Protein sequence

MSISSYPFDGQAVSEGQYSYLFRELASHSGIADTESGEGFKVYGDSSGMQVKVNPGFAVVRGHAVQSTAVETRTIAAASAATRYDRVVLRLDPTANAISLAVVQGTSGGGAPALTQTDTGVFEFPLATVTVPVGAATITAGNVSLEREFLGNTVGGWATSTRPKSPRTGRLGFNNSTKTWEFWDGTAWKDLAPTITWSTIEGAPATFPPSSHTHAWGDVTGKPTTFNPSSHSHDWDAITGKPSTFAPSTHSHSWSSITSKPSTFPPSGHSHDSYLTSGETIAWANGSKKPHNNSASGSGTWYAVWVEGDGTFCRNTSSARFKKNIRDYDIDVEDVLNLRPVIYDRKDTANEDGSVKEGRKDEVGLIAEEVEAAGLDWLVNYLDGEVDGLRYDLLGVALLPVVQKQAAQISDLEARLAALEDRLS

Physico‐chemical properties

protein length:	424 AA
molecular weight:	45322,35000 Da
isoelectric point:	5,24126
aromaticity:	0,08962
hydropathy:	-0,35071

Domains

Domains [InterPro]

DC_1002
STR
1–333

DC_1002 Coil

DC_0203
RBD
305–424

DC_0203

IPR030392
CHP
317–373

IPR030392

IPR030392
CHP
317–416

IPR030392

ATI18888.1

1 424

Architecture

STR

RBD

STR 1-333 | RBD 334-424

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_1002	STR	DC_1002	1	333	Novel HMM	DC_1002	Central	Low	Positional only	129 proteins / 129 hits
DC_0203	RBD	DC_0203	305	424	Novel HMM	DC_0203	C-terminal	Low	Positional only	178 proteins / 178 hits
IPR030392	CHP	DC_0088	317	373	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits
IPR030392	CHP	DC_0088	317	416	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits
Coil	Unmapped	-	402	422	Coils	Coil	-	-	-	-

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Streptomyces phage SqueakyClean [NCBI]	2041208	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	No host information

Coding sequence (CDS)

Genbank protein accession

ATI18888.1 [NCBI]

Genbank nucleotide accession

MF766047 [NCBI]

CDS location

range 20068 -> 21342
strand +

CDS

GTGTCCATCAGCTCCTACCCGTTCGACGGCCAGGCCGTCTCCGAGGGGCAGTACAGCTACCTCTTCCGCGAGCTGGCCTCGCACTCCGGCATCGCCGACACCGAGAGCGGCGAAGGCTTCAAGGTGTACGGCGACAGCTCTGGAATGCAGGTCAAGGTGAACCCCGGCTTCGCGGTTGTGCGCGGCCACGCCGTCCAGTCGACGGCAGTGGAAACCCGGACCATCGCAGCCGCGAGCGCGGCCACCCGCTACGACCGCGTGGTGCTCCGCCTCGACCCGACCGCGAACGCCATCTCCCTCGCCGTCGTGCAGGGCACCTCCGGTGGCGGCGCCCCCGCCCTGACCCAGACCGATACCGGCGTCTTCGAGTTCCCCCTCGCGACCGTCACGGTCCCGGTCGGCGCCGCGACCATCACTGCCGGGAACGTCTCCCTGGAGCGCGAGTTCCTGGGCAACACCGTGGGCGGCTGGGCGACTTCGACGCGCCCGAAGTCACCGCGCACGGGCCGGCTCGGCTTCAACAACTCCACGAAGACGTGGGAGTTCTGGGACGGGACGGCGTGGAAGGATCTCGCTCCGACGATCACCTGGTCGACGATCGAGGGGGCGCCGGCCACCTTCCCCCCGAGCTCGCACACGCACGCCTGGGGCGACGTCACCGGCAAGCCGACCACGTTCAACCCGTCTTCCCACTCGCACGACTGGGACGCGATCACGGGCAAGCCGAGCACCTTCGCCCCGTCGACCCACTCGCACTCCTGGTCGTCCATCACCTCGAAGCCCTCGACCTTCCCGCCGAGCGGCCACAGCCACGACTCCTACCTCACCTCGGGCGAGACGATCGCCTGGGCCAACGGCTCGAAGAAGCCGCACAACAACTCGGCCTCCGGCTCCGGCACCTGGTACGCAGTGTGGGTCGAGGGTGACGGCACCTTCTGCCGGAACACCTCCTCGGCCCGCTTCAAGAAGAACATCCGCGACTACGACATCGACGTCGAGGACGTCCTCAACCTGCGTCCGGTCATCTACGACCGCAAGGACACCGCCAACGAGGACGGCTCCGTCAAGGAGGGCCGCAAGGACGAGGTCGGCCTGATCGCCGAAGAGGTGGAGGCGGCCGGTCTCGACTGGCTGGTCAACTACCTGGACGGCGAGGTCGACGGCCTGCGCTACGACCTGCTCGGCGTCGCCCTGCTTCCGGTCGTGCAGAAGCAGGCCGCGCAGATCTCCGATCTCGAAGCCCGCCTCGCCGCGCTGGAGGACCGGCTGTCGTGA

Genome Context

Tertiary structure

PDB ID

c9aa72a380191ccc1d5743478175d984bc4cd48a986112ba89fdcf1c0c3c59cc

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,7817

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence