Protein

View in Explore

Genbank accession

YP_001595457.1 [GenBank]

Protein name

virion structural protein

RBP type

Evidence RBPdetect

Probability 0,68

Protein sequence

MANQKDLMKLSVNELIALGSQSGLTFHAGMKKSHMVQQLSASAASGWLDTNAELMGGSFEDDSLITESLGDSSMISDAAHIAQVLSSAGYTEAFHAAMNGPTHHVEAVHAYMERLGVNTDDVWMHMPKPNPNLPQGSFNMLNAYMRDTLAGHQDIMPELPGHYTGDIMGEYSTNRGDIAKSMGYLAHMYVDRQQYDDPDRYARDVYRVAKRLESELPQNFREVAAVSAMNVGNKSGPRVSYMDSLPQLGSESIVGDIQHPRQPLNASGLPLGSMGSGIKAEYSLSASLSGSPGWSDASKSLYQDVSGAVKSAAKVYAGGSERGMNAYRTQSSDRDLILDSASRYTDLADARSGYDNLKKDIGDDPRYSGASIRGVLENAHQYNEAEISKTFDPAERLRNTGPTELSTSNEFTANLNEPTSWNSARDRRESIAIANLDSASVGQHSSVKYHDALEQGTQEWLDFRKQYDITGSTIGDYLGHNPATNNSPIHTMGEKIGLTVRKDSPRARENFERGHRLEAWARPRVGERYGIEITETGAITNDDYPGMMYSPDGLIGDDALWEHKAPNNFKDLETTPNYMDQMQLGMHLSGRSRTLFTQTVGEESRSQWVEADPTWFERNKNKIISSQARMNAGREFMESSDLEGKDLVNETRKVMSGDGIWGYQTRDHREGEGYTAGKRGMAKYSAAAGTAADPFIGSHSPYNPEASRSGYQPNFVMHEQNFPATTGNGDTGNDSMALSVKKGILAAQEENKQKGIGADADFDGKADSMGWNQERFDAANGGGSGGGGGRGGYFTSGGNYFDDYGRMGGSLAAGIAGGSIGSATNGVMQALMATPAGRMAAVGIGAIQIGNEAAEYMNDFIGNSLDAGVMNPNEYSSMSQGLEMLGLNSQQAARMNQTTHSAYNTMLNGDPSAAVNIVRGSRGLLTIGDIRSTGGDPVALARIMQERGKERGWSQARIAGAAQMAGLDGMARAFDRTEYSHERAGSVVESGRNSDFAEGMAQSEMLQVERAQLLPGYNVPQSVLSHGAALFEAGSTAAGAANSGYSQARQVAANVYDFIAGEESGGKEYNKDGTRVTSPTGARGIMQVLPSTARDPGYGIKPSDGSPEDDARVGREYYDAMYKRFGGDHEKAMAAYTDGAGTVDKAVDKFGMDWLSAVPAQAQKRVKAFREWSKSSQSLEEGATGFTRNGMSYGQTQTVVNVKIDAKVNNQVASATVAVPGGQTVTQQMNMNNGAQQRR

Physico‐chemical properties

protein length:	1239 AA
molecular weight:	133359,56180 Da
isoelectric point:	5,31197
aromaticity:	0,07345
hydropathy:	-0,61525

Domains

Domains [InterPro]

DC_0169
ATT
1–422

DC_0169 IPR011335 DC_0159 IPR023346 DC_0800

IPR011604
STR
453–645

IPR011604 G3DSA:1.10.530.10

IPR019080
STR
459–591

IPR019080 IPR008258

cd00254
ENZ
1059–1150

cd00254

YP_001595457.1

1 1239

Architecture

ATT

STR

RBD

ATT 1-422 | STR 453-1150 | RBD 1151-1239

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0169	ATT	DC_0169	1	422	Novel HMM	DC_0169	N-terminal	Low	Positional only	46 proteins / 46 hits
IPR011335	Unmapped	-	452	621	InterPro	Restriction endonuclease type II-like	-	-	-	-
IPR011604	STR	IPR011604	453	645	Merged direct domain	PD-(D/E)XK endonuclease-like domain superfamily	Central	Low	Positional only	46 proteins / 46 hits
IPR019080	STR	DC_0765	459	591	InterPro cluster	YqaJ viral recombinase	Central	Low	Positional only	44 proteins / 44 hits
DC_0159	STR	DC_0159	637	1052	Novel HMM	DC_0159	Central	Low	Positional only	48 proteins / 48 hits
G3DSA:1.10.530.10	RBD	G3DSA:1.10.530.10	1043	1183	Merged direct domain	G3DSA:1.10.530.10	C-terminal	Low	Positional only	95 proteins / 95 hits
IPR008258	ENZ	DC_0010	1045	1149	InterPro cluster	Transglycosylase SLT domain 1	C-terminal	High	Text match	100 proteins / 142 hits
IPR023346	STR	IPR023346	1059	1150	Merged direct domain	Lysozyme-like domain superfamily	Central	Low	Positional only	29 proteins / 29 hits
cd00254	ENZ	DC_0010	1059	1150	InterPro cluster	cd00254	C-terminal	High	Text match	100 proteins / 142 hits
DC_0800	RBD	DC_0800	1180	1239	Novel HMM	DC_0800	C-terminal	Low	Positional only	42 proteins / 42 hits

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Escherichia phage phiEcoM-GJ1 [NCBI]	451705	Uroviricota > Caudoviricetes > Chaseviridae > Carltongylesvirus > Carltongylesvirus GJ1
Host	Escherichia coli [NCBI]	562	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales

Coding sequence (CDS)

Genbank protein accession

YP_001595457.1 [NCBI]

Genbank nucleotide accession

NC_010106 [NCBI]

CDS location

range 38231 -> 41950
strand +

CDS

ATGGCTAATCAAAAAGATTTAATGAAGTTGAGCGTTAATGAGTTAATTGCATTAGGCTCTCAAAGCGGTCTGACTTTCCATGCTGGTATGAAGAAGTCGCACATGGTTCAACAACTTAGTGCGAGCGCTGCTTCGGGATGGCTGGATACAAATGCAGAATTAATGGGTGGGTCGTTTGAAGATGACAGTTTAATTACTGAATCTCTTGGCGACTCTTCCATGATTTCAGACGCTGCCCACATTGCACAAGTGCTTTCAAGTGCTGGCTACACAGAAGCATTTCATGCAGCAATGAATGGCCCAACACACCATGTAGAAGCTGTTCACGCATACATGGAAAGGCTTGGTGTCAACACAGATGATGTGTGGATGCACATGCCAAAGCCAAATCCGAACTTACCGCAAGGTAGCTTCAACATGCTTAATGCGTACATGCGTGATACGCTGGCAGGTCATCAAGATATAATGCCGGAACTTCCTGGTCATTACACTGGTGACATTATGGGTGAATACTCTACAAACCGTGGAGATATTGCCAAATCTATGGGCTATCTTGCTCATATGTATGTTGACCGTCAACAATATGACGACCCAGACCGCTATGCACGAGATGTTTATCGTGTAGCCAAACGTTTAGAATCAGAATTGCCGCAAAACTTCCGTGAAGTTGCTGCTGTATCTGCAATGAATGTAGGTAATAAGTCGGGGCCAAGAGTTTCATACATGGATTCTCTCCCTCAACTTGGTTCCGAATCTATTGTTGGTGATATTCAACATCCTCGCCAACCACTTAACGCATCTGGCCTACCTTTAGGCTCTATGGGTTCTGGCATTAAAGCTGAATATTCTTTATCTGCATCATTATCTGGCTCCCCAGGTTGGTCTGATGCAAGTAAATCTTTATATCAAGATGTATCTGGCGCAGTTAAATCTGCTGCTAAGGTATATGCTGGTGGTTCAGAACGAGGGATGAACGCATATCGCACTCAATCTTCTGACCGAGATTTGATTCTTGATTCTGCATCTCGTTATACAGACCTTGCAGATGCTCGTTCTGGTTATGACAACCTAAAGAAAGATATTGGTGATGACCCTCGTTACTCTGGTGCATCTATTCGTGGCGTACTGGAAAATGCTCACCAATATAATGAAGCTGAAATCAGTAAGACTTTCGACCCTGCTGAACGTTTAAGAAATACTGGACCTACTGAACTTAGTACATCCAATGAGTTTACGGCAAATCTAAATGAACCGACAAGTTGGAACTCTGCAAGGGATAGAAGAGAGTCTATTGCTATTGCAAATCTCGATAGTGCTAGCGTTGGACAGCATAGTTCGGTTAAGTACCACGATGCGCTCGAACAAGGTACGCAGGAGTGGCTTGATTTTCGTAAGCAGTATGATATTACTGGCTCTACTATTGGTGACTATCTGGGCCACAACCCCGCAACCAATAATAGCCCAATACATACAATGGGCGAAAAGATTGGCCTCACAGTAAGAAAGGATTCCCCACGAGCGCGCGAGAACTTTGAGCGTGGACATAGATTAGAGGCGTGGGCCAGACCCAGGGTAGGTGAACGATATGGGATTGAAATAACTGAAACTGGTGCAATCACAAACGACGACTATCCTGGCATGATGTACTCGCCTGATGGGCTAATTGGTGATGATGCTTTGTGGGAACATAAAGCTCCAAATAACTTTAAAGATTTGGAAACAACTCCAAACTACATGGACCAGATGCAACTTGGTATGCATTTGAGTGGCCGTAGTCGCACACTGTTTACCCAAACTGTTGGCGAAGAGTCCAGAAGTCAGTGGGTTGAAGCCGACCCAACGTGGTTTGAACGTAACAAGAACAAGATTATATCCTCTCAAGCACGCATGAATGCTGGACGCGAGTTTATGGAAAGCTCCGACCTTGAGGGAAAAGACCTTGTTAATGAAACCCGCAAAGTTATGTCTGGTGATGGAATTTGGGGCTACCAGACTCGTGACCACAGGGAAGGTGAGGGATATACTGCTGGCAAGCGCGGGATGGCTAAATATAGTGCTGCTGCTGGCACTGCTGCTGACCCGTTTATTGGCTCCCATTCTCCCTACAATCCAGAGGCATCTCGTTCAGGCTACCAACCAAACTTTGTAATGCACGAGCAAAACTTTCCAGCAACCACAGGAAATGGTGATACTGGAAATGACTCGATGGCATTGTCTGTTAAGAAAGGTATCCTTGCTGCTCAGGAAGAGAATAAGCAAAAGGGTATTGGTGCAGACGCAGACTTTGATGGCAAAGCTGATTCAATGGGTTGGAATCAGGAACGATTTGATGCTGCCAATGGTGGTGGAAGTGGTGGCGGCGGTGGTCGTGGCGGCTACTTCACAAGTGGTGGCAACTACTTCGATGACTACGGTCGTATGGGTGGTTCACTTGCTGCTGGCATTGCTGGTGGCAGTATTGGTTCGGCAACCAACGGAGTTATGCAAGCATTGATGGCAACTCCTGCCGGACGTATGGCTGCTGTAGGCATTGGTGCTATTCAGATTGGCAATGAAGCTGCTGAATACATGAATGACTTTATCGGCAACTCGCTTGATGCTGGTGTTATGAATCCTAATGAATATTCTTCCATGTCGCAAGGCTTGGAGATGTTAGGACTCAACTCACAACAAGCGGCACGTATGAATCAAACCACACATAGTGCCTACAACACCATGCTTAACGGCGACCCCAGCGCCGCTGTGAACATCGTTCGCGGCAGTAGGGGATTGCTCACCATAGGTGATATTCGCTCGACTGGCGGCGACCCTGTTGCCCTCGCTCGCATTATGCAGGAAAGAGGCAAGGAACGTGGCTGGAGTCAGGCCCGTATCGCTGGTGCTGCGCAGATGGCTGGGCTGGATGGTATGGCTCGTGCCTTCGACCGCACGGAATACAGCCATGAGCGAGCAGGTTCGGTGGTAGAAAGTGGTAGAAACTCTGACTTTGCCGAAGGTATGGCTCAATCAGAAATGTTGCAGGTGGAGCGCGCACAGCTTCTGCCAGGGTATAACGTGCCACAAAGTGTGCTATCTCATGGTGCTGCACTGTTCGAAGCTGGAAGCACTGCTGCTGGTGCTGCTAACTCTGGATACAGCCAAGCCCGACAAGTTGCTGCAAACGTTTATGATTTCATTGCTGGTGAAGAGTCTGGTGGCAAGGAATACAACAAGGATGGTACACGAGTTACAAGCCCGACTGGTGCTCGTGGAATCATGCAGGTTCTTCCTTCTACTGCTCGTGACCCAGGTTACGGAATCAAACCTTCTGATGGAAGTCCTGAAGATGATGCTCGTGTCGGTCGTGAATACTACGATGCGATGTATAAACGATTCGGTGGCGACCATGAGAAAGCAATGGCTGCTTACACGGATGGTGCTGGAACTGTTGACAAGGCTGTCGATAAGTTTGGAATGGATTGGCTCAGTGCTGTTCCGGCTCAGGCTCAGAAACGTGTTAAAGCATTCCGTGAATGGTCCAAATCTTCTCAATCTTTGGAAGAAGGTGCTACAGGGTTTACTCGCAATGGAATGTCCTACGGTCAAACCCAAACTGTTGTCAATGTTAAGATTGATGCTAAGGTCAACAACCAGGTTGCTTCTGCTACAGTTGCAGTTCCTGGTGGCCAGACTGTAACTCAACAAATGAACATGAACAACGGTGCACAACAAAGACGTTAA

Genome Context

Tertiary structure

PDB ID

f4880c22ab8918c630ca74059d03e5c29715974717627d7991a0ad95c7046005

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,3437

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence