Protein

View in Explore

Genbank accession

QQV93487.1 [GenBank]

Protein name

tail fiber protein

RBP type

Evidence GenBank

Probability 1,00

Evidence RBPdetect2

Probability 0,89

Protein sequence

MEIKGYKGGGGNARTPVEDPDSLVSNATVRMLLALSEGEVEDIPAAELPKRVYLDGTPVENEDGSVNIPGVTVEFRNGSPTQEPIQGFPAVESETRINVALKQPTPWVRQVTNTELDAVRIRMNFRLVIQESDGDRVGGRIEYKIEYRKVGDSAYTEAFNGAVDGKQKDNYERDHRIDLPKSATGWQIRVTRITPDSDADTRVLDSGIVAITEIVDARVRYPWTALLFVSFDAKSFQNIPKVSIKMKGRRVRVPSNYDPETATYNGSWDGTFKQAYTTNPAWHVFDMATHKRYGLGRRIPANFLNKWTMYAIAQRCDELVTNADGTQERRYTSNLYIQKRASAWTVIRDLVSIFNGMVSYGNQQLQIAQDAPAAVRHTVTNDEVVDGKFQYAYGSVENRKGIAHVSYDDPANHYKTNVTVVQRKDLVERYGIEPIELSAIGCVSEYEAQRRGLWALISNTNDRMVSYRVGLDGIKYLIGDVIAVANKYVQGGQFGGRVVKAEGPIVTVDRVIPDNAVPGDKFLCREEGTDGNLIRDIVSISEDRLQLTLSADVKIQAGEVYLLDCAAIAPELFRVTKIVYNEQDANFTVTGLAYSHSKYLEVDTGARIEDRPTTLIPTGQLPAPENIQLEGYSIINQGTRSANLNGTWNPVENAVAYEIQIRRKSQTNGSWSQGWSNLPTQSTTSVDVNGVLAGTYQIRVRAVGRDGQTSVWGESGDEFVDGKRGEIPDVQGLVGEGVVNGITWRWVTGTDDLIDMKSTDLEWRQINDQGVPVGDFVALTNQTYPTGLFTQYGLSFAQKVQVRARFVSSFGDAGPWSDPVIGMASDNMGDYYENIDQAIKDSDTYGELTNDIKDVSEAAQAAQDAADAAGEHADQIAADVVAQGQQISQNAQGLAQEVKDRVAGDAATAQAAADALLNTKNEVEAQIETTNTTMQDGFDSLAQQIASISAGTGEQFDSLKIWYYDKDSEGWSADDGGTNLLPITDDGWLLPAGGSSEMRSPSGTGTLIDGNSYKYIRLRIKKVGTPPWNARLYWIGANEQGWNDSRRLSIPAPDFDPTTGIAAVSIADIPWQASDIIRRIRLDFSQGGGANADNYYAIDWLAVGRPTPGASQAQIQQLQKAITDGDSAEATLRNQLAVQMRGSYDGTNIDSVTSGLMFSEKTARVTADQAITQSVEVLEADYNANKATVTQRLDTLASATEANANAITDLNSKLETVEGDTAANAQAIGALQTKVTDIDGKVTVNSNAITSLNSAMTTAQYQGGNMWIDGSFESYKVGQQLGQDYTAQVSDTAAHVGSKSLWIRRLNGEGGNSDKYLGKQITIRSEGVYRFELWAMMPSGQTLPTSWNVAVGIRTVGATGEGQSWISGLVITSARVTEVGFDKWFKISGKATIPAGSVRSTGQMWISCRGVAGGAGYSMYLDDVTIVDVSDADMVDKKADANASAITGLTTEVTNVKGQITSISQQITQLDNDITSLEGAMKDKADASALATLNNKVTDLDGKVISQGQALTQLTNSVTQSIADTDSLAEMPGNMVVNHSFERLLETWVISNGGAEAYKAQNPRTGSYILRGTPTTSPTLIQSKATSLKKGRTYRYGAWVRRDAAMTIQGDGSNMKLAIRDTGNQLLASTNLTLTNTPATGTWNNVSGEYTPAADTAARFTFHLFIAGGNFYADDAYLIDVTDEKNITANASATEALTTRVEKTEQGLVSQGQAITNLENSVANVQVGGANLVLNSDFSAAPQASISPATSFLQRSYTTDPSVLNWIVEKDETFTLSVWYQEYSEGFGTDKPFTDFVLGKAVGQTDPWTMRMSARNGVFTKEGNLYRVTVSQTAKKGSTIAAAGNWKLLFQDTTQKTGMKLVRLKLEKGNKATDWTPAVADMATAKALDALTTTVTQQGEDLTAVSQATQKLSAMLQTSNAIMNGDLANNADQWANSGSGSSFSYNAGERAIQTGTDSIRVANTTAIPAEAGLKFTVSIDARVTAEGFTPSSDSMGFIGNLGNPTAWAVSQTGWLKDLTTAYQTKTFELTLPANFTGRYVYLRFASAGAAPSGVRILLRNIVVTTSTGVGQKAEASAVNELTTTVQNIDGRVTANATAINSMKSRVDGAEAAIDGLNETVAENGLAMATGFNQMRAMIGDNSAAITQQNTVIADLEQATAEQINTINSSIGDMSATVQQVSSTVADIDGKLSAQWGVKVQTDTGGNNPRVAGIQLGIDATGSSQFLVQADTFGVYTGGAGKAYPFVVKNGVAYMQSAMIENGSIDNAKIGNMIQSNNYVWQSTGWAINKDGNFSINGNSPGQGRMTLDASGIRFFDANNVQRVTLGLY

Physico‐chemical properties

protein length:	2328 AA
molecular weight:	250913,95890 Da
isoelectric point:	4,84612
aromaticity:	0,07517
hydropathy:	-0,32809

Domains

Domains [InterPro]

IPR053171
Unmapped
2–1255

IPR053171 G3DSA:2.60.120.260 G3DSA:1.20.5.340 G3DSA:2.60.120.260 DC_1673 DC_1604

DC_0129
STR
7–959

DC_0129 DC_0793 IPR003305 IPR008979 Coil IPR015406

IPR055385
ATT
91–217

IPR055385 IPR032876 IPR036116 Coil Coil G3DSA:1.20.5.340 IPR008979 DC_0793 G3DSA:1.20.5.340

IPR013783
STR
622–716

IPR013783 IPR008979

IPR003961
STR
622–715

IPR003961

IPR003961
STR
623–725

IPR003961

QQV93487.1

1 2328

Architecture

STR

ATT

STR

ATT

STR

RBD

STR 7-90 | ATT 91-217 | STR 218-339 | ATT 340-500 | STR 501-959 | STR 1054-2129 | RBD 2130-2326 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
IPR053171	Unmapped	-	2	1255	InterPro	Viral Tip Attachment Protein	-	-	-	-
DC_0129	STR	DC_0129	7	959	Novel HMM	DC_0129	Central	Low	Positional only	234 proteins / 234 hits
IPR055385	ATT	DC_0360	91	217	InterPro cluster	Tip attachment protein J, HDII-ins2 domain	N-terminal	High	Text match	1136 proteins / 1139 hits
IPR032876	ATT	DC_0307	340	500	InterPro cluster	Tip attachment protein J	Central	Medium	Text match	1111 proteins / 1112 hits
IPR036116	STR	IPR036116	621	714	Merged direct domain	Fibronectin type III superfamily	Central	Low	Positional only	52 proteins / 52 hits
IPR013783	STR	IPR013783	622	716	Merged direct domain	Immunoglobulin-like fold	Central	Low	Positional only	144 proteins / 144 hits
IPR003961	STR	DC_0003	622	715	InterPro cluster	Fibronectin type III	Central	High	Text match	998 proteins / 1603 hits
IPR003961	STR	DC_0003	623	725	InterPro cluster	Fibronectin type III	Central	High	Text match	998 proteins / 1603 hits
Coil	Unmapped	-	845	865	Coils	Coil	-	-	-	-
Coil	Unmapped	-	906	933	Coils	Coil	-	-	-	-
DC_0793	STR	DC_0793	1054	1482	Novel HMM	DC_0793	Central	Low	Positional only	50 proteins / 50 hits
G3DSA:1.20.5.340	STR	G3DSA:1.20.5.340	1183	1260	Merged direct domain	G3DSA:1.20.5.340	Central	Low	Positional only	38 proteins / 38 hits
G3DSA:2.60.120.260	STR	G3DSA:2.60.120.260	1261	1429	Merged direct domain	G3DSA:2.60.120.260	Central	Low	Positional only	264 proteins / 264 hits
IPR008979	STR	IPR008979	1265	1430	Merged direct domain	Galactose-binding-like domain superfamily	Central	Low	Positional only	24 proteins / 24 hits
G3DSA:1.20.5.340	STR	G3DSA:1.20.5.340	1430	1487	Merged direct domain	G3DSA:1.20.5.340	Central	Low	Positional only	38 proteins / 38 hits
DC_0793	STR	DC_0793	1475	1791	Novel HMM	DC_0793	Central	Low	Positional only	50 proteins / 50 hits
G3DSA:2.60.120.260	STR	G3DSA:2.60.120.260	1532	1681	Merged direct domain	G3DSA:2.60.120.260	Central	Low	Positional only	264 proteins / 264 hits
IPR003305	CBM	DC_0700	1533	1664	InterPro cluster	Carbohydrate-binding, CenC-like	C-terminal	High	Text match	15 proteins / 15 hits
IPR008979	STR	IPR008979	1533	1680	Merged direct domain	Galactose-binding-like domain superfamily	Central	Low	Positional only	24 proteins / 24 hits
DC_1673	STR	DC_1673	1789	1990	Novel HMM	DC_1673	Central	Low	Positional only	15 proteins / 15 hits
IPR008979	STR	IPR008979	1916	2064	Merged direct domain	Galactose-binding-like domain superfamily	Central	Low	Positional only	24 proteins / 24 hits
DC_1604	RBD	DC_1604	2049	2326	Novel HMM	DC_1604	C-terminal	Low	Positional only	61 proteins / 61 hits
G3DSA:1.20.5.340	STR	G3DSA:1.20.5.340	2059	2129	Merged direct domain	G3DSA:1.20.5.340	Central	Low	Positional only	38 proteins / 38 hits
Coil	Unmapped	-	2099	2119	Coils	Coil	-	-	-	-
IPR015406	RBD	DC_0135	2176	2301	InterPro cluster	Tip attachment protein J, central straight fiber domain	C-terminal	High	Text match	1265 proteins / 1266 hits

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Enterobacter phage ATCEA23 [NCBI]	2801521	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Klebsiella aerogenes [NCBI]	548	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales

Coding sequence (CDS)

Genbank protein accession

QQV93487.1 [NCBI]

Genbank nucleotide accession

MW419910.1 [NCBI]

CDS location

range 10 -> 6996
strand +

CDS

ATGGAAATCAAAGGTTACAAGGGCGGCGGAGGCAACGCGCGGACGCCAGTCGAAGATCCAGACTCATTAGTGAGTAATGCAACAGTCCGCATGCTGCTGGCGTTGTCCGAGGGTGAAGTGGAGGACATCCCGGCGGCGGAACTGCCGAAGCGTGTCTATCTGGATGGGACGCCAGTCGAGAACGAAGACGGCAGCGTGAACATTCCAGGCGTGACCGTGGAATTCCGCAACGGTTCACCGACACAGGAACCGATCCAGGGCTTCCCGGCCGTTGAGAGTGAAACGCGCATTAACGTGGCGCTGAAGCAACCGACCCCATGGGTTCGCCAGGTGACTAACACCGAACTGGACGCCGTGCGCATCAGGATGAACTTCCGCCTGGTCATTCAGGAGTCGGACGGCGATCGCGTGGGCGGCCGCATTGAGTACAAGATCGAATATCGCAAGGTTGGCGATAGCGCGTACACCGAAGCATTCAACGGCGCGGTAGACGGCAAACAGAAAGACAACTATGAACGCGATCACCGCATCGACTTACCGAAGAGTGCGACAGGCTGGCAGATCCGCGTAACCCGTATCACGCCAGACAGTGACGCAGATACCCGCGTTCTTGACTCCGGGATCGTGGCAATCACTGAGATCGTCGACGCTCGCGTTCGCTATCCATGGACGGCGTTGCTGTTCGTGAGCTTCGACGCGAAATCGTTCCAGAACATCCCGAAAGTCAGCATTAAGATGAAGGGCCGCCGAGTCCGTGTGCCGAGCAACTACGACCCGGAGACGGCAACCTATAACGGCAGCTGGGACGGGACATTCAAACAGGCGTACACCACTAACCCGGCCTGGCACGTCTTCGACATGGCGACACACAAGCGCTACGGTCTCGGCCGCCGCATTCCGGCTAACTTCCTGAACAAGTGGACGATGTACGCTATCGCGCAGCGTTGCGACGAGCTGGTGACGAACGCCGACGGCACACAGGAACGTCGATACACGTCGAACCTGTACATTCAGAAGCGCGCCAGCGCATGGACGGTGATCCGCGACCTTGTGTCGATCTTTAATGGGATGGTTAGCTACGGCAACCAGCAATTGCAGATCGCGCAGGATGCCCCGGCAGCAGTTCGCCACACGGTGACGAACGACGAAGTCGTGGACGGGAAATTTCAATATGCCTATGGCAGCGTTGAAAACCGCAAAGGGATCGCGCATGTCAGCTATGACGACCCGGCGAACCACTACAAAACGAACGTTACCGTCGTGCAGCGCAAGGATCTGGTCGAACGCTATGGCATTGAGCCGATCGAGCTGTCGGCGATTGGCTGTGTTTCCGAGTATGAGGCGCAACGCCGTGGCCTGTGGGCGCTGATCTCAAACACTAACGACCGCATGGTGAGCTACCGTGTCGGCCTTGACGGTATCAAGTACCTGATCGGCGACGTGATCGCCGTGGCGAACAAATATGTCCAGGGCGGACAGTTCGGCGGCCGTGTCGTGAAGGCCGAAGGCCCGATCGTCACCGTCGACCGTGTGATCCCTGATAACGCTGTTCCCGGCGACAAGTTCCTGTGTCGCGAGGAAGGAACCGACGGCAATCTGATCCGCGACATCGTGAGCATCAGCGAAGACCGCCTTCAGCTGACCCTGTCGGCAGACGTCAAGATTCAAGCCGGGGAAGTATATCTTCTGGACTGTGCGGCCATTGCGCCGGAACTCTTCCGCGTGACGAAGATCGTCTACAACGAACAGGACGCGAATTTCACCGTCACCGGGCTGGCTTATAGCCACTCTAAATATTTAGAAGTCGACACTGGCGCGCGTATCGAAGATCGCCCTACCACGCTGATCCCGACTGGACAGCTACCAGCGCCGGAGAACATCCAGCTGGAAGGCTATTCCATCATCAACCAGGGAACACGCTCGGCGAACCTTAACGGCACCTGGAACCCGGTCGAGAACGCTGTGGCCTACGAAATCCAGATCCGCCGCAAGTCGCAGACTAACGGCAGCTGGTCACAGGGCTGGTCTAACCTTCCAACGCAGTCGACCACGTCCGTCGACGTGAACGGGGTGCTGGCTGGCACCTATCAGATCCGCGTCCGCGCTGTCGGCCGTGACGGTCAGACGTCCGTGTGGGGTGAGTCCGGCGACGAGTTCGTGGACGGCAAGCGCGGCGAGATCCCGGACGTTCAGGGGCTGGTCGGAGAGGGAGTCGTGAATGGCATTACCTGGCGCTGGGTTACTGGCACCGACGACCTGATCGACATGAAATCTACAGATCTGGAATGGCGGCAGATTAATGATCAGGGCGTCCCGGTCGGTGATTTTGTCGCACTGACTAACCAGACCTACCCGACCGGGCTGTTCACTCAGTACGGCCTATCATTCGCGCAAAAAGTGCAGGTTCGCGCGCGTTTCGTGTCCTCGTTCGGCGATGCTGGGCCATGGTCTGATCCGGTTATCGGCATGGCGTCCGACAACATGGGCGACTATTACGAGAACATCGATCAGGCGATCAAGGACTCCGACACCTATGGCGAGCTGACCAACGATATCAAAGACGTGTCTGAAGCCGCACAGGCGGCACAGGACGCCGCCGACGCCGCAGGTGAACACGCAGACCAGATCGCGGCCGATGTCGTCGCACAGGGCCAGCAGATTAGCCAGAACGCGCAAGGACTGGCGCAGGAAGTCAAAGACCGCGTAGCAGGTGACGCAGCAACCGCACAAGCAGCGGCCGACGCGCTGCTGAACACGAAGAACGAAGTCGAAGCGCAGATCGAGACGACGAACACGACCATGCAAGACGGTTTTGACAGTCTGGCACAACAGATCGCGTCTATCTCCGCAGGCACTGGCGAGCAGTTCGACAGCCTAAAAATCTGGTACTACGACAAGGACAGCGAAGGCTGGAGCGCCGACGATGGCGGGACAAACTTGCTACCTATCACGGACGACGGCTGGCTTCTTCCTGCTGGCGGTTCGTCTGAAATGCGCAGTCCTTCCGGCACTGGTACGCTGATCGATGGCAATTCGTATAAATATATCCGCCTTCGCATTAAGAAGGTCGGGACGCCGCCATGGAACGCTCGCCTGTACTGGATCGGTGCTAATGAGCAAGGTTGGAACGACTCGCGACGCCTGTCCATTCCCGCGCCTGACTTCGACCCGACCACCGGGATCGCGGCAGTCTCGATCGCCGATATTCCATGGCAGGCTTCGGACATCATTCGACGCATTCGCCTGGACTTCTCGCAGGGCGGCGGCGCTAATGCCGATAACTACTACGCGATCGACTGGCTGGCAGTAGGCCGTCCGACTCCTGGCGCTTCACAGGCGCAGATCCAGCAACTGCAAAAAGCCATCACCGACGGCGACAGCGCTGAAGCAACGCTTCGCAATCAGCTGGCCGTTCAGATGCGCGGCAGCTATGACGGGACGAACATCGACAGCGTTACTTCTGGCTTGATGTTCAGTGAGAAGACGGCGCGCGTCACCGCCGATCAGGCGATCACGCAGTCCGTCGAAGTGCTGGAAGCTGACTATAACGCTAACAAGGCCACCGTCACCCAGCGCCTTGACACGCTCGCCTCGGCCACCGAAGCGAACGCCAACGCAATCACCGACCTGAACAGCAAGCTGGAGACAGTCGAGGGAGACACCGCCGCGAACGCGCAGGCGATCGGCGCGCTGCAAACGAAAGTTACCGACATCGACGGCAAAGTGACGGTTAACTCTAACGCCATTACGTCCCTGAACTCGGCCATGACTACCGCACAATATCAGGGCGGTAACATGTGGATCGATGGTTCATTTGAATCGTACAAGGTCGGCCAACAGCTGGGGCAGGATTACACGGCGCAGGTTAGCGACACAGCGGCACACGTCGGAAGTAAATCGCTATGGATCCGCCGTCTAAATGGCGAAGGCGGTAACAGCGACAAATATTTAGGCAAACAGATCACGATCCGGTCTGAAGGCGTCTATCGCTTCGAACTGTGGGCCATGATGCCGAGCGGTCAGACGTTGCCGACGTCGTGGAACGTGGCTGTCGGTATCCGAACAGTCGGCGCTACTGGTGAGGGTCAATCGTGGATCTCCGGCCTGGTTATTACATCGGCGCGCGTGACAGAAGTCGGTTTTGATAAGTGGTTCAAGATCTCCGGGAAGGCAACAATCCCGGCCGGAAGCGTTCGTTCAACCGGGCAAATGTGGATCTCATGTCGCGGCGTTGCTGGTGGCGCTGGCTATAGCATGTACCTTGACGACGTGACGATCGTGGACGTCTCAGACGCCGACATGGTCGACAAGAAGGCTGACGCTAACGCATCGGCGATCACCGGGCTAACGACTGAAGTCACCAACGTGAAAGGCCAGATTACCAGCATCAGCCAGCAGATCACGCAGCTGGATAACGACATCACGTCGTTAGAAGGCGCGATGAAGGACAAGGCCGACGCGAGCGCACTGGCGACCCTGAACAACAAAGTCACCGACCTTGATGGCAAAGTGATTTCGCAGGGGCAAGCACTGACCCAACTGACGAACAGCGTCACGCAGTCGATCGCCGATACCGACTCACTGGCAGAAATGCCGGGTAACATGGTTGTGAACCACTCGTTCGAGCGCTTGCTTGAAACGTGGGTTATCAGTAACGGCGGTGCTGAAGCGTACAAGGCGCAGAATCCGCGCACAGGTTCGTACATCCTCCGGGGAACTCCGACGACATCGCCGACCCTTATCCAAAGTAAAGCGACGTCCCTGAAGAAAGGAAGGACGTACCGCTACGGCGCATGGGTTCGTCGTGATGCGGCAATGACGATCCAGGGTGACGGCAGCAACATGAAGTTAGCCATCCGTGACACTGGCAATCAGTTACTTGCGAGCACTAACCTGACGCTGACCAACACCCCGGCGACTGGCACGTGGAATAACGTTTCCGGCGAGTACACCCCAGCAGCGGACACAGCGGCGCGGTTTACGTTTCACCTGTTCATCGCTGGCGGCAACTTCTACGCGGACGACGCCTATCTGATCGACGTCACCGACGAGAAGAACATCACCGCGAACGCCAGCGCAACCGAGGCGTTAACGACCCGCGTCGAGAAGACAGAGCAGGGTCTTGTGTCGCAGGGTCAAGCGATCACTAACCTTGAAAACAGCGTTGCAAACGTGCAGGTCGGCGGGGCTAACCTTGTGCTGAACTCAGACTTCAGCGCAGCGCCACAAGCGAGCATTTCCCCGGCGACTAGCTTCCTTCAGCGTAGCTACACCACCGACCCGTCTGTTCTGAACTGGATCGTCGAGAAAGACGAGACTTTCACGCTGTCGGTCTGGTATCAGGAATACAGCGAAGGATTCGGCACTGATAAGCCGTTTACCGACTTCGTGTTAGGGAAGGCCGTCGGACAGACTGACCCGTGGACGATGCGAATGAGTGCGCGTAACGGCGTATTCACGAAGGAAGGGAACCTTTACCGCGTCACCGTATCGCAGACGGCGAAGAAGGGATCCACCATCGCGGCCGCCGGGAACTGGAAGCTACTGTTCCAGGACACCACGCAAAAGACCGGGATGAAGTTAGTCCGCCTGAAACTGGAGAAGGGCAACAAGGCCACCGACTGGACGCCAGCTGTCGCAGACATGGCAACCGCGAAGGCACTGGACGCGCTGACGACTACCGTCACGCAGCAGGGCGAAGATCTTACGGCCGTTTCACAGGCTACGCAGAAACTTTCCGCCATGCTTCAGACCAGCAACGCGATCATGAACGGCGACCTTGCGAACAACGCTGATCAGTGGGCCAACTCCGGCAGCGGTTCGTCCTTCAGCTACAACGCTGGCGAGAGGGCGATCCAGACCGGGACTGACTCTATCCGCGTGGCGAACACCACGGCGATCCCAGCGGAAGCCGGGCTGAAGTTCACCGTCTCCATTGACGCGCGTGTGACTGCTGAAGGGTTCACGCCATCATCGGACAGCATGGGGTTCATCGGTAATTTAGGAAATCCGACAGCCTGGGCTGTTTCGCAGACTGGATGGCTTAAGGACTTAACCACCGCTTACCAGACTAAGACGTTCGAACTGACACTTCCGGCCAACTTCACCGGGCGCTATGTCTATCTACGATTCGCATCAGCAGGCGCGGCACCTTCCGGCGTCCGCATCCTGTTACGTAACATCGTAGTAACGACGTCTACCGGAGTGGGCCAGAAAGCGGAAGCCAGCGCGGTCAATGAGCTAACCACCACCGTGCAGAATATCGACGGGCGTGTGACGGCGAACGCTACGGCCATCAATAGCATGAAGTCGCGAGTCGATGGCGCTGAAGCGGCGATCGATGGACTGAACGAGACAGTCGCCGAGAACGGCCTGGCGATGGCTACTGGCTTCAACCAGATGCGCGCGATGATTGGCGACAACAGCGCAGCAATCACCCAGCAAAACACGGTGATCGCGGATCTGGAACAGGCTACCGCCGAGCAGATTAACACCATCAATTCGTCGATCGGCGATATGTCGGCCACCGTTCAGCAGGTATCAAGCACGGTCGCAGACATTGACGGCAAGCTGTCGGCACAGTGGGGCGTTAAGGTTCAGACCGACACCGGGGGGAATAACCCGCGCGTCGCTGGTATTCAGTTAGGCATTGACGCTACTGGATCGTCTCAGTTCTTAGTCCAGGCCGACACGTTCGGCGTGTATACTGGCGGCGCTGGCAAGGCTTACCCGTTCGTGGTCAAGAATGGCGTCGCGTATATGCAATCGGCTATGATTGAGAACGGTTCTATCGACAACGCCAAGATCGGCAACATGATCCAGTCGAACAACTATGTCTGGCAGTCGACAGGTTGGGCGATCAACAAAGATGGTAACTTCTCGATCAATGGGAACTCGCCGGGGCAAGGTCGCATGACCTTAGACGCCAGCGGGATCCGGTTCTTCGACGCTAACAATGTGCAACGTGTAACATTAGGACTTTATTAA

Genome Context

Tertiary structure

PDB ID

ed67a3af520f0133afad4537672316f99b096e232eb9ef6796aed4a2e0f9eb1d

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,6975

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Literature

Title	Authors	Date	PMID	Source
Complete genome sequence of a novel bacteriophage, ATCEA23, infecting Enterobacter aerogenes	Myung,H., Hong,H. and Jo,J.	2020-08-03	—	GenBank

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence

Literature