Genbank accession
CAJ1523441.1 [GenBank]
Protein name
Phage long tail fiber
RBP type
TF
Evidence GenBank
Probability 1,00
TF
Evidence RBPdetect
Probability 0,65
TF
Evidence RBPdetect2
Probability 0,93
Protein sequence
MADIKRKFRAEDGLDAGGDKIVNVALADRTVGTDGVNVDFLVQENTVQVYDSTRGYNKGFVVLYDNRLYQAINDIVSPSGAFNLLQWRAVRTDAQWITVASGTYQLSSGESISVNTGAGNDMVFTLPNTPVDGDTVVLADIGGRTGTVKVQINASVQSILNFRGEQVRTVLMTRPRSQLLFVFSNRLWQMYIIDYGKESITVTPATPYQAQANDFIVRRFTSAAPINITLPRNANNGDIIHLVDLDKLNPLYHTIVKTFDDTTSIGEVGTHIAEGRNDSDAFFVFDAASSLWRIWEGDQKSRLRIIRADSNIRPNEEVLIFGTNNATTGTINLTLPTGILSGDTVKISMNYMRKGQTVKIKAAEGDTIASSVALLQFPKRSEYPPDAQWVSVTELEFNGTTSYVPVLELAYIEDTVAGTRYWVVQQNVPTVERVDAGSDATRARLGVIALATQAQANVDLENTPAKEVAITPETLANRTATEARRGIAKIATTAQVNQNSTATFVDDTIVTPKKLNERTATETRRGLAEIATQVETDAGLDDTTIITPKKLQARQGSETLSGIVKYVSTTSATPAETRGAAGTNIYNKTVNNLTISPKALDQYKATYAQQGAVILAVDSEVIAGQSQAGYSHAVVTPETLHKKTSTDGRIGLIEIATQAETNAGTDYTRAVTPKTLNDRKATEGLSGIAELATQVEFDTGTDDTRISTPLKIKTHFDSSDRTSVNSDSGLIEEGTLWNHYTLDISKANETQRGTLRVATQAESNAGTLDDVLITPKKLLGTKSTETSEGVIKVATQAETVTGTSANTAVSPKNLKWIVQNEPTWAATTAIRGFVKTSSGSITFVGNDTVGSTQPLESYEKNSYAVSPYELNRVLANYLPLKAKAADANLLDGLDSSQFIRRDIAQTVNGSLTLTQQTNLSAPLVSTSTATFGGSVSANSTLTISNTGTATRLIFEKGPQTGTNPAQTMTIRVWGNEFGGSGSDTTRSTVFEVGDETSNHFYSQRNKAGNITFSINGTVMPININASGLMNVNGVATFGRSVTANGEFISKSANAFRAISGDYGFFIRNDAANTYFMLTASGDQTGGFNGLRPLAINNASGQVTIGEGLIIAKGATINSGGLTVNSRIRSQGTKASDLYTRAPTSDTVGFWSIDINDSATYNQFPGYFKMVEKTNEVTGLPYLERGEEVKSPGTLTQFGNTLDSLYQDWITYPTTPEARTTRWTRTWQKTKNSWSSFVQVFDGGNPPQPSDIGALPSDNATIGNLTIRDFLRIGNVRIIPDPVNKSVKFEWIE
Physico‐chemical
properties
protein length:1292 AA
molecular weight: 139515,80150 Da
isoelectric point:5,42718
aromaticity:0,07353
hydropathy:-0,29373

Domains

Domains [InterPro]
IPR048390
ATT
979–1095
DC_1209
STR
1001–1278
CAJ1523441.1
1 1292
Architecture
ATT
STR
ATT
STR
ATT
STR
ATT 15-140 | STR 343-978 | ATT 979-1095 | STR 1096-1141 | ATT 1142-1240 | STR 1241-1278 |
Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Taxonomy

  Name Taxonomy ID Lineage
Phage Escherichia phage vB_Eco_NicPhage
[NCBI]
3070299 Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host No host information

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
CAJ1523441.1 [NCBI]
Genbank nucleotide accession
OY726582.1 [NCBI]
CDS location
range 161603 -> 165481
strand +
CDS
ATGGCCGACATCAAACGTAAGTTCAGAGCCGAAGACGGTCTGGACGCCGGTGGCGACAAGATTGTTAACGTAGCATTAGCCGACCGTACAGTAGGTACTGATGGCGTAAACGTTGACTTCCTGGTACAAGAAAACACCGTTCAAGTATATGATTCTACGCGTGGATATAACAAAGGATTTGTTGTTCTTTATGACAACCGTTTATATCAAGCAATAAATGATATCGTGTCTCCTTCCGGGGCATTTAACCTTTTACAATGGCGTGCAGTTCGTACTGATGCACAATGGATAACTGTCGCTTCTGGGACTTATCAACTTTCTTCAGGTGAATCGATTTCGGTTAACACTGGGGCCGGCAATGATATGGTTTTCACGTTGCCGAATACGCCGGTTGATGGCGATACTGTTGTTTTGGCTGATATTGGCGGAAGAACCGGGACAGTTAAAGTACAGATTAACGCGTCTGTGCAGAGTATTTTAAACTTTAGAGGTGAACAGGTTCGTACGGTTTTAATGACGCGTCCGCGTTCACAACTATTGTTTGTGTTTAGTAATCGTTTGTGGCAGATGTATATTATCGATTATGGTAAAGAATCAATCACTGTTACACCTGCGACACCATATCAAGCACAAGCAAATGATTTTATCGTTCGTCGTTTTACTAGTGCAGCACCAATCAACATTACACTTCCACGTAATGCTAACAATGGTGATATAATCCACCTAGTTGATTTAGATAAATTAAACCCACTGTATCATACAATTGTTAAAACATTTGATGATACAACGTCTATTGGTGAAGTCGGGACTCATATTGCCGAAGGCAGAAATGACTCTGACGCGTTTTTTGTTTTTGATGCTGCAAGTAGTTTATGGCGTATATGGGAAGGCGACCAGAAATCGCGTCTTCGTATTATCCGGGCGGATTCAAATATTCGTCCAAATGAAGAAGTTCTTATTTTTGGCACAAATAACGCTACAACCGGAACTATTAATCTTACGCTGCCTACCGGAATTTTGAGTGGTGACACTGTTAAAATTTCAATGAACTACATGCGTAAAGGCCAAACAGTAAAAATTAAAGCTGCCGAAGGTGATACAATTGCTTCTTCTGTTGCGTTGCTTCAGTTCCCTAAACGTTCTGAATATCCACCTGATGCTCAATGGGTCTCTGTTACTGAACTAGAATTCAATGGCACTACTTCATATGTTCCTGTATTAGAATTAGCGTATATCGAAGACACCGTTGCTGGTACACGTTATTGGGTTGTGCAACAGAATGTCCCTACGGTAGAACGTGTTGATGCTGGATCTGATGCTACACGAGCTCGTTTAGGTGTTATTGCTCTTGCTACTCAAGCGCAAGCAAATGTTGATTTAGAGAATACTCCAGCTAAAGAAGTGGCTATTACTCCTGAAACGTTGGCAAATCGTACAGCAACTGAAGCTCGACGTGGTATCGCTAAAATTGCTACAACAGCACAAGTTAATCAGAATTCCACTGCAACATTTGTGGATGATACTATTGTTACGCCTAAAAAACTAAATGAGCGTACAGCAACTGAAACTCGTCGTGGTCTTGCTGAAATTGCTACTCAGGTTGAAACAGATGCTGGTCTTGATGACACAACGATTATTACACCTAAGAAATTGCAGGCACGTCAGGGTTCTGAAACACTATCTGGTATAGTTAAATATGTATCAACTACTTCTGCTACTCCTGCTGAAACTCGTGGGGCCGCAGGCACTAACATTTATAATAAAACCGTAAATAATTTAACTATTTCTCCTAAAGCCCTTGACCAATATAAAGCAACTTATGCTCAACAAGGTGCAGTAATTTTAGCTGTTGATAGTGAAGTAATTGCTGGTCAATCTCAAGCAGGTTATTCTCATGCTGTAGTAACTCCTGAAACACTACATAAGAAAACTTCTACTGATGGACGTATTGGCTTAATTGAAATTGCTACGCAAGCAGAAACTAATGCTGGGACTGATTATACTAGAGCAGTAACGCCTAAGACATTAAATGATAGGAAAGCTACGGAAGGATTATCCGGCATAGCCGAACTTGCTACGCAAGTTGAATTTGATACTGGAACTGATGATACTCGTATCTCGACTCCACTGAAAATTAAAACTCATTTTGATTCTTCTGACCGTACCAGTGTTAATTCTGATTCCGGACTTATTGAAGAAGGAACCTTATGGAACCATTATACTCTTGATATTTCTAAAGCAAATGAAACACAACGTGGTACACTTCGAGTAGCGACCCAGGCAGAATCTAATGCAGGAACTTTAGATGATGTTCTTATTACTCCTAAAAAGCTTTTAGGGACTAAGTCCACTGAAACGTCTGAAGGCGTAATTAAGGTTGCTACTCAGGCTGAAACTGTAACAGGAACTTCTGCTAATACTGCTGTATCTCCTAAGAATTTAAAATGGATTGTCCAGAATGAACCAACATGGGCTGCTACTACAGCAATTCGCGGATTCGTTAAAACTTCATCTGGTTCTATTACATTTGTTGGTAATGATACAGTTGGTTCAACACAACCTTTAGAATCATATGAGAAAAATAGCTATGCGGTATCACCATATGAATTAAACCGTGTACTTGCTAACTATTTGCCATTAAAAGCAAAAGCTGCTGACGCAAATTTATTAGATGGTCTAGATTCATCTCAGTTCATTCGTAGGGACATTGCACAGACGGTTAATGGTTCACTAACCTTAACCCAACAAACGAATCTGAGTGCCCCTCTTGTATCAACTAGTACTGCTACGTTTGGTGGTTCAGTTTCGGCAAATAGTACATTAACTATTTCTAATACTGGAACGGCAACTCGTCTGATTTTTGAGAAAGGACCTCAAACTGGAACTAACCCAGCACAGACGATGACTATCAGAGTTTGGGGAAATGAATTTGGTGGTAGTGGTTCAGATACAACACGTTCTACTGTATTTGAAGTTGGTGATGAAACATCTAATCACTTTTATTCTCAACGTAATAAAGCTGGGAATATAACGTTTAGCATTAATGGTACTGTGATGCCAATAAACATTAATGCTTCCGGTTTGATGAATGTTAATGGCGTTGCAACATTTGGTCGTTCAGTCACAGCCAATGGTGAATTCATTAGCAAGTCTGCAAATGCTTTCAGAGCAATTAGCGGTGATTACGGATTCTTTATTCGTAATGATGCTGCTAATACCTATTTTATGCTTACTGCATCCGGTGATCAGACCGGTGGATTTAATGGATTACGTCCTTTGGCTATTAATAATGCATCTGGCCAAGTAACGATTGGTGAAGGCTTAATCATTGCCAAAGGTGCTACTATAAATTCAGGTGGTTTAACTGTTAACTCGAGAATTCGTTCTCAGGGTACTAAAGCATCTGATTTATATACCCGTGCGCCAACATCTGATACTGTAGGATTCTGGTCAATCGATATTAACGATTCAGCCACTTATAACCAGTTCCCGGGTTATTTTAAAATGGTTGAAAAAACTAATGAAGTGACTGGGCTTCCATACTTAGAACGTGGCGAAGAAGTTAAATCTCCTGGTACATTGACTCAGTTTGGTAATACACTTGATTCGCTTTACCAAGATTGGATTACTTATCCAACAACTCCAGAGGCACGTACAACCCGTTGGACACGTACATGGCAGAAAACTAAAAATTCTTGGTCAAGTTTTGTTCAGGTATTTGATGGTGGAAACCCTCCTCAACCTTCTGATATTGGTGCTTTACCTTCTGATAATGCAACAATCGGAAACTTGACAATAAGGGATTTCTTAAGGATTGGTAATGTCCGCATTATTCCAGACCCTGTGAATAAATCTGTTAAATTCGAGTGGATTGAATAA

Genome Context

Genome Context

Tertiary structure

PDB ID
55b56323836e28eefd798f5a58a8dddb4a2b8118126832d0b76f2cc05abb4ded
ESMFold
Source ESMFold
Method ESMFold
Resolution 0,5545
Oligomeric State monomer
Model Confidence
Very high
pLDDT > 90
High
90 > pLDDT > 70
Low
70 > pLDDT > 50
Very low
pLDDT < 50