Protein

Genbank accession
AIX24373.1 [GenBank]
Protein name
putative short tail fiber
RBP type
TSP
Evidence DepoScope
Probability 1,00
TSP
Evidence RBPdetect
Probability 0,87
TF
Evidence RBPdetect2
Probability 0,63
TF
Evidence GenBank
Probability 1,00
TF
Evidence Phold
Probability 1,00
Protein sequence
MALTRLKNIITSRTGRIIYVNPDDFDASDAIDNRGNSALRPFKSIQRAFLEVARFSYRVGLSNDEFDAFSIMLYPAEYIVDNRPGEVLYTNVAPIDENSNLDLTSPNNVLHKFNSVEGGIIVPRGCSLVGTDLRRTKIIPKYVPYPTVFAAKGINTESQVPPRTAIFKVTGGTYFWQFSFFDGAEEGVYYKPDSVETLAPKFSHHRLTCFEFADGFNSLQTLISGDPTRGLEQTVPNADYSAVPNILERTDLEIYYQKVSKAFATIPDTSGDPANDQIQARVEENRIVGPISDEYRVLQVTRNGNTATAVTVDEFDNPRDHGFSVGVNINISGVTGSSGPQSLVDASLYNGSFTVTSASGNIFTYQMLSEPSGNAVGSNVTVKTEIDTVDSASPYAFNLSLRSVWGMNGMLANGAKATGFKSMVVAQFTGLSLQKDDRAFVRFNESTGNYDNAAAGDGAHLDGFAEYRKGWAHRHIVCTNDSFIQAVSVFAVGYGTHFTAESGADMSITNSNSNFGSTALRSAGFKAKAFSKDKAGEITHIIPPKALSVISTTATGASGEVSITLANDGSVNGVIEGMNVTGTNVGVGATVVSVNTNTRIVTLSVVNTDTVNGNIIFGEETSVNWVNIDIQRTVTINQALAAGGGVAGSRLYLYGYTAQGSPPTTRVQGYSVGARQDGTGASAVADRLNVKLIPSVGSDAEIKTADISPYGPDVSGKAAGETGSPIQFDENTYTVGGLSVVGGWYLSVNATGNSIYTVLTTNTQTYGNVNFTPTTFIKRIPDSRDLADRTYRVRMVIDKDKSNPLPRDPLSGYVMQPLNSNTSAFKLNGTFYIYDIEKVQEFVRGVDDGIYYLTLLYASVAPSAANFNDRKFSQNVNEVYPSFDRDNPLADPDRAYSIADNETIGLVNATDNASPTPNKDPKRSITKEAIVNLLTDTGWADPSTEPAYNSVNKTLSSVQLTARFGDEETRKINIRENVADNSVAPIPIELRRHSIMRSGNHTFEYLGFGPGNYSTAFPQTQVETLSQDQIKFSQSIKEEAGVAFYSGLNSNGDLFIGNQVINPVTGQITNEDIAQLNVIGEENTTIETFSELVLTDKLTVIGGASNQLESVFAGPVTFQGQVSSTSNIIARKITYNNQDGTVIKSTLLAPEDSNGLPNFTNITNYDTPSDGDLVYNSTWSPGKSLGWIYYGQVWKEFGLTDIEQIDIQTFTDNNGDEQQHLGFGVAANTSYRANLKGNVRIDGNLVTTGTGGISADKYVSRIYRNGENNGPDGSILTFPITTFTGGVQHTATSLLVMLNGVVQIGGTTTEVNSGDANYSVDSNAQNIVFASGTPPQATDVLHIIEMPI
Physico‐chemical
properties
protein length:1348 AA
molecular weight: 145184,07550 Da
isoelectric point:4,81400
aromaticity:0,08976
hydropathy:-0,25319

Domains

Domains [InterPro]

No domain annotations available.

Legend: Pfam SMART CDD TIGRFAM HAMAP SUPFAM PRINTS Gene3D PANTHER Other

Taxonomy

  Name Taxonomy ID Lineage
Phage Synechococcus phage ACG-2014g
[NCBI]
1493512 Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host Synechococcus sp. WH 7803
[NCBI]
32051 Bacteria > Cyanobacteria > Oscillatoriophycideae > Chroococcales > Synechococcus >

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
AIX24373.1 [NCBI]
Genbank nucleotide accession
KJ019071 [NCBI]
CDS location
range 23251 -> 27297
strand +
CDS
ATGGCTCTTACTAGACTTAAGAATATTATTACGTCCAGAACTGGACGTATTATCTACGTTAACCCTGATGATTTCGATGCATCCGATGCTATCGATAATAGGGGAAACTCGGCGTTACGACCCTTTAAGTCTATTCAAAGAGCGTTTCTTGAGGTAGCAAGATTCTCGTATCGAGTTGGTTTATCAAATGACGAATTTGATGCCTTCTCGATTATGCTGTATCCAGCAGAATATATTGTTGACAACAGACCTGGCGAAGTTTTATATACAAACGTTGCTCCCATTGATGAGAACTCAAACTTAGATTTGACTTCTCCAAACAATGTTCTGCATAAATTTAATTCGGTAGAAGGTGGTATCATTGTTCCTAGAGGTTGTTCCCTCGTTGGTACTGATCTTCGCCGTACAAAAATTATTCCTAAGTATGTTCCATATCCTACAGTATTTGCTGCAAAGGGTATTAATACAGAATCTCAAGTTCCTCCTCGTACTGCTATCTTTAAGGTAACTGGTGGTACTTATTTCTGGCAATTCTCATTCTTCGATGGTGCTGAAGAGGGTGTATATTACAAACCTGATAGTGTAGAGACACTAGCACCTAAATTTTCACACCATAGACTTACTTGTTTTGAATTTGCTGATGGATTTAATTCCTTGCAAACCTTAATCTCTGGTGATCCTACTAGAGGTTTAGAGCAAACAGTTCCTAATGCAGATTATTCTGCTGTTCCTAATATCTTAGAAAGAACTGACCTAGAAATTTACTATCAGAAAGTATCGAAAGCATTTGCTACTATTCCCGATACATCTGGTGACCCTGCTAATGACCAAATCCAGGCAAGAGTAGAAGAAAATAGAATCGTTGGTCCTATTTCCGATGAATACCGAGTCCTTCAAGTTACTCGTAATGGTAATACTGCTACGGCAGTTACTGTTGATGAGTTTGATAATCCCAGGGACCATGGTTTCTCTGTTGGTGTTAACATTAATATCTCAGGAGTTACTGGTTCATCTGGACCACAATCGTTAGTCGATGCAAGTTTGTATAATGGTTCCTTTACTGTAACTTCTGCATCAGGTAATATCTTTACCTATCAGATGCTATCCGAACCTTCTGGTAATGCTGTTGGTAGTAATGTTACAGTTAAGACTGAAATTGATACCGTTGACTCTGCATCACCATATGCGTTTAACTTGTCACTGAGAAGTGTCTGGGGCATGAATGGAATGTTGGCGAATGGTGCTAAAGCAACTGGTTTCAAATCAATGGTTGTTGCACAGTTCACTGGTTTGAGTCTTCAGAAAGATGATAGAGCGTTTGTAAGATTTAACGAGTCTACTGGTAATTATGATAATGCAGCAGCGGGTGATGGTGCTCACTTAGATGGTTTTGCTGAGTATCGTAAGGGTTGGGCACATAGACATATCGTCTGTACTAATGATTCTTTCATCCAGGCAGTTTCTGTGTTCGCTGTTGGATATGGCACACACTTTACTGCTGAAAGTGGTGCTGACATGTCGATTACGAACTCAAACTCTAACTTTGGATCGACAGCACTTCGTTCTGCTGGTTTCAAAGCAAAGGCATTCTCTAAAGATAAAGCAGGAGAAATTACACATATCATTCCTCCTAAAGCACTTAGTGTTATTTCTACAACTGCAACAGGTGCAAGTGGTGAGGTGAGTATTACGTTAGCAAACGATGGTTCTGTTAATGGTGTTATTGAGGGTATGAATGTTACTGGCACTAATGTTGGTGTCGGTGCAACAGTTGTTTCTGTTAATACTAACACCAGAATAGTTACGCTGTCTGTAGTTAACACCGATACTGTCAATGGCAATATTATTTTTGGAGAAGAGACTTCGGTTAACTGGGTGAATATTGACATTCAGAGAACAGTTACTATTAACCAAGCACTTGCTGCTGGTGGAGGAGTTGCTGGTTCAAGACTTTACCTCTATGGATATACTGCTCAAGGTTCACCACCAACAACTAGAGTACAAGGTTATAGTGTTGGTGCTCGTCAAGATGGTACTGGTGCTAGTGCAGTTGCAGATAGACTTAATGTTAAGTTGATTCCTTCTGTAGGTTCTGATGCTGAAATTAAAACCGCAGACATCTCTCCATATGGTCCTGATGTATCGGGTAAAGCAGCAGGAGAAACAGGATCTCCAATCCAATTTGATGAAAATACATACACTGTCGGTGGATTATCTGTTGTTGGTGGATGGTATCTATCTGTAAATGCAACTGGAAATTCAATTTATACAGTTCTCACTACAAATACACAAACATACGGCAATGTAAACTTTACACCAACAACATTTATTAAGAGAATTCCTGACTCTAGAGACCTTGCTGATAGAACTTACCGTGTTCGTATGGTTATTGACAAGGATAAGAGCAATCCTCTTCCTAGAGATCCTTTGAGTGGTTATGTAATGCAACCACTTAATAGTAATACATCCGCATTCAAATTGAATGGTACATTCTACATCTATGATATTGAAAAAGTACAAGAATTTGTTAGAGGCGTCGATGATGGAATATACTACCTCACCCTTTTATATGCATCTGTTGCACCTTCAGCTGCTAATTTTAACGACAGAAAGTTCAGTCAAAATGTCAACGAAGTCTACCCTTCGTTTGACAGAGACAACCCTCTTGCTGACCCTGATCGTGCTTATTCCATCGCTGACAACGAAACTATCGGTCTCGTAAATGCAACGGATAATGCAAGTCCAACTCCAAATAAAGATCCTAAGAGGTCTATTACGAAAGAGGCAATTGTTAATCTTTTAACCGACACTGGTTGGGCAGATCCTTCTACTGAACCTGCATATAATTCAGTTAACAAAACACTTTCTAGTGTTCAACTCACTGCTCGTTTTGGTGATGAAGAAACCAGAAAGATTAATATCAGAGAAAATGTTGCTGATAATTCGGTTGCACCGATTCCAATAGAACTTAGAAGGCATTCTATTATGCGTTCTGGTAATCACACGTTTGAGTATCTTGGTTTCGGTCCTGGTAACTACTCAACTGCATTCCCTCAGACACAAGTAGAAACTTTATCACAAGACCAAATTAAGTTCTCTCAGTCTATTAAAGAGGAAGCAGGAGTTGCATTCTATTCGGGTCTTAACTCTAATGGTGACCTATTCATTGGTAACCAGGTTATTAACCCTGTTACTGGTCAGATTACCAATGAAGATATTGCACAACTGAATGTTATTGGTGAAGAGAATACAACGATTGAGACATTCTCAGAGTTGGTTCTGACTGATAAACTCACTGTTATTGGTGGTGCATCTAACCAATTAGAATCTGTATTTGCTGGTCCTGTCACATTCCAAGGTCAGGTATCTTCCACTAGTAATATTATTGCTAGAAAGATTACTTATAATAACCAAGACGGTACGGTTATTAAATCTACTCTGTTAGCACCAGAAGATTCAAATGGTTTACCAAACTTTACTAATATCACTAACTATGACACACCTTCTGATGGTGATTTAGTTTATAATTCAACTTGGTCTCCTGGTAAATCTTTGGGGTGGATTTATTATGGTCAAGTTTGGAAAGAGTTTGGATTAACTGATATTGAGCAGATTGATATTCAAACATTTACTGACAATAATGGCGATGAGCAACAACACTTAGGTTTTGGTGTTGCTGCAAATACTTCATACCGTGCTAATCTAAAAGGTAATGTTAGAATTGATGGTAACTTAGTTACTACAGGTACGGGTGGTATTTCTGCTGACAAATATGTCAGTCGCATATATCGCAATGGTGAAAATAATGGACCTGACGGTAGTATTTTGACATTCCCAATTACTACTTTTACTGGCGGTGTTCAGCACACTGCAACTTCTCTCTTAGTTATGTTGAATGGCGTAGTTCAAATTGGAGGAACTACTACTGAAGTTAACAGTGGAGATGCTAACTATTCTGTTGATAGTAATGCACAAAACATTGTGTTTGCTTCGGGTACTCCTCCTCAGGCAACTGATGTTCTTCATATTATTGAAATGCCTATCTAA

Gene Ontology

No Gene Ontology terms available.

Enzymatic activity

No enzymatic activity data available.

Tertiary structure

PDB ID
f052d8fb577a564c79b59258bf69f3bc3a9bf952a717c49e90e17bc1f63a5b5b
ESMFold
Source ESMFold
Method ESMFold
Resolution 0,3730
Evidence 0,3730

Literature

Title Authors Date PMID Source
Ecological redundancy of diverse viral populations within a natural community Gregory,A.C., LaButti,K., Copeland,A., Woyke,T. and Sullivan,M.B. 2015-03-20 GenBank