Protein

View in Explore

Genbank accession

ATW62800.1 [GenBank]

Protein name

tail fiber protein

RBP type

Evidence Phold

Probability 1,00

Protein sequence

MSSAHKFHHKTSDVPGDRPTNQVLDPAEIGLNTEPSEPGIFFRTSDGNVVKAGPAIVSTETPRNLPERGEVWYDLTEGTAKIGSTEEAKKVWRTIASPFMGGGERVVFVAPEFPYANDTLGNDGQSLPYKTVIRASIELTKIFIQDTLTKSESERNSRKYTIFYAPSRLSGDNSPGPNTVDFNVRFPEDPGYEPGIQELVKFNAESGGVIIPGNFSLIGMDSQKCEIHPSYVPSYAHPALPPERAGVNQPITAIFKVGLRAYFENFRISDQLNSFEVYKITSVDNDVALLHSRRPHTLSQETPFAFSYSSNFDRQSRLFKEGVYIAEPIDTFTLRLIDPTSNGTTPDLNYVRYSNLVPPGSTNEFKLLSERTLYSNHRLRCFREASISELSQYFVKVQRAFLSFFGGQVAQGADILLRSQALTEAYADPKDTYSFDFFRSIHVFSDYGLCGGEIDGSNVGEQFSLRVQDSSIDSIQLDPAAYEIYTTLLDENNNPVQKWWPLIDAAYRSISTENRPESLADTPREAQLSLLRETPVERIRYHYGFLSADSGKSLGLVNLDEDFRHFGLRIVNSGNVYTDNVTTRAAVGIWGLNGGNIFDTNSESQFGSIAIRSEGFRGVGTLGGANQNLKGFQFSGIYAPLALTRKQVEDNANKKILSLGGRIVDISIDPSDPNVQLVKLSCDFFPSYILPYSLKPNTAIWVTSGGCTYRGFLASDGGPTVIRNNQQPCPHGAILRIRLSDSTIPTDSSDISAFDIPYLRRFSDPRNKEDTSYRLVVSNTSPDTIAPSVGSILRLDQTSQGIGNPKVRPNVQFDPGVLGGWGRVFSVNDVDTVASGRSPNFNYVVSDGEQDSKYLVTLSASDYCRPWLQDHNHASGMATVRANRNWYAAENNYWTTLYHDSPFSENVGPLKLAPAETSSPFVPTAPLERGTSVGETFQGNYSSDSELARYSEEDSYLRGYTVPFTQYPVRDIWDYDDGSEGLGIILKRTPSGNTTNLISAINQDAITQEAQAASESGRYRPEIVKFRVLSPKDIINPRQNVSVLLLQNGPVKEYLQVINLIGSEVEAIRLDSENSLYLSPSTSNKPVWEGGSQVQICTFDSEAEPESYDPIWSNSKASILRFFEVMGYSRDSMSPSLTPKYWGEREIPQTALPQSPDIQGYALETAEWPLEFNEPSTVISISHSWNSCGYLTPSRGLRINRSNTVSRKLGYDFLAYSSWGGRLIVNGVNESGEQITLGPQREALTAQFVELETHTRSLANQQIYEDQSYVEFPNQVVVYTADDISGEFDNARITYSLTKGGFPVPLSHLSESSVFVQLGSVTQRPGIDYTLIQDSIRFTVPPQQGLYCDIRIVTTEDQEKTLVVAEMDLAEPFDGSRSTFTMSSEKDIRLLDIDYDNLLVFLGGILQQPEVSYFLTRDSASQLTISFTEVIPAGTSADIRAICTNSLWASQGIFPVALYSLDNISQQFDNSVKEFELKYQGSYLNPSVVNSENVLASIGGVIQIPGYSYEVKAGRIIFSEAPPLGATSEIRVITNSHFLPCLNSRGRAESFLYWGPSVIMNLENELNLLKTAG

Physico‐chemical properties

protein length:	1573 AA
molecular weight:	174331,08700 Da
isoelectric point:	4,90170
aromaticity:	0,10235
hydropathy:	-0,34571

Domains

Domains [InterPro]

DC_0066
STR
1–1564

DC_0066

ATW62800.1

1 1573

Architecture

STR

STR 1-1564 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0066	STR	DC_0066	1	1564	Novel HMM	DC_0066	Central	Low	Positional only	99 proteins / 99 hits

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Synechococcus phage S-CBWM1 [NCBI]	2053653	Uroviricota > Caudoviricetes > Aokuangvirus >
Host	Synechococcus sp. CBW1002 [NCBI]	1353134	Cyanobacteriota > Cyanophyceae > Synechococcales > Synechococcaceae > Synechococcus >

Coding sequence (CDS)

Genbank protein accession

ATW62800.1 [NCBI]

Genbank nucleotide accession

MG450654.1 [NCBI]

CDS location

range 71786 -> 76507
strand +

CDS

ATGAGTTCCGCCCACAAATTTCACCACAAGACCTCCGACGTACCAGGAGATCGCCCAACAAATCAGGTCTTAGACCCCGCAGAGATCGGGCTCAACACAGAGCCATCAGAGCCGGGAATCTTTTTCCGCACAAGCGACGGGAATGTTGTCAAAGCTGGCCCGGCTATCGTATCCACCGAGACTCCGAGGAATCTTCCAGAACGAGGGGAGGTTTGGTACGACCTAACTGAGGGAACGGCCAAGATTGGCTCCACAGAGGAAGCGAAGAAGGTTTGGCGAACGATCGCATCCCCTTTCATGGGTGGGGGGGAAAGAGTAGTATTTGTCGCTCCGGAATTCCCTTACGCCAACGACACACTAGGGAATGACGGCCAGTCCCTACCCTACAAGACGGTAATCCGGGCATCTATTGAACTAACCAAAATCTTCATCCAAGACACTCTGACGAAGAGTGAGAGTGAGAGGAACTCAAGGAAGTACACGATATTCTACGCCCCATCTCGCCTTTCTGGGGACAACTCCCCAGGACCCAATACGGTAGACTTCAACGTAAGGTTCCCTGAGGACCCAGGGTATGAACCAGGGATCCAAGAACTTGTGAAGTTTAATGCTGAGAGTGGTGGTGTCATCATTCCTGGCAACTTCTCCCTCATTGGGATGGACTCTCAGAAGTGTGAGATCCACCCGTCCTACGTCCCTTCATACGCTCACCCAGCACTGCCTCCAGAAAGGGCTGGGGTCAATCAACCCATCACAGCAATCTTCAAGGTTGGTCTACGGGCCTATTTTGAGAATTTCCGAATCTCTGACCAGCTCAACTCGTTTGAGGTCTATAAGATCACTAGTGTGGATAACGATGTCGCTCTTCTGCACAGTCGTCGCCCACACACATTATCTCAAGAAACTCCTTTCGCATTCTCCTACTCCTCGAACTTCGATAGGCAGAGCCGATTGTTCAAGGAAGGGGTCTACATTGCAGAACCAATCGACACCTTCACTCTGCGGTTGATTGATCCGACTTCAAACGGTACTACCCCGGACCTAAATTACGTTCGGTATTCCAACCTTGTCCCCCCTGGATCTACCAATGAGTTCAAACTGCTGTCTGAGCGAACCCTGTACTCCAACCACCGCCTAAGGTGTTTCAGAGAAGCTTCGATTTCTGAGCTGTCCCAGTATTTTGTCAAGGTCCAGCGAGCCTTCCTCTCATTCTTTGGTGGGCAAGTTGCACAGGGGGCCGACATTCTCCTGCGTTCCCAAGCCCTAACCGAGGCATACGCAGACCCCAAGGATACCTACTCATTCGACTTCTTCCGGAGTATTCACGTCTTCTCCGACTACGGTCTTTGCGGAGGGGAGATTGATGGGAGCAATGTCGGGGAACAATTCTCTCTCCGGGTCCAAGACAGCTCGATCGACTCGATCCAGCTCGACCCTGCCGCTTACGAAATCTACACTACTTTGCTGGACGAGAACAATAATCCAGTCCAGAAGTGGTGGCCTCTCATTGATGCAGCCTATCGCTCCATCTCAACTGAAAATCGCCCAGAGTCACTGGCTGACACTCCCAGAGAGGCACAACTTTCCCTGCTTCGGGAAACTCCCGTTGAGCGGATCCGGTATCACTATGGCTTCCTCTCCGCGGATTCCGGCAAATCCTTAGGACTTGTCAATCTTGATGAGGACTTCCGCCACTTTGGTCTCCGGATCGTCAATAGCGGGAACGTTTACACCGACAATGTTACAACTAGAGCCGCTGTTGGGATTTGGGGATTGAATGGTGGGAACATCTTCGACACCAACTCTGAGTCCCAATTCGGCTCAATCGCTATCCGCTCCGAGGGATTTAGGGGAGTTGGGACTCTAGGGGGAGCCAACCAAAATCTTAAGGGGTTCCAGTTCTCCGGAATCTATGCTCCATTGGCACTGACCCGGAAGCAAGTTGAGGACAACGCCAACAAGAAAATCCTGAGCCTAGGGGGAAGAATCGTCGATATTTCTATCGACCCCTCAGATCCCAACGTTCAGCTTGTTAAGCTCAGTTGCGACTTCTTCCCAAGCTACATTCTCCCCTACTCCCTGAAGCCCAACACCGCTATCTGGGTGACATCTGGGGGATGCACATACAGGGGATTCTTGGCCTCAGATGGCGGACCCACTGTCATTCGCAACAATCAGCAACCTTGCCCACACGGCGCAATCCTAAGAATTCGCCTTTCTGATAGCACGATTCCCACGGACAGTTCCGATATTTCAGCATTCGACATCCCATATCTCCGTCGTTTCTCCGACCCTAGGAATAAAGAAGACACCTCGTACCGCCTCGTAGTTTCCAACACCAGTCCGGATACGATTGCCCCATCGGTCGGAAGTATTCTCCGCCTTGATCAGACTAGCCAAGGAATTGGAAACCCCAAGGTTCGCCCCAATGTTCAGTTTGATCCAGGAGTTCTTGGTGGTTGGGGAAGGGTGTTCTCCGTAAATGACGTGGACACTGTGGCTTCTGGCCGCTCCCCAAACTTCAACTACGTTGTGTCCGATGGTGAGCAAGATTCTAAGTATCTGGTGACTCTTTCTGCCTCTGACTATTGCCGCCCCTGGCTTCAGGATCACAACCATGCCTCAGGGATGGCTACGGTTCGAGCTAATCGCAACTGGTACGCCGCCGAGAACAACTACTGGACCACTCTATACCACGATTCTCCGTTTAGCGAGAACGTCGGCCCTCTAAAGTTGGCTCCTGCTGAAACAAGCTCCCCCTTCGTGCCAACCGCACCTCTTGAGCGCGGGACTTCCGTCGGTGAAACCTTCCAGGGGAATTACTCAAGTGATTCGGAGCTGGCCCGGTATTCTGAGGAAGATTCTTACCTTCGTGGGTACACTGTCCCATTCACTCAATACCCTGTTAGGGACATTTGGGACTACGATGATGGCTCAGAAGGTTTGGGAATAATTCTGAAGCGCACCCCTAGCGGAAACACCACAAACTTGATTTCCGCGATCAACCAAGACGCGATCACTCAGGAAGCCCAAGCGGCCAGCGAATCGGGAAGATACCGCCCAGAGATCGTGAAATTCCGTGTTCTCTCGCCTAAGGACATCATCAACCCAAGGCAGAATGTTAGCGTTCTCCTGTTGCAGAATGGACCTGTCAAGGAATACCTCCAGGTAATTAACCTGATCGGTTCTGAAGTGGAGGCCATCCGCCTTGACTCAGAGAATAGCCTGTACCTGAGCCCTTCGACTAGCAACAAACCTGTCTGGGAAGGTGGCAGCCAGGTGCAAATCTGCACTTTTGATTCAGAGGCAGAGCCGGAATCCTACGACCCAATCTGGTCTAATTCCAAGGCCAGTATCCTCAGATTCTTCGAGGTCATGGGATATTCCAGAGATTCTATGTCCCCATCTTTGACTCCCAAGTATTGGGGGGAGCGAGAAATCCCTCAAACAGCCCTTCCTCAATCCCCCGATATCCAGGGGTACGCACTGGAGACTGCGGAGTGGCCACTGGAGTTCAACGAACCCTCCACCGTCATTTCCATCTCGCACTCCTGGAACTCATGTGGATACCTAACCCCATCCCGTGGACTACGAATCAATCGCTCCAACACAGTTTCTAGGAAACTCGGATACGACTTCTTGGCGTATTCCTCTTGGGGAGGAAGACTCATTGTCAATGGGGTTAACGAAAGCGGGGAGCAGATTACTCTCGGCCCACAGAGAGAAGCCCTCACTGCTCAGTTTGTGGAACTGGAAACCCACACCAGGAGTCTAGCTAACCAGCAGATTTATGAGGATCAATCTTACGTGGAGTTTCCGAATCAAGTAGTCGTTTACACTGCAGATGATATCTCCGGGGAATTCGACAATGCTCGGATCACTTATTCTTTGACGAAGGGTGGATTCCCCGTCCCATTGAGCCACCTGTCAGAAAGCTCGGTATTTGTGCAGCTTGGGTCCGTCACTCAGAGGCCAGGAATAGACTACACTCTGATTCAGGACTCAATCCGATTCACAGTTCCCCCACAACAGGGACTATACTGTGATATCCGCATCGTAACGACGGAAGACCAGGAAAAGACTCTCGTTGTCGCGGAAATGGATCTCGCTGAGCCGTTTGATGGTTCGCGTTCCACATTCACAATGTCCTCGGAGAAGGATATCCGCCTCCTGGACATCGACTACGACAATCTCCTTGTCTTCCTCGGTGGAATCCTACAACAACCCGAGGTGTCCTACTTCCTAACTAGGGATAGCGCTTCCCAACTCACGATCTCCTTCACAGAGGTCATTCCTGCTGGAACTTCTGCGGATATCCGAGCGATCTGCACCAATTCTCTGTGGGCTTCTCAAGGAATCTTCCCAGTCGCCCTATACTCTTTGGACAACATCTCTCAGCAATTCGACAACTCCGTTAAGGAATTTGAGCTCAAGTATCAGGGGTCCTACCTCAACCCTTCGGTAGTGAATTCGGAAAATGTCCTAGCCAGCATCGGTGGAGTCATCCAGATTCCGGGCTACTCCTATGAGGTGAAGGCGGGCAGGATTATCTTCTCGGAAGCTCCTCCGTTGGGAGCGACTTCTGAAATCCGAGTAATCACCAACTCACACTTCCTGCCTTGCCTCAATAGCAGAGGGAGAGCCGAGAGCTTCCTCTACTGGGGGCCAAGTGTCATTATGAATTTGGAGAACGAGCTAAATCTCCTGAAAACAGCCGGGTAA

Genome Context

Tertiary structure

PDB ID

7dd6a7e539f5c30f5e802ab667b164ce444a9f8c121ce616703273e172a7aed2

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,7560

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence