Protein

View in Explore

Genbank accession

YP_009322459.1 [GenBank]

Protein name

tail fiber protein

RBP type

Evidence UniProt/TrEMBL

Probability 1,00

Evidence GenBank

Probability 1,00

Evidence Phold

Probability 1,00

TSP

Evidence DepoScope

Probability 1,00

Evidence RBPdetect2

Probability 0,87

Protein sequence

MPLSRLENFLKNVEGNILYVNPTDLDATDSIDNQGNSLTRPFKTIQRALLEAARFSYQIGLNNDKFNRTTILLYPGTHEVDNRPGYNVIQSGSNAIYRDRNGVEVSLNQLSSGSNYNIDDSANELHKYNSVEGGVIVPRGVSIVGLDLRKTNIRPKFVPDPTDDAILRSAIFRITGGCYFWQFTVFDGDSKGSVYRDYTNNRYTPSFSHHKLTVFEYADGVNGVGIGTSTTTTDLSMYYHKIQKAYGDSSGRGIADFPANRDMQAKLPEYEIVGPVSAIDVGITSIRAGAGSKTNTSTTITVDCETPHNLVVDSEFRVSGVNTYPNIYNGNFVVTGVSSERIFTYRSSSPPTDGLPDLDGDEKIIADTDTVSGASPYIFNCSLRSVYGMCGMHADGSKATGFKSMVVAQYTGVGLQKDNNAFLFYNEANGQYDTNSTVDDSEKPLYLNSKAVYRPSYENYHVKASNKSVIQIVSVFAIGYAQHFLAESGGDQSITNSNSNFGAKSLIANGFQDESFSRDNRGYVTHVVPPRRLSKSEKSVEWLTLNVGLTTSPVGVGTIQKIFIDEFTDPDVPPPVVVEGFRLGAKSTFSQDKLCTNPDLLNISIAGVGTFSAPIRMLNKDGTSGPSRTKEYNVGFVGAANSITTSVLTLQENHELYAGESIRVISDDGSLPDGIESNTIYYAVTNDSTNETLNPDQIKLARTENEAILGGSGNFISISNNRGGRLRINSRVTDKQPGEFGHPVQYDTTNSNWYINSDISPVTNRIYNALVTNGPAIGARTNKSFFTRREDNRSINDKLYKLRYVLPKESEDARPPIPGFVIQDSSTVGVTTASDFTDNIPNATIQRNIRILKGLNRDSNSGVTTFVTEKPHNFEVGDTVNFLNIKSSGNTVGAANSGYNISRVVTGISSSKGFQVNFSNDPGSFINNISTRDDGLPTVSRKSAKETFTVYRVETLKAHEYNKQDGVYHLICVDSSIKPTVNEFGNFGYTQQIENLYPQFDGDNFVMDPSQASSFAVATPQGKVVTNDLRYSITKEFTNRYIRSNGIGIGITFAEGSTQGITTIYTDREHNLNSIISVGLGSTGLNYGAGVSTTLYNASLTYSGIETGKGATANIDIDANGGITGITIVDGGSAYGVGHTLNITGVETSASHVQGWITVNKISNNIGDAIEIVGVGTSLARYVSGYNGIHTITAIRPRAVEYNNGFWPGYYDVNTVGLATGFMMYAGPVPDISNVVYDSSVGVVTVTTTSAHGLNVNNPFKIVGVAQTIFNTENIVRERVSTTQFNFKFNEDYDAATYTSGGSVLPVNYAARGGITEFGNERIAQRHVPFRTGIQTAMSGSSLNATSTSLTLGDSSGFQKGDYVQIDGEIIRVSSDFSANSATVLRGQLGSRSAAHDGGSLVKKLRILATEKRRHSILRASGHTFEYLGYGPGNYSSGLPQKQDRILSREEQFLSQAQTPNGGAVVYTGMNDAGDFYIGNKVINAQDGTEATFNIPVPTVTGADQDGSGTGTRLDAIFDSLTVREGITVDGNNNSTTRFNGPVVTNEKLTNTSSDGIETVQISINGGLTENRTITYSPSKPTTSGTTGDIVFNSNPSFGQYVGWIYTQESWKRFGLISTEVDETQLSLNTVGVGSTSASRIGQQDGVDVRGTIVADAFVCAGVCTFSGNVTFASITFSEITVAGVGTFSNRLDVPGNSNFVGVTTLRDVESIKVSGISTFNGNVNIGNATSDTLTLTSRIAGRLDPSANATYDIGRGNRQWRNIVASGVVTATSFVGDGSNLTNTGATLSAASGSQRVVLTSLTSGTMTSAATEAALAYNASTNTLTATTFSGNATTATSATTATTATNATNITVADESADTTCFPVFTTAATGNRPPKTGSNLTFNSSTGRLSATSFAGNGASLTGVVATTAIDATNSTNLNLRARNTENATHYVTFGTSTTGNQRLNTDTGLTYNPSTNTLTATTFSGNATTATTATTATTATTATTATTATNCTNFDVAADNTTDATHYPIFTGGATGNQRPNSDTDLTYNPNSGVLSSAEFSATSDERLKKNIETITDALDKVTHLRGVEYDLKSNDRHQIGVIAQEVEKVIPSVVSERDDNGTKTVAYGNMVGLLIEAIKEQQIQIQEQQTQIQELKAKVDDLSK

Physico‐chemical properties

protein length:	2150 AA
molecular weight:	229968,57890 Da
isoelectric point:	5,32231
aromaticity:	0,08140
hydropathy:	-0,31940

Domains

Domains [InterPro]

DC_0066
STR
1–1876

DC_0066 DC_1985

IPR036388
RBD
2037–2149

IPR036388

IPR030392
CHP
2049–2100

IPR030392 Coil

IPR030392
CHP
2049–2138

IPR030392

YP_009322459.1

1 2150

Architecture

STR

RBD

STR 1-1876 | RBD 1894-2150

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0066	STR	DC_0066	1	1876	Novel HMM	DC_0066	Central	Low	Positional only	99 proteins / 99 hits
DC_1985	RBD	DC_1985	1894	2150	Novel HMM	DC_1985	C-terminal	Low	Positional only	107 proteins / 107 hits
IPR036388	RBD	IPR036388	2037	2149	Merged direct domain	Winged helix-like DNA-binding domain superfamily	C-terminal	Low	Positional only	96 proteins / 96 hits
IPR030392	CHP	DC_0088	2049	2100	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits
IPR030392	CHP	DC_0088	2049	2138	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits
Coil	Unmapped	-	2124	2144	Coils	Coil	-	-	-	-

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

YP_009322459.1

1 2150

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	79	79	0,8202
Central domain	80	308	230	0,9253
C-terminal	309	2150	1841	0,1583

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-79

Central
80-308

C-terminal
309-2150

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Synechococcus phage S-CAM9 [NCBI]	1883369	Uroviricota > Caudoviricetes > Pantevenvirales > Kanaloavirus > Kanaloavirus scam9
Host	Synechococcus sp. [NCBI]	1131	cellular organisms > Bacteria > Bacillati > Cyanobacteriota/Melainabacteria group > Cyanobacteriota > Cyanophyceae

Coding sequence (CDS)

Genbank protein accession

YP_009322459.1 [NCBI]

Genbank nucleotide accession

NC_031922.1 [NCBI]

CDS location

range 17779 -> 24231
strand +

CDS

ATGCCTTTAAGTAGACTAGAGAATTTCCTAAAGAACGTTGAAGGTAACATTCTTTATGTAAACCCAACTGATCTTGATGCTACTGATAGTATTGATAATCAGGGTAACTCCTTAACGAGGCCTTTCAAAACTATTCAAAGAGCTTTATTAGAAGCTGCTAGATTTTCATATCAAATTGGACTGAATAACGATAAGTTCAATAGAACAACAATTCTGTTGTATCCTGGAACTCATGAAGTTGATAACAGACCTGGATATAACGTTATACAGTCTGGTTCCAACGCGATCTATCGCGACAGAAATGGAGTTGAGGTATCTTTAAATCAGTTAAGTTCGGGTAGTAATTATAATATCGATGACTCTGCAAACGAACTGCACAAATATAACTCTGTAGAAGGTGGGGTTATTGTGCCCCGTGGTGTCTCTATTGTTGGTTTGGATCTACGTAAGACCAACATTAGACCAAAGTTTGTTCCTGATCCAACAGATGATGCGATTCTGAGATCTGCAATCTTCCGTATTACTGGTGGGTGTTACTTCTGGCAGTTCACTGTTTTTGATGGTGATTCAAAAGGTTCTGTTTATAGAGACTACACAAATAACAGATATACTCCAAGTTTTTCACACCACAAACTTACTGTATTTGAATATGCAGATGGTGTAAATGGTGTTGGTATTGGTACGTCTACGACTACCACTGACCTTTCGATGTATTATCATAAGATTCAAAAGGCTTATGGTGACAGTTCTGGTCGTGGAATTGCAGATTTCCCAGCTAATAGAGATATGCAGGCTAAACTGCCTGAATATGAGATTGTTGGACCTGTTTCTGCGATTGATGTAGGTATTACAAGTATCCGTGCGGGTGCTGGTTCTAAAACAAATACTTCTACAACAATTACTGTTGATTGTGAAACACCACACAACCTGGTTGTTGACAGTGAATTTAGAGTATCGGGTGTTAATACATATCCAAATATTTACAACGGTAACTTTGTTGTAACTGGTGTATCTTCTGAAAGAATCTTTACATATCGATCAAGTTCTCCACCGACAGATGGATTACCAGATCTTGACGGTGATGAAAAGATAATTGCTGATACTGACACTGTATCAGGTGCATCTCCATATATTTTCAACTGTTCTTTGAGATCTGTTTATGGTATGTGTGGTATGCACGCTGATGGATCTAAAGCTACAGGCTTTAAGTCCATGGTTGTTGCTCAATATACTGGTGTTGGTCTGCAGAAAGATAACAACGCATTCCTCTTCTATAATGAAGCAAATGGTCAATATGATACTAATTCCACAGTTGATGATAGTGAAAAACCACTTTACTTAAACAGTAAGGCAGTTTATAGACCATCTTACGAAAATTATCATGTAAAGGCCTCTAATAAATCTGTTATCCAGATCGTATCCGTCTTTGCTATCGGTTACGCACAACACTTTCTTGCAGAGTCTGGTGGTGACCAATCAATTACCAACTCCAACTCTAACTTTGGTGCAAAATCTCTGATTGCAAATGGATTCCAAGATGAATCATTTAGTAGAGATAACAGAGGATATGTAACACACGTCGTTCCTCCTCGTAGATTAAGTAAATCTGAAAAATCTGTAGAGTGGTTAACCCTTAATGTTGGTCTTACAACAAGTCCTGTTGGTGTTGGAACTATTCAGAAGATTTTCATTGATGAATTTACCGATCCAGATGTTCCACCCCCAGTTGTTGTAGAGGGTTTTAGACTTGGTGCGAAATCTACGTTTAGTCAAGACAAACTTTGCACAAATCCAGATCTTCTCAATATTTCTATTGCTGGTGTAGGAACATTTTCTGCTCCAATTAGAATGCTGAACAAGGATGGTACTAGTGGACCATCGAGAACAAAAGAATATAATGTTGGATTCGTTGGTGCAGCTAACAGCATTACAACTAGTGTTTTAACTCTTCAGGAAAATCATGAACTATACGCTGGAGAAAGTATTCGTGTAATCTCTGATGATGGTTCTTTACCTGATGGCATTGAAAGTAATACAATTTATTATGCAGTTACAAATGATTCTACTAATGAAACTCTGAACCCCGATCAGATCAAACTTGCAAGAACAGAAAACGAAGCTATTCTTGGTGGATCTGGTAACTTTATTTCAATCAGTAATAACAGAGGTGGTAGACTTAGAATTAATTCCAGAGTTACTGATAAACAACCTGGAGAATTTGGACACCCAGTTCAGTATGATACTACCAACTCTAACTGGTATATTAACAGTGACATTAGTCCAGTCACTAACAGAATTTATAATGCTCTGGTAACAAACGGCCCTGCTATTGGTGCAAGAACCAATAAGTCGTTCTTTACTAGAAGAGAAGACAATAGATCTATTAATGATAAACTGTATAAACTTCGTTATGTGCTTCCTAAAGAATCTGAAGATGCACGTCCACCTATTCCTGGATTTGTAATTCAAGATTCTAGTACTGTCGGTGTAACAACTGCAAGTGATTTCACTGACAATATTCCAAATGCGACTATTCAAAGAAATATTCGTATTCTCAAGGGTTTGAATCGCGATTCAAATAGTGGTGTTACAACGTTTGTCACTGAGAAACCTCACAATTTTGAAGTTGGAGATACTGTTAACTTCCTGAACATTAAGAGTTCGGGTAACACAGTTGGTGCAGCTAACAGTGGATACAACATTTCCAGAGTTGTTACTGGAATCAGTAGCTCTAAGGGATTTCAGGTTAATTTCTCCAATGATCCTGGAAGTTTCATCAACAACATTTCCACAAGAGATGATGGTCTTCCTACAGTATCCAGAAAGTCCGCTAAAGAAACTTTCACAGTATACCGTGTTGAAACTCTAAAAGCCCATGAGTATAACAAACAAGATGGTGTTTATCATTTGATCTGTGTTGATAGTAGTATCAAACCAACCGTTAATGAATTTGGAAATTTTGGTTATACACAACAAATTGAAAACTTGTATCCTCAATTTGATGGTGATAACTTTGTCATGGATCCCTCTCAGGCATCCAGTTTTGCTGTCGCAACTCCTCAAGGTAAGGTTGTAACAAACGATCTTCGTTATAGCATCACAAAAGAATTTACCAACAGATACATTAGAAGTAATGGTATTGGTATTGGAATTACTTTTGCAGAAGGATCCACCCAAGGTATTACCACGATTTACACAGATCGTGAACACAATCTGAACAGTATTATATCTGTTGGTTTAGGTTCTACTGGTCTTAACTATGGTGCAGGTGTATCCACGACTCTCTACAACGCCTCTCTGACCTATTCTGGTATTGAGACTGGTAAGGGTGCAACAGCTAACATTGACATTGATGCGAATGGTGGTATTACAGGTATTACAATTGTTGATGGTGGTTCTGCATATGGAGTTGGACATACCCTGAATATCACGGGTGTAGAAACTTCTGCAAGTCATGTTCAAGGTTGGATCACAGTTAATAAGATCTCTAATAATATTGGTGATGCAATTGAAATCGTTGGTGTTGGTACTTCTCTTGCACGTTATGTGAGTGGATACAACGGAATCCATACAATTACTGCGATCAGACCAAGAGCAGTTGAATACAACAATGGATTCTGGCCTGGTTATTATGATGTGAATACAGTTGGTCTTGCAACTGGATTCATGATGTACGCTGGTCCTGTACCAGACATTTCTAATGTTGTGTATGACAGTTCTGTTGGTGTTGTCACTGTCACGACTACATCGGCTCATGGACTCAACGTCAATAATCCATTCAAGATTGTTGGTGTTGCACAGACTATCTTTAACACTGAAAATATTGTTAGAGAAAGAGTTAGTACGACTCAATTCAACTTCAAGTTCAATGAAGATTATGATGCTGCAACTTATACCTCTGGTGGTTCTGTCTTACCTGTCAACTATGCAGCTCGTGGTGGAATAACTGAGTTTGGCAATGAAAGAATTGCACAAAGACATGTTCCTTTCAGAACTGGTATTCAGACTGCAATGTCTGGTTCGAGTCTGAATGCTACTTCTACAAGTCTTACTCTTGGTGACAGTTCTGGATTCCAGAAAGGTGATTATGTACAGATTGATGGTGAAATCATTCGTGTATCTTCTGACTTCTCTGCAAACTCAGCTACAGTTCTGAGAGGTCAACTTGGCTCTCGTTCTGCTGCTCATGATGGTGGATCTCTGGTCAAGAAACTTCGCATTCTTGCAACTGAGAAGAGAAGACACTCCATTCTTCGTGCATCTGGTCACACATTTGAATATCTTGGTTATGGTCCTGGTAACTATTCCAGTGGTCTTCCTCAGAAACAGGATAGGATTCTTTCTAGAGAAGAACAATTCCTGAGTCAGGCACAAACACCTAATGGTGGTGCAGTTGTTTACACTGGTATGAATGATGCTGGTGACTTCTACATTGGTAACAAAGTCATCAATGCACAAGATGGTACTGAAGCTACCTTCAATATTCCTGTTCCAACTGTAACTGGTGCTGACCAAGATGGATCTGGAACTGGCACAAGACTTGATGCTATCTTCGATTCCTTAACTGTCAGGGAGGGTATCACAGTTGATGGTAACAACAATAGCACTACTAGATTTAATGGTCCAGTTGTTACAAATGAAAAACTGACTAATACCAGTTCTGATGGTATTGAAACTGTTCAGATTTCTATCAACGGTGGTCTTACCGAAAACAGAACTATCACATATTCTCCTTCTAAACCAACCACGTCTGGAACAACTGGTGACATTGTTTTCAACTCCAATCCAAGTTTCGGACAATATGTTGGTTGGATTTATACTCAAGAATCTTGGAAGAGATTTGGCCTTATTTCTACAGAAGTTGATGAGACACAACTCAGTCTCAACACTGTTGGTGTTGGATCCACAAGTGCTTCTAGAATTGGTCAACAGGATGGTGTTGATGTTCGCGGTACTATTGTTGCTGACGCATTTGTTTGTGCAGGTGTTTGTACATTCTCTGGTAATGTCACATTTGCATCGATCACATTCTCCGAGATTACTGTAGCTGGTGTTGGAACTTTCTCAAATAGACTTGATGTTCCTGGAAACTCCAACTTTGTTGGTGTAACAACTCTGAGAGATGTTGAATCTATCAAAGTTTCTGGTATTTCTACATTTAACGGAAATGTAAATATCGGTAATGCAACTTCTGATACTCTTACATTAACTTCTAGGATTGCTGGAAGACTTGATCCATCGGCTAATGCAACTTACGATATTGGTCGTGGTAACAGACAATGGAGAAATATTGTTGCATCTGGTGTTGTAACGGCTACATCTTTTGTTGGTGATGGTTCTAATCTGACCAATACTGGTGCAACCCTGAGTGCTGCTTCTGGATCACAGAGAGTTGTTCTTACTAGTTTGACTAGTGGCACAATGACATCTGCAGCTACTGAAGCTGCCCTTGCATACAATGCAAGTACTAACACTCTTACCGCGACTACATTTAGTGGTAACGCGACAACTGCTACAAGTGCAACTACTGCGACAACTGCCACTAATGCTACTAACATTACTGTTGCAGATGAGTCTGCTGATACCACTTGTTTCCCAGTATTCACCACAGCAGCAACAGGAAATCGACCACCTAAAACTGGATCTAATTTAACTTTTAATTCCAGTACTGGTAGATTATCTGCGACATCATTTGCTGGAAATGGAGCTTCACTTACTGGTGTTGTTGCAACCACTGCAATTGATGCAACTAATTCCACCAATTTAAATCTTCGTGCAAGAAATACAGAGAATGCAACTCATTATGTTACATTTGGCACATCAACCACTGGTAATCAGAGACTTAATACTGACACTGGATTAACTTATAATCCAAGTACTAACACTCTCACCGCAACTACATTTAGTGGTAATGCGACCACTGCCACTACTGCCACTACGGCTACCACGGCCACTACTGCAACTACTGCAACTACTGCGACAAATTGCACCAATTTTGATGTTGCAGCTGACAACACTACTGATGCTACTCATTATCCTATCTTTACTGGCGGAGCCACTGGAAATCAACGTCCCAATAGTGACACTGATTTAACTTATAATCCAAACAGTGGAGTTTTAAGTTCTGCAGAATTTTCCGCAACATCTGACGAAAGACTTAAGAAAAACATTGAAACTATCACTGATGCACTTGATAAAGTCACACATCTCCGTGGTGTTGAATATGACTTGAAGAGTAACGACAGACATCAAATTGGTGTTATCGCTCAAGAGGTTGAAAAAGTTATTCCTTCTGTTGTTTCTGAACGTGATGATAATGGTACAAAGACAGTCGCTTATGGTAACATGGTCGGTCTTTTAATTGAAGCTATTAAAGAACAACAGATTCAAATTCAAGAACAACAAACTCAGATACAAGAACTGAAGGCTAAGGTTGATGATCTATCTAAATAA

Genome Context

Tertiary structure

PDB ID

f16312d78fa17f02d280c9d596d3b627cabf80e55e8ee80ba5cc6c4d7fe5fae1

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,7681

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence