Protein

View in Explore

Genbank accession

YP_009322953.1 [GenBank]

Protein name

tail fiber protein

RBP type

Evidence GenBank

Probability 1,00

Evidence Phold

Probability 1,00

TSP

Evidence RBPdetect2

Probability 0,51

Protein sequence

MPLNKLENFIKNVDGRTLYVNPADLNATDSITNEGTSLTEPFRTLQRALIESARFSYVQGDNNDLIEKTTIILYPGEHTIDNRPGYGIKVDGSGDAIAVAPNGQQVTPAPVFNLASDTNFDIESPNNILWHFNSIYGGVVIPRGTSIVGMDLRKTKIRPKYVPNPTDPSVPSSAIFRVTGTCYFWQFTIFDGAENGLVFTDPQDFSENNQCRPTFSHNKLTAFEYADGVNPAIANGFELTDLQMYYSKLSNAYNEASGRQIKQKFPAQPEGFAPMLPEFEIVGAFATDPIRIASLISGDGFTPDAVITVDTVVPNDLAVGTPIKIRGVAISDYNISAKVATVINPTRFTYLIPFVRPELPARPSVSSATVTVETDTVTGASPYIFNVSMRSVWGINGMHADGSKATGFRSMVVAQFTAISLQKDDRSFVKYNEQARRYDGIDVSTTVRGAELAAGSSSTNSARVYHLDPRAIYRPGWDTTHIKMSNDAVIQIVSVFAIGFNQHFAALSGADASVTNSNSNFGQFALLSGGFKNDAFEKDDRGFVTQIVTPNTAYNPSEDAISNIGWVNIDFSLTNSQSLPGQLYLLGYSNKEDIPPYINQGFRIGGNYNETLYQPLSDESLESASICMVDNLIDGNSNVATGTDIARKTYPVIAGPGQGPTSGSTLTLPFHGLLNGETIRIFSGTGDLPENIDAATLYYANVVDAENIRISTSQSNALNDLFLDIYGGTDLRIESRVNDKTPGDAGHPIQYDDTIGNWFVHTNVNSDIYQYVKSNPTSTEGLDSVTFYQREGDNRSLDDKIYRLRYVIPKETVNAKPPTPGYVIQESSSTGARDNDDFILNDLTFTDYEYDRNPRYIVSCNFISISSEVEVRSEIPHQLFVGDKINIINVTSTNNPDAVNGRGYNGEFLVTRIIDARTFYYSSTDVNGFTRNLIGELFTNDTNDRNILLPRFQRKDNQTNTFVYRVEEISPFSETIRDGIYHLFCVNGSNQVTETFTNRFYNQPIEDLYPQLDTDNTNNNVESSTTFANSSPLGKVVIDSLQSSITRETIDKLSKSSSTNIIKTVTIGASETTLEFEREHNFSGVYGYTTLAGGSGYVDGTYYNVRLLSGAAWKGASAEVVVISGQVNSLTIMDPGSGYSGGETLNIDPSGLGGGVGASITITSDDIESSAGFVLQLTGGGLTTPDLYAPIVTVDSTTSVSIANSSIVSGISTTGMYALPTDSGTSIAAYSFDSTTGVSTFTADPTTGFGMQRGNSFVAFDSNGYPLGKYYVSSVPSPNIIETKTNSNLIDVALVGKCGYEDNDANTGSSGENIGIRGTAAFDLGVFYLETNSGTGNVLTLSARDGGVTGKVAQKLPLGRYLQIGSEIIRVASTTFGGLNLNEVTVIRGALGTNIINHPQYSKVRAISPLAIELRRPSILRASGHTFEYLGYGPGNYSTALPQLQVEQLPDEEVFLVQAQELSCGQVVYTGMSDNGDFYIGNTKYSATSGTQTTFDVPIPTVAGQNASSNNVVFDEVIVNQRLFVAGGETNQVLSQFDGPVKFTQSVNIENTLGVTGNSSFNTVDILSQENAISLTDGGALTIRGGASVGKDLYIGGTLYSTGDFSTNIVLAAEPDSPISLFENQNNGLLGIGSQPGKVVFNTTVPATGDGGDDIADADAGVVVEGGLVVRGTLLAGEVKANGLGKPGTVIMWGGTVDNVPEGYLLCNGAAYDRTTYDKLFASIGYVHGGSGNNFNVPDLRDKFITGAGSQYNTSDEGGSNTVVLTEAELPTHTHIIDNTDISHTHALDAGATASVVNDNTPLSVSGSTDDDTGKHIHSSGATSDPGNHTHSITDVQHAHSMAGFNQEDSAERSAGLIVDDDRRPNENTGWATRGAFTGITGTNGGGSHTHTISVTNLNSEHNHTLTASGNANHNHDLEGNTASSLGDHDHTAQTTGADVAHENRPPYYALVYLIQYK

Physico‐chemical properties

protein length:	1958 AA
molecular weight:	209976,82440 Da
isoelectric point:	4,64098
aromaticity:	0,08733
hydropathy:	-0,26164

Domains

Domains [InterPro]

DC_0066
STR
1–1958

DC_0066

IPR037053
ATT
1686–1741

IPR037053

SSF88874
STR
1687–1831

SSF88874

IPR011083
ATT
1688–1745

IPR011083

YP_009322953.1

1 1958

Architecture

STR

ATT

STR

STR 1-1685 | ATT 1686-1745 | STR 1746-1958

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0066	STR	DC_0066	1	1958	Novel HMM	DC_0066	Central	Low	Positional only	99 proteins / 99 hits
IPR037053	ATT	IPR037053	1686	1741	Merged direct domain	Phage tail collar domain superfamily	N-terminal	Low	Positional only	37 proteins / 37 hits
SSF88874	STR	SSF88874	1687	1831	Merged direct domain	SSF88874	Central	Low	Positional only	109 proteins / 109 hits
IPR011083	ATT	DC_0235	1688	1745	InterPro cluster	Phage tail collar domain	C-terminal	Medium	Text match	1051 proteins / 1051 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

YP_009322953.1

1 1958

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	118	118	0,7934
Central domain	119	317	200	0,8777
C-terminal	318	1958	1640	0,1604

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-118

Central
119-317

C-terminal
318-1958

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Synechococcus phage S-CAM7 [NCBI]	1883368	Uroviricota > Caudoviricetes > Pantevenvirales > Mazuvirus > Mazuvirus scam7
Host	Synechococcus sp. WH 7803 [NCBI]	32051	Bacteria > Cyanobacteria > Oscillatoriophycideae > Chroococcales > Synechococcus >

Coding sequence (CDS)

Genbank protein accession

YP_009322953.1 [NCBI]

Genbank nucleotide accession

NC_031927.1 [NCBI]

CDS location

range 20643 -> 26519
strand +

CDS

TTGCCACTTAATAAGTTAGAAAATTTCATTAAGAACGTTGACGGTCGCACTCTGTATGTGAATCCAGCGGATTTGAATGCGACCGACAGTATTACAAACGAAGGCACTTCTCTCACAGAGCCCTTCCGTACTCTTCAAAGGGCACTCATAGAGTCAGCTCGTTTTTCCTATGTTCAGGGAGATAATAACGATTTAATCGAAAAAACTACGATTATCTTATATCCAGGTGAGCACACTATTGATAATAGACCTGGCTATGGTATTAAGGTTGATGGTAGTGGTGATGCTATTGCGGTAGCTCCTAATGGTCAGCAAGTTACACCAGCACCAGTATTCAACCTAGCTTCTGATACAAACTTTGATATTGAGTCCCCAAACAATATTTTATGGCACTTCAACTCCATTTATGGTGGTGTTGTAATTCCTCGTGGTACTTCTATCGTAGGTATGGATCTACGTAAGACAAAGATCCGCCCCAAGTATGTACCAAACCCAACAGACCCATCAGTACCATCCTCTGCAATTTTCCGTGTTACTGGTACCTGTTACTTCTGGCAGTTCACAATTTTTGATGGTGCTGAAAATGGTCTAGTATTCACTGACCCACAAGATTTCTCTGAAAACAATCAGTGTCGCCCAACATTCTCCCACAATAAACTAACCGCATTTGAGTATGCTGATGGTGTAAATCCTGCTATTGCTAATGGATTTGAGCTAACTGACTTGCAGATGTATTATAGTAAGCTATCAAATGCTTATAATGAAGCATCTGGTCGTCAAATTAAGCAGAAGTTTCCAGCACAGCCTGAGGGATTTGCTCCAATGCTCCCTGAGTTTGAGATTGTGGGTGCATTTGCAACAGATCCTATTCGTATTGCTTCTCTAATTTCGGGTGATGGATTTACCCCAGACGCTGTTATTACAGTTGATACTGTTGTTCCCAATGATTTAGCCGTTGGAACTCCCATTAAGATCCGTGGAGTAGCTATATCAGATTATAATATTTCTGCGAAAGTTGCGACAGTCATTAACCCAACACGTTTTACATACCTAATCCCATTCGTAAGACCTGAACTTCCAGCGCGTCCATCAGTATCCTCTGCAACTGTAACCGTTGAGACTGATACTGTTACTGGTGCATCTCCGTACATTTTTAACGTATCCATGCGATCCGTCTGGGGTATCAATGGTATGCATGCTGACGGCAGTAAGGCAACTGGATTCCGTAGCATGGTCGTTGCACAGTTCACCGCGATCAGCCTTCAAAAAGATGACCGTTCATTCGTTAAGTATAACGAACAGGCACGTAGATATGATGGTATTGATGTTAGTACCACAGTACGTGGTGCTGAACTAGCAGCAGGCTCATCCTCCACAAATAGTGCTCGTGTTTATCATCTAGACCCACGAGCAATTTATCGTCCAGGTTGGGATACTACTCACATTAAGATGAGTAATGATGCTGTTATTCAGATCGTTTCAGTCTTTGCTATTGGATTCAACCAGCACTTCGCAGCACTATCTGGAGCTGACGCATCTGTCACCAACTCAAACTCAAACTTCGGTCAATTTGCCCTATTATCAGGTGGATTTAAGAATGATGCATTTGAGAAAGACGACCGAGGATTTGTAACACAAATTGTTACACCAAATACTGCATACAATCCATCAGAAGATGCTATCTCCAATATTGGTTGGGTTAATATTGACTTTTCGTTGACTAACAGCCAATCATTACCTGGTCAGTTATATCTACTTGGTTATTCTAATAAAGAGGATATACCACCATACATCAATCAGGGCTTCCGTATTGGTGGAAACTATAATGAGACTTTATATCAACCACTTAGTGATGAATCACTGGAAAGTGCTTCAATTTGTATGGTTGATAACCTTATTGATGGCAATTCCAATGTTGCTACTGGTACTGATATTGCTCGCAAAACATATCCAGTAATTGCTGGTCCTGGTCAAGGTCCAACATCAGGCTCCACTCTAACTCTTCCATTCCACGGTCTATTAAATGGAGAAACTATTCGTATCTTCTCTGGGACGGGTGATCTACCAGAAAATATCGATGCAGCTACATTATATTACGCAAACGTTGTTGATGCAGAGAACATTCGCATTTCAACCTCCCAGTCTAATGCTCTAAATGACCTATTTTTGGATATTTACGGCGGCACTGATCTGCGCATTGAATCTCGTGTAAATGATAAGACACCTGGTGATGCGGGTCATCCAATCCAGTATGATGATACTATAGGTAATTGGTTTGTTCATACTAATGTAAATAGTGATATCTATCAGTATGTTAAATCAAATCCCACATCTACTGAAGGTCTTGACTCTGTTACTTTCTACCAGAGAGAGGGTGATAATAGAAGCCTTGACGATAAAATCTATAGACTAAGATATGTTATCCCCAAAGAAACTGTAAATGCTAAGCCACCAACCCCAGGATATGTTATTCAGGAGTCTTCTTCTACTGGTGCTAGGGATAATGATGATTTCATCCTCAATGATTTAACATTCACTGATTATGAATATGATAGAAACCCAAGATATATTGTTAGCTGTAACTTCATCTCTATCTCATCAGAGGTAGAGGTTCGCAGTGAAATCCCTCACCAATTATTTGTTGGTGATAAGATCAACATCATTAATGTTACTTCAACAAATAATCCTGACGCAGTAAATGGTAGAGGATATAATGGTGAGTTCTTAGTAACACGTATTATAGATGCTAGAACTTTCTATTATAGTTCTACTGATGTTAATGGATTTACTAGAAACTTAATTGGTGAATTGTTTACCAATGATACAAACGATAGAAACATCCTACTACCACGTTTTCAGCGTAAGGATAATCAAACCAATACTTTCGTCTATCGTGTAGAGGAAATTTCTCCATTCAGTGAGACGATTAGAGATGGTATCTATCATTTGTTCTGTGTTAATGGTTCAAATCAAGTAACCGAGACCTTTACCAATAGATTCTACAATCAGCCCATTGAAGATCTTTATCCTCAATTAGATACTGATAATACTAATAACAATGTTGAGTCATCAACAACTTTCGCCAATAGTTCACCACTAGGTAAAGTCGTTATTGATAGCCTACAGTCCTCTATCACTAGAGAGACTATTGATAAGCTATCAAAGAGTTCAAGTACAAATATAATCAAAACAGTTACTATTGGTGCTTCAGAAACTACATTAGAATTTGAGCGTGAGCACAACTTCAGTGGAGTATATGGTTACACTACATTAGCCGGTGGTAGTGGTTATGTTGATGGTACTTACTATAATGTAAGGTTGCTATCTGGTGCTGCCTGGAAAGGTGCATCTGCCGAGGTTGTTGTTATCTCAGGTCAAGTTAATTCACTAACCATTATGGACCCAGGTTCTGGGTATAGTGGTGGAGAAACATTGAATATTGATCCATCTGGCTTGGGTGGTGGCGTAGGCGCAAGTATTACTATCACTTCAGATGATATTGAAAGTTCTGCTGGATTCGTATTACAGCTTACTGGTGGTGGTCTAACAACACCCGACTTATACGCACCTATTGTAACAGTAGATAGTACAACATCAGTATCAATTGCTAATTCTTCTATTGTTTCTGGTATCTCAACTACTGGAATGTATGCTCTACCTACCGATAGTGGAACATCTATCGCAGCATATAGTTTTGATAGCACTACTGGAGTATCAACATTCACTGCAGACCCAACAACTGGCTTTGGTATGCAGAGGGGCAATAGCTTCGTAGCATTTGATTCTAATGGATATCCATTAGGTAAGTATTACGTGTCTTCTGTTCCATCTCCAAACATCATTGAAACTAAAACTAATTCAAATCTAATAGATGTAGCATTAGTTGGTAAGTGTGGTTATGAAGATAACGATGCTAATACTGGTTCTAGTGGAGAAAATATTGGTATCCGTGGTACCGCAGCATTTGATTTGGGTGTATTCTACTTAGAAACCAATTCAGGCACTGGAAATGTATTGACTCTATCAGCCAGAGATGGCGGCGTAACTGGTAAAGTCGCACAGAAACTACCTCTTGGAAGATACCTACAGATTGGCTCTGAAATTATTCGTGTTGCTAGCACTACATTTGGTGGACTAAACCTTAATGAAGTAACTGTTATTCGTGGTGCTCTTGGTACTAATATCATCAACCACCCACAGTATTCTAAGGTTCGTGCTATCTCTCCATTAGCGATTGAGCTACGCAGACCTTCTATTCTCCGTGCATCTGGTCACACTTTTGAGTACCTAGGCTATGGTCCTGGTAACTACTCAACAGCACTACCACAGCTACAAGTAGAACAGCTCCCTGATGAAGAAGTATTCTTGGTACAGGCACAGGAACTATCTTGTGGTCAGGTTGTATACACTGGTATGTCCGATAATGGAGACTTCTACATCGGTAACACCAAGTATTCTGCTACTTCAGGCACACAAACTACATTTGATGTACCCATTCCAACAGTAGCAGGTCAAAATGCTTCCAGTAATAACGTAGTATTTGATGAAGTTATAGTCAATCAGAGATTATTCGTTGCTGGTGGTGAGACAAATCAAGTTCTATCACAGTTTGATGGACCTGTTAAGTTTACTCAATCAGTTAACATAGAAAATACTTTAGGTGTAACAGGTAATAGTTCATTCAATACTGTAGATATTCTCTCACAGGAGAATGCTATTTCTCTAACTGATGGTGGAGCACTTACTATTCGTGGTGGGGCATCCGTTGGTAAGGATTTGTATATTGGAGGCACACTATACTCAACTGGTGATTTCTCTACTAATATTGTTTTAGCAGCTGAGCCAGATTCTCCTATTAGCCTATTTGAGAATCAGAATAATGGTTTGCTTGGTATTGGTAGTCAACCAGGTAAAGTTGTTTTCAACACAACAGTACCTGCTACTGGTGATGGTGGAGATGACATTGCTGATGCTGATGCTGGTGTTGTTGTTGAGGGTGGTTTAGTTGTAAGGGGCACTCTACTAGCAGGTGAAGTTAAGGCTAATGGTCTTGGTAAGCCTGGTACCGTTATTATGTGGGGTGGTACTGTTGATAATGTCCCTGAGGGATACTTATTGTGTAATGGTGCAGCATATGATAGAACCACATACGATAAGTTATTCGCTTCCATTGGGTATGTTCATGGTGGTTCTGGTAATAACTTCAATGTTCCTGACCTAAGAGACAAGTTCATTACTGGTGCTGGTTCTCAATATAATACTTCTGATGAAGGTGGAAGCAATACTGTTGTTTTAACTGAAGCGGAACTTCCCACGCATACTCACATCATAGACAATACGGATATATCCCATACACACGCTCTTGATGCGGGGGCAACTGCAAGTGTTGTAAATGATAATACTCCATTATCTGTTAGTGGTTCTACTGATGATGATACAGGAAAGCATATACACTCTTCTGGTGCTACCAGTGATCCTGGAAATCATACCCATTCTATTACTGATGTACAACATGCACATAGTATGGCAGGCTTTAATCAAGAGGACAGTGCAGAAAGAAGTGCTGGACTCATTGTCGATGATGATCGAAGACCTAATGAGAATACTGGGTGGGCTACAAGGGGAGCATTCACTGGAATTACTGGCACGAATGGAGGTGGGAGTCATACCCATACTATTTCTGTAACTAATCTCAACTCCGAGCATAATCATACATTGACTGCTAGTGGTAATGCTAACCATAACCATGATCTTGAGGGAAATACTGCAAGTTCTCTTGGTGATCATGATCATACTGCACAAACCACTGGTGCTGATGTTGCTCACGAGAACCGTCCTCCATATTACGCTCTGGTCTATTTGATCCAGTACAAGTGA

Genome Context

Tertiary structure

PDB ID

5bc4836a5e816498dd0e122c3e113dd9bd68745064a169d9c93cd438d4a2dc27

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,7999

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence