Protein

View in Explore

Genbank accession

UNH61169.1 [GenBank]

Protein name

tail fiber protein

RBP type

Evidence GenBank

Probability 1,00

Evidence Phold

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,88

TSP

Evidence RBPdetect2

Probability 0,86

Protein sequence

MALTRLKNIITSRTGRIIYVNPDDFDASDAYDNRGNSALRPFKTLQRAFLEVARFSYRVGLSNDEFDAFSIYLYPSDYVLDNRPGVTDYNDIQPFDANTNFDLTSSSNVLYKFNSTRGGIIVPRGCSVVGSDLRRTKFIPKYVPYPTVQGSLGITATNEPGPTAIFRVTGGCYFWQASFFDGDTNGVYYRGDDIATIAPNYSHHKITCFEYANVADLNLYYQKISKAYATIPDSSGVVAQDQLQARVEENRIVGPISDEFAVSQIIRNGQTATAFTVDELGNPKNHGFSVGVAVNISGVTGPTEQDQLLYNGSFLVTSAQGNQFTYQMSAEPSGNAIGSNILVKVEIDTVDSASPYVFNMSLRSVWGINGMHADGAEATGFKSMVLAQFTGISLQKDDRAFVLYNQSTGNYEPQAAGSGAHINGLAEYRKGWRHAHIKASNDAFIQVVSVFAVGFGDHFFSDSGGDLSITNSNSNFGNTSLRSKGFKSTAFTKDKAGQITHVIPPKSLSDVDEISINWITIDIAATRAEADASRLYLYGYTSELGRPPSKIQGYTIGARRDDVNTPDRIYVALIASGASEPTTHFAKISPSGPDVTGTRAGDEESPIKWDPNRGQWYLQVESAGVDNTIYTTLQANALYQNLGFTPTTFIRRVPDARDLNDRTYRFRYVLDKDAFPVPRPPITGFVLQPRSSETNSPAFSKTYYIYDVETFQTFERGVADGIYYLTVLSASVNPSTSNFDDFAFSQNTVDIYPAFDRDNPVADPAAAVSVADNEVLGLVRTTDGASPTPNENTQLSITKETAQFFLLESENNLGYNTTSNVLNSIVVTARLGDEEDRKIPLRLNPDGSVSPLQIELRRYSILRASGHTFEYLGFGPGNYSTAFPSTQVEVLQPEQVRLSQSLKEAAGVAYYSGVNSDGELFVGNQVINPVTGQITNEDIAQLNVLGEEDTTIETFSELVLTDKLTVIGGASNQLESVFSGPVTLQKKLTSQAEIQSLKFVYSNDDGTVLKQTFLAEELNGLPDLAPNLAFNNGDICYNIDWVPGQSLGWVYDNGTWYKFGLSDTTPITSNRFSGVTNYGIGMAPDASNRLKISGNTYINGNLDVSGRYGCADKYSLATGIANGNNGVTYSGNGVTQSFNISPGHTAYSILVFLNGVAQIPGVDYTVTGNAVDFSISAPPATGDTIHIRELVI

Physico‐chemical properties

protein length:	1192 AA
molecular weight:	129755,17420 Da
isoelectric point:	4,79649
aromaticity:	0,10654
hydropathy:	-0,25998

Domains

Domains [InterPro]

DC_0066
STR
1–1191

DC_0066

IPR023366
STR
266–343

IPR023366

UNH61169.1

1 1192

Architecture

STR

STR 1-1191 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0066	STR	DC_0066	1	1191	Novel HMM	DC_0066	Central	Low	Positional only	99 proteins / 99 hits
IPR023366	STR	IPR023366	266	343	Merged direct domain	ATP synthase subunit alpha, N-terminal domain-like superfamily	Central	Low	Positional only	44 proteins / 44 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

UNH61169.1

1 1192

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	104	104	0,8997
Central domain	105	303	200	0,7821
C-terminal	304	1192	888	0,0219

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-104

Central
105-303

C-terminal
304-1192

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Synechococcus phage S-SZBM1 [NCBI]	2926475	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Synechococcus sp. CB0101 [NCBI]	232348	Bacteria > Cyanobacteria > Oscillatoriophycideae > Chroococcales > Synechococcus >

Coding sequence (CDS)

Genbank protein accession

UNH61169.1 [NCBI]

Genbank nucleotide accession

OL473597.1 [NCBI]

CDS location

range 23049 -> 26627
strand -

CDS

ATGGCACTTACTCGTCTTAAGAATATCATCACGTCGAGAACGGGACGCATTATCTATGTGAACCCTGATGACTTTGACGCATCGGACGCATACGACAACAGAGGTAACTCAGCGTTGCGTCCGTTTAAGACGTTGCAACGTGCCTTTTTAGAAGTTGCTAGATTTTCGTATCGAGTGGGTCTGTCGAATGACGAATTCGACGCCTTCTCGATTTATTTGTATCCTTCTGACTACGTTCTGGATAACAGACCTGGCGTCACTGATTACAATGATATTCAGCCTTTTGATGCCAATACAAACTTTGATCTGACATCATCTAGTAACGTACTGTACAAGTTTAATTCCACCCGTGGTGGTATTATCGTTCCTAGAGGTTGCTCGGTTGTTGGTTCTGACCTTCGCCGTACAAAGTTTATCCCTAAGTATGTTCCTTATCCCACTGTTCAGGGTTCTCTTGGTATTACCGCAACTAATGAACCTGGACCTACTGCTATCTTTAGGGTCACAGGTGGTTGTTATTTCTGGCAAGCATCTTTCTTCGATGGTGATACCAACGGTGTGTATTATCGTGGGGATGATATCGCTACCATCGCTCCTAACTATTCTCACCACAAGATAACTTGTTTTGAGTATGCGAATGTTGCAGATCTGAATCTGTATTACCAGAAGATCTCTAAAGCATACGCTACGATTCCTGATTCTTCTGGCGTTGTTGCACAAGACCAACTGCAGGCAAGAGTCGAAGAAAACAGAATCGTGGGTCCAATTTCGGACGAATTTGCTGTTTCTCAGATTATCCGAAATGGTCAGACTGCTACAGCGTTTACTGTTGACGAACTCGGCAATCCGAAGAATCATGGATTCTCCGTGGGTGTCGCAGTTAATATTTCTGGCGTTACTGGTCCTACTGAGCAAGATCAATTACTCTATAATGGATCGTTCCTGGTAACATCAGCGCAAGGTAACCAGTTTACTTACCAAATGTCGGCAGAACCTTCTGGTAATGCTATTGGTTCTAACATTCTTGTGAAGGTTGAGATTGATACCGTTGACTCGGCATCTCCCTATGTGTTTAACATGTCCCTGCGCTCTGTGTGGGGTATCAATGGTATGCACGCTGATGGTGCTGAAGCAACTGGTTTTAAATCGATGGTTTTGGCACAGTTCACGGGCATCTCTCTGCAAAAAGATGACCGTGCATTTGTTCTCTATAACCAGTCAACTGGTAATTATGAACCACAAGCAGCAGGTTCTGGTGCTCACATCAATGGTCTAGCGGAGTATCGTAAGGGGTGGAGACATGCACACATTAAAGCAAGTAATGATGCGTTCATTCAGGTGGTGTCGGTCTTCGCTGTGGGTTTCGGTGATCACTTCTTCTCTGATAGTGGTGGTGACCTATCTATTACTAACTCAAACTCCAATTTCGGTAATACATCACTGAGATCGAAAGGATTTAAGTCCACTGCATTTACCAAGGACAAAGCGGGTCAGATTACACACGTTATCCCACCCAAGTCTTTGTCTGATGTTGATGAAATTTCTATCAACTGGATCACAATTGATATTGCAGCGACTCGCGCAGAAGCAGATGCTTCCAGACTGTATCTCTATGGTTACACTTCTGAACTTGGTCGTCCCCCTAGCAAGATTCAGGGTTACACTATCGGTGCAAGACGTGATGACGTTAATACTCCCGATAGAATCTATGTTGCTCTGATTGCATCTGGTGCTTCGGAACCCACCACACACTTTGCAAAGATTTCTCCTTCTGGTCCTGATGTGACTGGAACCCGTGCTGGTGATGAAGAATCTCCTATCAAGTGGGATCCTAACAGAGGTCAGTGGTATCTTCAGGTAGAATCTGCTGGTGTAGACAACACCATTTACACTACACTTCAGGCAAACGCCCTGTATCAAAACCTCGGATTCACACCTACAACCTTTATCCGTCGTGTGCCCGATGCTCGTGACCTGAACGACAGAACCTATCGTTTCCGTTATGTTCTGGATAAGGATGCGTTCCCTGTTCCTCGTCCTCCCATCACTGGTTTTGTTCTTCAGCCCAGATCGTCGGAGACTAACTCTCCTGCATTCAGTAAGACATACTATATCTACGATGTAGAGACATTCCAGACCTTTGAGCGTGGTGTTGCTGATGGTATCTATTATCTGACAGTTCTTTCAGCATCTGTTAATCCATCTACATCTAACTTTGATGACTTTGCATTCTCTCAGAATACAGTAGACATTTACCCTGCATTCGACAGAGACAACCCAGTTGCAGATCCTGCTGCTGCAGTTTCTGTTGCTGATAATGAAGTTCTGGGTCTAGTTAGAACAACGGATGGTGCTTCTCCTACACCTAACGAGAATACTCAACTATCCATCACTAAAGAGACTGCTCAGTTCTTCCTGCTGGAAAGTGAGAACAACCTTGGATATAACACAACATCGAATGTACTGAACTCGATTGTTGTTACTGCAAGACTTGGTGATGAAGAAGATCGCAAGATTCCTCTGAGACTTAACCCTGACGGTTCTGTTTCTCCACTGCAGATCGAACTCCGTCGTTATTCTATTCTTCGTGCATCTGGTCACACATTTGAGTACCTTGGTTTCGGTCCTGGTAACTACTCAACTGCATTCCCCTCTACTCAGGTTGAGGTTCTGCAACCTGAGCAAGTTAGACTGTCTCAGTCACTGAAAGAAGCAGCGGGTGTTGCATACTATTCTGGTGTGAACTCTGACGGTGAACTGTTCGTTGGTAACCAAGTTATCAACCCAGTTACGGGTCAGATCACTAACGAAGATATTGCACAACTGAATGTTCTTGGTGAGGAAGACACCACCATCGAAACATTCTCTGAACTGGTTCTTACTGATAAATTGACCGTCATCGGTGGTGCATCTAACCAATTGGAGTCGGTGTTCTCAGGTCCTGTTACTCTGCAGAAGAAACTGACATCTCAAGCCGAGATTCAGTCTCTGAAGTTTGTATATTCTAACGACGATGGTACGGTTCTGAAGCAGACTTTCCTTGCAGAAGAACTGAATGGTCTTCCTGATCTTGCTCCCAACCTTGCATTTAACAACGGAGATATTTGCTACAACATTGATTGGGTTCCTGGTCAATCTCTTGGTTGGGTGTATGATAATGGAACTTGGTATAAGTTTGGTCTGAGTGACACAACTCCTATCACATCCAACAGATTCAGTGGTGTGACTAATTATGGTATTGGCATGGCACCTGATGCCAGCAATAGACTGAAGATTAGTGGAAATACTTACATCAATGGTAATCTTGATGTCTCTGGTAGATATGGTTGCGCAGATAAATACTCTTTAGCAACTGGTATTGCCAACGGCAATAATGGAGTGACTTACAGTGGTAATGGCGTAACGCAGTCCTTTAACATCTCACCTGGACACACTGCGTATTCTATTTTGGTATTCCTTAATGGTGTTGCCCAGATTCCTGGAGTTGATTATACGGTTACAGGTAATGCTGTTGATTTCTCCATCTCGGCACCACCCGCGACTGGTGACACCATTCACATTCGTGAACTCGTTATCTAA

Genome Context

Tertiary structure

PDB ID

fe0957130d5ceaa9d58f7138a122a1317fc4600afa8c45ba23749b7ccd6d92da

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,3678

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence