Protein

View in Explore

UniProt accession

G8EXV4 [UniProt]

Protein name

Tail fiber protein

RBP type

Evidence UniProt/TrEMBL

Probability 1,00

Evidence GenBank

Probability 1,00

Evidence Phold

Probability 1,00

Evidence RBPdetect

Probability 0,89

Protein sequence

MSNQGFLGQSKPAGATNTLLYSAPANRSASTVLNVANDGTGSAYSVGVKRYDQELTVDASTYLLHEGDLVTGYTVTVDTPFEPISAGFSSGLQLTSVDAEKKFKFESSIRPEFVEYFVKSISIRQVALESVTGDAFSIGDTITKGTAPADTTAVIYGINGNTIYIGPSTFSTGAEFAEGDTISTAGGSGGTISTGGLFAAANKFVFSTTVSGIYDLYLTAAGNSLSLFNDRPYRFDVSDSSMTGHLFQLSTTTNGEWGPDGLSPSDPSDTGDGGTENTAGKTTSGTAGSSSAYVQYDFTLDTSGNSLFYWYNGDLTTATNNTYGSESGYLTNTATPTFTQFFVYDVEGTWVNATDAFLVGGTTYTVTAQDAGPYGYVRSYSGTTLQVIKGLYSADFAGTDTFLDAPLNSTADRSTVTVSSVDVATTALQAGEYIIEGKTNAANAVDRTTSLVIGPGERVIVNSATGDNTFSLIGFEDISTALTTRRFGV

Physico‐chemical properties

protein length:	489 AA
molecular weight:	51098,01860 Da
isoelectric point:	4,19764
aromaticity:	0,11043
hydropathy:	-0,11513

Domains

Domains [InterPro]

DC_0373
STR
1–489

DC_0373

G8EXV4

1 489

Architecture

STR

STR 1-489

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0373	STR	DC_0373	1	489	Novel HMM	DC_0373	Central	Low	Positional only	22 proteins / 22 hits

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Synechococcus phage S-CAM8 [NCBI]	754038	Uroviricota > Caudoviricetes > Pantevenvirales > Neritesvirus > Neritesvirus scam8
Host	Synechococcus sp. [NCBI]	1131	cellular organisms > Bacteria > Bacillati > Cyanobacteriota/Melainabacteria group > Cyanobacteriota > Cyanophyceae
Host	Synechococcus sp. WH 7803 [NCBI]	32051	Bacteria > Cyanobacteria > Oscillatoriophycideae > Chroococcales > Synechococcus >

Coding sequence (CDS)

Genbank protein accession

AET72644.1 [NCBI]

Genbank nucleotide accession

JF974299 [NCBI]

CDS location

range 96694 -> 98163
strand -

CDS

ATGTCTAATCAAGGATTTTTAGGACAATCTAAACCAGCAGGTGCAACTAACACTTTGTTGTATTCTGCACCCGCTAACAGATCTGCAAGCACAGTATTGAATGTTGCTAATGATGGCACAGGATCTGCTTATAGTGTCGGTGTTAAGAGGTACGATCAAGAGCTGACGGTTGATGCCAGCACGTATCTTTTACATGAAGGTGATCTAGTTACAGGATATACTGTTACTGTTGATACTCCATTTGAACCTATTAGTGCAGGATTTAGTTCTGGATTGCAACTTACTAGCGTTGATGCTGAGAAAAAATTTAAGTTTGAATCTTCTATTAGACCAGAATTTGTTGAGTATTTTGTTAAAAGTATTTCAATTCGTCAGGTAGCACTTGAAAGTGTAACTGGTGACGCTTTCAGTATTGGTGATACAATTACTAAAGGTACTGCACCTGCAGATACAACCGCAGTTATTTACGGTATAAATGGTAATACGATTTATATCGGTCCCTCCACCTTTTCTACTGGTGCTGAATTTGCAGAAGGTGACACAATTAGCACTGCTGGTGGATCTGGTGGTACTATTTCTACTGGTGGTTTATTTGCTGCAGCAAACAAGTTTGTTTTTTCTACTACAGTTAGTGGCATTTATGATTTATATCTGACTGCTGCAGGTAATAGTCTGTCACTTTTTAACGATCGTCCATATAGATTTGATGTTTCTGATTCCTCTATGACAGGACATCTTTTCCAACTTTCAACAACTACTAATGGCGAGTGGGGTCCTGATGGTTTATCACCTTCTGATCCAAGTGATACTGGTGATGGTGGTACAGAAAATACCGCAGGTAAAACTACTTCTGGCACAGCAGGTTCTTCTAGTGCATATGTTCAATATGATTTCACTTTAGATACATCTGGCAACAGTCTTTTCTATTGGTATAATGGAGATTTAACAACTGCTACTAACAATACTTATGGTAGTGAGTCTGGTTACCTGACAAACACTGCTACACCTACCTTTACTCAGTTCTTTGTTTATGATGTAGAAGGAACTTGGGTAAATGCTACGGATGCTTTCCTAGTTGGTGGCACAACCTATACCGTAACTGCACAAGATGCTGGTCCTTACGGTTATGTTCGTAGTTACAGCGGCACTACCCTTCAAGTAATTAAAGGTTTATACTCGGCAGACTTTGCTGGTACTGACACTTTCCTTGATGCTCCTTTAAATAGTACTGCAGATAGATCTACTGTTACTGTAAGTTCTGTTGATGTTGCTACAACTGCATTGCAGGCAGGTGAATATATCATTGAAGGTAAAACTAATGCAGCAAATGCTGTAGATAGAACTACATCTCTCGTTATTGGTCCTGGGGAAAGAGTTATTGTTAATAGTGCTACTGGTGATAATACCTTCAGTCTCATTGGATTTGAGGATATCTCAACCGCCCTCACAACTAGACGTTTTGGCGTCTGA

Genbank protein accession

AGN33869.1 [NCBI]

Genbank nucleotide accession

HQ634178 [NCBI]

CDS location

range 21404 -> 22873
strand +

CDS

ATGTCTAATCAAGGATTTTTAGGACAATCTAAACCAGCAGGTGCAACTAACACTTTGTTGTATTCTGCACCCGCTAACAGATCTGCAAGCACAGTATTGAATGTTGCTAATGATGGCACAGGATCTGCTTATAGTGTCGGTGTTAAGAGGTACGATCAAGAGCTGACGGTTGATGCCAGCACGTATCTTTTACATGAAGGTGATCTAGTTACAGGATATACTGTTACTGTTGATACTCCATTTGAACCTATTAGTGCAGGATTTAGTTCTGGATTGCAACTTACTAGCGTTGATGCTGAGAAAAAATTTAAGTTTGAATCTTCTATTAGACCAGAATTTGTTGAGTATTTTGTTAAAAGTATTTCAATTCGTCAGGTAGCACTTGAAAGTGTAACTGGTGACGCTTTCAGTATTGGTGATACAATTACTAAAGGTACTGCACCTGCAGATACAACCGCAGTTATTTACGGTATAAATGGTAATACGATTTATATCGGTCCCTCCACCTTTTCTACTGGTGCTGAATTTGCAGAAGGTGACACAATTAGCACTGCTGGTGGATCTGGTGGTACTATTTCTACTGGTGGTTTATTTGCTGCAGCAAACAAGTTTGTTTTTTCTACTACAGTTAGTGGCATTTATGATTTATATCTGACTGCTGCAGGTAATAGTCTGTCACTTTTTAACGATCGTCCATATAGATTTGATGTTTCTGATTCCTCTATGACAGGACATCTTTTCCAACTTTCAACAACTACTAATGGCGAGTGGGGTCCTGATGGTTTATCACCTTCTGATCCAAGTGATACTGGTGATGGTGGTACAGAAAACACCGCAGGTAAAACTACTTCTGGCACAGCAGGTTCTTCTAGTGCATATGTTCAATATGATTTCACTTTAGATACATCTGGCAACAGTCTTTTCTATTGGTATAATGGAGATTTAACAACTGCTACTAACAATACTTATGGTAGTGAGTCTGGTTACCTGACAAACACTGCTACACCTACCTTTACTCAGTTCTTTGTTTATGATGTAGAAGGAACTTGGGTAAATGCTACGGATGCTTTCCTAGTTGGTGGCACAACCTATACCGTAACTGCACAAGATGCTGGTCCTTACGGTTATGTTCGTAGTTACAGCGGCACTACCCTTCAAGTAATTAAAGGTTTATACTCGGCAGACTTTGCTGGTACTGACACTTTCCTTGATGCTCCTTTAAATAGTACTGCAGATAGATCTACTGTTACTGTAAGTTCTGTTGATGTTGCTACAACTGCATTGCAGGCAGGTGAATATATCATTGAAGGTAAAACTAATGCAGCAAATGCTGTAGATAGAACTACATCTCTCGTTATTGGTCCTGGGGAAAGAGTTATTGTTAATAGTGCTACTGGTGATAATACCTTCAGTCTCATTGGATTTGAGGATATCTCAACCGCCCTCACAACTAGACGTTTTGGCGTCTGA

Genome Context

Tertiary structure

PDB ID

e9c2f7658e25013be4a00bc10488d0f217f7cb87088de9f1934c649d5c106332

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,4914

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence