Protein

View in Explore

Genbank accession

QLF88242.1 [GenBank]

Protein name

tail fiber

RBP type

Evidence GenBank

Probability 1,00

Evidence RBPdetect

Probability 0,89

Protein sequence

MTISSTTVKNSYSGNGTLDTFNYTFKVFADADIQVIIRDATATETVKTLTTHYTVTGAGSASGGTIVFTAGNIPSATETVVIRRASPQTQAIDYIANDPFPAESHEEGLDRSMMAIQQLQEEIDRSIKLSRTNTMTSTEFAVGSTDRAGKIFGFDDNGELVVSQELGTFKGDWSASTTYAARDIVKDTSTNNIFLCNTGHTSSGVEPLTTNTDSAKWDLLVDAASATTSQNAAAASAAAALVSENNASTSESNALSYKNDAETAKTAAELAETNAETAQTAAEVAQAAAEAALDTFDDSFLGAKTSDPTVDNDGNALIDGALYFNTTVDLMKVYNLANTTWYQLALTGSNQTNVNTVAADLSGSDTIGTVATNIANVNTTATNIANINTTAGIDTEITNVSGISSAISAVNSNSSNINAVNANSTNINLLAANNTNITNVGGSINNVNTVATNLSDVNSFAETYRISSSAPTTSLDIGDLYFDTTADELKVYKSSGWSAAGSSVNGTSARYTYTISGTPSSVSGADDNSATLAYDAGFADVFVNGVRMSSADITITSGTSVVFASPLTDGDVVDIVAYGTFNVAAIDASNITSGTLNTSRIADASITNAKLATPFSLTLPTISSISPDTIDNAEATITITGSNFTSVPQVEFLNPSTGIWYTASTVTFNNSTSLTVTVTLTVDAQYKIRVENPDGLAILSGTILTVSDAPTWNTAAGDLGTFAGDFSGTLATLSATSDSAITYSEVGSNLTTANVTLNTSTGALTTTDFGGTSTTATTYNFTIRATDAENQTADRSFSLTSSFGATGGGQFN

Physico‐chemical properties

protein length:	812 AA
molecular weight:	83789,92930 Da
isoelectric point:	4,05003
aromaticity:	0,06897
hydropathy:	-0,07143

Domains

Domains [InterPro]

DC_0055
ATT
8–137

DC_0055 DC_2093 IPR013783

Coil
Unmapped
102–122

Coil DC_0841

IPR014756
STR
619–699

IPR014756

QLF88242.1

1 812

Architecture

ATT

STR

ATT 8-137 | STR 149-812

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0055	ATT	DC_0055	8	137	Novel HMM	DC_0055	N-terminal	Low	Positional only	56 proteins / 56 hits
Coil	Unmapped	-	102	122	Coils	Coil	-	-	-	-
DC_2093	STR	DC_2093	149	403	Novel HMM	DC_2093	Central	Low	Positional only	75 proteins / 75 hits
DC_0841	STR	DC_0841	394	812	Novel HMM	DC_0841	Central	Low	Positional only	60 proteins / 60 hits
IPR013783	STR	IPR013783	618	700	Merged direct domain	Immunoglobulin-like fold	Central	Low	Positional only	144 proteins / 144 hits
IPR014756	STR	IPR014756	619	699	Merged direct domain	Immunoglobulin E-set	Central	Low	Positional only	3 proteins / 3 hits

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Pelagibacter phage Greip EXVC021P [NCBI]	2736229	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Candidatus Pelagibacter ubique HTCC1062 [NCBI]	335992	Bacteria > Proteobacteria > Alphaproteobacteria > Pelagibacterales > Pelagibacteraceae > Candidatus Pelagibacter

Coding sequence (CDS)

Genbank protein accession

QLF88242.1 [NCBI]

Genbank nucleotide accession

MT375525.1 [NCBI]

CDS location

range 3303 -> 5741
strand -

CDS

ATGACAATATCATCGACAACAGTAAAGAACTCCTACTCTGGTAATGGTACACTAGATACTTTCAACTATACTTTTAAAGTTTTTGCAGACGCAGATATTCAAGTTATTATTAGAGATGCAACAGCAACTGAAACAGTTAAGACATTAACTACTCACTACACAGTTACAGGTGCAGGTTCTGCTTCTGGTGGAACTATTGTATTCACAGCAGGTAACATTCCAAGTGCTACAGAAACTGTTGTTATAAGAAGAGCATCACCACAAACACAAGCAATCGATTATATTGCAAACGATCCATTCCCTGCTGAATCTCACGAAGAAGGATTAGACAGATCTATGATGGCAATTCAACAGTTGCAAGAAGAAATAGATAGATCAATTAAATTATCAAGAACAAACACAATGACTTCAACCGAGTTTGCTGTAGGTTCAACTGATAGAGCTGGTAAAATTTTTGGATTTGATGACAATGGTGAATTAGTTGTATCGCAAGAACTAGGAACTTTTAAAGGTGATTGGTCTGCATCAACTACTTATGCTGCTAGAGATATTGTAAAAGACACATCAACAAATAATATATTTTTATGTAATACTGGTCACACATCATCTGGTGTTGAACCTCTAACAACTAATACAGATAGTGCTAAATGGGATTTATTGGTAGACGCAGCTAGTGCTACAACTTCTCAAAATGCAGCAGCAGCTAGTGCAGCAGCAGCTTTAGTATCAGAAAACAATGCTTCTACTTCAGAAAGCAATGCTTTAAGTTACAAGAATGATGCAGAAACTGCAAAGACAGCAGCAGAATTAGCAGAAACAAATGCCGAAACTGCACAGACAGCAGCAGAGGTTGCTCAAGCAGCAGCAGAAGCTGCATTAGATACTTTTGACGATAGTTTTTTAGGTGCAAAAACTAGTGATCCAACAGTTGATAATGATGGCAACGCATTAATAGATGGAGCATTATATTTTAATACAACAGTTGACTTAATGAAAGTTTACAATCTAGCTAATACTACTTGGTATCAATTAGCTTTAACTGGAAGTAATCAAACTAATGTAAATACTGTAGCTGCAGACTTATCTGGATCAGACACAATAGGAACTGTGGCAACTAACATTGCTAATGTAAACACAACTGCAACTAACATTGCGAACATAAACACAACTGCAGGAATAGATACTGAAATTACAAATGTGTCTGGAATAAGTTCTGCAATATCTGCTGTTAATTCAAATTCAAGCAACATAAATGCAGTTAATGCAAACAGTACAAATATAAATTTATTAGCAGCTAATAATACTAATATTACAAATGTAGGTGGTTCAATAAATAATGTTAATACAGTTGCAACTAATTTATCTGATGTAAATAGTTTTGCAGAAACTTATAGAATTTCATCTTCTGCTCCAACAACTTCTTTAGATATTGGAGATTTATATTTTGATACTACTGCTGATGAATTAAAAGTTTATAAATCTTCTGGATGGAGTGCAGCAGGTTCAAGTGTTAATGGAACTTCTGCTAGATACACTTACACAATTTCTGGTACACCTAGTTCAGTATCTGGTGCAGATGACAATAGTGCAACACTTGCGTATGACGCAGGATTCGCAGATGTGTTTGTTAATGGAGTTAGAATGTCTAGTGCAGATATTACAATTACATCTGGTACTTCAGTTGTCTTTGCTTCACCTTTAACAGATGGAGATGTAGTTGACATTGTTGCTTATGGAACATTTAATGTTGCAGCTATTGATGCTTCTAATATAACAAGTGGAACTTTAAATACTTCTAGAATTGCAGATGCTTCAATTACTAATGCTAAACTTGCAACACCTTTTAGTTTAACATTACCAACTATTAGTTCTATCTCGCCAGACACAATAGATAATGCAGAAGCAACTATTACAATAACAGGTTCAAACTTTACATCAGTTCCTCAAGTAGAATTTTTAAATCCTTCTACTGGTATTTGGTACACAGCTAGTACAGTTACATTTAATAACTCAACATCATTAACAGTTACAGTTACTTTAACAGTTGATGCTCAATATAAAATTAGAGTTGAGAATCCAGATGGATTAGCAATATTGTCTGGAACAATTCTTACAGTTTCAGATGCTCCAACTTGGAATACTGCTGCTGGAGATTTAGGAACTTTTGCAGGAGATTTCTCTGGAACACTTGCAACACTTTCAGCTACATCAGATAGTGCAATAACTTATTCAGAAGTAGGAAGTAATCTTACAACAGCTAATGTTACTTTAAATACTTCAACAGGTGCTTTGACTACAACAGACTTTGGTGGTACAAGCACAACAGCAACAACATACAACTTTACTATAAGAGCAACAGATGCAGAAAACCAAACAGCAGACAGAAGTTTTAGTTTGACATCATCATTTGGTGCAACAGGTGGGGGACAATTTAACTAA

Genome Context

Tertiary structure

PDB ID

001f320de389a69679fe6a152940039c6fbefb8dff519642a7b426b101ae6190

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,7754

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence