Protein

View in Explore

Genbank accession

UAW01161.1 [GenBank]

Protein name

tail fibers protein

RBP type

Evidence GenBank

Probability 1,00

Evidence RBPdetect

Probability 0,56

Evidence RBPdetect2

Probability 0,93

Protein sequence

MRKAVSSKAPDCQVKKYVGTSFDDVKIVADNIDDVITVADNISKIDDVMPHVGDIAIVANNIDDVETVADNIADVNTLAPIASDITNVSTNIDAVKNTSDNMDAVIDAPNQAAAAKASADAALVSETNAKTSETNAKQSETNASTSEQNAAASAQAAQASASAASASEQAASTSETNAKQSETNAATSASAALASENAAKLSETNAKTSETNAAASALAASNSASAAATSETNAGISETNAKDSEIAAANSEQVATTKAAEASASAIAAKASEDAALQSKNDAELAKLAAQDAQEKSETIYEAFMKGAVYRGAWNPKTQVYPDPQGINSHWDVLLDSGVTYEDFDGKRWYSGDRLIWSEPDQEYFHVNRVAGVLSVNGKTGAVNITADDINAIDSVPATVPDVDALFAQNKHVIDHTNSSVPGLAGQRALLHIQNGQGGFQLTARSVGSEYHVRTANSSDGTIYPWERLYTTGYKPTPADIGAAPDDYSPSWAQVGLVKGTNLYRAVGRTLGSEASDWDTLDSAGIYARLINNTSINGPVGGTGYHYLENFNYGSTGNTTQLAIPYGISGKNGRIALRSRYNNVWNPWEYLYTTENKPTLTELGALGKTEAAVGISNPTNGTTSTDWDSFIPDDMKLTTTSINSPTGNAAHGFFLPHQGGFGTRFGTQFVARDNNYFLRSREDDAWNPWVEIYTSGNKPTAADINAVSKSGDTMTGDLVINTRLRTSTVVNNDNGEQGLLMYAGGTTRLGGSGASSMYFCPNGVSNNSAGDKAMELSKEGFVNFNADSATPLNIYRIGNGINVNMKFQGRNTDGTVIGTPWYAGAYTEGDGFGFGKDPNLAASVNRVLEIAETGVGVRATGGTSGMTIYSDDPAVIFYRNSIGKSGYIGMSGDTDDAFYVRPPSTGTRFKVYHQGNKPRADEVANNEVSLDGLSESLFYPLVFDANNTAGYVCHIDLGVGSGSGSDPYNNNTLVGYARGGGWSDHTDFWDVTVQKYVDSETNIHSMWEGAQNFSGIVIYVRGGQTVKLRSNSHARLYTSDFSLGGSVFKAGVSDPNTSGVVTNGIRLASFGESGRYCSSTASRFYTNEIKILPKEAHGLFKIETPANYDSMIRMSEDSAKHGAFLHYEGSGGNEFRIGTRNNDSDVIAMRIYRGSQSVHVGDELLAKDLNVSLNGGLKLSGRRAIRSTDSSWLRLNDEDAFSSGIYCGSSLLRTDGQITSGSWGGSTKSARVANNFTDSTWGTNGTAGFSVNNPDTASAHWLAASYYNSSNIRAGIQVLSTSEGRMRFYTNRRSKYVEINGGNVVAQGNVTGYSDARVKTDLEVIPNALDKVSQLTGYTYKRTDMDSDERKVGLIAQDVEKVLPEAVVTVDREDLGIDDFKTLDYGNMVALLVEGMKEQQAQIEELKKQIEELKK

Physico‐chemical properties

protein length:	1415 AA
molecular weight:	150749,40300 Da
isoelectric point:	4,89011
aromaticity:	0,07986
hydropathy:	-0,42240

Domains

Domains [InterPro]

DC_0608
ATT
3–222

DC_0608 DC_1814 DC_1985

DC_0268
ATT
213–411

DC_0268 cd19958 DC_1209 IPR030392 Coil

IPR030392
CHP
1314–1410

IPR030392

UAW01161.1

1 1415

Architecture

ATT

STR

RBD

ATT 3-411 | STR 483-753 | RBD 1105-1415

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0608	ATT	DC_0608	3	222	Novel HMM	DC_0608	N-terminal	Low	Positional only	308 proteins / 308 hits
DC_0268	ATT	DC_0268	213	411	Novel HMM	DC_0268	N-terminal	Low	Positional only	23 proteins / 23 hits
DC_1814	STR	DC_1814	483	652	Novel HMM	DC_1814	Central	Low	Positional only	120 proteins / 120 hits
cd19958	STR	DC_0464	509	592	InterPro cluster	cd19958	Central	Low	Positional only	1183 proteins / 1674 hits
DC_1209	STR	DC_1209	612	753	Novel HMM	DC_1209	Central	Low	Positional only	904 proteins / 904 hits
DC_1985	RBD	DC_1985	1105	1415	Novel HMM	DC_1985	C-terminal	Low	Positional only	107 proteins / 107 hits
IPR030392	CHP	DC_0088	1314	1367	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits
IPR030392	CHP	DC_0088	1314	1410	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits
Coil	Unmapped	-	1389	1413	Coils	Coil	-	-	-	-

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Vibrio phage BUCT194 [NCBI]	2859072	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Vibrio alginolyticus [NCBI]	663	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Vibrionales

Coding sequence (CDS)

Genbank protein accession

UAW01161.1 [NCBI]

Genbank nucleotide accession

MZ447858.1 [NCBI]

CDS location

range 48342 -> 52589
strand -

CDS

ATGAGAAAAGCCGTATCCAGTAAAGCACCTGATTGTCAGGTAAAGAAATATGTTGGTACTTCTTTTGATGATGTAAAGATTGTTGCTGACAACATTGATGATGTTATTACGGTAGCAGATAACATTAGTAAGATTGATGATGTAATGCCTCATGTAGGTGACATTGCTATCGTTGCTAATAATATTGATGACGTAGAGACAGTAGCCGATAACATTGCAGACGTTAATACATTGGCTCCTATTGCTTCAGATATTACTAACGTATCCACCAATATTGATGCTGTTAAGAATACTTCAGACAATATGGATGCTGTTATTGATGCACCTAATCAAGCCGCTGCTGCTAAAGCTTCTGCTGATGCTGCACTTGTATCTGAGACAAACGCTAAAACATCTGAAACCAACGCAAAGCAAAGTGAGACTAATGCCTCAACATCAGAACAGAACGCTGCTGCGTCGGCGCAAGCTGCACAAGCGTCAGCGAGTGCTGCGTCAGCGTCAGAGCAAGCAGCAAGTACTTCAGAAACAAACGCAAAACAATCAGAAACTAACGCAGCAACCAGTGCCTCTGCTGCCTTGGCTTCCGAAAACGCTGCCAAACTTAGCGAGACAAATGCTAAAACCTCTGAGACTAATGCAGCCGCTTCAGCGTTAGCTGCTAGTAACAGTGCAAGTGCTGCTGCCACTTCTGAAACCAATGCGGGTATTTCAGAGACTAATGCTAAAGATAGTGAAATTGCTGCTGCTAACTCAGAACAAGTAGCAACCACTAAAGCTGCTGAAGCTAGTGCAAGTGCTATTGCTGCAAAGGCTAGTGAGGATGCTGCATTACAGTCTAAGAATGATGCTGAGCTTGCTAAGTTAGCTGCACAAGATGCTCAAGAGAAATCAGAAACCATTTATGAAGCATTCATGAAAGGTGCTGTTTATCGTGGTGCATGGAACCCTAAGACTCAAGTATATCCTGACCCTCAAGGTATTAACTCCCACTGGGATGTATTGTTGGATTCAGGTGTCACTTATGAAGACTTCGACGGTAAACGTTGGTATTCAGGTGACCGTTTGATTTGGTCTGAACCTGACCAAGAATACTTTCATGTTAATCGTGTAGCAGGTGTACTTTCTGTTAATGGTAAGACTGGTGCTGTAAACATTACTGCTGATGACATTAATGCTATTGATAGTGTTCCAGCTACTGTTCCTGATGTGGATGCATTATTTGCACAAAACAAACATGTAATTGACCACACTAACTCTTCAGTTCCGGGATTAGCAGGTCAACGTGCATTGCTACATATTCAGAATGGTCAAGGTGGTTTCCAATTAACTGCTAGAAGTGTTGGTTCTGAGTACCATGTAAGAACTGCTAACTCTAGTGACGGTACTATTTACCCTTGGGAACGTTTATATACTACAGGTTATAAGCCTACTCCTGCGGATATTGGCGCTGCACCTGATGATTACTCACCATCTTGGGCACAGGTTGGATTGGTTAAGGGTACTAATCTATACCGTGCAGTGGGTAGAACTTTAGGAAGTGAAGCATCCGATTGGGATACTTTAGACTCAGCAGGTATCTACGCACGTTTAATTAATAACACTTCTATCAATGGTCCGGTAGGTGGTACTGGTTACCATTACCTAGAGAACTTCAATTATGGTTCTACTGGTAATACTACTCAGTTAGCTATTCCATATGGTATCTCTGGTAAGAATGGTCGTATTGCTTTACGTTCACGCTACAACAATGTGTGGAACCCTTGGGAGTATTTATACACTACCGAGAATAAACCAACCCTTACTGAATTAGGTGCGTTAGGTAAAACTGAAGCTGCTGTAGGTATTAGTAATCCTACTAACGGTACTACCTCTACTGACTGGGATAGTTTTATTCCTGATGATATGAAGTTAACCACTACTTCAATCAATTCACCTACAGGTAATGCAGCTCATGGTTTCTTCCTACCTCATCAAGGTGGATTTGGTACTCGTTTTGGTACTCAGTTTGTAGCCCGTGATAACAACTACTTCTTAAGAAGTCGTGAAGATGATGCATGGAATCCTTGGGTAGAAATCTACACTAGCGGTAACAAACCAACTGCTGCTGATATCAATGCAGTAAGCAAGTCTGGTGACACCATGACTGGTGACCTAGTAATTAATACCAGACTGCGAACTAGCACTGTTGTTAATAATGATAATGGTGAACAAGGCTTATTAATGTATGCGGGTGGTACTACTCGTTTAGGTGGTTCTGGTGCTTCCAGCATGTACTTCTGTCCAAATGGTGTATCTAATAATAGTGCTGGCGATAAAGCTATGGAGTTGTCTAAAGAAGGTTTTGTAAACTTTAATGCTGACTCCGCTACTCCATTAAATATTTACCGTATCGGTAATGGCATCAATGTAAACATGAAATTCCAAGGTAGAAATACCGATGGAACTGTTATCGGTACTCCATGGTATGCAGGTGCTTATACTGAAGGTGATGGTTTTGGTTTTGGTAAAGACCCTAACTTAGCTGCTTCTGTTAATCGTGTTCTTGAGATTGCTGAAACAGGTGTAGGAGTTAGAGCTACTGGCGGTACATCAGGTATGACTATTTATAGTGATGACCCCGCTGTAATTTTCTATAGAAATAGTATTGGTAAATCTGGTTACATCGGTATGTCCGGTGATACTGATGATGCATTTTATGTACGTCCACCATCAACAGGTACTCGCTTTAAGGTTTACCATCAAGGTAATAAACCAAGAGCAGATGAAGTAGCAAATAATGAAGTTAGTTTAGATGGTTTAAGTGAGTCTTTATTTTATCCATTAGTGTTTGATGCTAATAACACTGCCGGCTATGTCTGCCATATTGATTTGGGTGTTGGCTCAGGTTCAGGTAGTGACCCATATAATAACAATACTCTAGTAGGTTATGCACGTGGGGGTGGTTGGTCTGACCATACAGATTTCTGGGATGTCACTGTACAAAAGTATGTAGATAGCGAAACCAACATCCACTCTATGTGGGAAGGTGCTCAAAACTTTAGTGGTATTGTTATTTATGTACGTGGTGGGCAAACAGTTAAATTACGTAGTAACTCTCACGCTAGACTTTACACTAGTGATTTTAGTCTTGGGGGTTCCGTCTTTAAAGCAGGAGTATCTGACCCTAATACTAGTGGTGTAGTTACTAATGGTATTAGATTAGCTAGTTTCGGTGAGTCTGGTCGTTATTGTTCTTCTACGGCTTCTAGATTCTATACAAACGAAATTAAGATTTTACCTAAAGAAGCCCACGGGTTATTTAAGATTGAAACCCCAGCTAACTATGATTCTATGATTCGAATGTCGGAAGACAGCGCAAAACATGGTGCTTTCCTTCATTATGAAGGCTCAGGAGGTAATGAATTCCGTATTGGTACACGAAACAATGATTCAGATGTCATTGCAATGCGTATCTATCGTGGCTCTCAAAGTGTCCATGTTGGGGATGAATTACTAGCTAAAGATTTAAACGTATCCTTGAATGGTGGTTTAAAACTTAGCGGAAGAAGAGCAATTCGTTCTACTGATTCTAGTTGGTTACGTCTTAATGATGAAGATGCATTCTCTTCTGGTATCTACTGTGGTAGTTCATTGCTACGTACTGATGGACAGATTACCTCTGGTTCATGGGGTGGTTCTACTAAATCTGCAAGAGTAGCTAATAACTTTACAGACTCTACTTGGGGAACCAATGGTACTGCTGGTTTTTCTGTAAATAACCCTGACACTGCAAGTGCTCACTGGTTGGCTGCTTCTTATTACAATAGTTCAAATATTCGTGCAGGTATTCAAGTCCTGTCTACCTCTGAAGGTCGTATGCGTTTCTACACTAACCGTAGAAGTAAGTACGTAGAAATCAATGGTGGTAATGTAGTAGCCCAAGGTAACGTAACCGGTTATTCAGATGCTCGTGTTAAAACTGATTTAGAGGTTATTCCTAATGCTCTGGATAAAGTTAGTCAGTTAACTGGTTACACTTACAAACGTACTGATATGGATTCAGATGAACGTAAAGTTGGTTTGATTGCTCAGGACGTTGAGAAAGTACTACCAGAAGCAGTTGTTACTGTTGACCGTGAAGACTTAGGTATTGATGACTTTAAGACTCTTGATTACGGTAATATGGTTGCTCTACTTGTAGAGGGTATGAAAGAACAACAAGCTCAAATCGAAGAGTTGAAGAAACAAATTGAGGAGCTTAAGAAATGA

Genome Context

Tertiary structure

PDB ID

a8e912c142e6162a52764a64d38bcd4278a8327b6ced26e56fd063702d8586de

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,5201

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence