Protein

View in Explore

Genbank accession

CAH0448123.1 [GenBank]

Protein name

tail fiber protein

RBP type

Evidence GenBank

Probability 1,00

Evidence RBPdetect2

Probability 0,53

Protein sequence

MAIIRKALIKFYLTKAEAATANETPGDIGYFSDGAPAGWFEASIDNGNPAVDGNTLQGSESNLYWKRIVNAETEAPTPVLVPDAYAEGTAYQQYQIVESGGKLYVCDSAHTPTAAEVTSLAKVTELGTGAAGIADVVAVEYKATETYKAFELVYIGTDIFVTSSAHTADADNVTNKDQLIQLNGGGGSLDEVVAKEYVAATLYKAYELVRIGSEIFISGSEHTPTAGEVADKSKLIPISEDKDTGPGVHTSVANETDYRKGDVFKLANGIFMLKVDFTTDANATDAEVIAQCEKLAGPEASVRTSFTNSTDYFKGDFFIFDSGTYRVKADFQTDANATEAEIIAACDKLSGPTQKTYAGFPASTAFSIGDIVTEDDRSYVVKTAFSTGASDNTVTDQETNLLPLFAEHLVPRVYSNGAVLKENEIFEYGGNLYFTPNSVDGTSTNQTTWAEIESSCILVAQVPVTATPDFVAANTYNANDVVKFDGLEWKLTGTHTVNDPIDLTNWSRVITTGVNRGEHKTNHVYLKDDIVTRSGIAYKANANVDDTVSFAEGLSGATFIRLDTAVFDGLSNSKVYIVGDIVSAGTASYAVHTAYKSAAAATEAELAANSTLIATSIETYLPTYTNGSALKNGQLFFYDEAVYRADADKDGTTASETTWAEIEGEMTFLFSFKVEPAPAAWAKANAYAVGDKATYAGQVVVATAASAANDEFSYSDWTRELDYPYNQGDHVNGRAYMKGDVVFIDSVEYIARSNVDSDAGASEIKLGVSSDFYRLTPTTHSDLVADTLYSNFDIVIKEGITYLVTTPILTTSSTTWNDLVANMTVVADNSAYAVREYVAEEDLKKYEFVVEPATGDVYVTTSAIAGNAGNTFQIVKDNGVRVAESPVTPVPDFDAGELYTENDEVRFESMVYTAKDQTGRLVNDAFSLTYFERNIPAGFKFGDFVANKLYLNGDFVTNGGIEYKVKATGTFATLTETNTTFERTSTIFKFTLEAAKRYIPGDLLYLTSGAYYVRNEFTTNNPADIDDHAADIYVIAEKDHPPVEEYVPTQDGEEFKLIVHNEGLYFIKTAWTADVSNADSANWTNDTFDKIKGNLVELVPQKNPTPIAFVQADTYQEDDYVSHDGFNWHRNDSTTRKGGDAFSLDHFNREEAGGQNRGTFTSGQHYLSGDKVFDNGIEYRANTLINYGDVTVFVEGLGLQEFVRITPIVHQGFAPDTLYIRGDWVIEDGVTYYVQPVTFFESGAAETLAEFEARNEVEVIADHRILNPREYVAKDNAEQGEIIQYQGSVYYVTTAWVSDTTDADAANHVNHEWDAVKDKVVALYQTPAPVLPVFDAATAYNANDEVQDKYGLVWTRRNVADGTAQPLTETHWTRNDADPQIFEHIPDREYTYLPNDKIKYGTSYFHFNLANDLASADIDEWATWLEANTRIEPTGEIKIVAGNGSLTGLEYVAPGQLVSFLTDGTLNGLQGKQGETYVITSTMRSTTLNKAYFVKIAEKAKLATAFDATATYATGDLVTIAEDSFTYELTGTHNVNDAFNLTNWSRVEPAQHRGAHSDAVYYITGDKVTNAGKEYEALGPISKTAFAEGIAGNTFKRVTQNVAASLTADMFYVEGDIFNLNGYDLEVTAAFQADADPTFAENIANMQAINVDEKYYLAAADGVAFHDYNKKEHVFIFTEDRSTELFNGFTPMTGDRMVLKRDRTATNNPPIAADFDIFLAKQIEDAIEPHDDGTAYLTGDKVTYQGFVWTSTEAQSALVWDFTKWTRDLPGGEHRGTFSNAVHYRTGDTVTHPDDGALYAINSNVDSVAAFNIGSLAAEWTRVGPGIFTDASVVAWNTQFFKGDRLYFGKQYRTVTEDFAIGADPADGSVPELDETKLRIEGRWDRSNVRTVTADESVSAEEVVRYGNKLYFVFADYVPSDPVVAAELEAKIYELVNFESTQHEAYDAAKIYAEGDIVSYQDEIFQRTNDTIGDAGNFTAARWTKLSEKSVRTAGVLADMNDWYVGVDDIVHYQGITLTAKVARGVDELKIPFDDTKFDRAGNFVFNTAFSYLGRRALIKGDFIIDGRNMYFVTAAFEVLDGESWDNALRTHQSSFRLVGDYELLDWQADTFYRTGDLVKVQGYEMVVVANHTSASAWNTGELLKFVLRDQPTYGFTMEATDFIPAGTKFDTNGDDDSSTALPFTITGTVPLANINLLLQVGFRFFVNKTDITDAIVVDGSDATLFDMGSIFLEAGDVLEIAGYQNGEGTSIAEVVQGGYADLTVTPTTANVSLTDANKGQVIDITAAITVTAAGGTTGSTWTVVNRSGGQLAVTLGTGITAIGNVNVQDGTAITLVMLDATTVLIAGGVA

Physico‐chemical properties

protein length:	2351 AA
molecular weight:	256541,84290 Da
isoelectric point:	4,42738
aromaticity:	0,11272
hydropathy:	-0,22761

Domains

Domains [InterPro]

DC_1986
ATT
48–179

DC_1986 G3DSA:2.10.10.90 G3DSA:2.10.10.90 DC_1986 DC_1986

CAH0448123.1

1 2351

Architecture

ATT

STR

ATT

ATT 48-179 | STR 468-552 | STR 679-765 | ATT 1768-1868 | ATT 1885-2021 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_1986	ATT	DC_1986	48	179	Novel HMM	DC_1986	N-terminal	Low	Positional only	693 proteins / 693 hits
G3DSA:2.10.10.90	STR	G3DSA:2.10.10.90	468	552	Merged direct domain	G3DSA:2.10.10.90	Central	Low	Positional only	29 proteins / 29 hits
G3DSA:2.10.10.90	STR	G3DSA:2.10.10.90	679	765	Merged direct domain	G3DSA:2.10.10.90	Central	Low	Positional only	29 proteins / 29 hits
DC_1986	ATT	DC_1986	1768	1868	Novel HMM	DC_1986	N-terminal	Low	Positional only	693 proteins / 693 hits
DC_1986	ATT	DC_1986	1885	2021	Novel HMM	DC_1986	N-terminal	Low	Positional only	693 proteins / 693 hits

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Vibrio phage vB_VpaM_sm033 [NCBI]	2893233	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	No host information

Coding sequence (CDS)

Genbank protein accession

CAH0448123.1 [NCBI]

Genbank nucleotide accession

OV032902.1 [NCBI]

CDS location

range 281883 -> 288938
strand +

CDS

ATGGCTATTATTAGAAAAGCTCTCATTAAGTTTTATTTGACTAAAGCTGAAGCAGCGACTGCAAATGAAACTCCGGGCGACATCGGTTACTTTAGTGACGGTGCCCCTGCCGGTTGGTTTGAAGCCTCAATCGATAATGGAAATCCTGCTGTCGATGGTAATACGCTACAAGGTAGTGAATCTAACCTTTACTGGAAGCGTATCGTTAATGCGGAAACTGAAGCTCCTACTCCGGTTCTTGTTCCAGATGCTTATGCGGAAGGTACTGCTTATCAACAATACCAAATCGTTGAGTCTGGTGGCAAGCTGTACGTTTGTGATTCTGCTCACACGCCAACCGCTGCTGAAGTAACTAGCCTTGCTAAGGTTACTGAACTTGGCACGGGCGCAGCTGGTATTGCTGATGTAGTCGCTGTGGAATACAAAGCCACCGAAACATACAAAGCATTTGAGCTTGTTTACATCGGCACGGATATCTTTGTTACTTCTTCTGCGCATACTGCCGATGCAGATAACGTAACCAACAAAGACCAGCTTATCCAGCTTAATGGCGGTGGCGGTTCTTTGGATGAAGTAGTTGCAAAAGAATACGTAGCTGCTACGCTATACAAGGCATATGAACTAGTGCGTATTGGTAGCGAAATCTTTATCTCTGGTTCAGAACACACGCCAACCGCTGGCGAAGTAGCTGACAAGTCTAAGCTTATCCCAATAAGTGAAGATAAAGATACTGGCCCTGGTGTTCATACATCAGTGGCTAACGAAACTGATTACCGTAAAGGCGATGTTTTCAAACTAGCTAACGGTATCTTCATGCTTAAGGTTGACTTCACTACTGATGCAAATGCTACTGATGCAGAAGTAATCGCACAGTGTGAAAAGCTAGCTGGTCCTGAAGCTTCTGTTCGTACTTCGTTTACCAATAGTACTGATTACTTCAAAGGCGATTTCTTTATCTTTGATTCTGGTACTTACCGTGTTAAAGCTGACTTCCAGACCGATGCAAATGCTACTGAAGCAGAAATTATTGCAGCGTGTGATAAGCTTTCTGGCCCTACTCAGAAAACTTATGCAGGCTTCCCTGCATCAACTGCATTCAGTATCGGCGATATTGTTACTGAAGATGACCGCAGCTATGTAGTTAAAACGGCGTTTAGTACTGGCGCGTCAGACAACACGGTCACTGATCAAGAAACTAACCTTCTACCTTTGTTCGCAGAGCATTTGGTTCCACGTGTGTATAGTAATGGCGCAGTACTTAAAGAAAACGAAATCTTTGAGTATGGCGGTAACCTTTACTTTACTCCTAACTCGGTTGACGGTACGTCTACTAACCAAACAACTTGGGCGGAAATTGAATCAAGCTGCATCCTAGTTGCTCAGGTTCCAGTAACCGCAACTCCTGATTTCGTAGCAGCTAACACATACAACGCCAATGATGTTGTTAAATTCGACGGACTAGAATGGAAGCTTACTGGTACGCACACTGTCAATGATCCTATTGACTTGACTAACTGGTCTCGTGTTATCACAACAGGCGTTAACCGTGGTGAGCACAAAACAAACCATGTTTACTTGAAAGACGACATCGTCACAAGGAGCGGCATTGCTTATAAGGCAAACGCTAATGTGGACGACACCGTTAGTTTCGCCGAAGGATTATCAGGCGCGACCTTTATTCGCCTAGACACAGCAGTGTTCGATGGACTGTCTAATTCCAAGGTTTATATAGTAGGCGATATCGTTTCAGCCGGTACGGCATCGTATGCAGTACACACTGCTTACAAGTCTGCTGCCGCTGCTACTGAAGCAGAGCTAGCTGCTAACTCTACATTGATTGCAACCAGTATCGAAACTTACTTGCCTACATACACAAACGGTAGTGCATTGAAGAATGGTCAATTGTTCTTCTATGATGAAGCTGTTTATCGCGCAGACGCGGATAAAGATGGTACAACTGCTAGCGAAACCACATGGGCTGAAATCGAAGGCGAAATGACGTTCTTGTTTAGCTTTAAGGTTGAACCGGCTCCTGCTGCATGGGCTAAGGCTAACGCTTATGCTGTTGGCGATAAAGCCACTTATGCTGGTCAGGTTGTAGTTGCTACTGCTGCATCTGCTGCTAACGACGAGTTCTCGTATAGTGATTGGACCCGTGAATTGGATTATCCTTACAATCAGGGCGATCACGTAAACGGCCGTGCTTACATGAAGGGCGACGTAGTCTTTATTGATAGTGTTGAGTACATTGCACGCTCTAATGTTGATTCTGATGCCGGTGCTTCCGAAATCAAACTAGGCGTGTCTTCTGACTTCTATCGTTTGACTCCGACCACTCATAGTGATCTAGTTGCAGACACTTTATACTCTAACTTTGATATCGTTATCAAAGAAGGCATTACGTATCTTGTAACGACTCCTATTCTTACAACTAGCTCTACAACCTGGAATGACCTTGTAGCGAACATGACTGTGGTTGCAGATAACTCTGCGTATGCGGTTCGTGAATACGTTGCAGAAGAAGACCTGAAGAAGTACGAGTTTGTCGTAGAGCCCGCAACAGGTGACGTTTACGTTACAACTAGTGCTATTGCCGGCAACGCAGGTAACACATTCCAAATCGTTAAAGACAACGGCGTTCGCGTAGCTGAATCTCCAGTTACTCCTGTTCCTGACTTTGACGCTGGTGAGCTATATACAGAGAACGACGAAGTTCGTTTCGAAAGTATGGTGTACACAGCTAAAGACCAAACAGGTCGTTTAGTAAACGATGCATTTAGCCTTACTTACTTTGAGCGTAACATTCCTGCCGGATTTAAGTTCGGTGACTTCGTAGCCAACAAGTTATACCTAAACGGTGACTTTGTTACAAATGGCGGCATAGAATACAAAGTTAAAGCAACTGGTACTTTTGCCACGTTAACTGAAACTAATACTACGTTTGAGCGTACAAGTACAATCTTCAAGTTTACCCTGGAAGCAGCGAAGCGTTACATCCCAGGTGACTTGCTTTACTTGACGAGCGGTGCTTACTACGTGCGTAACGAGTTTACGACTAACAACCCTGCTGATATTGATGACCACGCAGCCGACATTTATGTCATTGCTGAGAAAGATCATCCTCCAGTAGAAGAGTATGTTCCTACTCAAGATGGCGAAGAGTTCAAGTTGATCGTTCATAATGAAGGTCTTTACTTCATTAAGACGGCCTGGACTGCTGATGTATCTAACGCAGATAGTGCTAACTGGACCAATGATACTTTTGACAAGATCAAAGGCAACCTAGTTGAACTTGTTCCTCAGAAGAATCCTACTCCAATTGCGTTTGTTCAGGCTGATACATACCAAGAAGACGATTATGTTTCACATGATGGTTTTAATTGGCATCGTAATGACTCTACGACTCGTAAGGGTGGTGACGCATTCAGTCTAGATCACTTCAATCGTGAAGAAGCTGGTGGTCAAAATCGTGGTACATTTACTTCCGGTCAACACTACTTATCTGGCGATAAAGTGTTCGACAACGGAATTGAATATCGTGCTAATACATTGATCAACTACGGCGATGTAACGGTATTCGTTGAAGGTCTGGGCTTACAAGAGTTTGTTCGTATTACTCCAATCGTTCATCAAGGCTTTGCACCAGATACACTTTACATTCGTGGTGACTGGGTAATTGAAGACGGCGTTACATACTACGTGCAACCTGTGACTTTCTTTGAGTCTGGCGCAGCTGAAACACTGGCTGAATTTGAAGCACGTAATGAGGTAGAAGTGATTGCGGACCACCGCATCCTTAATCCTCGTGAGTACGTTGCCAAAGATAATGCCGAGCAAGGCGAGATCATTCAGTACCAAGGTTCCGTTTACTACGTTACTACGGCGTGGGTTTCAGATACTACGGATGCTGATGCGGCTAACCATGTTAACCATGAATGGGATGCAGTTAAGGATAAAGTCGTTGCGCTTTACCAAACACCTGCCCCAGTACTTCCGGTATTTGATGCAGCCACTGCATACAATGCCAATGACGAAGTTCAGGATAAATATGGTTTAGTTTGGACTCGTCGTAATGTTGCAGACGGAACAGCACAACCATTGACTGAAACTCACTGGACGCGTAATGATGCTGACCCGCAGATCTTCGAACATATTCCTGATCGCGAGTACACATACCTGCCTAACGACAAGATTAAATACGGAACATCTTACTTCCACTTTAATCTAGCCAATGACCTTGCTTCGGCGGATATTGATGAATGGGCTACGTGGCTAGAAGCTAACACTCGAATCGAACCTACCGGCGAGATTAAGATTGTGGCTGGCAACGGGAGTCTGACCGGACTTGAGTATGTTGCACCTGGTCAACTAGTAAGCTTCCTAACGGACGGCACGCTTAATGGCCTTCAAGGCAAGCAAGGCGAAACATACGTTATTACGTCTACGATGCGTTCTACCACTCTTAACAAGGCATACTTTGTTAAGATTGCTGAGAAAGCTAAACTGGCAACTGCATTTGATGCTACGGCGACATATGCAACTGGTGACTTAGTTACTATTGCCGAAGATAGCTTTACTTATGAGCTAACCGGTACGCACAATGTTAACGATGCGTTTAACTTGACTAACTGGTCTCGTGTAGAACCAGCACAGCACCGTGGTGCACATAGCGATGCAGTTTACTATATCACCGGTGATAAGGTTACTAATGCTGGCAAAGAGTACGAAGCTCTTGGTCCTATTAGTAAGACAGCTTTTGCTGAAGGCATTGCAGGTAATACATTCAAGCGTGTTACTCAAAACGTTGCTGCTTCTTTAACGGCTGACATGTTCTATGTTGAAGGCGATATCTTTAACTTGAATGGTTATGACCTAGAAGTAACTGCTGCGTTCCAAGCTGATGCTGACCCAACGTTCGCTGAGAACATTGCTAACATGCAGGCAATCAACGTAGATGAGAAATACTACTTGGCTGCTGCTGACGGCGTAGCGTTCCATGACTACAACAAGAAAGAGCATGTGTTTATCTTCACCGAAGATCGCTCGACTGAGTTGTTTAATGGTTTCACACCTATGACTGGCGACCGCATGGTTCTTAAGCGCGACCGTACGGCTACGAACAACCCTCCAATAGCGGCTGACTTTGATATCTTCCTAGCGAAGCAAATCGAAGATGCTATTGAGCCGCATGATGATGGCACTGCTTACTTGACTGGCGACAAAGTAACTTACCAAGGTTTTGTTTGGACTTCTACTGAAGCTCAATCGGCTCTTGTTTGGGACTTTACTAAGTGGACTCGTGACCTGCCTGGTGGTGAACATCGCGGTACGTTCAGCAATGCTGTACACTACCGTACAGGCGACACCGTAACCCATCCTGATGATGGTGCTTTGTATGCAATCAATTCTAACGTTGATAGCGTAGCTGCATTTAACATCGGCTCACTTGCGGCAGAATGGACGCGTGTTGGTCCTGGTATCTTCACGGATGCCTCGGTCGTGGCATGGAATACTCAGTTCTTTAAAGGCGATCGTCTATACTTCGGTAAGCAGTACCGTACTGTAACAGAAGACTTTGCGATTGGTGCTGACCCTGCCGATGGCTCTGTTCCTGAACTGGATGAAACCAAGCTTCGCATCGAAGGTCGTTGGGACCGCTCTAACGTTCGTACTGTTACGGCAGACGAGTCTGTTAGTGCAGAAGAAGTTGTTCGCTACGGCAACAAACTTTACTTTGTGTTTGCTGACTATGTGCCAAGTGACCCTGTGGTTGCTGCCGAGCTAGAAGCGAAGATTTACGAACTCGTAAACTTTGAGTCCACTCAGCACGAAGCATACGATGCTGCCAAGATATATGCCGAAGGCGATATCGTTTCTTATCAAGACGAAATCTTCCAGCGTACTAATGATACCATTGGTGATGCAGGTAACTTTACTGCTGCTCGCTGGACTAAGTTGTCTGAGAAGAGTGTACGTACTGCTGGTGTTCTAGCAGACATGAATGACTGGTATGTTGGTGTTGATGACATAGTTCACTATCAAGGCATTACACTTACCGCTAAGGTAGCTCGCGGTGTTGATGAACTCAAGATTCCTTTCGATGATACTAAGTTCGATCGTGCTGGTAACTTTGTGTTTAATACGGCATTCTCTTACCTTGGCAGACGCGCTCTAATCAAAGGTGACTTTATCATTGACGGTCGTAACATGTATTTTGTTACAGCTGCTTTTGAGGTCCTTGATGGCGAGTCTTGGGATAATGCTCTTCGTACACATCAATCTAGCTTCCGCTTAGTCGGTGACTATGAGTTACTTGATTGGCAAGCAGATACTTTCTATCGTACTGGTGACCTTGTTAAAGTACAGGGTTATGAGATGGTAGTAGTTGCTAACCATACTTCAGCTTCTGCTTGGAATACTGGTGAGCTTCTTAAGTTTGTGTTGCGTGATCAGCCTACTTACGGCTTTACGATGGAAGCTACTGACTTCATCCCGGCTGGAACTAAGTTTGATACTAACGGTGATGATGACTCAAGCACAGCACTGCCGTTTACTATTACTGGCACGGTTCCTTTGGCAAACATAAATCTGTTACTTCAAGTCGGTTTCCGCTTCTTTGTGAATAAGACTGATATCACAGACGCTATTGTGGTCGATGGTTCGGATGCAACGCTCTTTGATATGGGCAGTATCTTCCTTGAAGCTGGAGATGTCTTAGAGATTGCTGGTTACCAGAATGGCGAAGGTACAAGTATCGCAGAAGTAGTCCAAGGTGGTTATGCTGACCTAACAGTTACTCCTACGACAGCTAATGTTTCATTGACGGATGCTAACAAAGGTCAAGTCATTGACATTACTGCGGCGATCACAGTAACTGCTGCTGGTGGTACTACTGGTTCTACATGGACTGTTGTTAACCGTTCAGGCGGACAACTAGCTGTTACACTGGGTACTGGTATTACGGCGATCGGTAACGTTAACGTTCAGGATGGTACAGCGATTACTCTAGTTATGCTAGACGCTACGACTGTGCTTATTGCTGGTGGTGTTGCTTAA

Genome Context

Tertiary structure

PDB ID

97bb49af68bfd7a61ebc126e9bd3c12725b6682a651dfe899f5e45f848bc2e2d

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,2847

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence