Protein

View in Explore

Genbank accession

CAL9996644.1 [GenBank]

Protein name

tail fiber protein

RBP type

Evidence GenBank

Probability 1,00

Evidence RBPdetect2

Probability 0,93

Protein sequence

MNPEIQPLVENIEILNGARGSGLDRAVLLRDLVDLGLAGTVKTSGGKVRPVTGTPGTGTPGGGTSPTPDPTVEDPVAPTGVYASGGFSNILIAWDSPGYKGHAYANIYRSATDDYSQAVAISQTAANLYSDTVAVGATWYYWIRFVNKNDKEGPIQSTNGVKGTTSAAIGDILDQLKGEIDETFFTPVFNTRLDDTDKDIQQLFGDVTNIDNKFTDKFVQVEDQFVEFDGKFVDVNSIIDELKEAGEIIAEAAMSAAVGVEIESDTRRKITARIEEKQRTIITDQIAMAEDIKTVTATVDDNKAQISINNTALVELDKDTKEAVKTITERLDTQQSNIDDNKASITNQQQTLVSVQDSVNKNTGEIDATKQDVQAVTTRLDKQQSEIDDNKATITTQQQTIITIDGKVTGNADDIKDTADKVEVITQRVDTLTSEVGDNKAQISQTQQTLITIDGKVTDNEKEIGDNAKSIQVVTTRIDQQQSEIDSNKATITSQSQTIIKIDGEVQKNKADVEKAITAASNAQATADGKIDTFFQDSHPANASSGDIWFDTNDGNKQYIYHNGAWIVAQDTAIGDAILAAAGAQATADGKIETFYQPDAPTASAKGDLWVDTDDKNKLYRWSGSAWVDIHDQNIDEIKGDVEVITQRVDTMKSEVDNNTAEITDTKQTLVTIDGKVSDNANDIADANQSITTMTQRLESQQSEIDGNKASITSQAQTIVTIDGKVSQNASDIDTANKSIETITQKQDEQKSELDGAKAVIESNSQTIARIEGELGEDGDNSQEILAEAVMSSAIGVDNEGSTRRKVTARIEKQQRVIMTDQSAMAQELTIITASVADNKAEIKSVNTALVEFDKETEQALKVMTERLDTQKANIDDNTASITTQQQTIVTIDGKVQDNTEEVAKAIASASNAQATADGKIDTFFQDDEPATASEGDIWFDTNSGNKQYIYQSGSWVIAQDTEIGDAIKAAAGAQATADGKIETFYQTTPPTANAEGDLWIDTNNNDRLYRWNSLTWVDIQDKDIHKAIQDAASAQATADGKIDTFFQDGEPQAASEGDLWFDTDNGNKQHVYKNGAWIVAQDTAIGDAILAAATAQSTADGKITTFYVPDAPKAKAVGDLWVDTNDKNKLYRWSGSNWLDIQDGNINEIDGKVTVITERLDQLKSEVDGNTASITTNSQTIIEVNSKAEANESKINVVSQQLTTVESELGDTKSAVSTNSQTIAKMNADGTTAYEAQWGVKASVGDVQAGIGLVAKKNPDGTTTSQCTVLADQFSVGHVNTDGDDETIYPFIVTSEGVYIDTAYIKAATVQELVAGEVIADTVKASASITAPKIKGGTIEIGSNFSVDENGNATTNNIKGNNVHLTGYINATSGTFRGTVYATTGEFKGTVYATDGDFKGTVYANRIVGDVVTANTKKKSNSVGYFDRARVNKPTSKNRTLQFTVMVGLKAKGYRDQEGRFQPSTVEGRLKVTGTYGTRYSQIFSFSTNRSSEESRFFPVNVSIPIPANTTGTVNIYSEKTHSVGETSVVTSAPTTDGIWTAMLFTDGSDLS

Physico‐chemical properties

protein length:	1553 AA
molecular weight:	167230,35600 Da
isoelectric point:	4,43983
aromaticity:	0,05795
hydropathy:	-0,49047

Domains

Domains [InterPro]

IPR013783
STR
79–161

IPR013783 PTHR18937 DC_0308 Coil DC_0308 DC_1951 G3DSA:1.20.5.340

DC_0308
STR
100–369

DC_0308 G3DSA:1.10.287.1490 G3DSA:1.10.287.1490 DC_0308 DC_0237

SSF57997
STR
300–510

SSF57997 DC_0308

DC_0308
STR
354–415

DC_0308

Coil
Unmapped
366–386

Coil DC_0308

CAL9996644.1

1 1553

Architecture

STR

RBD

STR

RBD

STR 79-1091 | RBD 1092-1131 | STR 1132-1233 | RBD 1234-1469 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
IPR013783	STR	IPR013783	79	161	Merged direct domain	Immunoglobulin-like fold	Central	Low	Positional only	144 proteins / 144 hits
DC_0308	STR	DC_0308	100	369	Novel HMM	DC_0308	Central	Low	Positional only	44 proteins / 44 hits
PTHR18937	Unmapped	-	275	526	PANTHER	STRUCTURAL MAINTENANCE OF CHROMOSOMES SMC FAMILY MEMBER	-	-	-	-
SSF57997	STR	SSF57997	300	510	Merged direct domain	SSF57997	Central	Low	Positional only	14 proteins / 14 hits
DC_0308	STR	DC_0308	354	415	Novel HMM	DC_0308	Central	Low	Positional only	44 proteins / 44 hits
Coil	Unmapped	-	366	386	Coils	Coil	-	-	-	-
G3DSA:1.10.287.1490	STR	G3DSA:1.10.287.1490	379	541	Merged direct domain	G3DSA:1.10.287.1490	Central	Low	Positional only	5 proteins / 5 hits
DC_0308	STR	DC_0308	406	583	Novel HMM	DC_0308	Central	Low	Positional only	44 proteins / 44 hits
DC_0308	STR	DC_0308	575	638	Novel HMM	DC_0308	Central	Low	Positional only	44 proteins / 44 hits
G3DSA:1.10.287.1490	STR	G3DSA:1.10.287.1490	629	793	Merged direct domain	G3DSA:1.10.287.1490	Central	Low	Positional only	5 proteins / 5 hits
DC_0308	STR	DC_0308	635	742	Novel HMM	DC_0308	Central	Low	Positional only	44 proteins / 44 hits
Coil	Unmapped	-	684	704	Coils	Coil	-	-	-	-
DC_0308	STR	DC_0308	734	973	Novel HMM	DC_0308	Central	Low	Positional only	44 proteins / 44 hits
DC_0308	STR	DC_0308	965	1033	Novel HMM	DC_0308	Central	Low	Positional only	44 proteins / 44 hits
DC_1951	STR	DC_1951	1020	1091	Novel HMM	DC_1951	Central	Low	Positional only	10 proteins / 10 hits
DC_0237	RBD	DC_0237	1073	1469	Novel HMM	DC_0237	C-terminal	Low	Positional only	10 proteins / 10 hits
G3DSA:1.20.5.340	STR	G3DSA:1.20.5.340	1132	1233	Merged direct domain	G3DSA:1.20.5.340	Central	Low	Positional only	38 proteins / 38 hits

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Vibrio phage D182 [NCBI]	3104937	Viruses >
Host	No host information

Coding sequence (CDS)

Genbank protein accession

CAL9996644.1 [NCBI]

Genbank nucleotide accession

OZ196028.1 [NCBI]

CDS location

range 14424 -> 19085
strand +

CDS

ATGAATCCTGAGATTCAGCCGCTTGTAGAAAATATAGAGATACTTAACGGCGCAAGGGGTTCAGGCTTAGATCGAGCCGTGCTACTGCGCGACCTTGTTGATCTCGGTTTAGCCGGTACTGTAAAAACGTCGGGCGGAAAGGTTAGGCCAGTTACCGGAACGCCTGGTACTGGCACGCCTGGCGGTGGTACATCACCAACACCAGACCCAACAGTAGAAGATCCCGTTGCACCTACTGGCGTTTATGCTTCTGGTGGTTTTAGTAACATTCTTATTGCTTGGGATTCCCCAGGGTACAAAGGTCACGCATACGCTAATATTTATCGATCGGCTACTGACGACTATTCACAAGCTGTAGCTATCAGCCAAACGGCTGCGAACCTTTACAGTGATACCGTTGCGGTAGGTGCAACGTGGTACTACTGGATTAGATTTGTAAACAAGAACGATAAAGAAGGTCCGATCCAATCGACTAACGGCGTTAAGGGTACAACCAGTGCCGCTATTGGCGATATATTAGATCAGCTAAAAGGTGAGATTGACGAAACGTTTTTCACGCCTGTATTCAACACTCGACTTGATGACACTGATAAAGACATACAGCAATTATTTGGTGACGTCACAAATATTGATAACAAGTTCACTGACAAGTTTGTACAGGTTGAAGATCAGTTTGTTGAGTTCGATGGTAAATTTGTAGACGTTAACTCAATCATTGATGAGCTTAAAGAGGCTGGCGAGATCATAGCTGAAGCGGCTATGAGTGCGGCGGTAGGCGTTGAGATTGAAAGTGATACACGACGCAAGATTACAGCTCGAATTGAAGAGAAGCAGCGCACTATCATCACTGATCAGATTGCTATGGCCGAAGATATCAAAACGGTTACAGCTACGGTTGACGATAACAAAGCTCAAATAAGCATTAACAACACTGCGCTGGTTGAGCTTGATAAGGACACCAAGGAAGCGGTTAAGACAATTACCGAGCGATTGGATACCCAACAATCAAACATTGACGACAACAAAGCGTCTATCACCAACCAGCAGCAGACACTTGTAAGCGTTCAGGACTCCGTAAACAAAAATACCGGGGAAATAGATGCTACTAAACAAGACGTTCAAGCAGTAACAACGAGGCTTGATAAACAACAGTCTGAGATTGACGATAACAAAGCGACGATCACCACGCAGCAGCAAACCATCATTACCATTGACGGTAAGGTTACTGGTAACGCTGACGACATCAAGGACACCGCCGATAAAGTTGAGGTGATTACACAGCGTGTTGATACGTTAACCTCTGAAGTTGGCGACAACAAAGCACAAATATCTCAAACGCAACAAACGTTAATCACCATTGACGGCAAGGTTACGGACAACGAAAAGGAAATAGGCGATAACGCTAAGTCCATTCAAGTGGTAACTACTCGAATTGATCAGCAGCAATCTGAAATTGATAGCAACAAGGCTACCATTACCAGCCAGTCTCAAACGATCATTAAGATTGATGGTGAAGTTCAGAAGAACAAAGCAGACGTTGAGAAAGCAATTACCGCCGCGTCTAATGCGCAAGCAACTGCAGACGGCAAGATCGATACGTTTTTCCAAGACTCACACCCTGCTAATGCGAGTAGTGGTGACATTTGGTTCGACACTAACGACGGCAATAAGCAATACATTTACCACAACGGTGCTTGGATTGTTGCGCAGGATACTGCTATCGGTGATGCGATTCTTGCGGCGGCAGGAGCACAAGCAACAGCAGACGGTAAGATCGAAACCTTCTACCAGCCAGATGCACCGACGGCAAGCGCTAAGGGCGACTTATGGGTAGACACTGACGATAAAAATAAACTTTATCGTTGGAGCGGATCAGCTTGGGTTGATATTCACGATCAGAACATTGATGAGATCAAAGGTGACGTTGAGGTAATAACGCAACGTGTCGACACAATGAAGTCAGAGGTTGATAACAACACCGCTGAAATCACAGACACAAAGCAAACCTTAGTAACTATTGACGGTAAGGTATCCGATAACGCCAATGACATTGCAGATGCAAATCAAAGCATCACAACAATGACGCAGCGCTTGGAAAGCCAGCAATCAGAAATAGATGGTAACAAGGCCAGCATTACCAGCCAGGCACAAACGATCGTTACTATTGACGGCAAGGTTAGCCAAAACGCTAGCGATATCGACACGGCTAATAAATCGATTGAAACTATCACGCAAAAGCAAGACGAACAGAAGTCCGAGCTTGATGGTGCGAAAGCTGTTATTGAATCTAACTCTCAAACTATCGCTAGAATTGAGGGTGAACTTGGTGAGGATGGAGACAACTCTCAAGAGATACTAGCTGAAGCTGTGATGAGCTCTGCTATTGGTGTTGATAACGAAGGCTCGACACGACGCAAAGTAACCGCACGAATTGAGAAGCAGCAGCGAGTGATCATGACCGATCAATCCGCTATGGCTCAAGAGTTGACGATAATCACGGCAAGCGTCGCAGATAACAAGGCAGAAATTAAAAGCGTAAACACTGCGCTAGTTGAGTTTGACAAAGAGACAGAGCAAGCGCTCAAGGTAATGACTGAGCGACTAGACACGCAAAAGGCAAACATTGACGATAATACGGCCTCTATCACTACTCAGCAGCAAACAATCGTAACCATTGACGGAAAGGTACAGGACAATACTGAAGAAGTAGCCAAGGCTATTGCTTCAGCTTCTAACGCTCAAGCAACAGCTGACGGTAAGATTGATACGTTTTTCCAAGATGACGAGCCAGCAACAGCAAGCGAAGGCGATATTTGGTTCGATACTAATAGCGGTAACAAACAGTATATTTATCAAAGCGGCTCTTGGGTAATCGCTCAAGACACTGAGATCGGAGACGCAATAAAAGCGGCTGCGGGCGCACAAGCTACAGCTGACGGCAAGATTGAAACGTTCTACCAAACGACACCACCGACGGCAAATGCTGAAGGTGATCTATGGATTGATACAAATAACAACGATCGCCTATATCGTTGGAACTCGCTTACCTGGGTTGATATTCAAGACAAGGATATTCACAAGGCCATTCAAGATGCAGCGAGCGCACAAGCTACAGCTGACGGCAAGATTGACACCTTCTTTCAAGATGGTGAGCCGCAAGCAGCAAGCGAAGGTGATCTTTGGTTTGATACTGATAACGGGAACAAGCAGCACGTTTATAAAAACGGCGCTTGGATTGTCGCTCAAGATACAGCTATCGGTGACGCAATCCTTGCAGCAGCTACGGCCCAATCAACTGCAGACGGGAAGATCACAACGTTCTATGTCCCAGATGCACCAAAAGCTAAAGCGGTTGGCGATCTTTGGGTAGACACCAATGACAAGAACAAGCTTTACCGTTGGAGCGGTAGCAACTGGTTAGATATTCAAGACGGCAATATTAACGAGATTGACGGAAAGGTTACGGTAATCACTGAAAGACTGGATCAGTTAAAATCAGAGGTTGACGGAAACACAGCAAGTATCACAACAAACAGTCAAACTATTATTGAGGTAAACAGCAAGGCAGAAGCTAACGAAAGCAAAATAAACGTAGTATCTCAGCAGCTAACAACAGTTGAGAGTGAGTTAGGTGATACTAAGTCGGCGGTTTCTACAAACAGCCAAACTATTGCCAAAATGAATGCAGACGGTACAACGGCATACGAAGCGCAATGGGGAGTTAAAGCAAGTGTTGGTGATGTTCAAGCGGGTATCGGTTTAGTTGCTAAGAAGAACCCGGACGGCACAACCACTTCACAATGTACTGTGCTGGCGGATCAGTTCTCAGTTGGCCATGTAAACACTGACGGGGATGACGAGACAATTTACCCGTTTATCGTTACGTCAGAAGGGGTTTACATTGATACTGCTTACATCAAGGCGGCTACTGTTCAGGAGCTTGTTGCTGGTGAAGTTATTGCTGATACCGTTAAAGCGTCTGCTTCAATCACTGCACCTAAAATAAAAGGCGGCACAATTGAGATAGGCAGTAACTTTAGCGTTGACGAAAACGGCAATGCTACAACGAACAACATTAAAGGCAATAACGTTCATCTTACTGGTTATATCAATGCAACATCCGGCACGTTCAGGGGGACTGTTTACGCGACCACAGGAGAGTTTAAAGGCACTGTTTATGCGACTGATGGTGATTTTAAAGGCACTGTATATGCTAATAGAATTGTCGGTGATGTAGTTACAGCGAATACAAAAAAGAAATCTAATAGTGTGGGGTATTTTGACAGAGCAAGGGTAAATAAACCGACAAGCAAAAATAGAACTTTGCAATTTACGGTTATGGTAGGGCTAAAGGCTAAGGGTTATAGAGATCAAGAGGGCAGATTCCAACCAAGTACCGTAGAGGGTAGGCTTAAAGTTACAGGCACCTACGGGACCAGATATTCTCAAATATTTAGCTTTTCCACAAATAGAAGTTCTGAGGAATCTAGATTTTTTCCTGTAAATGTCAGTATTCCTATTCCTGCAAACACAACCGGCACCGTTAATATATATTCAGAGAAAACACATAGCGTCGGGGAAACTAGCGTAGTGACTAGCGCTCCAACTACTGACGGTATTTGGACAGCAATGTTATTCACAGATGGCAGCGATCTATCATAG

Genome Context

Tertiary structure

PDB ID

9d89a3378f99505c0ca83deb0c78cdddc3abe4505247ce618488eb2adbe5b7db

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,6281

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence