Protein

View in Explore

Genbank accession

CAB4122149.1 [GenBank]

Protein name

central tail fiber J

RBP type

Evidence Phold

Probability 1,00

Evidence RBPdetect2

Probability 0,94

Protein sequence

MLANVIYCNNPLDPINNREVVTLTRKRRIDKLAPKITTPFIAVLNGQPLLRKDEGWKRSIKNGDILVFVAIPQGGGGGSNPLKLALMVALSFAAPGIGAAIADSMGIAGAGFMASTTVFGSVTVGSLFGAAVSFLGTSLLNAIMPASTPSAYNNGSYNTASPSPTYNINAQGNAARLMQAIPAIYGRHLIYPDYAAEPYSEYSGNEQYLYQLFSIGLGYYDIEKINIEDTDISNFDEVQYEVIQPGSSVTLFPTNVITASEVSGQEIQDMKSGTYSVGGLVVTVTATAHGVGVGNKIFANFANNDAYDGIYTVTATPTADTLKFSLLSVPAVTSGNITVSPFVGAYSINAATTSISKVAVDVVLPQGLFYANDAGGLDARTVSWRVVVRKIDDSGVAIGGYQTLGSETFTAATNTPQRLTYRYDVAPGRYEIMLARTSIKDTSARAGNSLNWGSARGYIQGTETYPATMLAVRIRATNNISNTSARRFNVIVTRKLPIYRNGKWTTTPEATRSIAWAVADMLRASYGGMSSDARIDLRKLTYLENTWSARGDKFDAVFDSKMTVWEAISAALRVGRTRPFFQGGIVRFVRDEPVTLPTAMFNMRNITKGSLKTQYLMNDTDTADSVIVEYFDSTTWKPAEVTATLPGSTNVNPARVKLFGCTDKTRAWKEGMYMAASNRYRRQMITFTTEMEGFIPALGDLIAISHDRPNWGQSGELLSEVTGTNLLPYSEQLERVTPWVQVAMNVAANAKAAPDGKTTAARLVPTAVAGPHYLDYQVSTLSDNTIVSASIYVAQHVLPKVSFSFIAKDGLETWIELYFKDSTVTSSNIAVGQTTAKLTVDVLPSGWYRLNIAGLSAKSGATIPRFRVYSGINAGLAFAHWTKSDTTSVFNSISIPIGSIPTDLWSADSLIDTATTARHYATTSLNLIANKKVVIEQYFRPIVTGQPRYVSVVLTTGGGAFTANQAVTIDLNNGSVPYTTGTAITAISVSDILDLGNGWFKVILEVVPTGTGTAEYQITLSNVSNNPLASYLGDGGSGVYVFRPHVYWKTKDTTVGPFAVRTAASHTGDAISGIYAWGGQLEYGSAVGKYIQTVATATTAHVITLSEPVTFDTSGTNYIALRKTDGSVAGPFVALPSTSSSSEVIINDFGGFAPYYGSEKEKTYFAFGTGQLYSRMAKVISTKPASAETVEISCVNEDAAVHTADSSSNPPVSTFWNLPAKISKPVVSGISVNLGGTSVTPTFDIGWLPGAGADKYIVEITFDSGTTWKRLGEPFTNHLTTPAHYGLVTIRVCAMSEFAQGEWVYWSGDPFATPPYDLTTFEVVAQPDGTRQFDWAFDGLPPPDIAGYKIKYRLGTGWTWDDLYDLHTSLITSSPYENNQLSSGLYTFAIKAFDDSGHESVNATFIDADLPDPRLAGVIYQTRPNTEGWPGTLTGCFVQPEYNVLAATDTKKWTDFPDWASYDRWITSPVTTMVYETNPIDVGYVVGFKPLVSATGDGIQVIEESHSSDGSNYTAYAPLAGQIAAQYVKIRITVTGPLCRLTSMDIKFDGVAKSEDLNDLDMTTLSGVNKIATGDIRVPLRKTYNAISQLQVSLQNVGSGWSWEVVDKSTSGPRIKVYDSNGTLADAVIDVFVRGF

Physico‐chemical properties

protein length:	1636 AA
molecular weight:	176322,50920 Da
isoelectric point:	5,56678
aromaticity:	0,10269
hydropathy:	-0,05012

Domains

Domains [InterPro]

DC_0118
STR
1–671

DC_0118 DC_0353 DC_0808 DC_1836

IPR055385
ATT
350–460

IPR055385 IPR032876 IPR036116

NF040662
Unmapped
353–724

NF040662

DC_0353
STR
597–902

DC_0353

CAB4122149.1

1 1636

Architecture

STR

ATT

STR

ATT

STR

RBD

STR

RBD

STR 1-349 | ATT 350-460 | STR 461-559 | ATT 560-707 | STR 708-1047 | RBD 1075-1229 | STR 1230-1399 | RBD 1400-1636

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0118	STR	DC_0118	1	671	Novel HMM	DC_0118	Central	Low	Positional only	383 proteins / 383 hits
IPR055385	ATT	DC_0360	350	460	InterPro cluster	Tip attachment protein J, HDII-ins2 domain	N-terminal	High	Text match	1136 proteins / 1139 hits
NF040662	Unmapped	-	353	724	NCBIfam	host specificity factor TipJ family phage tail protein	-	-	-	-
IPR032876	ATT	DC_0307	560	707	InterPro cluster	Tip attachment protein J	Central	Medium	Text match	1111 proteins / 1112 hits
DC_0353	STR	DC_0353	597	902	Novel HMM	DC_0353	Central	Low	Positional only	163 proteins / 163 hits
DC_0353	STR	DC_0353	875	1047	Novel HMM	DC_0353	Central	Low	Positional only	163 proteins / 163 hits
DC_0808	RBD	DC_0808	1075	1314	Novel HMM	DC_0808	C-terminal	Low	Positional only	361 proteins / 361 hits
IPR036116	STR	IPR036116	1230	1399	Merged direct domain	Fibronectin type III superfamily	Central	Low	Positional only	52 proteins / 52 hits
DC_1836	RBD	DC_1836	1382	1636	Novel HMM	DC_1836	C-terminal	Low	Positional only	21 proteins / 21 hits

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	uncultured Caudovirales phage [NCBI]	2100421	Uroviricota > Caudoviricetes > Peduoviridae > Maltschvirus maltsch >
Host	No host information

Coding sequence (CDS)

Genbank protein accession

CAB4122149.1 [NCBI]

Genbank nucleotide accession

LR796152.1 [NCBI]

CDS location

range 62515 -> 67425
strand +

CDS

ATGCTGGCTAATGTTATCTACTGCAATAACCCTTTAGACCCTATTAATAATAGAGAGGTAGTGACGCTTACTCGCAAGAGACGAATCGACAAACTTGCGCCTAAAATAACTACCCCATTTATTGCTGTATTGAATGGTCAGCCTTTATTACGTAAGGATGAAGGTTGGAAACGCTCTATTAAGAATGGCGATATTTTAGTGTTTGTTGCAATCCCACAAGGCGGTGGTGGTGGTTCTAATCCGCTTAAACTTGCATTGATGGTTGCATTGAGTTTTGCCGCTCCTGGAATCGGGGCGGCCATTGCAGACTCAATGGGTATTGCTGGTGCAGGCTTTATGGCAAGCACTACAGTTTTTGGTAGCGTTACAGTTGGTTCTTTATTTGGTGCGGCAGTTTCGTTTTTAGGAACATCTCTACTTAATGCAATTATGCCTGCAAGCACCCCATCGGCTTATAACAACGGTAGCTACAATACTGCATCTCCATCACCTACATACAATATTAATGCTCAGGGTAATGCCGCTCGCTTAATGCAGGCTATTCCAGCTATTTACGGTCGACATTTAATCTATCCAGATTACGCCGCAGAGCCTTACTCAGAATATAGCGGTAACGAGCAATATCTTTACCAATTATTCTCTATTGGGCTTGGCTATTACGATATTGAAAAAATTAATATCGAAGATACTGATATTTCCAATTTTGATGAAGTTCAATATGAGGTCATTCAACCAGGCTCTTCTGTTACTTTATTTCCTACAAATGTGATTACCGCTTCTGAAGTCTCTGGGCAAGAGATTCAGGATATGAAAAGTGGCACCTATTCAGTGGGCGGTTTAGTCGTGACTGTTACTGCAACCGCACATGGTGTTGGTGTAGGCAATAAAATATTTGCAAACTTTGCAAATAATGATGCTTATGATGGTATTTATACTGTTACTGCAACGCCTACAGCAGATACTTTAAAGTTTAGTTTATTATCAGTTCCAGCGGTAACTTCTGGGAATATTACTGTTAGTCCGTTTGTTGGTGCTTATTCAATTAATGCGGCAACGACTTCTATTAGCAAGGTCGCAGTAGATGTAGTTTTACCTCAAGGGCTGTTCTACGCAAATGATGCTGGTGGTCTTGATGCTAGAACTGTAAGTTGGCGTGTTGTTGTAAGAAAAATTGACGATTCTGGTGTTGCAATTGGCGGTTATCAAACACTTGGGTCTGAAACCTTTACGGCAGCTACTAATACGCCTCAACGTCTTACTTATCGTTACGATGTGGCGCCTGGTCGTTATGAGATTATGCTTGCAAGAACCAGTATAAAAGATACATCAGCTAGAGCTGGCAATAGTCTTAATTGGGGTTCTGCTCGCGGTTATATTCAGGGAACAGAAACTTATCCAGCAACGATGTTAGCAGTTCGTATTCGTGCAACTAATAATATTTCTAATACATCGGCAAGACGCTTTAACGTTATTGTAACCAGAAAATTACCTATCTATAGAAATGGGAAATGGACTACTACGCCAGAAGCAACTCGGTCAATCGCTTGGGCGGTCGCAGATATGCTCAGAGCTTCTTATGGTGGCATGAGTTCGGATGCAAGAATTGACTTACGCAAGCTCACCTATTTAGAGAATACTTGGTCAGCTCGTGGTGATAAGTTCGATGCGGTATTTGATAGCAAGATGACAGTATGGGAGGCAATCAGTGCGGCACTTAGAGTAGGGCGCACTAGACCATTCTTTCAAGGCGGCATAGTACGGTTTGTAAGAGATGAGCCAGTCACATTGCCAACGGCCATGTTTAACATGCGTAACATTACTAAAGGCAGTTTGAAGACACAGTATTTGATGAACGATACCGATACTGCCGATTCTGTGATTGTTGAATACTTCGATAGCACTACTTGGAAACCAGCAGAAGTAACCGCTACATTGCCTGGTTCAACTAACGTCAATCCAGCTCGTGTGAAATTATTTGGTTGTACAGATAAGACTAGAGCGTGGAAAGAGGGTATGTACATGGCGGCATCTAACCGCTATCGTCGCCAAATGATTACCTTTACTACAGAGATGGAAGGTTTTATTCCTGCTCTTGGTGATTTAATTGCAATTTCTCATGACAGACCAAATTGGGGTCAAAGTGGAGAACTTTTAAGCGAGGTTACTGGTACTAATTTATTGCCATATAGCGAGCAATTAGAAAGAGTGACGCCTTGGGTGCAAGTGGCAATGAATGTGGCTGCTAACGCTAAGGCAGCCCCAGATGGCAAAACTACTGCCGCAAGGCTAGTTCCAACAGCGGTAGCTGGCCCGCATTATCTTGATTATCAGGTAAGTACGCTTTCGGATAACACAATTGTAAGTGCTTCTATTTATGTGGCACAACATGTTTTACCAAAAGTCTCATTCTCATTCATCGCAAAAGATGGACTTGAAACATGGATTGAGTTGTACTTTAAAGACTCCACTGTTACTAGCTCTAATATTGCTGTAGGTCAGACAACCGCCAAACTTACGGTAGACGTACTGCCCTCTGGTTGGTATAGACTGAATATTGCGGGCTTAAGCGCGAAATCTGGTGCAACTATTCCAAGATTTAGAGTCTACAGCGGCATTAATGCGGGTCTTGCATTTGCTCATTGGACTAAATCAGACACTACGAGCGTCTTTAACTCTATTAGTATTCCAATTGGTAGCATACCTACAGACCTTTGGAGTGCTGACTCGTTGATTGATACTGCGACTACAGCAAGACATTATGCGACAACAAGTTTAAATCTTATTGCAAACAAAAAAGTAGTGATTGAGCAATATTTCCGACCAATTGTAACTGGGCAACCTAGATACGTTTCTGTCGTGCTCACTACTGGTGGTGGCGCATTCACTGCAAACCAAGCAGTGACTATCGACTTAAATAACGGCAGCGTTCCATATACTACTGGCACTGCTATTACTGCAATTAGCGTTTCGGACATCTTGGATTTAGGTAATGGATGGTTTAAGGTTATATTAGAAGTGGTACCAACTGGTACTGGTACCGCTGAGTATCAAATTACTCTTTCTAATGTCAGTAATAATCCACTCGCTAGTTATCTTGGCGATGGTGGTTCAGGCGTTTATGTATTCAGACCTCACGTATATTGGAAAACAAAAGACACAACAGTCGGCCCATTTGCTGTAAGAACGGCAGCCTCTCATACTGGCGATGCGATTTCTGGAATTTATGCTTGGGGCGGACAGTTAGAATACGGTAGCGCTGTTGGAAAATACATTCAAACGGTCGCTACGGCAACGACGGCGCATGTTATAACATTGTCTGAGCCTGTTACATTTGATACTTCTGGTACAAACTATATCGCTCTAAGAAAAACAGATGGCTCTGTTGCAGGCCCATTTGTGGCTTTGCCTTCAACATCCTCCAGTTCTGAAGTGATTATTAATGATTTTGGTGGTTTTGCACCTTATTATGGGTCTGAAAAAGAAAAAACTTACTTTGCTTTTGGCACTGGCCAGTTGTACAGCAGAATGGCTAAAGTTATCTCGACTAAACCAGCAAGTGCTGAAACTGTAGAAATATCATGCGTAAATGAAGATGCTGCCGTTCATACTGCGGATTCCTCAAGTAATCCGCCAGTTTCTACGTTTTGGAATCTTCCTGCAAAAATTAGCAAACCTGTTGTTTCTGGAATTTCTGTGAACTTGGGCGGTACATCTGTAACACCAACATTTGATATTGGCTGGTTGCCTGGCGCTGGTGCTGACAAATATATTGTTGAAATCACATTCGATAGCGGAACTACTTGGAAGAGATTAGGTGAGCCATTTACTAATCATTTAACAACGCCAGCACATTATGGTCTCGTGACAATTCGTGTTTGCGCTATGAGTGAGTTTGCTCAGGGTGAATGGGTATATTGGTCTGGAGACCCTTTTGCAACACCGCCTTATGATTTGACTACATTTGAAGTAGTTGCACAGCCTGATGGTACACGTCAATTTGACTGGGCATTTGATGGTCTGCCTCCACCAGATATTGCGGGTTACAAGATTAAATACAGACTAGGTACAGGTTGGACGTGGGATGACCTATATGACCTACATACTAGCTTGATTACATCTTCTCCATACGAAAATAATCAGCTATCTTCTGGCCTATACACATTTGCAATTAAAGCATTCGATGATTCTGGACATGAGTCAGTTAATGCAACGTTTATTGATGCTGATTTGCCTGACCCGCGCTTGGCTGGCGTGATATATCAAACTAGACCAAATACCGAGGGTTGGCCTGGTACTCTTACAGGGTGCTTTGTACAGCCTGAATATAATGTACTAGCGGCAACTGATACAAAAAAATGGACTGACTTTCCAGACTGGGCATCTTATGACCGCTGGATTACAAGTCCAGTAACTACGATGGTTTACGAAACAAACCCTATTGATGTTGGTTATGTTGTTGGTTTTAAACCGCTCGTATCAGCAACAGGCGACGGCATCCAAGTAATTGAAGAGTCTCATAGCAGTGATGGTAGCAACTACACTGCTTATGCTCCATTGGCAGGGCAAATTGCCGCCCAATACGTCAAAATTAGAATTACGGTCACTGGCCCGCTGTGTCGTTTAACTAGCATGGATATCAAGTTTGACGGCGTGGCTAAATCTGAAGACTTAAACGACTTAGATATGACTACTCTTTCTGGAGTGAATAAAATTGCAACTGGTGATATACGTGTTCCATTAAGAAAAACCTATAACGCCATTTCGCAACTTCAAGTTAGCTTGCAGAATGTGGGTAGTGGCTGGTCATGGGAAGTAGTAGATAAGAGTACCTCTGGGCCTCGTATCAAGGTCTATGATAGTAATGGAACATTGGCAGATGCGGTAATTGACGTTTTTGTACGGGGCTTTTAA

Genome Context

Tertiary structure

PDB ID

17ad96d0b8c2e15573392cd9f33783befa402eca12685d8afe3e786f31c67337

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,7598

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence