Protein

View in Explore

Genbank accession

UFE15749.1 [GenBank]

Protein name

central tail fiber J

RBP type

Evidence Phold

Probability 1,00

Evidence RBPdetect2

Probability 0,96

Protein sequence

MLINNTPVVDADGNSNIHGVTVVYQVGETPQAPLEGFEASGAETVLGVEVKHDNPVTRTVVSENVDRLRFTFGVQMLQETMDKGDRNPSSVNLLIQFQRSGIWNTEFDITINGKITTQYLASVVADNLPPRPFSVRMVRVTPDSTTDRLQNKTLWSSYTEIIDIRQGYPGTAVAGLLVDAEQFGSQQVTRNYHLRGRIFQVPSNYDPDTRTYTGLWDGAFKPAYTNNPAWCTMDKLTHPRYGLGRRIGGADVDKWALYAIAQYCDQPVPDGFGGTEPRMTLNAYITTQRKAYDVLADFCSVMRCMPVWNGRKMTFIQDRPSDKAWTYTNGNVVGGRFKYSFSALKDRHNAIEVRYTDPLNGWQTSTELVEDHASQARYGRNLLKMDAFGCTSRGQAHRTGLWVMMTELLETQTVDFSVGAEGLRHTPGDIIEVCDNDYAGASVGGRITDLDISTRTLTLDREITLPESGATTLNIVGPDGKPFSTEIQSQPAPDRVVTKVLPETVQPYSIWGLKLPSLKRRLFRCVRIKENDDGTYAITALQHVPEKESIVDNGAHFDPLPGTTNSIIPPAVQHLTVSTDNDSTLYQAKAKWGTPRVVKDVRFVVRLTTGSGNEGDPVRLVTTATTSETEYAFHELPLGDYTLTVRAINGYGQQGEPASVAFSIQAPEAPSTIEMTPGYFQITVTPHQTVYDASVQYEFWYSATQLATAADIQSKAQYLGVGSFWIKDGLKPLHDAWFYVRSVNLAGKSVFAEASGRPGDDAKGYLDFFKGLITETYLGTELLKKN

Physico‐chemical properties

protein length:	786 AA
molecular weight:	87090,78920 Da
isoelectric point:	5,57900
aromaticity:	0,09542
hydropathy:	-0,36298

Domains

Domains [InterPro]

DC_0129
STR
1–786

DC_0129

IPR053171
Unmapped
2–785

IPR053171

IPR055385
ATT
42–163

IPR055385 IPR032876 IPR055383 IPR057587

IPR003961
STR
569–659

IPR003961

IPR013783
STR
599–669

IPR013783

UFE15749.1

1 786

Architecture

STR

ATT

STR

ATT

STR

ATT

STR

STR 1-41 | ATT 42-163 | STR 164-286 | ATT 287-448 | STR 449-668 | ATT 669-769 | STR 770-786

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0129	STR	DC_0129	1	786	Novel HMM	DC_0129	Central	Low	Positional only	234 proteins / 234 hits
IPR053171	Unmapped	-	2	785	InterPro	Viral Tip Attachment Protein	-	-	-	-
IPR055385	ATT	DC_0360	42	163	InterPro cluster	Tip attachment protein J, HDII-ins2 domain	N-terminal	High	Text match	1136 proteins / 1139 hits
IPR032876	ATT	DC_0307	287	448	InterPro cluster	Tip attachment protein J	Central	Medium	Text match	1111 proteins / 1112 hits
IPR055383	STR	DC_0003	561	667	InterPro cluster	Tip attachment protein J, Fn3-1 domain	Central	High	Text match	998 proteins / 1603 hits
IPR003961	STR	DC_0003	569	659	InterPro cluster	Fibronectin type III	Central	High	Text match	998 proteins / 1603 hits
IPR013783	STR	IPR013783	599	669	Merged direct domain	Immunoglobulin-like fold	Central	Low	Positional only	144 proteins / 144 hits
IPR057587	ATT	DC_0130	669	769	InterPro cluster	Tip attachment protein J, second Ig-like domain	Central	Medium	Text match	309 proteins / 309 hits

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Salmonella phage ZC-S1_prp [NCBI]	2894717	No lineage information
Host	Salmonella enterica subsp. enterica serovar Newlands ZC-S1 [NCBI]	1505950	Basidiomycota > Agaricomycetes > Sebacinales > Serendipitaceae > Serendipita >

Coding sequence (CDS)

Genbank protein accession

UFE15749.1 [NCBI]

Genbank nucleotide accession

OK490361.1 [NCBI]

CDS location

range 12116 -> 14476
strand +

CDS

GTGCTGATTAATAACACGCCGGTGGTGGACGCGGACGGTAACAGTAATATTCACGGCGTGACCGTGGTATATCAGGTGGGGGAGACACCACAGGCACCGCTGGAAGGTTTTGAGGCTTCCGGCGCGGAAACGGTGCTGGGTGTGGAAGTGAAACACGATAATCCCGTTACCCGTACTGTTGTCTCAGAGAATGTCGACCGGCTACGCTTCACCTTTGGTGTACAGATGCTGCAGGAGACCATGGACAAGGGGGACCGTAACCCGTCCTCCGTGAATCTGCTGATACAGTTTCAGCGTAGCGGGATCTGGAACACAGAATTTGATATCACTATTAACGGCAAGATCACAACACAATATCTGGCATCGGTAGTGGCTGATAATTTACCGCCGCGCCCGTTCAGTGTCCGCATGGTCAGGGTGACACCGGACAGCACCACCGACAGGCTTCAGAACAAAACGCTGTGGTCGTCGTATACGGAAATCATCGATATCCGGCAGGGTTATCCTGGCACAGCGGTTGCCGGTCTGCTGGTGGATGCGGAACAGTTCGGCAGCCAGCAGGTCACGCGTAACTACCACCTGCGCGGACGTATTTTTCAGGTCCCCTCAAACTATGACCCGGATACCCGCACATATACCGGCCTGTGGGACGGGGCGTTTAAACCGGCGTACACGAATAACCCGGCGTGGTGCACGATGGATAAACTGACCCACCCCCGTTACGGGCTGGGCAGGCGTATCGGGGGGGCGGATGTGGATAAATGGGCGCTGTACGCCATCGCGCAGTACTGCGATCAACCGGTGCCGGACGGATTTGGCGGCACGGAACCCCGCATGACGCTTAATGCGTATATTACCACCCAGCGTAAGGCGTATGACGTTCTGGCGGATTTCTGCTCGGTGATGCGTTGTATGCCGGTATGGAATGGCCGCAAAATGACCTTCATCCAGGACCGCCCCTCCGATAAAGCATGGACCTACACCAACGGTAACGTGGTGGGCGGGCGCTTTAAATACAGCTTCAGTGCCCTGAAAGACCGCCATAACGCGATAGAAGTGAGATACACCGATCCGCTGAATGGCTGGCAAACCTCCACGGAGCTGGTGGAAGACCATGCCTCACAGGCCCGTTATGGACGCAATCTGCTGAAAATGGACGCGTTCGGCTGTACCTCACGTGGACAGGCGCACCGGACGGGGTTGTGGGTGATGATGACGGAGCTGCTGGAAACGCAGACCGTGGATTTTTCTGTCGGTGCGGAAGGTCTGCGTCATACACCGGGCGATATTATTGAGGTCTGCGACAACGATTACGCCGGGGCGTCGGTCGGTGGGCGTATCACTGACCTGGATATTTCCACCCGCACGCTGACGCTTGACCGGGAAATAACACTACCGGAAAGCGGCGCCACCACGCTGAATATTGTCGGGCCTGACGGTAAGCCGTTCAGTACGGAGATTCAGTCGCAGCCCGCACCGGATCGGGTGGTAACGAAAGTCCTGCCGGAAACCGTGCAGCCATACAGTATCTGGGGGCTGAAACTGCCCTCCCTGAAGCGCCGCCTTTTCCGTTGCGTGCGTATTAAGGAGAATGACGACGGCACATACGCCATCACTGCCTTGCAGCACGTTCCGGAAAAAGAGTCCATCGTGGACAACGGGGCGCACTTTGACCCGTTACCGGGGACCACCAACAGCATTATTCCGCCCGCTGTGCAGCATCTGACAGTCAGCACGGATAACGACAGTACCCTGTATCAGGCCAAAGCGAAGTGGGGCACGCCGCGGGTGGTAAAAGATGTGCGTTTTGTGGTGAGGCTGACCACAGGCAGTGGGAACGAGGGCGATCCGGTTCGTCTGGTGACAACGGCGACGACCAGCGAAACGGAGTACGCCTTCCACGAACTGCCACTGGGTGACTACACGCTGACAGTCAGGGCAATAAACGGTTACGGGCAGCAGGGTGAACCGGCGTCCGTGGCATTCAGTATTCAGGCACCGGAAGCGCCATCCACGATTGAGATGACGCCGGGTTATTTTCAGATAACGGTGACGCCGCACCAGACTGTCTACGATGCCAGTGTGCAGTATGAGTTCTGGTACTCCGCCACGCAACTGGCGACTGCCGCCGATATTCAGTCAAAAGCACAGTATCTGGGCGTCGGGTCATTCTGGATAAAGGATGGACTGAAACCACTGCATGATGCCTGGTTTTACGTGCGCAGTGTAAATCTGGCTGGAAAATCAGTATTTGCGGAAGCATCCGGACGTCCGGGGGATGACGCGAAAGGGTATCTGGATTTTTTTAAGGGACTGATTACGGAGACGTATCTTGGTACGGAGTTGCTGAAAAAAAATTGA

Genome Context

Tertiary structure

PDB ID

b8ef4116e269e0848de97205c3994882c5f8e9480489bb0ac519da5fcbf939f7

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,9066

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence