Protein

View in Explore

Genbank accession

AKI27400.1 [GenBank]

Protein name

central tail fiber J

RBP type

Evidence Phold

Probability 1,00

Evidence RBPdetect2

Probability 0,96

Protein sequence

MNIHGSKKQKGQARKPTIATDDLVATSHAQIMYGLCEGEIAGLVDDGKSIRLENTPLINDNGEPNFEGVSWEFRTGTLDQTHIAGFPSVENEHNIGVELRHDRDWTRQINNRELSAVRVRLNFNALKEQKENGDITGYAISYAIDVQTDGGSFVEVLTDTVRGKASQGYKKAHRIDLPNAGTAKRWTIRVRRITPNRDSELVADTMSIDALTEIIDAKLSYPCTALLGISYDAKTFNNIAKIAVRLKGKIIQVPSNYNAETRQYNGLWDGTFKFAYSNNPAWVFYDLCTHKRYGLGERLSAMVDKWRLYQIGQYCDELVDDGKGGQEPRFTCNVYIQKADDAYRVLQNLASVFRGLSFWDGQNIVVDSDTPKDPVYTFSPANVVGGEFSYTGTRARDRHTLSKIAWDNPENNFTTEYELIPDEEAIAKYGVRTLDISAFGCTSKGQAQRAGLWALKAEQLQTQTVTFKTGLQGFIPQVGQVINIADNVFAGRAISGRIINVNGKQITLDRAAGKIGDILTVATADAIVSSQITAVQGEILTLKQALNVANESIWAVISDDLKLKQFRILTIAQNDDATFDITALEYNRQKYAAVDGGAVVTQEPFTVLKVATISAPKSVALTAHTRTHQGQAVTTLNIAWEQVSGAVAYIVEWRKDDGNWQTLPKVSGQSVDIDGVYAGVYQAKVRAIDAFDNESLSQSSQLTQITGKQGKPPRPINFTAQGVLFGMNLGWNFAKGSGDTNYTEIQVSPDGRSNIATLGTFAYPTNKHEITGLQGNLRQFYRARIVDKLGNTSDWADWASGTTSADADKVLGLLSGQISQSHLDQSLRTPIGKIGTIESNISGINRKIPTIESNISKINVDLPKLNQSIADERTRINSINQQLPTLNQSIANAQSTLNTAVASIETEKKRLSSAIIDINTLKQSNDAKTQELLNLSQTVGGYISSIRDLGATTGNLSQRYQQLKTTSDQHNTEITTIKQTQSGQATSISRLNSQMADKASSADLQSVQQTLTTADSSLSQRINTLQSDYNGNKASVQSSINTLTDTNRTQAEQLERLTTRFDGVLGGQNLLSDTTTKTGTQFLLGEYPINRTLQEGQRVIVKATTTPAQQVLVYNSSPRGANRIGEITADGTPHELTWAVGDGGNNSLHIYRTNINNRSSVTLDTVSLAVPDGALADVTANLAEFKQATADKDQATASRITSIDTAYKQADSTLTTQIESEITARTDADNSLASRINTLQSDYNGNKASVAGQLKTLSDKDNATASQISRLNSQMADKASSADLQSVQQTLTTADSSLSQRINTLQSSVSGQTASIRNVERSVNGVRAIKAVTVDNNGFISGYGLMSDLQNGRVTSRFGINADQIYFGSTTNAKKPFVFTTRATTIDGVSYPAGAWINSASIAHASINMLHIADSIQSDNYVAGRQGWRLFKDGRFELNNTFGDGSSLELNSQGLTVWYDKAQGKKAVELGILL

Physico‐chemical properties

protein length:	1474 AA
molecular weight:	160549,86330 Da
isoelectric point:	6,35275
aromaticity:	0,06716
hydropathy:	-0,40149

Domains

Domains [InterPro]

IPR053171
Unmapped
2–1061

IPR053171 DC_0624 IPR015406

DC_0129
STR
16–950

DC_0129 DC_1625 Coil DC_0515

IPR055385
ATT
89–217

IPR055385 IPR032876 IPR013783 IPR003961 G3DSA:1.10.287.1490

SSF57997
STR
844–1047

SSF57997

AKI27400.1

1 1474

Architecture

STR

ATT

STR

ATT

STR

RBD

STR 16-88 | ATT 89-217 | STR 218-339 | ATT 340-501 | STR 502-1047 | STR 1201-1256 | RBD 1257-1473 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
IPR053171	Unmapped	-	2	1061	InterPro	Viral Tip Attachment Protein	-	-	-	-
DC_0129	STR	DC_0129	16	950	Novel HMM	DC_0129	Central	Low	Positional only	234 proteins / 234 hits
IPR055385	ATT	DC_0360	89	217	InterPro cluster	Tip attachment protein J, HDII-ins2 domain	N-terminal	High	Text match	1136 proteins / 1139 hits
IPR032876	ATT	DC_0307	340	501	InterPro cluster	Tip attachment protein J	Central	Medium	Text match	1111 proteins / 1112 hits
IPR013783	STR	IPR013783	604	704	Merged direct domain	Immunoglobulin-like fold	Central	Low	Positional only	144 proteins / 144 hits
IPR003961	STR	DC_0003	712	806	InterPro cluster	Fibronectin type III	Central	High	Text match	998 proteins / 1603 hits
G3DSA:1.10.287.1490	STR	G3DSA:1.10.287.1490	827	1002	Merged direct domain	G3DSA:1.10.287.1490	Central	Low	Positional only	5 proteins / 5 hits
SSF57997	STR	SSF57997	844	1047	Merged direct domain	SSF57997	Central	Low	Positional only	14 proteins / 14 hits
DC_1625	STR	DC_1625	992	1035	Novel HMM	DC_1625	Central	Low	Positional only	14 proteins / 14 hits
Coil	Unmapped	-	1040	1060	Coils	Coil	-	-	-	-
DC_0624	STR	DC_0624	1201	1256	Novel HMM	DC_0624	Central	Low	Positional only	9 proteins / 9 hits
DC_0515	RBD	DC_0515	1253	1473	Novel HMM	DC_0515	C-terminal	Low	Positional only	63 proteins / 63 hits
IPR015406	RBD	DC_0135	1312	1442	InterPro cluster	Tip attachment protein J, central straight fiber domain	C-terminal	High	Text match	1265 proteins / 1266 hits

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Moraxella phage Mcat9 [NCBI]	1647555	No lineage information
Host	Moraxella catarrhalis [NCBI]	480	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Moraxellales

Coding sequence (CDS)

Genbank protein accession

AKI27400.1 [NCBI]

Genbank nucleotide accession

KR093633.1 [NCBI]

CDS location

range 3792 -> 8216
strand -

CDS

ATGAACATACACGGCTCAAAAAAACAAAAAGGTCAAGCAAGAAAACCAACCATCGCCACCGATGATTTGGTTGCTACTAGCCATGCCCAAATCATGTACGGTCTTTGCGAGGGCGAGATTGCAGGCCTAGTAGACGACGGCAAATCTATTCGTCTTGAGAATACACCGCTCATCAATGACAATGGTGAGCCAAACTTTGAGGGCGTGTCTTGGGAGTTTCGCACAGGCACGCTTGACCAGACGCATATCGCAGGATTTCCGTCAGTTGAAAACGAACACAACATTGGCGTTGAGTTACGGCACGACAGAGATTGGACAAGACAAATTAACAATCGTGAATTGTCTGCTGTGCGTGTGCGTCTAAACTTTAACGCCCTTAAAGAACAAAAAGAAAATGGCGACATTACAGGTTATGCCATTTCTTATGCGATTGATGTACAAACAGATGGCGGCAGCTTTGTTGAAGTCTTGACCGACACCGTACGAGGTAAAGCGTCACAGGGCTATAAAAAAGCCCACCGCATTGATCTGCCTAACGCTGGCACGGCTAAACGCTGGACAATTCGTGTTCGTCGTATCACACCCAATCGTGATAGCGAATTGGTCGCTGATACGATGAGCATTGACGCACTGACCGAGATTATTGATGCCAAATTGTCTTATCCTTGTACAGCACTACTTGGCATATCTTATGACGCCAAAACTTTTAATAACATTGCTAAAATTGCCGTGCGATTAAAGGGTAAAATTATCCAAGTACCTAGTAATTACAATGCAGAGACAAGACAATACAATGGACTATGGGACGGCACATTTAAGTTTGCTTATTCCAACAACCCTGCGTGGGTATTTTATGACCTTTGCACCCACAAACGCTATGGCTTAGGTGAAAGATTATCTGCCATGGTAGATAAATGGCGACTGTATCAGATTGGGCAGTATTGTGATGAATTGGTGGATGATGGCAAAGGCGGACAAGAGCCAAGATTTACTTGCAATGTCTACATTCAAAAAGCAGACGATGCGTATCGTGTACTACAAAACTTAGCTTCAGTATTTCGTGGGTTATCGTTTTGGGATGGACAAAACATTGTTGTTGATAGCGACACGCCCAAAGACCCTGTTTATACCTTTAGCCCTGCAAATGTCGTGGGCGGTGAGTTTAGCTATACAGGGACAAGAGCAAGAGACCGCCATACTTTATCAAAAATTGCTTGGGATAATCCAGAGAATAATTTTACTACCGAATACGAGCTGATTCCTGATGAAGAAGCAATCGCCAAATATGGCGTGCGTACGCTAGATATTTCAGCCTTTGGCTGTACATCCAAAGGACAGGCACAAAGAGCAGGACTTTGGGCCTTAAAAGCGGAGCAATTACAGACCCAAACGGTAACTTTTAAAACAGGGCTACAAGGCTTTATTCCGCAAGTTGGGCAAGTGATTAATATTGCTGATAATGTCTTTGCAGGGCGTGCGATAAGCGGTCGGATTATCAATGTAAACGGCAAACAAATCACGCTTGACCGTGCGGCAGGTAAAATTGGCGATATCTTAACGGTAGCAACGGCAGACGCCATTGTCTCATCACAAATTACCGCTGTCCAAGGCGAAATACTTACCTTAAAACAAGCGTTAAATGTAGCAAATGAAAGCATTTGGGCAGTCATCTCAGATGATTTGAAGTTAAAGCAATTTCGTATCTTGACCATTGCTCAAAATGATGATGCTACCTTTGATATTACCGCATTAGAATACAACCGCCAAAAATATGCCGCCGTTGATGGCGGAGCTGTGGTAACTCAAGAGCCGTTTACCGTGCTAAAAGTCGCCACAATATCCGCCCCAAAATCGGTTGCACTCACAGCACACACTCGCACTCATCAGGGGCAGGCGGTTACCACGCTGAACATTGCATGGGAGCAAGTGAGCGGTGCGGTAGCGTATATCGTAGAATGGCGAAAAGATGATGGCAACTGGCAAACTTTGCCAAAAGTATCAGGGCAGAGCGTAGACATTGATGGCGTTTATGCAGGGGTATATCAAGCAAAAGTGCGAGCGATTGATGCGTTTGATAATGAAAGCCTATCACAATCAAGCCAATTAACACAAATCACAGGCAAACAAGGCAAACCGCCACGCCCCATTAACTTCACCGCCCAAGGGGTATTGTTTGGCATGAATTTGGGGTGGAATTTTGCCAAAGGCTCAGGTGACACCAATTACACAGAAATTCAAGTTAGCCCTGACGGTCGCTCAAATATCGCAACCCTTGGTACATTCGCTTACCCAACCAATAAGCATGAAATCACTGGCTTACAAGGCAATTTACGCCAGTTTTATCGTGCCAGAATTGTGGATAAACTTGGCAATACATCAGACTGGGCAGACTGGGCAAGTGGCACTACATCGGCAGACGCTGATAAAGTGCTTGGCTTGCTGTCAGGGCAGATTAGCCAAAGCCATCTTGACCAATCACTGCGTACGCCCATCGGCAAAATCGGCACAATTGAAAGCAATATTAGCGGTATTAATCGTAAAATCCCAACGATTGAAAGTAATATCAGCAAAATCAATGTTGATTTGCCAAAGCTTAATCAGAGCATTGCTGATGAGCGCACGCGTATTAACAGTATCAATCAGCAGTTGCCGACGCTTAATCAGAGTATCGCCAATGCTCAAAGCACGCTTAATACTGCTGTTGCTAGTATCGAAACAGAGAAAAAGCGACTCAGTAGTGCGATTATTGATATCAATACGCTTAAGCAGTCTAATGATGCTAAGACGCAAGAATTGCTTAATCTGTCGCAAACTGTGGGTGGTTATATATCATCTATACGTGATCTGGGTGCGACAACTGGCAATTTGTCTCAGCGCTATCAGCAGCTTAAGACGACAAGTGATCAGCATAACACAGAGATCACGACAATTAAGCAAACCCAAAGCGGACAAGCCACAAGTATCAGCCGCCTAAACAGCCAAATGGCAGATAAAGCCAGCAGTGCTGATTTACAAAGCGTGCAACAGACTTTGACAACCGCCGACAGCTCACTAAGCCAGCGTATCAACACCTTACAAAGCGACTACAATGGCAATAAAGCGAGTGTACAAAGTAGCATTAACACGCTAACAGACACTAACCGCACCCAAGCCGAGCAGCTTGAGCGATTGACAACACGCTTTGATGGCGTGCTTGGCGGTCAAAATCTGCTAAGTGATACGACTACAAAGACAGGTACGCAGTTTTTATTAGGAGAATATCCGATTAATCGTACGCTACAAGAAGGTCAAAGGGTAATCGTAAAAGCAACAACAACGCCCGCCCAGCAGGTACTTGTTTACAATTCATCGCCAAGAGGGGCTAACCGTATCGGTGAAATCACCGCAGACGGTACACCCCATGAACTGACTTGGGCAGTTGGCGACGGTGGTAATAATAGCTTGCATATTTATAGAACAAACATAAATAACCGTTCAAGTGTTACCCTAGATACGGTTAGCCTTGCGGTGCCTGATGGGGCGTTGGCTGATGTGACTGCCAATTTGGCTGAATTTAAACAAGCAACAGCAGATAAAGACCAAGCGACTGCTAGTCGCATCACCAGCATTGATACGGCTTACAAGCAAGCTGATAGCACGCTAACCACCCAAATCGAAAGCGAAATCACCGCTCGCACTGATGCAGATAACAGCCTAGCAAGTCGTATCAACACCTTACAAAGCGACTACAATGGCAATAAAGCGAGTGTGGCAGGTCAGCTAAAAACTTTGAGCGATAAAGACAATGCTACGGCAAGTCAAATCAGCCGCCTAAACAGCCAAATGGCAGATAAAGCCAGCAGTGCTGATTTACAAAGCGTGCAACAGACTTTGACAACCGCCGACAGCTCACTAAGCCAGCGTATCAACACCTTACAAAGCTCTGTAAGCGGTCAGACAGCGAGCATTCGTAATGTGGAGCGTTCTGTTAATGGCGTGCGTGCGATTAAAGCGGTAACGGTGGATAATAACGGCTTCATCTCAGGCTATGGCCTCATGAGTGATTTGCAAAATGGGCGTGTTACAAGCCGTTTTGGCATCAATGCTGACCAAATCTACTTTGGGTCAACCACCAACGCCAAAAAGCCCTTTGTCTTTACCACCAGAGCGACTACCATTGATGGGGTGAGCTATCCTGCTGGGGCATGGATAAACAGTGCCAGTATTGCCCATGCCAGCATTAACATGCTCCACATCGCCGACAGCATACAATCGGATAACTATGTGGCAGGCAGACAAGGTTGGCGACTGTTCAAAGATGGCAGGTTTGAGCTAAACAACACCTTTGGCGACGGGTCAAGTTTGGAGCTAAACTCACAAGGTCTTACCGTATGGTATGACAAAGCCCAAGGCAAAAAAGCGGTAGAACTGGGGATTTTACTATGA

Genome Context

Tertiary structure

PDB ID

20bc1a33f723d85c40fc87590e9a5744989d77ab087a4e15c17b66d0f9d4f613

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,6922

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence