Protein

View in Explore

Genbank accession

AVP41470.1 [GenBank]

Protein name

tail fiber protein

RBP type

Evidence Phold

Probability 1,00

Evidence RBPdetect2

Probability 0,96

Protein sequence

MAIPEGVETVTVSSGVPMTLPDGTLIRGHLRFIAPDLNIIGDEDYIFGGESPAELCHGEFSITLVPPDATGITPTGWTYTVIAELVNAPGWTRYIDITKDDPDVFLDDVIVLTPGDITNPDTVFVRKAGDTMTGALTLSGSPTQDLHAATKKYVDDHIPDTSDFVQRAGDTMLGELVLSGDPTVALGAAPKQYVDQAEADAVTAATAAAAAESVSLSGDTMTGPLILSGGPATGLGAATKDYADQVGADAEAAAAAESVSLSGDTMTGPLVLNADPSLALGAATKQYVDQAQADAEAAAAAESVSLSGDTMTGPLVLNADPSLALGAATKQYVDAAQAAAEANADAESVSLSGDTMTGELVLFGDPTVANGAANKQYVDGLDADNVKLTGDQTITGVKDFQTSPLVPTPTTGAQAAPKGYVDFGDAANAQDIADVATDLATLDSEVVKLTGNQTIAGVKTFSSIPVLPGTDPVAANEAVRKAYVDTLDAQNVKLTGDQSISGVKTFANTVEMNNAVNGVAASTLVGVETFDSWQMSHRGRMGWGDGSATRDAFFERVDVGVMQVTSQIRVTGAAPSNAADLTRKDYVDGLDAENVKLTGDQSIDGVKTFTSSPVVPDPATDQQAASKSYVDDGDDARVAVAGDTMTGFLTLNADPTDPLHAATQQYVDQQADAAQAAAELAAAAESVSITGDTMTGPLVLPGDPVNDLEASPKQYVDDTVDSELLAQLGLSTGIILGGELNVNAGDDTMVDIGDTYGVIVDYVTTPTTPTVTKVTFAADTITITDLVEPITWLLINSAGSVIQQTTRPTNTQRRTHLVLGGVLIAGGGIVQDQSIPNYPPQALNQLYDLMDALGPFNVTGNLLQPAGANLQLAKTVGTVFNRGFNHFAGGTLTADPHISATAAQNPVSMRYVTQTPDTPVAPVTVVDPTMYDVAGTITAVPGGSAVSTIQRVYITPLNDVTQQVVIQYGQTAYASLEAAIAAIGNQTFVKNPSLADATLLGYVVAKKSATNLSVAADARVIQAARLSGNSAGSGDSLSLALLLTGGTMAGDLVLAADPDQPLEAATKQYVDAGDATAVKLTGDQTVAGIKTFSSIPVLPASDPTTANQATRKSYVDTLDGANVKLTGAQTVAGVKTFSSIPVGPASNPTTANQLARKQYVDDGDATNATDIATLDGEVVKLTGDQSVAGIKTFSSIPVGPASDPTTDNQLTRKLYVDSEILVVQGNVDDVVADLATLDGEVVKITGDQSVAGIKTFSSIPVLPASSPTTDNQATRKLYVDTLDGANVKLTGNQSISGVKTFSSGISVTAGLGSDRFARKTANTSRASTVTTTVDPHLVVAVEANATYNVLANLVWRPSGSGGFRFKFTGPSGAEMIYMDNDSGSVTAINTELTFNVTTGASVGGTLVTAGTAGNLSLFWAQNVSNATNTTLNEHSALWVRRVA

Physico‐chemical properties

protein length:	1443 AA
molecular weight:	148114,79110 Da
isoelectric point:	4,18877
aromaticity:	0,05059
hydropathy:	0,00506

Domains

Domains [InterPro]

DC_1109
ATT
1–265

DC_1109 DC_1293 G3DSA:6.10.140.2190 G3DSA:6.10.140.2190 G3DSA:6.10.140.2190 DC_1293 DC_0232 G3DSA:6.10.140.2190 G3DSA:6.10.140.2190 G3DSA:6.10.140.2190

DC_1389
STR
247–322

DC_1389 DC_1795 DC_1293 DC_1293 G3DSA:6.10.140.2190 G3DSA:6.10.140.2190 DC_1293

DC_0232
RBD
1124–1241

DC_0232

AVP41470.1

1 1443

Architecture

ATT

STR

RBD

STR

RBD

STR

RBD

STR

ATT 1-265 | STR 266-407 | STR 421-567 | STR 580-819 | RBD 1040-1063 | STR 1064-1142 | RBD 1143-1162 | STR 1163-1198 | RBD 1199-1215 | STR 1216-1430 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_1109	ATT	DC_1109	1	265	Novel HMM	DC_1109	N-terminal	Low	Positional only	79 proteins / 79 hits
DC_1389	STR	DC_1389	247	322	Novel HMM	DC_1389	Central	Low	Positional only	19 proteins / 19 hits
DC_1293	STR	DC_1293	318	365	Novel HMM	DC_1293	Central	Low	Positional only	22 proteins / 22 hits
DC_1795	STR	DC_1795	359	407	Novel HMM	DC_1795	Central	Low	Positional only	19 proteins / 19 hits
G3DSA:6.10.140.2190	STR	G3DSA:6.10.140.2190	421	466	Merged direct domain	G3DSA:6.10.140.2190	Central	Low	Positional only	15 proteins / 15 hits
DC_1293	STR	DC_1293	430	567	Novel HMM	DC_1293	Central	Low	Positional only	22 proteins / 22 hits
G3DSA:6.10.140.2190	STR	G3DSA:6.10.140.2190	479	513	Merged direct domain	G3DSA:6.10.140.2190	Central	Low	Positional only	15 proteins / 15 hits
G3DSA:6.10.140.2190	STR	G3DSA:6.10.140.2190	580	615	Merged direct domain	G3DSA:6.10.140.2190	Central	Low	Positional only	15 proteins / 15 hits
DC_1293	STR	DC_1293	589	654	Novel HMM	DC_1293	Central	Low	Positional only	22 proteins / 22 hits
DC_1293	STR	DC_1293	652	819	Novel HMM	DC_1293	Central	Low	Positional only	22 proteins / 22 hits
DC_0232	RBD	DC_0232	1040	1139	Novel HMM	DC_0232	C-terminal	Low	Positional only	11 proteins / 11 hits
G3DSA:6.10.140.2190	STR	G3DSA:6.10.140.2190	1064	1096	Merged direct domain	G3DSA:6.10.140.2190	Central	Low	Positional only	15 proteins / 15 hits
G3DSA:6.10.140.2190	STR	G3DSA:6.10.140.2190	1104	1142	Merged direct domain	G3DSA:6.10.140.2190	Central	Low	Positional only	15 proteins / 15 hits
DC_0232	RBD	DC_0232	1124	1241	Novel HMM	DC_0232	C-terminal	Low	Positional only	11 proteins / 11 hits
G3DSA:6.10.140.2190	STR	G3DSA:6.10.140.2190	1163	1198	Merged direct domain	G3DSA:6.10.140.2190	Central	Low	Positional only	15 proteins / 15 hits
G3DSA:6.10.140.2190	STR	G3DSA:6.10.140.2190	1216	1261	Merged direct domain	G3DSA:6.10.140.2190	Central	Low	Positional only	15 proteins / 15 hits
DC_1293	STR	DC_1293	1221	1430	Novel HMM	DC_1293	Central	Low	Positional only	22 proteins / 22 hits
G3DSA:6.10.140.2190	STR	G3DSA:6.10.140.2190	1269	1308	Merged direct domain	G3DSA:6.10.140.2190	Central	Low	Positional only	15 proteins / 15 hits

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Streptomyces phage Wentworth [NCBI]	2126735	No lineage information
Host	No host information

Coding sequence (CDS)

Genbank protein accession

AVP41470.1 [NCBI]

Genbank nucleotide accession

MH019216.1 [NCBI]

CDS location

range 21239 -> 25570
strand +

CDS

GTGGCAATCCCCGAAGGAGTCGAGACCGTAACCGTCAGCAGCGGCGTCCCCATGACGCTGCCAGACGGCACTCTCATCCGTGGGCACCTGCGCTTCATCGCCCCGGATCTCAACATCATCGGTGACGAGGACTACATCTTCGGTGGTGAGTCTCCCGCCGAGCTCTGCCACGGCGAGTTCTCCATCACGCTCGTCCCGCCGGACGCGACTGGCATCACTCCGACGGGATGGACCTACACGGTCATCGCGGAGCTCGTCAACGCGCCCGGCTGGACGCGCTACATCGACATCACCAAGGACGACCCGGACGTCTTCCTGGACGACGTGATCGTCCTGACGCCCGGCGACATCACGAACCCCGACACCGTGTTCGTTCGCAAGGCGGGCGACACCATGACCGGGGCTCTCACGCTGTCCGGATCGCCGACGCAGGACCTGCACGCGGCGACCAAGAAGTACGTGGACGACCACATCCCGGACACTTCGGACTTCGTGCAGCGCGCGGGCGACACGATGCTTGGAGAGCTCGTCCTCTCGGGCGACCCCACGGTCGCGCTCGGGGCCGCTCCCAAGCAGTACGTAGACCAGGCGGAGGCGGACGCCGTAACGGCCGCTACGGCGGCTGCGGCGGCCGAGTCGGTGAGTTTGTCCGGCGACACGATGACAGGCCCGCTAATCCTGAGCGGAGGCCCGGCAACGGGCCTCGGAGCGGCGACGAAGGACTACGCCGACCAGGTTGGGGCCGACGCGGAGGCAGCGGCAGCGGCCGAGAGCGTCTCGCTCAGCGGTGACACCATGACCGGTCCGCTGGTCCTCAACGCCGATCCGTCGCTTGCACTGGGAGCGGCAACCAAGCAGTACGTGGACCAGGCACAGGCGGATGCAGAAGCGGCTGCTGCTGCCGAGTCTGTCTCGCTCTCTGGCGACACGATGACCGGGCCTCTGGTGCTGAACGCCGACCCGAGCCTGGCCCTCGGAGCCGCCACGAAGCAGTATGTGGATGCAGCCCAGGCGGCTGCGGAGGCCAATGCCGACGCGGAGTCGGTGAGCCTCTCTGGCGACACCATGACGGGCGAGCTGGTCCTGTTCGGCGATCCGACCGTGGCGAACGGGGCGGCCAACAAGCAGTACGTTGACGGCCTGGACGCGGACAACGTCAAGCTCACGGGCGACCAGACGATCACGGGCGTCAAGGACTTCCAGACGTCACCGCTCGTCCCGACCCCGACGACCGGTGCGCAGGCCGCACCCAAGGGCTATGTCGACTTCGGAGATGCGGCGAACGCGCAGGACATCGCGGATGTCGCTACGGACCTGGCCACGTTGGACTCCGAGGTCGTCAAGCTCACTGGCAACCAGACCATCGCCGGGGTGAAGACCTTCTCCTCGATCCCGGTCCTGCCGGGCACGGACCCGGTTGCCGCGAACGAGGCGGTCCGCAAGGCGTACGTTGACACGCTCGATGCACAGAACGTGAAGCTGACCGGAGACCAGAGCATCTCCGGCGTGAAGACGTTCGCCAACACGGTCGAGATGAACAACGCCGTCAACGGCGTCGCCGCTTCCACGCTCGTCGGGGTCGAGACGTTCGACAGCTGGCAGATGTCGCATCGCGGCCGCATGGGCTGGGGAGACGGAAGCGCGACCCGAGACGCGTTCTTCGAGCGCGTGGACGTCGGCGTCATGCAGGTCACGAGCCAGATCCGAGTCACCGGAGCCGCCCCGTCCAACGCGGCCGACCTGACGCGCAAGGACTATGTCGACGGGCTGGATGCAGAGAACGTCAAGCTGACTGGCGACCAGTCCATCGACGGCGTCAAGACGTTCACTTCTTCCCCTGTCGTGCCGGACCCCGCGACTGATCAGCAGGCTGCCAGCAAGTCCTATGTGGACGACGGCGACGACGCTCGGGTCGCAGTCGCTGGCGACACCATGACGGGATTCCTCACGCTCAACGCGGACCCGACCGATCCGCTCCACGCGGCGACTCAGCAGTATGTCGACCAGCAGGCGGACGCAGCTCAGGCCGCAGCCGAGCTGGCAGCCGCAGCCGAGAGCGTCTCCATCACAGGTGACACGATGACGGGGCCGCTGGTTCTCCCCGGCGACCCGGTCAACGACCTGGAGGCGAGCCCGAAGCAGTACGTTGACGACACCGTCGACTCGGAGCTGCTCGCACAGCTCGGGCTGTCGACGGGCATCATCCTCGGCGGCGAGCTCAACGTCAACGCGGGCGACGACACGATGGTCGACATCGGAGACACGTACGGCGTCATCGTGGACTACGTCACGACGCCCACGACTCCGACCGTGACCAAGGTGACGTTCGCGGCCGACACCATCACGATCACGGACCTGGTCGAGCCGATCACCTGGCTCCTGATCAACAGCGCTGGATCCGTCATCCAGCAGACGACGCGCCCGACCAACACCCAGCGCAGGACGCATCTCGTCCTCGGTGGCGTGCTGATCGCTGGTGGCGGCATCGTGCAGGACCAGAGCATCCCCAACTATCCGCCCCAGGCCCTCAACCAGCTGTACGACCTGATGGACGCTCTCGGCCCGTTCAACGTCACTGGCAACCTCCTCCAGCCCGCTGGTGCGAACCTTCAGCTGGCCAAGACCGTCGGCACCGTCTTCAACCGAGGCTTCAACCACTTCGCCGGTGGAACGCTCACGGCTGATCCGCACATCTCTGCGACGGCTGCACAGAACCCTGTGTCCATGCGTTACGTCACGCAGACTCCGGACACCCCGGTCGCCCCTGTGACCGTCGTGGATCCGACGATGTACGATGTTGCCGGCACGATCACGGCTGTGCCCGGCGGATCGGCTGTGTCGACGATCCAGCGCGTCTACATCACACCGCTCAACGACGTCACGCAGCAGGTCGTCATCCAGTACGGCCAGACCGCGTACGCCAGTCTCGAAGCGGCCATCGCCGCGATCGGCAACCAGACGTTCGTCAAGAACCCGTCCCTGGCCGACGCCACGCTGCTGGGTTATGTTGTCGCCAAGAAGAGCGCCACCAACCTCTCGGTCGCGGCCGACGCCCGCGTGATCCAGGCTGCCAGGCTGAGCGGGAACTCCGCCGGTTCGGGCGACAGCCTCTCGCTCGCTCTGCTGCTGACCGGCGGAACGATGGCTGGCGACCTGGTTCTCGCGGCAGATCCGGACCAGCCTCTCGAGGCGGCCACCAAGCAGTATGTCGACGCGGGCGACGCCACGGCTGTCAAGCTGACTGGCGATCAGACCGTTGCAGGGATCAAGACGTTCTCGTCCATCCCGGTCCTGCCGGCATCCGACCCGACGACTGCGAACCAGGCGACGCGGAAGTCCTATGTGGACACGCTCGATGGAGCCAACGTCAAGCTCACTGGTGCACAGACCGTGGCCGGTGTCAAGACGTTCTCCTCCATCCCGGTTGGTCCGGCGAGCAACCCCACAACGGCCAACCAGCTGGCTCGCAAGCAGTATGTCGACGACGGCGACGCAACCAACGCAACGGACATCGCGACGCTGGACGGCGAGGTCGTCAAGCTGACGGGAGACCAGTCGGTCGCTGGCATCAAGACCTTCTCCTCGATCCCCGTCGGCCCGGCCTCGGACCCGACGACGGACAACCAGCTCACGCGCAAGCTGTATGTGGACAGCGAGATCCTGGTCGTCCAGGGGAACGTCGACGATGTGGTGGCCGACCTCGCCACGCTCGACGGCGAAGTGGTCAAGATCACCGGAGATCAGTCGGTTGCCGGCATCAAGACATTCAGCAGCATCCCGGTCCTGCCGGCATCCAGCCCGACCACCGACAACCAGGCCACCCGGAAGCTGTATGTCGACACGCTCGACGGGGCGAACGTCAAGCTCACCGGCAACCAGTCGATCTCTGGCGTGAAGACGTTCAGCAGCGGAATCAGCGTGACGGCCGGTCTCGGATCCGACCGCTTCGCTCGCAAGACGGCCAACACCTCCAGGGCGAGCACGGTCACTACGACAGTTGACCCGCATCTGGTTGTTGCGGTTGAGGCCAACGCAACGTACAACGTGTTGGCGAACCTTGTGTGGCGTCCATCTGGATCAGGAGGATTCCGATTCAAGTTCACCGGTCCTTCTGGTGCAGAGATGATCTACATGGACAATGACAGCGGATCCGTCACGGCCATCAACACAGAGCTCACATTCAACGTTACGACAGGAGCCAGCGTCGGAGGCACCCTCGTCACTGCAGGAACTGCCGGCAACCTCTCGCTGTTCTGGGCTCAGAATGTCTCCAACGCAACCAACACGACGCTCAACGAGCACTCCGCACTCTGGGTCCGTCGGGTAGCCTAG

Genome Context

Tertiary structure

PDB ID

f894fcc86959251a66ef0160acd583e572f563452e5deb30ceb573984d3c497c

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,5366

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence