Phage RBP Database

Genbank accession

WFG41561.1 [GenBank]

Protein name

hypothetical protein

RBP type

TSP

Evidence DepoScope

Probability 1,00

Protein sequence

MPREDAAQFNGTLSTATYPNRYSTVIPVEAPFYRIGLTLTVTDKATGTKRKLIEGLDYFLGHYFQELAEAENDAIYGSIMLLNATEVEYELLSVGRQYRIPASEIGKYLVKTDMKDPRNCDWSELMKYPPIISPIDPPKDLEEAILRDEIVKALEDIRLGILERAHELDEAFAEVTDLIYQNGKQVFDDEMYQHHLIKNAHGYTCGDIGALPVLGKAVDATKAFGRTLAELVTLMSTSGIQQKHVDMLLDNTLGDLLGRMRVLNNDAITFQTTSGHVISMKGEKFIITSTKPLVLKADQDNNEPGIATEFSAGLNTLWVHSGKAGDKWGAYDAGVLAPVYNSVYLVTPDMVKMYLTSVKILPANAYFKSSDTLKIYGSGKETNKVYMNAELPAATTTVQGLFAITNLSASAAASTAISQKAVTDLKNKLDGYVDDTYTVNGKGFVLDSNGQMHLTLTAADFGIEKMDNTGPLEKPVTNALRTVLSGKALTTHTHTIADLDNVPYASTSVTGLAKLWDAIDTTSDKMVTSRQGFLLEQKIDTLNDKIGTLLPAWTVGGSSYGNNNFLPIPVQGNYEGYTKNQTWQKGLARYESGKVYSLRNGSNGNPPGDWAIYYAYADVSPSNTLENMQQTSVRYRPAGMSAYPGVNLVAIVITGTDAMICLGSDGAYYLVIFDGTIDHAKHHRVVKVQLGDYRNGNAAGVITTAPWVVDPSTNDLIVCNERVYLLRTVLTSGDYFVSMRSIALDELNLGGSNTFVADVLTGGMLTSGDNIYLRQGQKRSDTDVLVAPVTQIYADASAKWNSARNFVHGPECNHAIGVDGLNFRVGLTPTVWFASTTGQTINFKQWVSSFVVDCSSMTITLEGADRFPIVADLTTVRYNGGAEIGIPSRKWGEGQANNRTFATSQDKYIVSQGHAGDRDLMPYVTITTLDDGVSWYEYLSCDYNFSARSFSAVMLNQGRGSIYELGMAYPLTLGANSRLIWLSQPRTRLAIEVEFDPNTTYSGKAGYGPTNNRRVVDSTTYENLSQMCHIVTPASPGTELNGWYCTGPETFPYHNVSGTFTIHADRLTLSQAEWDKMKQMIIDGAPAGAANGYASEFILAANNAGKALFSIWFIGIGTATPLTLAQVACTRTVNNVNLLDIYYFTLKPTISNGQVTFPAAILALFDFYNNLDYGLNYATLGEITGGKTRRPGQPTLVSVDGTQFGLYLPHTLTLRQIGDLGALNYGVGLTLSNGTWTRSSAPHGIGRMAPSHTPVSPAYLAHRDQVMLHNSSLDYVYCGGIAMSSRDFVAAPNFSGPTESVVIAGVETAEGWLVYVTEEVNLRFGSSTYKLPTWYIDLSAAFPTNHQNRTFYLHAKVENGTPKYVMDVTQHPDTETELYIGYVKTGSSRVVETNVEHAKRLGAVKQLLEHAAVENKHDVEVGRDAATGRLAPLRKEAMGPLSIDATKGYLDSQLLYTVSDAQRRGKAMVSKRFEGLKTLPAFTQANKSGAFWKHPTTIATVTADENGEAASLGMEWVGIPTPAFSPTSTNLMVVVQSKFVVPGTPGVETTFNVHVAPWEAVDGFFYNVEAEGTDVNIDENPEVLLPSPHTVHHKQHSLPAGVPCTFTFVAAVSSSALETANQHICSWLFTDAGGLPITTDLSDSKIQILPQPGETNGTPVVLNSRSYTFTNVTGAIPVVTTGAQGLFPPPIVAWDGDDLTLTIAHDWVNERGRQQPDIIQVNLMFRT

Physico‐chemical properties

protein length:	1727 AA
molecular weight:	188168,04360 Da
isoelectric point:	5,41769
aromaticity:	0,09207
hydropathy:	-0,15866

Domains [InterPro]

No domain annotations available.

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

WFG41561.1

1 1727

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	534	534	0,9141
Central domain	535	1294	761	0,8153
C-terminal	1295	1727	432	0,4690

Note: Constraints were applied during segmentation.
Fixed 16 C-terminal predictions appearing before Central domain

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-534

Central
535-1294

C-terminal
1295-1727

	Name	Taxonomy ID	Lineage
Phage	Salmonella phage MET_P1_082_240 [NCBI]	3032418	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	No host information

Coding sequence (CDS)

Genbank protein accession

WFG41561.1 [NCBI]

Genbank nucleotide accession

OQ383623 [NCBI]

CDS location

range 33335 -> 38518
strand +

CDS

ATGCCGAGAGAAGATGCGGCGCAGTTTAACGGTACCCTCAGTACCGCTACTTACCCGAACCGTTATTCGACGGTCATTCCCGTCGAAGCACCGTTCTATCGCATCGGGTTAACGTTAACCGTTACCGATAAAGCAACCGGAACCAAACGCAAGTTAATAGAAGGTCTTGATTATTTCTTAGGACATTACTTCCAGGAATTAGCCGAGGCTGAGAACGATGCAATATACGGCAGCATAATGCTGCTGAACGCCACAGAGGTAGAATACGAGTTGTTGTCGGTTGGTCGACAGTATCGCATCCCTGCTTCTGAAATCGGCAAGTATCTGGTTAAGACGGATATGAAAGACCCGCGCAACTGCGATTGGTCTGAGCTGATGAAATATCCACCGATTATCTCGCCAATTGACCCGCCAAAAGATCTCGAAGAAGCGATTCTTCGCGATGAAATCGTAAAGGCGTTGGAAGATATCCGTCTGGGTATTTTAGAGCGCGCCCACGAACTGGATGAGGCATTTGCCGAAGTTACCGATTTGATTTATCAGAACGGTAAACAGGTGTTTGATGACGAAATGTATCAACACCACCTGATTAAAAATGCACATGGTTACACCTGCGGTGACATTGGCGCACTCCCTGTGCTCGGTAAGGCCGTGGATGCGACTAAAGCGTTTGGACGTACACTGGCAGAGTTAGTGACGTTAATGTCTACCAGTGGCATCCAACAGAAACACGTTGACATGCTTCTGGATAATACCCTGGGCGATTTACTGGGCCGTATGCGTGTTCTGAATAACGACGCGATTACGTTCCAAACAACGTCTGGTCACGTTATCAGCATGAAGGGTGAGAAGTTCATCATCACCTCGACAAAACCGCTGGTATTAAAAGCTGACCAGGATAACAACGAACCGGGTATCGCTACGGAGTTCAGTGCTGGTCTGAACACGCTTTGGGTTCACTCGGGTAAAGCAGGTGACAAGTGGGGCGCTTATGATGCAGGTGTGCTTGCACCTGTGTATAACAGCGTGTATCTCGTTACACCGGATATGGTTAAGATGTACTTGACCTCGGTGAAGATACTTCCAGCAAACGCCTACTTCAAGTCCAGCGACACGTTGAAGATTTACGGCTCTGGTAAAGAAACAAACAAAGTTTACATGAATGCGGAGCTGCCTGCAGCAACCACAACTGTGCAGGGTTTGTTTGCGATTACTAACCTCTCGGCATCCGCTGCGGCGTCCACTGCAATCTCTCAAAAAGCTGTTACTGACTTGAAGAACAAACTCGACGGATATGTGGACGACACGTATACAGTCAACGGTAAAGGGTTTGTATTAGATTCAAACGGGCAGATGCATCTGACCTTAACCGCGGCAGATTTCGGTATTGAGAAAATGGACAATACCGGACCGTTAGAAAAGCCAGTTACTAACGCATTGCGTACCGTGCTATCAGGCAAAGCGCTTACAACGCACACCCACACCATTGCAGATCTAGATAACGTGCCGTACGCATCCACGTCTGTTACAGGTTTGGCTAAACTGTGGGATGCAATCGACACTACCTCGGATAAGATGGTCACTTCGCGTCAGGGCTTCTTGCTTGAACAAAAGATTGACACACTGAATGACAAGATTGGTACGTTATTACCGGCGTGGACTGTCGGCGGATCATCGTACGGCAACAATAACTTCTTGCCTATACCAGTCCAGGGGAACTACGAAGGGTATACCAAAAACCAAACCTGGCAGAAAGGTTTGGCGCGTTACGAGTCTGGTAAGGTTTACTCGCTCCGTAACGGTTCTAACGGGAATCCACCAGGTGACTGGGCTATCTATTACGCCTATGCTGATGTGTCGCCAAGCAATACGCTGGAAAATATGCAGCAGACGTCCGTACGTTATCGACCCGCTGGAATGTCGGCGTATCCTGGGGTGAATCTGGTTGCTATTGTGATTACCGGTACAGATGCAATGATCTGCTTAGGCAGTGATGGTGCGTATTACCTGGTCATCTTTGACGGCACCATTGACCATGCAAAACATCATCGTGTTGTTAAAGTTCAGTTGGGCGATTACCGAAATGGTAACGCGGCCGGTGTGATTACAACCGCTCCATGGGTTGTTGATCCATCAACAAACGATTTGATCGTTTGCAACGAGCGGGTTTATCTGCTCCGTACTGTGCTTACCTCCGGTGACTATTTCGTGAGTATGCGTAGCATCGCACTCGACGAACTTAATCTGGGTGGTAGCAACACGTTTGTGGCGGATGTGTTAACAGGTGGGATGTTAACGTCGGGAGATAATATCTACTTGCGTCAGGGTCAGAAACGTTCTGATACAGATGTGTTGGTAGCGCCAGTAACACAAATCTACGCAGACGCATCGGCGAAGTGGAATAGTGCGCGAAATTTCGTCCATGGTCCGGAATGTAATCACGCGATTGGTGTGGATGGGTTGAACTTTCGTGTTGGTTTAACTCCAACGGTTTGGTTTGCTTCTACTACAGGGCAAACTATTAACTTTAAACAATGGGTGTCAAGCTTTGTTGTTGATTGTAGTTCAATGACGATAACGCTGGAAGGTGCTGATCGATTCCCTATTGTGGCCGATCTTACCACGGTTCGTTATAACGGTGGCGCTGAGATTGGGATTCCGAGCCGGAAATGGGGCGAAGGTCAAGCTAATAACCGAACCTTTGCAACATCGCAAGACAAGTATATCGTTTCGCAAGGACATGCAGGCGATCGCGACCTAATGCCTTATGTCACGATTACAACGTTAGATGACGGTGTGAGTTGGTACGAGTACCTGTCGTGCGACTACAACTTCAGTGCCAGAAGTTTTAGTGCGGTAATGTTAAACCAAGGTCGTGGTTCTATCTACGAGCTGGGTATGGCGTATCCGCTGACTCTGGGAGCGAATTCCAGACTTATCTGGTTGTCACAGCCGCGTACCCGTTTGGCAATTGAAGTTGAGTTTGATCCGAACACCACTTATTCAGGTAAAGCGGGGTATGGACCAACTAACAATCGTCGTGTAGTAGATTCTACCACGTACGAGAATCTGTCGCAGATGTGCCACATTGTTACACCGGCGTCGCCTGGTACAGAGTTAAACGGCTGGTATTGCACAGGACCAGAAACATTCCCTTACCACAACGTTTCTGGCACTTTCACGATTCATGCCGATCGGTTGACGCTGTCACAAGCCGAATGGGATAAGATGAAGCAGATGATCATCGACGGCGCACCGGCTGGCGCTGCGAATGGTTATGCTTCGGAATTTATCCTTGCCGCAAATAACGCCGGAAAGGCACTGTTCTCCATTTGGTTCATCGGCATTGGTACGGCCACACCGCTCACGTTAGCACAAGTAGCATGTACGCGTACTGTGAACAATGTTAACTTGTTGGATATCTACTACTTTACACTGAAACCAACAATCAGCAACGGGCAGGTAACATTCCCGGCAGCGATATTGGCATTGTTTGACTTCTATAACAACCTCGACTATGGCTTGAACTATGCTACGTTGGGTGAGATAACGGGAGGAAAAACACGCCGGCCGGGACAACCTACACTGGTGTCAGTAGATGGTACTCAGTTCGGGTTGTATCTTCCACACACGTTAACCTTGCGCCAAATTGGCGACTTGGGTGCGCTTAACTACGGTGTTGGTCTTACGCTGTCTAATGGTACCTGGACGCGTTCTTCTGCTCCACACGGCATTGGACGCATGGCACCATCCCACACTCCAGTCAGCCCAGCTTATCTGGCTCATCGTGATCAGGTGATGCTACACAACTCATCTCTCGACTACGTCTATTGTGGTGGTATCGCAATGTCGTCGAGAGATTTTGTCGCGGCTCCTAATTTTAGTGGCCCGACTGAATCGGTTGTCATTGCTGGTGTGGAAACAGCCGAAGGTTGGCTGGTATATGTGACTGAGGAAGTTAACCTGCGTTTCGGCTCGAGCACTTATAAGCTGCCTACGTGGTATATTGACCTCAGCGCAGCATTTCCAACAAACCATCAGAACCGGACATTCTACCTGCACGCCAAGGTAGAAAATGGTACACCGAAGTACGTAATGGACGTGACTCAACATCCAGACACTGAAACGGAACTCTATATCGGGTATGTTAAAACGGGCTCGTCGCGAGTCGTCGAGACTAACGTCGAACATGCTAAGCGATTGGGGGCGGTGAAACAACTGTTGGAACATGCGGCGGTTGAGAATAAGCATGATGTGGAAGTGGGAAGGGATGCAGCAACGGGCAGACTGGCACCATTGCGTAAAGAAGCGATGGGTCCTTTGTCGATCGATGCTACGAAAGGCTATCTAGATAGTCAGTTGCTTTATACCGTATCTGACGCACAGCGTCGCGGTAAAGCGATGGTGTCCAAACGTTTCGAAGGCTTGAAAACTTTGCCGGCGTTTACTCAGGCAAACAAGTCGGGGGCGTTTTGGAAACATCCTACAACAATTGCGACGGTAACGGCCGATGAGAACGGTGAAGCGGCATCGTTGGGAATGGAGTGGGTAGGTATTCCAACGCCCGCTTTCTCTCCGACCTCAACGAACTTGATGGTGGTGGTGCAAAGTAAATTCGTCGTCCCAGGTACACCGGGAGTAGAAACGACCTTTAATGTCCACGTTGCCCCATGGGAGGCGGTGGATGGCTTTTTCTACAACGTCGAAGCGGAAGGTACGGATGTTAACATTGATGAAAATCCAGAAGTGTTATTGCCGTCACCACACACCGTGCACCACAAACAGCACTCTCTGCCAGCAGGCGTGCCGTGCACCTTTACATTTGTCGCGGCGGTAAGTTCTTCAGCGCTCGAAACAGCTAACCAGCATATTTGCTCTTGGCTTTTCACTGACGCTGGGGGACTACCAATCACCACCGATCTTTCGGATAGTAAGATTCAAATCTTACCACAGCCGGGAGAGACCAACGGCACACCAGTTGTTCTGAACAGTCGTAGCTACACGTTTACGAATGTGACAGGTGCAATCCCGGTTGTTACCACGGGCGCTCAGGGTTTATTCCCACCACCGATCGTGGCGTGGGATGGCGATGATCTTACGTTAACGATTGCGCACGATTGGGTGAACGAGAGAGGACGTCAACAGCCTGATATTATCCAGGTCAATCTTATGTTCCGTACCTAA

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence