ケモインフォマティクス(Cheminformatics)を勉強する際に役立つ書籍・オンライン教材・ツール・ブログ紹介
ケモインフォマティクスの研究をやろうとした際、恐らく初めに悩むのは勉強するための教材が少ないことだと思います。
ここ最近でいくつか書籍やオンラインチュートリアルなどが出てきてはいますが、それらの情報源に書学者が辿り着くにはなかなか厳しいかと思います。
そこでこの記事では、初学者がスムーズに勉強できるように分野界隈ではよく知られているであろう書籍・教材・ツール・ブログをまとめようと思います。
※ここに全てを載せることはできないので、これが入ってないのはおかしいだろ!というものがありましたらご指摘いただけたらと思います。
一覧を見たい方
書籍
ケモインフォマティックス―予測と設計のための化学情報学
今となっては情報としても古くなってしまいましたが、「ケモインフォマティックス― 予測と設計のための化学情報学」は東大の船津先生が翻訳された当時のケモインフォマティクスが網羅的に解説されている書籍。
ケモインフォをやっている方の多くはこの書籍を読まれたのではないでしょうか。
(日本語で)歴史的な流れも含めて体系的に勉強できるほぼ唯一のソースではないでしょうか。
現在は絶版となっておりかなり高額になっているため、図書館等で借りて読むのが良いかと思います。
Tutorials in Chemoinformatics
「Tutorials in Chemoinformatics」は比較的最近出てきたケムインフォに関する書籍です。
洋書のため初学者にとっては少し厳しいかもしれないが、スクリプトやツールの使用画面等が豊富に盛り込まれているため、そっちのスキルがある場合はすんなりと勉強できるかもしれないです。
様々なタスクを紹介しており、タイトル通りチュートリアルとしては十分役に立つかと思います。
ただ唯一不満があるとしたら、Kindle版は非常に見にくくなっているため、書籍版で購入することをお勧めします。
化学のための Pythonによるデータ解析・機械学習入門
「化学のための Pythonによるデータ解析・機械学習入門」明治大の金子先生が書かれている化合物×機械学習・データ解析がメインの書籍。
大部分はタイトル通りデータ解析・機械学習メインであり、題材が化合物を使ったものになっている感じです。
ケムインフォを勉強しようと思って購入するとちょっとズレているかもしれないが、とても丁寧に解説されているので上記のことを勉強したかったらお勧めします。
オンライン教材
py4chemoinformatics
「py4chemoinformatics」はMishima.sykが作成した、日本語で学べる数少ないケモインフォに関するオンライン教材。
こちらはドキュメントが充実しており、一部はJupyter Notebookも提供されている。
現在も適度に更新されており、最新のケモインフォについて勉強したかったらこれをフォローしておくと良いと思います。
TeachOpenCADD
「TeachOpenCADD」はコンピュータ支援創薬(CADD)を学ぶことのできるJupyter Notebookベースのオンラインチュートリアルです。
Jupyter NotebookだけでなくKNIMEでも利用することができ、どちらも国際雑誌に掲載されています。
- TeachOpenCADD: a teaching platform for computer-aided drug design using open source packages and data
- TeachOpenCADD-KNIME: A Teaching Platform for Computer-Aided Drug Design Using KNIME Workflows
どちらもコードやワークフローだけでなく、文章もきちんと記載されておりCADDの流れを一通り勉強したい人には最適かと思います。
ライセンスもCC BY 4.0となっており、企業の方でも利用しやすいのも良いと思います。
ツール
RDKit
Pyhtonでケムインフォをやる場合は必須と言っていいほどのツールではないでしょうか。
多くの研究はRDKitを使用して行われており、現在も精力的に開発がされています。
チュートリアルは充実はしているが、全機能については書かれいないため使い方を調べるときに苦労することがしばしば。
ドキュメントも丁寧に書かれているわけではないので、本格的に使いこなすには自力で使い方を調べられるスキルは必須だと思います。
ChemAxon
ChemAxonはケモ・バイオインフォに関する様々なアプリケーションを提供しています。
有償にはなるがアカデミックフリーであり、有償ならでは痒いところに手が届く機能が豊富にある。
アプリケーションだけでなくJava/.NET APIも提供しており、研究用途にも利用しやすい。
ただし、APIのドキュメントは十分整備されているとは言えず、試行錯誤することも多々あるかと思います。
DeepChem
DeepChemはオープンソースの創薬・材料科学・量子化学・生物学向けのツール群。
深層学習を含め多種多様なことができる一方、最近はいろいろなことができすぎるため扱いが難しくなってきている印象。
ただ最近のケムインフォツールとしては間違いなく代表的格だと思います。
Chainer Chemistry
Chainer ChemistryはChainerベースのケムインフォ向けの深層学習フレームワーク。
Chainerをメインで使用している人にとっては使い勝手の良いフレームワークではあったが、Chainerの開発が終わってしまったためこれ以上はメンテナンスはされないのが残念です。
kGCN
kGCNは化合物をグラフとして扱う手法に特化した深層学習フレームワーク(私も開発に関わっています)。
Command Line Interface、KNIME、Jupyter Notebookと様々なインターフェースに対応しており、様々なユーザーに対応できるようにしています。
DScribe
DScribeは原子構造を固定長の記述子に変換するためのオープンソースのPythonライブラリです。
計算できる記述子としては、「Coulomb matrix, Sine matrix, Ewald sum matrix, Atom-centered Symmetry Functions (ACSF), Smooth Overlap of Atomic Positions (SOAP), Many-body Tensor Representation (MBTR), Local Many-body Tensor Representation (LMBTR)」があります。
matminer
matminerは材料系のデータの取得から解析までを行えるオープンソースのPythonライブラリです。
ブログ
Practical Cheminformatics
CHEMINFOGRAPHIC
データ化学工学研究室(金子研究室)@明治大学
IS LIFE WORTH LIVING?
Cheminformatics 2.0
おまけ
Awesome Cheminformatics
Awesome Cheminformatics はケモインフォマティクスに関する情報をかなり網羅的にまとめてあるレポジトリです。
なにか自分がやりたいことができるツールなどを調べたいときに役立つと思います。
終わりに
以上、ざっと私が把握している中で主要なものをまとめさせてもらいました。
ここで紹介したもの以外にももちろん多様なものが世の中にはありますが、まずはここにあげたものを勉強しておけばケムインフォについてある程度把握することはできるのではないでしょうか。
この情報が何かの役に立つことを祈ります。
ケモインフォマティクス(Cheminformatics)を勉強する際に役立つ書籍・オンライン教材・ツール・ブログ紹介
https://sishida21.github.io/2020/04/11/recommend-cheminfo-books-and-tutorials/