機械学習メモ

化学を機械学習で何か

Materials informaticsって

学習モデルについては、かなりな勢いで進化を遂げていて、深層学習は任意の写像を表現できる強力な手法でもある。

 

ニューラルネットワークと深層学習 (nnadl-ja.github.io)

「まず、この表現はニューラルネットワークは任意の関数を完全に計算できる事を意味するのではありません。 そうではなく、好きなだけ近い近似関数を得られるという意味です。 隠れ層のニューロンを増やすことで、近似の精度を上げることができます。」

 

他方で、記述子選びが大変で、一筋縄で行かない場合がほとんど。

 

Fingerprintを利用する問題点も書籍で指摘されていた通り。分子自体の記述子の導入という手も確かにあるだろう。それでも、一筋縄で行かない場合の方策があれば良いのだが、まだ出会ったことはない。

 

グラフ折りたたみニューラルネットワークも、良いのだけれど、最良の方法でもない場合がある。

【機械学習+分子設計】分子生成モデルの主要トレンド - ころがる狸 (dajiro.com)

 

現状考えうる、分子表現は以下のようにレビューが多数ある。

 

Molecular representations for machine learning applications in chemistry - Raghunathan - 2022 - International Journal of Quantum Chemistry - Wiley Online Library

 

A review of molecular representation in the age of machine learning - Wigh - 2022 - WIREs Computational Molecular Science - Wiley Online Library

 

Molecular representations in AI-driven drug discovery: a review and practical guide | Journal of Cheminformatics | Full Text (biomedcentral.com)

 

次はMOLGANも見てみるかな。

 

magic3007/MolGAN-pytorch: 🦑 Pytorch implementation of MolGAN: An implicit generative model for small molecular graphs. (github.com)