機械学習メモ

化学を機械学習で何か

Xenonpyのインストール

動機

2023年3月17日より、Xenonpyを使った機械学習の方法を勉強するためにしばらくは、Xenonpyに関する事柄を自分のために記録する。小目標として、「Xenonpy(https://github.com/yoshida-lab/XenonPy)を使いこなす。」
を掲げて、しばらく続けていく。
しかしながら、少しの縛りを設ける必要がある。

機材と環境

Macbookpro(2021,14inch)
Miniconda (arm64 Apple Silicon)インストール済み

Linuxではなくて(あるけど)、MacのM1搭載機をフル活用したいので、機材に選んでいる。

準備

Xenonpyの環境を作成するのがまず最初にやるべきことで、コマンドを羅列していく。

conda create -n xenonpy  python=3.8
conda activate xenonpy
pip install xenonpy


不足しているパッケージ

  • PyTorch
  • Tensorly
  • Matminer
  • Xgboost
  • Ngboost
  • Fastcluster
  • Rdkit
  • OpenNMT-py
  • Optuna
  • Ipympl

Pytorch2.0.0がリリースされて話題になっているが、pytorch_geometricを使いたいので、あえて1.13を入れる。M1 Apple silicon用にバイナリが用意されていないため、pyg-libはソースからコンパイルする必要がある。ここではbrewでcmakeを導入した。

pip3 install torch==1.13 torchvision torchaudio
pip install pytorch-lightning 
pip install  torch_scatter torch_sparse torch_cluster torch_spline_conv torch_geometric
brew install cmake 
pip install git+https://github.com/pyg-team/pyg-lib.git  

ここまでできたら、そのほかの足りないライブラリーを入れる。

pip install tensorly matminer xgboost ngboost fastcluster rdkit-pypi OpenNMT-py optuna ipympl  jupyterlab

Pythonのコンソール画面で試してみて、表面上はインストールできていることを確認した。

Python 3.8.16 | packaged by conda-forge | (default, Feb  1 2023, 16:01:13) 
[Clang 14.0.6 ] on darwin
Type "help", "copyright", "credits" or "license" for more information.
>>> import xenonpy
>>> xenonpy.__version__
'0.6.7'
>>> from rdkit import Chem
>>> mol=Chem.MolFromSmiles("C")
>>> mol
<rdkit.Chem.rdchem.Mol object at 0x104c65120>