alvaModel/alvaRunner

alvaModel

 

製品情報

alvaModelは、定量的構造活動/特性関係(QSAR / QSPR)モデルを作成するためのソフトウェアツールです。これらのモデルは、化学物質の生物学的、物理化学的、環境的特性を予測するために使用できます。

 

ビルドとデプロイ

QSAR / QSPR回帰モデルを構築および展開するためのAlvascienceのソリューションは、alvaModelとalvaRunnerの 2つのソフトウェアで構成されています。後者は、alvaModelを使用して作成されたモデルを、他のソフトウェアツールを必要とせずに新しい分子セットに適用できるソフトウェアツールです。

このソリューションは、モデルのトレーニングを展開から分離します。したがって、モデルを第三者に展開したり(再現性を証明するために利用可能にしたい場合など)、他の人が作成したモデルを使用したりできます(科学論文で説明されているモデルをテストする場合など) 。

alvaModelを使用すると、以前にalvaDescで計算された記述子とフィンガープリントを使用してQSAR / QSPR回帰モデルをトレーニングできます。予測するターゲット変数は、外部テキストファイルからインポートできます。

 

GUI

使用する分子記述子、物理化学的特性をわかりやすいGUI上で選択でき、簡潔なステップでモデルを作成できます。

 

遺伝的アルゴリズムを用いた特徴選択

alvaDescプロジェクトの記述子は極めて多くなりえます(5000以上)。alvaModelは、定義されたスコア(R2, Q2, RMSEなど)に従って最適なモデルを見つけるために、遺伝的アルゴリズムによる機能選択を実行可能です。

 

特徴の削減

いくつかの機能削減ツールを使用して、モデルをトレーニングする記述子の数を減らすことができます(定数値、標準偏差、ペア相関など)。

 

回帰モデル

いくつかの回帰モデルが利用可能です。

1.Ordinary Least Squares (OLS)モデル

2.kNNモデル、具体的にはa weighted Nearest Neighbour Regression (wNNR)モデル

3.選択したモデルによって予測された値の算術平均として定義されたコンセンサスモデル

 

適用ドメイン

モデルの適用領域は、トレーニングデータセットと指定された分子の類似性を測定することで推定できます。In/out表示は、分子が適用可能ドメイン内であるか否かを示します。利用可能な適用可能ドメイン判断手法は距離ベース(平均距離など)とレバレッジ(いわゆるHat Matrix)です。

 

実際にalvamodelを用いて作成されたモデルはこちら(alvarunnerを用いて分子に適用できます。)

 

更新情報/バージョン情報

v 1.0.4(2020年4月20日付リリース)の主な改善点

  • Modelsメニューで「自動モデル構築」を選択している場合に表示されるエラーメッセージが修正されました。
  • Modelsメニューで「自動モデル構築」を使用する際に、「Exclude row if missing value found(欠損値を含む行を除外)」オプションを無効にしました。
  • 整数列に’na’を含む外部変数をインポートした際に生じていた問題が修正されました。
  • alvaDescプロジェクトファイルを読み込む際に、不適切あるいは記述子が無効な分子を除去する自動処理が導入されました。(MasterCleanedデータセット)
  • LinuxとmacOS版においてUIの軽微な不具合が修正されました。

v 1.0.2(2020年3月4日付リリース)の主な改善点

  • Modelsのツリーに表示されているモデルを右クリックして表示されるメニューから、そのモデルに関するトレーニングとテストのデータセットを変更できるようになりました。
  • Modelsのツリーに表示されているモデルを右クリックして表示されるメニューからモデルの複製を行うことができるようになりました。
  • columnの値を用いてモデルを分割できるようになりました。
  • 外部変数を入力に用いてモデルを構築することができるようになりました。

(※ 外部変数はalvaDescのプロジェクトファイルに含まれる形でも、別途インポートをする方法でも入力できます。)

  • 線形回帰モデル(OLS)の切片と独立変数としての各記述子(column)に対する係数(βi)がmodel viewの中に表示されるようになりました。

(※ OLS: Ordinary Least Squares regression)

  • 外部変数のインポートダイアログにText qualifierのフィールドが追加されました。(alvaDesc 1.0.18と同様)
  • alvaDescのプロジェクトファイルをインポートする際に、alvaDescでそのファイルを使用している状態でもalvaModelにインポートできるようになりました。

動作環境

◎Windows(64bit)

◎Mac OS

◎Linux

 

関連ツール

  • 入力はalvaDescを用いて作成されたプロジェクトです。
  • モデルは新規分子セットに適用できる形でalvaRunnerにエクスポート可能です。

 

alvaRunner

 

製品情報

alvaRunnerは、一連の分子に定量的構造活性/特性関係(QSAR / QSPR)回帰モデルを適用するソフトウェアツールです。これらのモデルは、化学物質の生物学的、物理化学的、環境的特性を予測するために使用できます。

 

モデルの適用

このソフト単体で指定されたQSAR / QSPR回帰モデルを適用するために必要な記述子とフィンガープリントを計算できます。QSAR / QSPR回帰モデルはalvaModelを使用して作成する必要があり、たとえば以下の目的で第三者の利用を許可するために展開できます。

1.論文等で再現性を証明するため。

2.モデルを組織内で利用するため。

 

GUI

インポートしたすべての分子について予測ターゲット、モデルの適用ドメイン内外の判定をGUI上で確認できます。

 

こちら

 

更新情報/バージョン情報

v 1.0.4(2020年4月20日付リリース)の主な改善点

  • 軽微な変更と不具合の修正が行われました。

v 1.0.2(2020年3月4日付リリース)の主な改善点

  • 線形回帰モデル(OLS)の切片と独立変数としての各記述子(column)に対する係数(βi)がviewメニューのProject detail中に表示されるようになりました。

(※ OLS: Ordinary Least Squares regression)

  • ヘッダーがついたままのSMILESフォーマットファイルを読み込むことができるようになりました。

 

動作環境

◎Windows(64bit)

◎Mac OS

◎Linux

 

関連ツール

  • 入力はalvaModelを用いて作成されたプロジェクトです。
  • モデルを分子セットに適用するために必要な記述子計算をalvaDescのライセンスなしで実行可能です。
公開日:2020/02/18
最終更新日:2020/06/22