alvaModel/alvaRunner

alvaModel

 

製品概要

alvaModelは、定量的構造活性/特性相関(QSAR / QSPR)モデルを作成するためのソフトウェアツールです。これらのモデルは、化学物質の生物学的、物理化学的、環境的特性を予測するために使用できます。

alvaDescを用いて作成されたプロジェクトをロード可能です。モデルは新規分子セットに適用できる形でalvaRunnerにエクスポート可能です。

開発元:イタリア Alvascience srl

 

関連製品

alvaDesc

最大5,000超の分子記述子と3種(PFP/ECFP/MACCS166)のフィンガープリント計算が可能なソフトウェア。

alvaDescページはこちら

alvaBuilder blank

de novo分子設計用のソフトウェアツール。

alvaBuilderページはこちら

alvaMolecule blank

分子データセットを分子グリッドもしくはスプレッドシートとして可視化し、分析キュレート及び標準化を行うソフトウェア。

alvaMoleculeページはこちら

 

主要な機能

ビルドとデプロイ

QSAR / QSPRの回帰と分類モデルを構築および展開(deploy)するためのAlvascienceのソリューションは、alvaModelとalvaRunnerの 2つのソフトウェアで構成されています。後者は、alvaModelを使用して作成されたモデルを、他のソフトウェアツールを必要とせずに新しい分子セットに適用できるソフトウェアツールです。

このソリューションにより、モデルのトレーニングと展開を別々に実行することが可能です。したがって、第三者がモデルを展開したり(再現性を証明するために利用可能にしたい場合など)、他の人が作成したモデルを使用したりすることができます(科学論文で説明されているモデルをテストする場合など) 。

alvaModelを使用すると、以前にalvaDescで計算された記述子とフィンガープリントを使用してQSAR / QSPRモデルを学習・構築することができます。予測する目的変数は、外部ファイルからインポートします。

blank

 

GUI

使用する分子記述子、物理化学的特性をわかりやすいGUI上で選択でき、簡潔なステップで回帰・分類モデルを作成できます。

 

遺伝的アルゴリズムを用いた特徴選択

alvaDescプロジェクトの記述子は極めて多くなりえます(5000以上)。alvaModelは、定義されたスコアに従って最適なモデルを見つけるために、遺伝的アルゴリズムによる機能選択を実行可能です。

 

特徴の削減

いくつかの機能削減ツールを使用して、モデルをトレーニングする記述子の数を減らすことができます(定数値、標準偏差、ペア相関など)。

 

回帰モデル

次の回帰モデルを利用可能です。

1.Ordinary Least Squares (OLS)モデル

2.Partial Least Squares (PLS) モデル

3.KNNモデル、具体的にはa weighted Nearest Neighbour Regression (wNNR)モデル

4.Support Vector Machine (SVM) モデル

5.選択したモデルによって予測された値の算術平均として定義されたコンセンサスモデル

 

分類モデル

次の二値分類モデルを利用可能です。

1.Linear Discriminant Analysis (LDA) モデル

2.Quadratic Discriminant Analysis (QDA) モデル

3.Partial Least Squares Discriminant Analysis (PLS-DA) モデル

4.KNNモデル

5.Support Vector Machine (SVM) モデル

6.選択したモデルによって予測された値の算術平均として定義されたコンセンサスモデル

 

適用ドメイン

モデルの適用領域は、トレーニングデータセットと指定された分子の類似性を測定することで推定できます。In/out表示は、分子が適用可能ドメイン内であるか否かを示します。利用可能な適用可能ドメイン判断手法は距離ベース(平均距離など)とレバレッジ(いわゆるHat Matrix)です。

 

実際にalvaModelを用いて作成されたモデルはこちら(alvaRunnerを用いて分子に適用できます。)

 

バージョン情報

 

バージョン2.0.8(2023年420日リリース)

  • モデル作成後に分子をダブルクリックして開く”Prediction detail”ウィンドウの”Fragment contribution”表示に於いて、スキャフォールドとリンカーでの環外二重結合(exocyclic double bond)を含むBemis-Murckoフレームワークの検出を改良しました。
  • モデル作成後のグラフに於いて、表示させるデータセットを”Test”にした際のヒストグラムの色を修正しました。
  • Apple M1/M2 CPUで使用する際に生じる可能性のあるランタイムエラーを修正しました。

バージョン2.0.6(2022年11月1日リリース)

  • PLSモデルの潜在変数(Latent Variables: LV)の最適値を探すための機能を追加しました
  • PLS-DA分類モデルに於ける主成分数の計算を改善しました
  • PLS-DA分類モデルに対するクロスバリデーションスコアの計算を修正しました
  • 前処理されたデータ入力に対するPLS-DA分類モデルとPLS回帰モデルに於けるクロスバリデーションスコアの計算を修正しました

バージョン2.0.4(2022年6月1日リリース)

  • Yランダマイゼーションテスト結果の表と統計情報、KNN法で生成されたモデルでK値の最適化を行った結果の表を、テキストデータとしてクリップボードにコピーできるようになりました。
  • ヒストグラムや散布図、Yランダマイゼーションの結果などのチャートのデータをタブ区切りテキストファイルとしてエクスポートできるようになりました。
  • 分類モデルを生成した後、個々の分子をダブルクリックして現れる予測の詳細画面(Prediction detail)に於けるTarget値の不具合を修正しました。
  • 分類モデルを生成した後、分子グリッドに表示されるCorrect値をソーティングする際の不具合を修正しました。
  • 一つの行に空白の列が並んでいるファイルを外部変数ファイルとしてインポートする際に起こる不具合を修正しました。
  • ヘルプドキュメントの画像と記述を変更しました。

バージョン2.0.2(2022114日リリース)

  • Y-ランダマイゼーションテストを実行させるUIを追加しました。
  • 予測値から残差等へとモデル図表を切り替えた際に、選択されていた分子が保持されるようにしました。
  • macOSに於いてプロジェクトファイルをロード/インポートしている間に起こり得る不具合を修正しました
  • フィルタされて残った分子の全てを削除できるようにしました。これにより、フィルタを用いて不要な分子をデータセットから削除することができます
  • 前処理されたデータセット上でのSVMのハイパーパラメータ計算を修正しました。

バージョン2.0.0(2021年11月9日リリース)

  • 回帰モデルだけでなく、2値分類モデルも使用できるようになりました。
  • 対応する分類モデル
    • 線形判別分析(Linear Discrimination AnalysisLDA
    • 二次判別分析(Quadratic Discrimination AnalysisQDA
    • 部分的最小二乗判別分析(Partial Least Squares Discrimination AnalysisPLS-DA
    • K近傍法(K-Nearest Neighbors AlgorithmKNN
    • サポートベクターマシン(Support-Vector MachineSVM
    • コンセンサスモデル
  • 分類モデルに対する主要なスコアを付加しました。(検出率など)
  • 新たな回帰モデルを追加しました。
    • 部分的最小二乗回帰(Partial Least Squares RegressionPLS
    • サポートベクターマシン(Support-Vector MachineSVM
  • スプレッドシート形式の表にフィルタ機能が追加されました。
  • 外部変数のインポートがCSVファイルからだけでなくSMILESファイルからもできるようになりました。
  • モデルによる予測結果がSMILESファイルやMDL/SDFファイルとしても出力できるようになりました。
  • 新しいモデル図表を追加しました。
    • ウィリアムスプロット
    • 最小二乗回帰(OLS)と部分的最小二乗回帰(PLS)の回帰係数βの棒グラフ
    • 記述子と予測値のヒストグラム
  • 最小二乗回帰(OLS)モデルの回帰係数βを手動で編集できるようになりました。
  • K近傍法(KNN)モデルに対し、近傍のサンプル個数(K値)の最適値を探す機能を追加しました。
  • モデルに使用する記述子を変更するためのUIを追加しました。
  • 遺伝的アルゴリズムによる自動モデル生成の進捗状況表示が改善され、時間の経過と共にスコアが伸びていくトレンドを表示するグラフとなりました。
  • 個々のサンプル(分子)に関する予測を分析するためのUIを追加しました。
    • 原子毎の寄与
    • フラグメント毎の寄与
    • KNN法で用いられたK個の近傍サンプル(分子)
  • alvaModel 2.0.0 と完全互換なalvaRunner 2.0.0 alvaRunner KNIME Pluginを同時にリリースしました。
  • macOS Montereyに対応しました。

バージョン1.0.8(2020年12月14日リリース)

  • テンプレート保存機能がalvaDesc バージョン2.0の記述子をサポートするようになりました。
  • AllからTraining/Testへの切り替えの際に生じていた行の色がリセットされるバグを修正しました。
  • 列数が数千の場合に生じていた自動モデル生成の問題を修正しました。
  • 大規模なalvaDescプロジェクトをインポートする際のエラーを修正しました。

バージョン1.0.4(2020年4月20日リリース)

  • Modelsメニューで「自動モデル構築」を選択している場合に表示されるエラーメッセージが修正されました。
  • Modelsメニューで「自動モデル構築」を使用する際に、「Exclude row if missing value found(欠損値を含む行を除外)」オプションを無効にしました。
  • 整数列に’na’を含む外部変数をインポートした際に生じていた問題が修正されました。
  • alvaDescプロジェクトファイルを読み込む際に、不適切あるいは記述子が無効な分子を除去する自動処理が導入されました。(MasterCleanedデータセット)
  • LinuxとmacOS版においてUIの軽微な不具合が修正されました。

バージョン1.0.2(2020年3月4日リリース)

  • Modelsのツリーに表示されているモデルを右クリックして表示されるメニューから、そのモデルに関するトレーニングとテストのデータセットを変更できるようになりました。
  • Modelsのツリーに表示されているモデルを右クリックして表示されるメニューからモデルの複製を行うことができるようになりました。
  • columnの値を用いてモデルを分割できるようになりました。
  • 外部変数を入力に用いてモデルを構築することができるようになりました。

(※ 外部変数はalvaDescのプロジェクトファイルに含まれる形でも、別途インポートをする方法でも入力できます。)

  • 線形回帰モデル(OLS)の切片と独立変数としての各記述子(column)に対する係数(βi)がmodel viewの中に表示されるようになりました。

(※ OLS: Ordinary Least Squares regression)

  • 外部変数のインポートダイアログにText qualifierのフィールドが追加されました。(alvaDesc 1.0.18と同様)
  • alvaDescのプロジェクトファイルをインポートする際に、alvaDescでそのファイルを使用している状態でもalvaModelにインポートできるようになりました。

 

動作環境

 

対応OS

  • 64-bit Windows
  • 64-bit Mac OS
  • 64-bit Linux

 

ライセンス形態

alvaModelのライセンスは、企業向け一般ライセンス(商用)とアカデミックライセンス(教育用)の2種類のライセンス形態があります。

 

評価ライセンス

無償評価ライセンスをご提供可能です。

ご希望の場合、こちらの評価ライセンス申請フォームからご申請いただくか、弊社営業までお問い合わせください。

 

価格情報

alvaModelのライセンス価格は、企業向け一般ライセンス(商用)とアカデミックライセンス(教育用)の形態によって異なります。ライセンス形態と価格については、お問い合わせフォームからお問い合わせいただくか、弊社営業までお問い合わせください。

 

alvaRunner

 

製品概要

alvaRunnerは、一連の分子に定量的構造活性/特性関係(QSAR / QSPR)モデルを適用するソフトウェアツールです。これらのモデルは、化学物質の生物学的、物理化学的、環境的特性を予測するために使用できます。

モデルの記述子とフィンガープリントはalvaDescの技術を使用して計算されますが、alvaDescライセンスは必要ありません。alvaRunnerプロジェクトに含まれるモデルは、alvaModelを使用して準備する必要があります。

KNIMEでalvaRunnerの使用が可能になりました(alvaRunnerプラグイン)。

開発元:イタリア Alvascience srl

 

主要な機能

モデルの適用

このソフト単体で指定されたQSAR / QSPRの回帰と分類モデルを適用するために必要な記述子とフィンガープリントを計算できます。QSAR / QSPRモデルはalvaModelを使用して作成する必要があり、たとえば以下の目的で第三者の利用を許可するために展開できます。

1.論文等で再現性を証明するため。

2.モデルを組織内で利用するため。

 

GUI

インポートしたすべての分子について予測ターゲット、モデルの適用ドメイン内外の判定をGUI上で確認できます。

 

実際に適用することができるモデルはこちら(alvaModelを用いて作成できます。)

 

バージョン情報

 

バージョン2.0.8(2023年420日リリース)

  • モデルを適用し予測された値をダブルクリックして開く”Prediction detail”ウィンドウの”Fragment contribution”表示に於いて、スキャフォールドとリンカーでの環外二重結合(exocyclic double bond)を含むBemis-Murckoフレームワークの検出を改良しました。
  • Apple M1/M2 CPUで使用する際に生じる可能性のあるランタイムエラーを修正しました。

バージョン2.0.6(2022年11月1日リリース)

  • 一つの分子が無効な場合のSDF/MDFへのエクスポートを修正しました

バージョン2.0.4(2022年6月1日リリース)

  • プロジェクトの詳細(Project details)画面に於いて、インポートしたモデル全体の情報と個々のモデルの情報をテキストデータとしてクリップボードにコピーできるようになりました。
  • 分類モデルの予測の詳細に於いてTarget値の不具合を修正しました。
  • ヘルプドキュメントの画像と記述を変更しました。

バージョン2.0.2(2022114日リリース)

  • ソートされた変数列に対するフィルタリングの動作を修正しました。

バージョン2.0.0(2021年11月9日リリース)

  • alvaModel 2.0.0に対応しました。

バージョン1.0.6(2020年7月20日リリース)

  • コマンドラインから操作できるようになりました。
  • KNIMEでalvaRunnerの使用が可能になりました(alvaRunnerプラグイン)。

バージョン1.0.4(2020年4月20日リリース)

  • 軽微な変更と不具合の修正が行われました。

バージョン1.0.2(2020年3月4日リリース)

  • 線形回帰モデル(OLS)の切片と独立変数としての各記述子(column)に対する係数(βi)がviewメニューのProject detail中に表示されるようになりました。

(※ OLS: Ordinary Least Squares regression)

  • ヘッダーがついたままのSMILESフォーマットファイルを読み込むことができるようになりました。

 

動作環境

alvaRunnerはコマンドラインからもGUIからも操作が可能です。

 

対応OS

  • 64-bit Windows
  • 64-bit Mac OS
  • 64-bit Linux

 

ライセンス形態

alvaRunnerのライセンスは、企業向け一般ライセンス(商用)とアカデミックライセンス(教育用)の2種類のライセンス形態があります。

 

評価ライセンス

無償評価ライセンスをご提供可能です。

ご希望の場合、こちらの評価ライセンス申請フォームからご申請いただくか、弊社営業までお問い合わせください。

 

価格情報

alvaRunnerのライセンス価格は、企業向け一般ライセンス(商用)とアカデミックライセンス(教育用)の形態によって異なります。ライセンス形態と価格については、お問い合わせフォームからお問い合わせいただくか、弊社営業までお問い合わせください。

公開日:2020/02/18
最終更新日:2023/04/27