文献
J-GLOBAL ID:202102284168099374   整理番号:21A2092805

転移学習:新しいレベルへの小さな化学反応データセットスケールに基づく逆合成予測の作成【JST・京大機械翻訳】

Transfer Learning: Making Retrosynthetic Predictions Based on a Small Chemical Reaction Dataset Scale to a New Level
著者 (6件):
資料名:
巻: 25  号: 10  ページ: 2357  発行年: 2020年 
JST資料番号: U7014A  ISSN: 1420-3049  CODEN: MOLEFW  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: スイス (CHE)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
複合体または新規分子合成の効果的な計算予測は,有機および医薬化学を大いに助けることができる。再合成分析は,標的化合物に対する合成経路を予測するために,化学者によって採用された方法である。標的化合物は,出発化合物が市販されているまで,より単純な化合物に徐々に変換される。しかし,小さな化学データセットに基づく予測は,不十分な数のサンプルのために,しばしば低い精度をもたらす。この限界に取り組むために,レトロ合成解析への移動学習を導入した。転送学習は,1つのタスクのモデルを訓練する機械学習アプローチであり,次に,関連だが異なるタスクにモデルを適用する。このアプローチは,少数のデータの限界を解決するために使用できる。未分類USPTO-380K大規模データセットを,化合物,反応型および化合物の化学構造のSMILES型のキラリティーのような化学の基本的な理論的知識を得るために,予備訓練のモデルに適用した。USPTO-380KとUSPTO-50K(Liuらによって使用された)は,元々,ローエ特許採掘作業から導かれた。Liuらは,さらにこれらのデータを処理し,反応例を10カテゴリーに分割したが,著者らはそうではなかった。続いて,得られたスキルを,連続訓練と逆合成反応試験のために分類されたUSPTO-50K小データセットに利用し,事前訓練精度データを,予訓練のないモデルからの結果の精度と同時比較した。転送学習概念を,予測と検証のために配列対シーケンス(seq2seq)または変換機モデルと組み合わせた。seq2seqと変換機モデル(両方とも符号器デコーダアーキテクチャに基づいている)を,言語翻訳ミッションのために元々構築した。2つのアルゴリズムは,反応物のSMILES形を生成物のSMILES形に翻訳し,他の関連する化学的情報(キラリティー,反応タイプおよび条件)も考慮した。結果は,予訓練後のseq2seqと変換機モデルによる逆合成解析の精度が有意に改善したことを示した。変圧器転送学習モデルのトップ1精度(実際の結果と一致する最初の予測の精度率である)は,52.4%から60.7%に増加し,予測電力を大きく改善した。モデルトップ-20予測精度(実際の結果を含むトップ20カテゴリーの精度率)は88.9%であり,これはレトロ合成分析においてかなり良い予測を示した。要約すると,本研究は,異なる化学データセットで働くモデル間の移動学習が実現可能であることを証明した。モデルへの移動学習の導入は予測精度を著しく改善し,特に小さなデータセットベースの反応予測と逆合成解析に支援した。Copyright 2021 The Author(s) All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
生薬一般 
引用文献 (24件):
  • Almeida, A.F.; Moreira, R.; Rodrigues, T. Synthetic organic chemistry driven by artificial intelligence. Nat. Rev. Chem. 2019, 3, 589-604.
  • Judson, P. Knowledge-Based Expert Systems in Chemistry; Royal Society of Chemistry (RSC): Cambridge, UK, 2009.
  • Weininger, D. SMILES, a chemical language and information system. 1. Introduction to methodology and encoding rules. J. Chem. Inf. Model. 1988, 28, 31-36.
  • Nam, J.; Kim, J. Linking the Neural Machine Translation and the Prediction of Organic Chemistry Reactions. 2016. Available online: https://arxiv.org/abs/1612.09529 (accessed on 29 December 2016).
  • Vaswani, A. Attention is All You Need. 2017. Available online: https://arxiv.org/pdf/1706.03762 (accessed on 6 December 2017).
もっと見る
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る