合成反応の収率予測
これまで,計算化学的手法を用いて合成収率を試みた例は無かった.
一連の研究では,MO計算により得られる反応を直接的に表現する反応熱や活性化エネルギーと,
実験Ⅱ用いる溶媒や反応温度等の実験条件パラメータをGA-PLS法の説明変数として実験収率を予測することを目的としている.
- 岡野克彦,堀憲次,「分子軌道計算結果の統計論的解析による収率予測」(2005年JCAC論文賞),J. Comp. Aided Chem., 2005, .6, 57-66(論文はここからダウンロードできます).
(概要)我々は、コンピュータのみを使用した合成ルートの開発を行うために、遷移状態に関する情報を収集したデータベース、遷移状態データベース(TSDB)、の構築を行っている。その過程で、ある合成ルートが他のルートより良いかを判断する時に、有機化学反応の実験収率を予測することが非常に重要であると判断するに至った。そのため、反応物、中間体、生成物に対する分子軌道(MO)計算により得られる電子状態、エネルギー、物理化学的係数等と溶媒や反応温度等の実験条件パラメータをGA-PLS法の説明変数とした検討を行った。即ち、1,4-dihydro-quinolone-3-carboxylic acid骨格を作る芳香族求核置換(SNAr)反応の収率を目的変数として、その傾向が予測できるかについて研究を行った。その中で、求核種やキノロン環の構造により説明変数が異なること、更に、特定の求核剤ではモデル化不能である等、一見、モデル化可能に見えるが、問題点が多いことを明らかにした。 本研究では、反応をより直接的に表現するMO計算により得られる反応熱や活性化エネルギーと溶媒や反応温度等の実験条件パラメータをGA-PLS法の説明変数として、再度、同SNAr反応への適用を行った。その結果、実験収率を反応系中からの晶析、再結晶、カラムクロマトグラフィー等の単離方法により分類すれば、反応物や求核剤の構造等に因らず、また、ほぼ同じ説明変数を用いて、実験収率の傾向が予測できることを見出した。この結果は、統一した測定又は単離方法を用いた一連の実験を行えば、その実験収率が、計算化学的に得られる反応に直接関与するパラメータを用いた予測式で表現できることを示唆している。 - 岡野 克彦, 佐藤 耕司, 金井 和明, 船津 公人, 堀 憲次,「MO計算によるパラメータを用いた芳香族求核置換反応の収率予測に関する情報化学的解析」(この論文はここからダウンロードできます).
(概要)1,4-dihydroquinoline-3-carboxylic acid構造を持つキノロン誘導体は医薬品として製薬各社により開発されている。その鍵反応である芳香族求核置換(SNAr)反応の反応物、中間体、生成物の電子状態やエネルギー、物理化学的係数等の計算値、および溶媒や反応温度等の実験条件パラメータをGA-PLS法の説明変数とし、反応収率を目的変数としたSNAr反応における反応のモデル化(予測)を試みた。その結果、一部の構造についてはモデル化が出来なかったものの、求核種やキノロン環の構造ごとに分類することと、分子軌道(MO)計算により得られた値を用いて、反応の収率を予測することが可能であることが示された。又、一般的なHONO、LUMOのエネルギーのみよりも、それらにエネルギー準位が近い複数の軌道のエネルギーを用いた場合のほうが、外挿性に優れるという結果が得られた。しかしながら、モデル化された例では共通する説明変数が多く選ばれているものの、反応機構と直接関係がないと考えられる変数、たとえば、生成物のHOMO、LUMOのエネルギーや電子密度等も高い目的変数の説明分散(R2)を得るためには必要であった。GA-PLS法により選ばれた説明変数は、求核種やキノロン環の構造の種類により異なる。求核種やキノロン環の構造により説明変数が異なることは、反応が同一の機構で進行しているという実験からの予想に反する。そこで、パラメータ化の困難な要素に関する分類を試みた結果、単離条件による分類を行なうことで、化学構造によらずモデル化が可能であることを見出した。これは、収率を目的変数としたことで、実験条件の差が大きく影響を及ぼし、モデル化を困難にしていたことを示している。このようにMO計算により比較的容易に得られるパラメータを用いたモデル化は可能ではあるが、副反応や実験条件等の理由によって統一したモデル化が困難になっていることが明らかとなった。
分子軌道計算結果の統計論的解析による収率予測
収率予測機能を実装するには、反応に直接関係する情報を用いた多変量解析を行う必要がある.
- 反応熱
- 活性化エネルギー
- 溶媒
- 反応時間
ターゲットはキノロン環を用いたSNAr反応の収率予測
反応解析に用いた求核種
反応のエネルギー相関図

全サンプルでのQ2 およびY-Yプロット
- 全データを用いた時Y-Yプロットは,Q2=0.017,R2=0.168と低く、反応に直接関与するパラメータを用いても、すべての収率の傾向を予測することはでき無かった.
- 実験データを精査したところ、最終生成物を得るときの生成法が異なることが判明した.
- 特許データで単離法は晶析単離、カラム単離、再結晶単離により分類される.
- そのため,単離法により分類してGA-PLS解析を検討した.
晶析単離法のQ2およびY-Yプロット
- GA-PLS解析で説明変数の選択を行った後、PLSを行った結果では、R2が0.988、Q2が0.946が得られた.
- この結果は、これらの変数を用いて、収率の予測が可能であることを示している.
- 求核種の種類に関係なくモデル化できている
- カラム単離でのPLS解析の結果では,Q2=0.973、R2=0.988.
- 求核種に関係なくモデル化できている
- 再結晶単離でも、Q2=0.953、R2=0.976.
- 求核種に関係なくモデル化できている.
- 反応に直接関係のある計算値(反応熱、活性化エネルギー)と精製法でまとめれば、SNAr反応の収率の傾向を予測することが可能と考えられる。
⇒実験と計算の対比が必要 - 反応パラメータの収率への関与を解釈するには、温度・溶媒・反応時間などを統一する必要がある。
カラム単離法のQ2およびY-Yプロット
再結晶単離法のQ2およびY-Yプロット
結論