QUICK REVIEW

[論文レビュー] SPT-NRTL: A physics-guided machine learning model to predict thermodynamically consistent activity coefficients

Benedikt Winter, Clemens Winter|arXiv (Cornell University)|Sep 9, 2022

Machine Learning in Materials Science被引用数 2

ひとこと要約

SPT-NRTL は、SMILES表現でトレーニングされたトランスフォーマー・アーキテクチャを用いて、濃度依存の熱力学的整合性を持つ活量係数を予測する物理的制約付き機械学習モデルである。UNIFAC や COSMO-RS よりも高い精度を達成し、水/エタノールやクロロホルム/ｎヘキサンといった混合系の気液平衡予測において実験に近い精度を示し、1億通りの混合系の NRTL パラメータをオンラインで直接プロセスシミュレーションに利用可能に提供する。

ABSTRACT

The availability of property data is one of the major bottlenecks in the development of chemical processes, often requiring time-consuming and expensive experiments or limiting the design space to a small number of known molecules. This bottleneck has been the motivation behind the continuing development of predictive property models. For the property prediction of novel molecules, group contribution methods have been groundbreaking. In recent times, machine learning has joined the more established property prediction models. However, even with recent successes, the integration of physical constraints into machine learning models remains challenging. Physical constraints are vital to many thermodynamic properties, such as the Gibbs-Duhem relation, introducing an additional layer of complexity into the prediction. Here, we introduce SPT-NRTL, a machine learning model to predict thermodynamically consistent activity coefficients and provide NRTL parameters for easy use in process simulations. The results show that SPT-NRTL achieves higher accuracy than UNIFAC in the prediction of activity coefficients across all functional groups and is able to predict many vapor-liquid-equilibria with near experimental accuracy, as illustrated for the exemplary mixtures water/ethanol and chloroform/n-hexane. To ease the application of SPT-NRTL, NRTL-parameters of 100 000 000 mixtures are calculated with SPT-NRTL and provided online.

研究の動機と目的

化学プロセス開発における実験的性質データの不足というボトルネックを克服すること。
濃度依存の活量係数を熱力学的整合性を保ちながら予測できる機械学習モデルを開発すること。
特にギブス＝デュヘム方程式を含む物理的制約をデータ駆動型モデルに統合し、信頼性の高い相平衡予測を実現すること。
事前に計算された NRTL パラメータを提供することで、標準的なプロセスシミュレーションソフトウェアへの直接適用を可能にすること。
限界活量係数の予測を越えて、完全な二成分混合系の挙動を予測可能な機械学習の予測能力を拡張すること。

提案手法

SMILES 文字列から活量係数を予測するように微調整されたトランスフォーマー基盤のディープラーニングモデル（SPT）を採用。
全モル分率において熱力学的整合性を保証するため、ギブス＝デュヘム方程式によってモデルを制約。
微分可能なパラメータ化を用いて、モデル出力から直接 NRTL パラメータ（α、Aij、Bij）を予測。
実験的および COSMO-RS 参照データを含む、濃度依存の活量係数データの大幅なデータベースを用いてトレーニング。
マルチヘッドアテンション機構により、複雑な分子間相互作用および機能性基団の寄与を捉える。
最終モデルである SPT-NRTLFull は、トレーニングデータに含まれない混合系、特に共沸系を含めて検証。

実験結果

リサーチクエスチョン

RQ1機械学習モデルは、従来のグループ寄与法を上回る熱力学的整合性を保ちながら、濃度依存の活量係数を予測できるか？
RQ2SPT-NRTL は、共沸系を含む二成分混合系の気液平衡をどの程度の精度で予測できるか？
RQ3水やカルボン酸のような困難な成分を含む混合系に対して、モデルはトレーニングデータ外のデータにどの程度一般化できるか？
RQ4ニューラルネットワーク・アーキテクチャにギブス＝デュヘム方程式のような物理的制約を統合することで、制約なしのモデルよりも信頼性が高く汎用性の高い予測が得られるか？
RQ5実験的フィッティングを必要とせずに、大規模なプロセスシミュレーションに適した高品質な NRTL パラメータを生成できるか？

主な発見

SPT-NRTL は、すべての機能性基団において、UNIFAC よりも平均絶対誤差を約 50% 減少させる。
従来、困難とされてきた水およびカルボン酸に対しては、それぞれ ln γ において平均絶対誤差が 0.4 および 0.5 であり、依然として UNIFAC よりも顕著に低い。
水/エタノールおよびクロロホルム/ｎヘキサン混合系の気液平衡を、実験に近い精度で予測し、共沸点の位置と挙動を正しく捉えている。
予測結果の不確実性は、ボイル・デューポイント温度において最大で約 1 K のずれにとどまり、大多数の工学的応用において許容可能である。
SPT-NRTL は、1億通りの混合系（1万種類の固有分子を含む）の NRTL パラメータを提供し、プロセスシミュレーションソフトウェアへの即時利用を可能にしている。
物理的制約付き機械学習が、基本的な物理法則に整合しながら、複雑な熱力学的性質を信頼性高く予測できることを示している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。