QUICK REVIEW

[论文解读] Recurrent neural networks and transfer learning for elasto-plasticity in woven composites

Ehsan Ghane, Martin Fagerström|arXiv (Cornell University)|Nov 22, 2023

Mechanical Behavior of Composites参考文献 48被引用 12

一句话总结

本文开发基于 GRU/LSTM 的 RNN 替代模型，使用均场生成数据预测编织复合材料中的弹塑性应力历史，并利用迁移学习将源任务（随机加载）适配到目标任务（循环加载）

ABSTRACT

As a surrogate for computationally intensive meso-scale simulation of woven composites, this article presents Recurrent Neural Network (RNN) models. Leveraging the power of transfer learning, the initialization challenges and sparse data issues inherent in cyclic shear strain loads are addressed in the RNN models. A mean-field model generates a comprehensive data set representing elasto-plastic behavior. In simulations, arbitrary six-dimensional strain histories are used to predict stresses under random walking as the source task and cyclic loading conditions as the target task. Incorporating sub-scale properties enhances RNN versatility. In order to achieve accurate predictions, the model uses a grid search method to tune network architecture and hyper-parameter configurations. The results of this study demonstrate that transfer learning can be used to effectively adapt the RNN to varying strain conditions, which establishes its potential as a useful tool for modeling path-dependent responses in woven composites.

研究动机与目标

在不同微观结构属性下，推动对编织复合材料路径相关弹塑性行为的准确、高效建模。
开发基于递归神经网络（GRU/LSTM）的数据驱动代理，训练于介观尺度的均场仿真。
采用迁移学习，将在源任务（随机加载）训练的模型适应到目标任务（循环加载）且特征稀疏。
开展系统的超参数调优与特征缩放，以实现对多样加载路径和材料配置的鲁棒泛化。

提出的方法

利用均场模型（Mori-Tanaka/Digimat-MF）在不同基体和增强材料属性下生成两组全面数据集。
将六维应变 histories 与六维应力 histories 表示为源任务数据用于 RNN 训练。
训练 GRU/LSTM 网络，对架构和超参数进行网格搜索，并在 von Mises 应力上使用均方误差损失。
应用物理引导的初始化与迁移学习，将源任务模型适应到具有循环加载和稀疏特征的目标任务。
使用特征缩放（序列应变归一化至最大值1；静态特征进行最小-最大缩放）以及多种评估指标（MAE、RMSE、MBE），超越损失函数来选择架构。

实验结果

研究问题

RQ1在随机多轴加载下，RNN 替代模型是否能准确预测编织复合材料的路径相关弹塑性应力历史？
RQ2迁移学习是否能够在输入特征稀疏的情况下，有效地将预训练模型适应到循环加载？
RQ3网络类型（GRU 与 LSTM）、架构及超参数对预测准确性和在不同加载情景下的泛化能力有何影响？
RQ4缩放、正则化和 dropout 如何影响序列化应力预测的学习稳定性与性能？
RQ5对于多样化材料配置，代理模型相对于均场仿真的性能对比如何？

主要发现

在评估的配置中，具有三层、每层 512 个单元、50% dropout 的 LSTM 模型在随机行走测试集上实现了最佳的 MAE/RMSE。
GRU 网络收敛速度较慢，通常在预测精度上不及 LSTM，但在训练时间上有所差异。
迁移学习实现了源任务模型对循环加载的有效适应，尽管输入稀疏，在对循环数据微调后仍观察到收敛。
对 200 多种配置的超参数网格搜索发现学习率、批量大小和 dropout 对在准确性与训练效率之间取得平衡至关重要。
预测结果在许多分量上与均场结果高度一致，而某些剪切分量表现出更强的非线性以及与稀疏性相关的预测挑战。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。