QUICK REVIEW

[논문 리뷰] Recurrent neural networks and transfer learning for elasto-plasticity in woven composites

Ehsan Ghane, Martin Fagerström|arXiv (Cornell University)|2023. 11. 22.

Mechanical Behavior of Composites참고 문헌 48인용 수 12

한 줄 요약

mean-field 생성 데이터를 이용해 GRU/LSTM 기반 RNN 대리 모델을 훈련해 직조 복합재의 탄성-소성 응력 이력을 예측하고, 랜덤 로딩 소스 작업에서 순환 목표 작업으로 적응하기 위해 전이 학습을 활용한다.

ABSTRACT

As a surrogate for computationally intensive meso-scale simulation of woven composites, this article presents Recurrent Neural Network (RNN) models. Leveraging the power of transfer learning, the initialization challenges and sparse data issues inherent in cyclic shear strain loads are addressed in the RNN models. A mean-field model generates a comprehensive data set representing elasto-plastic behavior. In simulations, arbitrary six-dimensional strain histories are used to predict stresses under random walking as the source task and cyclic loading conditions as the target task. Incorporating sub-scale properties enhances RNN versatility. In order to achieve accurate predictions, the model uses a grid search method to tune network architecture and hyper-parameter configurations. The results of this study demonstrate that transfer learning can be used to effectively adapt the RNN to varying strain conditions, which establishes its potential as a useful tool for modeling path-dependent responses in woven composites.

연구 동기 및 목표

varied micro-structural properties 에 걸친 직조 복합재의 경로 의존적 탄성-소성 거동의 정확하고 효율적인 모델링을 동기 부여한다.
meso-scale mean-field 시뮬레이션에 기반한 데이터 기반 대리모델을 RNN(GRU/LSTM)로 개발한다.
소스 작업(무작위 로딩)에서 학습된 모델을 전이 학습으로 목표 작업(순환 로딩)으로 sparse features와 함께 적응시킨다.
다양한 로딩 경로 및 재료 구성에 대해 강건한 일반화를 달성하기 위한 체계적 하이퍼파라미터 튜닝 및 특징 스케일링을 체계적으로 수행한다.

제안 방법

mean-field 모델(Mori-Tanaka/Digimat-MF)을 이용해 매트릭스 및 보강재 특성을 변화시키며 두 개의 포괄적 데이터 세트를 생성한다.
소스 작업 데이터로 RNN 학습을 위해 6차원 변형 이력과 6차원 응력 이력을 표현한다.
GRU/LSTM 네트워크를 학습시키고 아키텍처 및 하이퍼파라미터에 대한 그리드 탐색을 수행하며 von Mises 응력에 대한 평균제곱오차 손실을 사용한다.
물리 guided 초기화 및 전이 학습을 적용해 소스-작업 모델을 순환 로딩과 희소 피처를 가진 목표 작업에 적응시킨다.
특성 스케일링(연속 변형은 최대 1로 정규화; 정적 특징은 최소-최대 스케일링) 및 손실 이외의 다양한 평가 지표(MAE, RMSE, MBE)를 사용해 아키텍처를 선별한다.

실험 결과

연구 질문

RQ1무작위 다축 로딩 하에서 RNN 대리모델이 직조 복합재의 경로 의존적 탄성-소성 응력 이력을 정확히 예측할 수 있는가?
RQ2전이 학습이 희소 입력 특징을 가진 순환 로딩으로의 사전 학습 모델의 효과적 적응을 가능하게 하는가?
RQ3네트워크 타입(GRU vs LSTM), 아키텍처, 하이퍼파라미터가 예측 정확도와 다양한 로딩 시나리오에 대한 일반화에 어떤 영향을 미치는가?
RQ4스케일링, 정규화, 드롭아웃이 시퀀스 기반 응력 예측의 학습 안정성 및 성능에 어떤 영향을 주는가?
RQ5대상 대리모델과 평균장(mean-field) 시뮬레이션 간의 다양한 재료 구성에서의 비교 성능은 어떠한가?

주요 결과

세 가지 층의 512 유닛과 50% 드롭아웃을 갖춘 LSTM 모델이 무작위 보행 테스트 세트에서 평가된 구성 중 최상의 MAE/RMSE를 달성했다.
GRU 네트워크는 수렴 속도가 느리고 일반적으로 예측 정확도에서 LSTM보다 뒤처지지만 학습 시간에서는 차이가 있었다.
전이 학습은 순환 로딩으로의 목표 작업 적응을 효과적으로 가능하게 했으며, 순환 데이터에 대한 미세 조정 후 입력 희소성에도 불구하고 수렴이 관찰되었다.
하이퍼파라미터 그리드 검색에서 200개 이상의 구성 중 학습률, 배치 크기, 드롭아웃이 정확도와 학습 효율성의 균형에 결정적이었다.
일부 전단(전단 응력) 구성 요소는 비선형성과 희소성으로 인한 예측 도전이 있었지만, 다수의 성분에 대해 평균장 결과와의 양호한 일치를 보였다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.