Skip to main content
QUICK REVIEW

[논문 리뷰] Evaluation of ChatGPT and Microsoft Bing AI Chat Performances on Physics Exams of Vietnamese National High School Graduation Examination

Dao Xuan-Quy, Ngoc-Bich Le|arXiv (Cornell University)|2023. 06. 07.
Online Learning and Analytics인용 수 30
한 줄 요약

이 연구는 베트남 국립 고등학교 졸업 시험 물리 문제(2019–2023)에 대해 ChatGPT와 BingChat을 평가합니다. 두 대형 언어 모델이 베트남 학생들보다 성능이 떨어지고 고급 응용 문제에서 어려움을 겪는 반면, BingChat은 일반적으로 더 높은 정확도를 보이고 ChatGPT는 더 높은 안정성과 교육적 가능성을 보여줍니다.

ABSTRACT

The promise and difficulties of language model-based approaches for physics teaching were assessed in this study. This study evaluates how well ChatGPT and BingChat, two state-of-the-art (SOTA) large language models (LLMs), perform when answering high school physics questions on Vietnamese exams from 2019 to 2023. When we compared the results of the LLMs with the scores of Vietnamese students, we discovered that ChatGPT and BingChat both perform worse than Vietnamese students, proving that LLMs are not yet capable of fully replacing human intellect in the field of physics teaching. The outcomes also showed that neither LLM is capable of responding to questions at the high application levels. In terms of accuracy, BingChat typically surpassed ChatGPT, although ChatGPT showed more stability. Our research suggests that LLMs can help students and teachers during learning and teaching activities, particularly by offering immediate feedback and individualized learning experiences.

연구 동기 및 목표

  • 최신 대형 언어 모델(ChatGPT 및 BingChat)의 베트남 고등학교 물리 시험에 대한 능력을 평가한다.
  • 2019–2023년 베트남 학생 실제 결과와 LLM의 성능을 VNHSGE 물리 데이터셋에서 비교한다.
  • 베트남 물리 교육에서 LLM의 강점, 한계, 그리고 잠재적 교육적 활용을 식별한다.
  • 피드백과 개인화 학습을 통한 교사와 학습자의 지원 측면에서 LLM의 교육적 활용 가능성에 대한 통찰을 제공한다.]
  • method: []
  • research_questions: []
  • key_findings: []
  • table_headers: []
  • table_rows: []}{
  • method_keys_being_translated_above_within_JSON_should_be_consistent
  • closing
  • note
  • seems
  • object
  • comment
  • end
  • final
  • translation
  • format
  • ignore
  • text
  • random
  • fields
  • translation
  • title
  • tldr
  • meta_description
  • objective
  • method
  • research_questions
  • key_findings
  • table_headers
  • table_rows

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.