Skip to main content
QUICK REVIEW

[논문 리뷰] Multiplicative Orthogonal Sequential Editing for Language Models

Hao-Xiang Xu, Jun-Yu Ma|arXiv (Cornell University)|2026. 01. 11.
Topic Modeling인용 수 0
한 줄 요약

MOSE는 수치적 안정성을 보존하면서 지식을 업데이트하는 직교적 곱셈 편집 패러다임을 도입하여 순차 편집 성능을 개선하고 일반 능력을 유지합니다.

ABSTRACT

Knowledge editing aims to efficiently modify the internal knowledge of large language models (LLMs) without compromising their other capabilities. The prevailing editing paradigm, which appends an update matrix to the original parameter matrix, has been shown by some studies to damage key numerical stability indicators (such as condition number and norm), thereby reducing editing performance and general abilities, especially in sequential editing scenario. Although subsequent methods have made some improvements, they remain within the additive framework and have not fundamentally addressed this limitation. To solve this problem, we analyze it from both statistical and mathematical perspectives and conclude that multiplying the original matrix by an orthogonal matrix does not change the numerical stability of the matrix. Inspired by this, different from the previous additive editing paradigm, a multiplicative editing paradigm termed Multiplicative Orthogonal Sequential Editing (MOSE) is proposed. Specifically, we first derive the matrix update in the multiplicative form, the new knowledge is then incorporated into an orthogonal matrix, which is multiplied by the original parameter matrix. In this way, the numerical stability of the edited matrix is unchanged, thereby maintaining editing performance and general abilities. We compared MOSE with several current knowledge editing methods, systematically evaluating their impact on both editing performance and the general abilities across three different LLMs. Experimental results show that MOSE effectively limits deviations in the edited parameter matrix and maintains its numerical stability. Compared to current methods, MOSE achieves a 12.08% improvement in sequential editing performance, while retaining 95.73% of general abilities across downstream tasks. The code is available at https://github.com/famoustourist/MOSE.

연구 동기 및 목표

  • 연속 업데이트에서 가법 지식 편집의 불안정성 해결.
  • 노름과 조건수(s 조건수)를 보존하기 위해 직교 변환을 사용하는 곱셈 편집 프레임워크 제안.
  • MOSE가 다운스트림 작업에서 일반 능력을 유지하면서 편집 성능을 유지하는지 보임.
  • 여러 LLM과 편집 데이터셋에서 MOSE를 최첨단 방법과 비교 평가.

제안 방법

  • 원래 매개변수 행렬에 대해 가법 업데이트를 좌측 곱셈하는 직교 업데이트 행렬로 대체합니다.
  • 최적의 직교 변환을 찾기 위해 제약된 최소제곱(Orthogonal Procrustes) 문제로 업데이트를 형식화합니다.
  • 원래 지식을 보존하고 새 지식을 맞추는 것을 정규화된 목적함수로 최소화합니다.
  • 레이어 활성화 기반의 기준으로 편집 레이어를 선택하고 성능 향상을 위해 이웃 레이어로 편집을 확장합니다.
  • 직교 행렬로의 좌측 곱셈이 Frobenius 놈과 행렬 조건수(norma) 보존을 입증하는 해석적 증명을 제공합니다.

실험 결과

연구 질문

  • RQ1정교하게 직교적이고 곱셈적인 업데이트가 순차 편집 중 수치적 안정성을 보존할 수 있는가?
  • RQ2MOSE가 연속 및 배치 편집 하에서 가법 방법보다 편집 성능과 일반 능력을 더 잘 유지하는가?
  • RQ3지식 업데이트 전반에 걸쳐 MOSE의 효율성을 극대화하기 위해 편집 레이어를 어떻게 선택해야 하는가?

주요 결과

방법모델CounterFact 신뢰도CounterFact 일반화CounterFact 지역성ConceptEdit-Inter 신뢰도ConceptEdit-Inter 일반화ConceptEdit-Inter 지역성
ROMELLama3-8B0.00000.00000.00000.00000.00000.0000
MEMITLLama3-8B0.00000.00000.00000.00000.00000.0000
RECTLLama3-8B0.52660.30750.23820.32340.19930.1397
EMMETLLama3-8B0.62870.46950.31140.38660.21780.1563
PRUNELLama3-8B0.77380.68990.51900.56820.40970.3083
AlphaEditLLama3-8B0.82220.78350.70910.69810.59280.4977
MOSELLama3-8B0.98870.98630.89720.78590.72750.6856
ROMEQwen2.5-7B0.00000.00000.00000.00000.00000.0000
MEMITQwen2.5-7B0.00000.00000.00000.00000.00000.0000
RECTQwen2.5-7B0.62030.47450.35820.37370.23060.1738
EMMETQwen2.5-7B0.67020.55890.47710.45930.26410.1903
PRUNEQwen2.5-7B0.81150.78600.68230.67080.50090.4120
AlphaEditQwen2.5-7B0.95190.92410.84180.73460.64530.6116
MOSEQwen2.5-7B0.99810.99020.90980.80120.75470.7069
  • MOSE는 순차 편집 중 편집된 매개변수 행렬의 수치적 안정성(노름 및 조건수)을 보존합니다.
  • MOSE는 기준선 가법 방법 대비 순차 편집 성능을 12.08% 향상시킵니다.
  • MOSE는 실험 전반에서 다운스트림 작업에 대한 모델의 일반 능력의 95.73%를 유지합니다.
  • 배치-순차 편집에서 MOSE는 일관되게 베이스라인보다 우수하며 스케일링이 더 잘됩니다.
  • 레이어 인식 MOSE(선택된 레이어와 이웃 편집)는 순차 및 배치 설정에서 가장 좋은 성능을 제공합니다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.