Skip to main content
QUICK REVIEW

[논문 리뷰] A closed form solution for a stochastic control problem with quasi-polynomial value function

Peter Kratz|arXiv (Cornell University)|2012. 04. 11.
Stochastic processes and financial applications참고 문헌 12인용 수 1
한 줄 요약

이 논문은 점프를 수반하는 확률적 제어 문제에 대해 닫힌 형식의 해를 제시한다. 여기서 가치 함수는 시간과 상태에 의존하는 이차다항식이다. 해밀턴-자코비-벨리만(HJB) 편미분방정식(PDE)을 풀 수 있는 상미분방정식(ODE)의 연립계로 감소시킴으로써, 확산 및 점프 성분에 대한 명시적 최적 제어를 도출하였으며, 계속행동 영역과 정지 영역을 분리하는 시간에 따라 변하는 경계를 규명하였다.

ABSTRACT

We study a constrained stochastic control problem with jumps; the jump times of the controlled process are given by a Poisson process. The cost functional comprises quadratic components for an absolutely continuous control and the controlled process and an absolute value component for the control of the jump size of the process. We characterize the value function by a polynomial of degree two whose coefficients depend on the state of the system; these coefficients are given by a coupled system of ODEs. The problem hence reduces from solving the Hamilton Jacobi Bellman (HJB) equation (i.e., a PDE) to solving an ODE whose solution is available in closed form. The state space is separated by a time dependent boundary into a continuation region where the optimal jump size of the controlled process is positive and a stopping region where it is zero. We apply the optimization problem to a problem faced by investors in the financial market who have to liquidate a position in a risky asset and have access to a dark pool with adverse selection.

연구 동기 및 목표

  • 포아송 점프에 의해 유도되는 제약 조건이 있는 확률적 제어 문제와 혼합된 이차비용 및 절대값 비용 성분을 해결하기.
  • 값 함수를 상태에 대해 이차다항식이며 시간에 따라 변하는 계수를 가진 준다항식(quasi-polynomial)으로 특성화하기.
  • 계속행동 영역(최적 점프 크기가 양수임)과 정지 영역(최적 점프 크기가 0임)을 분리하는 시간에 따라 변하는 경계를 규명하기.
  • 악성 선택 문제에 노출된 암시장에 접근할 수 있는 금융 시장에서의 최적 청산에 해를 적용하기.
  • HJB 방정식을 ODE 연립계로 감소시킴으로써 수치적 PDE 해법을 피하는 닫힌 형식의 해를 제공하기.

제안 방법

  • 제어된 과정을 포아송 점프 시간과 점프 크기에 대한 제어가 있는 점프-확산 과정으로 모델링하기.
  • 비용 기능에 확산 제어와 상태 과정에 대한 이차항을 포함하고, 점프 크기 제어에 절대값 항을 포함하기.
  • 값 함수가 상태 변수에 대해 이차다항식이며 시간에 따라 변하는 계수를 가진다고 가정하기.
  • HJB 방정식을 통해 값 함수의 계수에 대한 결합된 상미분방정식(ODE) 연립계 유도하기.
  • ODE 연립계를 닫힌 형식으로 풀어 최적 제어 정책의 명시적 표현을 도출하기.
  • 최적 정책을 시간에 따라 변하는 경계로 식별하기: 계속행동 영역에서는 양수의 점프 제어, 정지 영역에서는 0의 점프 제어.

실험 결과

연구 질문

  • RQ1점프와 혼합된 이차비용 및 절대값 비용 성분을 수반하는 확률적 제어 문제에 대해 닫힌 형식의 해를 유도할 수 있는가?
  • RQ2최적 점프 크기 제어 정책은 상태와 시간에 어떻게 의존하며, 계속행동 영역과 정지 영역을 분리하는 경계는 무엇에 의해 결정되는가?
  • RQ3이 설정에서 해밀턴-자코비-벨리만(PDE)를 얼마나 효과적으로 ODE 연립계로 감소시킬 수 있는가?
  • RQ4값 함수의 구조(준다항식)는 최적 제어의 명시적 특성화를 어떻게 가능하게 하는가?
  • RQ5악성 선택 문제에 노출된 암시장에서 유도된 최적 청산 전략의 금융적 해석은 무엇인가?

주요 결과

  • 값 함수는 시간에 따라 변하는 계수를 가진 상태 변수에 대한 이차다항식으로 명시적으로 특성화된다.
  • 값 함수의 계수는 닫힌 형식의 해를 가지는 결합된 상미분방정식(ODE) 연립계를 만족한다.
  • 최적 점프 크기는 시간에 따라 변하는 경계로 정의된 계속행동 영역에서는 양수이며, 정지 영역에서는 0이다.
  • HJB PDE는 효과적으로 ODE 연립계로 감소되어 수치적 PDE 해법을 피할 수 있다.
  • 악성 선택 문제에 노출된 암시장에 접근할 수 있는 금융 시장에서의 최적 청산을 위한 다루기 쉬운 프레임워크를 제공한다.
  • 해의 구조는 수치적 근사 없이 최적 제어 정책의 명시적 계산을 가능하게 한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.