DQN과 A2C network를 활용한 CartPole 강화학습 훈련과정 및 code
2025.01.13
1. CartPole environment
OpenAI gym의 CartPole은 카트 위에 막대기가 고정되어 있고 막대기는 중력에 의해 바닥을 향해 자연적으로 기울게 되는 환경을 제공한다. CartPole의 목적은 카트를 좌, 우로 움직이며 막대기가 기울지 않고 서 있을 수 있도록 유지시켜 주는 것이 목적인데, 강화 학습 알고리즘을 이용하여 막대기를 세울 수 있는 방법을 소프트웨어 에이전트가 스스로 학습할 수 있도록 한다.
2. DQN algorithm
Deep Q-Network는 state-action value Q값을 Deep...
2025.01.13