해피캠퍼스 토픽위키

토픽위키

A2C

Actor-Critic

Advantage

CartPole

DQN

OpenAIgym

강화학습

딥러닝

총 1개

연관순
조회순

- 연관순
- 조회순

DQN과 A2C network를 활용한 CartPole 강화학습 훈련과정 및 code

2025.01.13

1. CartPole environment OpenAI gym의 CartPole은 카트 위에 막대기가 고정되어 있고 막대기는 중력에 의해 바닥을 향해 자연적으로 기울게 되는 환경을 제공한다. CartPole의 목적은 카트를 좌, 우로 움직이며 막대기가 기울지 않고 서 있을 수 있도록 유지시켜 주는 것이 목적인데, 강화 학습 알고리즘을 이용하여 막대기를 세울 수 있는 방법을 소프트웨어 에이전트가 스스로 학습할 수 있도록 한다. 2. DQN algorithm Deep Q-Network는 state-action value Q값을 Deep...

2025.01.13