
총 17개
-
DQN과 A2C network를 활용한 CartPole 강화학습 훈련과정 및 code2025.01.131. CartPole environment OpenAI gym의 CartPole은 카트 위에 막대기가 고정되어 있고 막대기는 중력에 의해 바닥을 향해 자연적으로 기울게 되는 환경을 제공한다. CartPole의 목적은 카트를 좌, 우로 움직이며 막대기가 기울지 않고 서 있을 수 있도록 유지시켜 주는 것이 목적인데, 강화 학습 알고리즘을 이용하여 막대기를 세울 수 있는 방법을 소프트웨어 에이전트가 스스로 학습할 수 있도록 한다. 2. DQN algorithm Deep Q-Network는 state-action value Q값을 Deep...2025.01.13
-
고전적 조건형성 및 조작적 조건형성 관련 실험 요약 / 조건형성 원리를 교육분야에 적용할 수 있는 방법에 대한 고찰2025.01.121. 고전적 조건형성 고전적 조건형성은 동물의 본능적인 반응과 조건 자극 간의 연결을 통해 학습이 발생하는 것입니다. 즉, 동물에게 무조건 자극(US)과 함께 조건 자극(CS)을 제공함으로써, 결국 조건자극 만으로도 무조건 자극과 유사한 반응인 조건 반응(CR)을 나타내게 되는 과정을 의미합니다. 파블로브식 조건형성실험에서 개가 종소리만 들려주어도 침샘 활동(CR)을 유발하는 현상이 고전적 조건형성의 예입니다. 이러한 조건형성은 동물의 본능적 반응을 이용하여 학습을 형성할 수 있다는 점을 시사합니다. 2. 조작적 조건형성 조작적 조...2025.01.12
-
인공지능의 개념과 기술 그리고 활용사례2025.01.101. 인공지능의 개념 인공지능(AI)은 인간의 지능을 기계나 컴퓨터 소프트웨어로 구현하는 기술 또는 분야를 의미합니다. 즉, 인공지능은 기계가 인간의 학습, 추론, 문제해결 등의 지능적인 기능을 수행할 수 있는 능력을 가지도록 프로그래밍하거나 학습하는 컴퓨터 과학 분야입니다. 인공지능은 크게 '약한 인공지능(weak AI)'과 '강한 인공지능(Strong AI)'으로 나뉩니다. 약한 인공지능은 특정 작업이나 한정된 범위에서 인간 수준 또는 그 이상의 성능을 발휘할 수 있는 인공지능이며, 강한 인공지능은 모든 인간 지능 활동을 수행할...2025.01.10
-
머신러닝의 3가지 학습 방법: 지도학습, 비지도 학습, 강화학습2025.01.041. 지도학습 지도학습은 입력과 출력 간의 관계를 학습하는 방식으로, 정답과 사례를 연결시켜주는 방식으로 이루어집니다. 데이터 집합을 통해 입력과 출력 간의 함수관계를 기계가 배우게 되며, 이렇게 얻어진 함수를 모델이라고 합니다. 지도학습으로 만들 수 있는 대표적인 것은 패턴 분류와 회귀분석입니다. 2. 비지도 학습 비지도학습은 입력 데이터 세트에 레이블을 달아주지 않고, 기계가 데이터를 묶을 수 있는 특징을 스스로 찾아내게 합니다. 비지도 학습은 데이터 집합 속에서 숨겨진 패턴을 배우며, 군집화를 이용해 서로 유사한 데이터를 묶습...2025.01.04
-
모방학습 4단계 상세 설명 및 개인 경험 공유2025.01.291. 모방학습의 4단계 모방학습은 데이터 수집, 데이터 전처리, 정책 학습, 평가 및 개선의 4단계로 구성됩니다. 데이터 수집 단계에서는 전문가나 시범자의 작업을 기록하여 학습에 필요한 데이터를 확보합니다. 데이터 전처리 단계에서는 수집된 데이터를 정제하고 구조화하는 과정이 필요합니다. 정책 학습 단계에서는 전처리된 데이터를 바탕으로 모델이 최적의 행동 정책을 학습하게 됩니다. 마지막으로 평가 및 개선 단계에서는 학습된 모델의 성능을 평가하고, 필요에 따라 모델을 개선하는 과정이 이루어집니다. 2. 모방학습 적용 사례 및 경험 프로...2025.01.29
-
조작적 조건형성의 원리와 사례2025.01.151. 조작적 조건형성의 개념과 원리 조작적 조건형성은 행동과 결과 사이의 상관관계를 형성하여 원하는 행동을 학습시키는 원리이다. 이 개념은 행동을 조작하여 원하는 결과를 얻을 수 있도록 조건을 형성하는 것으로, 동물 훈련이나 교육 현장에서 활용된다. 조작적 조건형성은 '조작'과 '조건형성'의 두 가지 주요 요소로 이루어져 있다. '조작'은 특별한 행동을 유도하기 위해 자극이나 조건을 조작하는 것이고, '조건형성'은 조작된 행동과 결과 사이의 상관관계를 형성하는 것이다. 이를 통해 원하는 행동을 학습시킬 수 있다. 2. 물개를 이용한...2025.01.15
-
인공지능 머신러닝 지도학습, 비지도학습, 강화학습의 실사례2025.01.161. 지도학습(Supervised Learning) 지도학습은 입력한 데이터와 출력한 데이터를 각각 공급하여 작동하는 유형으로, 훈련을 통해 알고리즘이 입력값을 바탕으로 내용을 처리하고 모델을 수정하며 원하는 출력에 근접하는 결과물을 산출하게 됩니다. 이는 분류와 예측 문제에 유용한 학습 방법으로, 스팸 이메일 탐지 기능은 대표적인 사례입니다. 해당 모델은 '스팸 메일'과 '비스팸 메일'로 레이블이 지정된 이메일 데이터 집합을 통해 학습되며, 키워드, 발신자 정보, 이메일 구조 및 내용과 같은 특징을 사용하여 새로운 수신 이메일을 ...2025.01.16
-
고전적 조건형성과 도구적 조건형성에 대한 이해2025.05.081. 고전적 조건형성 고전적 조건형성의 구성요소로는 무조건 자극(US), 무조건 반응(UR), 조건 자극(CS), 조건 반응(CR)이 있다. 고전적 조건형성의 과정은 1단계에서 개에게 종소리(CS)를 들려주고, 2단계에서 종소리(CS)를 울린 다음 먹기(US)를 준다. 이러한 과정을 수십차례 반복하면 3단계에서 종소리(CS)만 들려주고 먹이(US)를 주지 않아도 개가 침(UR)을 분비하는 조건 반응(CR)이 나타난다. 2. 도구적 조건형성 도구적 조건형성은 어떤 행동을 학습시키고자 할 때 그 행동이 나타났을 때 보상을 주는 것이다....2025.05.08
-
슈퍼 마리오 - 인공지능은 어떻게 게임을 할까?2025.05.081. 데이터 기반 학습 인공지능은 슈퍼 마리오 게임 플레이 데이터를 사용하여 게임의 규칙과 패턴을 학습합니다. 이를 통해 어떤 상황에서 점프를 해야 하는지, 어떤 적과의 접촉을 피해야 하는지 등을 학습하게 됩니다. 2. 강화 학습 인공지능은 게임 플레이를 통해 보상과 벌점을 받고, 이를 통해 자동으로 학습하게 됩니다. 예를 들어 도착 지점에 도달하면 보상을 받고, 적에게 맞으면 벌점을 받는 식으로 학습하면서 게임을 플레이합니다. 3. 신경망과 패턴 인식 인공지능은 신경망 모델을 사용하여 게임 화면의 정보를 분석하고, 적의 위치, 장...2025.05.08
-
[인공지능의세계 A+] 기말고사 문제풀이 객관식 + 서술형 + 단답형 문제+해설2025.05.101. 기계학습 기계학습은 인간의 학습능력을 기계나 컴퓨터에서 구현한 것으로, 지도학습과 비지도학습으로 구분할 수 있다. 지도학습은 학습 데이터의 정답이 주어지는 반면, 비지도학습은 정답이 주어지지 않는다. 신경망은 자동으로 가중치를 학습하는 기계학습 방식이다. 강화학습은 보상을 통해 최적의 행동을 학습하는 방식으로, 알파고가 자체 연습 대국을 통해 좋은 수를 학습하는 데 사용되었다. 2. 클러스터링 K-Means 클러스터링은 데이터를 K개의 클러스터로 분류하는 방법이다. K-Means 클러스터링의 단점은 k의 개수를 사전에 정해야 ...2025.05.10