총 19개
-
트랜스포머 모델링2025.05.061. 트랜스포머 모델 트랜스포머는 어텐션만으로 구성된 신경망 모델로, RNN이나 CNN의 단점을 보완한 모델입니다. 트랜스포머는 어텐션 메커니즘을 사용하며, 단어를 동시에 고려할 수 있고 입력에 순서 정보가 없다는 특징이 있습니다. 트랜스포머 인코더는 멀티헤드 셀프 어텐션으로 구성되어 있으며, 트랜스포머 디코더는 마스크드 멀티헤드 셀프 어텐션을 사용합니다. 2. CNN의 문제점 CNN은 커널을 이용하기 때문에 이미지의 특징을 추출하는데 있어 국소적인 부분만을 고려하는 문제점이 있습니다. 3. RNN의 문제점 RNN은 시간의 흐름에 ...2025.05.06
-
VQGAN 논문 (인공지능) 발표 및 대본2025.05.071. VQGAN 모델 VQGAN은 VQ-VAE 구조를 따르며 CNN과 Transformer의 장점을 결합한 모델입니다. CNN으로 Locality를 잘 반영하는 codebook을 학습하고, Transformer의 풍부한 표현력으로 Image Synthesis를 이룹니다. VQGAN은 2-stage 모델로, 첫번째 stage에서 codebook을 학습하여 Transformer에 사용하기 위한 이미지의 구성요소를 학습하고, 두번째 stage에서 이러한 codebook을 바탕으로 Transformer를 이용하여 이미지를 구성합니다. 2....2025.05.07
-
객체 인식 기술의 원리와 응용 분야2025.12.191. 객체 인식의 개념과 기본 구조 객체 인식은 영상에서 개별 사물을 식별하고 분류하거나 위치를 찾아내는 과정이다. 영상 전처리, 특징 추출, 분류의 세 단계로 구성되며, 초기에는 사람이 직접 특징을 설계했으나 현대 딥러닝 기반 기법에서는 모델이 자동으로 특징을 학습한다. 이는 컴퓨터비전 분야의 핵심 기술로서 이미지나 영상 속에서 특정 대상이 무엇인지 식별하는 과정을 의미한다. 2. 딥러닝 기반 객체 인식 모델의 혁신 2012년 알렉스넷 등장 이후 합성곱 신경망(CNN)이 객체 인식 분야의 판도를 바꾸었다. VGG, ResNet, ...2025.12.19
-
의료 영상 분석에서의 컴퓨터비전 활용2025.12.191. 딥러닝 기반 의료 영상 분석 합성곱 신경망(CNN)은 방대한 영상 데이터로부터 자동으로 특징을 학습하여 기존 기법을 압도하는 성능을 보여주었다. U-Net은 의료 영상 분할에 특화된 구조로 종양이나 병변의 위치를 픽셀 단위로 정밀하게 예측할 수 있다. 3차원 CNN은 CT나 MRI와 같이 다차원 데이터를 처리하는 데 효과적이며, 최근에는 트랜스포머 기반 네트워크와 자기지도학습이 적용되어 데이터 효율성을 높이고 있다. 2. 의료 영상 모달리티와 응용 엑스레이는 폐 질환, 골절 진단에 활용되며 AI가 폐결절 검출을 자동화한다. C...2025.12.19
-
AI 기반 안저 이미지 분석을 통한 안질환 조기 진단2025.12.211. 당뇨망막병증(DR) 진단 당뇨병으로 인해 망막의 미세혈관이 손상되어 발생하는 질환입니다. 초기에는 미세혈관류, 출혈, 경성 삼출물 등이 나타나며, 진행될수록 신생혈관이 자라나 실명을 유발합니다. AI는 CNN을 통해 이러한 초기 미세 병변을 인간의 눈보다 빠르고 객관적으로 식별하며, 비증식성 당뇨망막병증(NPDR) 단계에서 특히 뛰어난 효과를 보입니다. 최신 AI 모델들은 95% 이상의 민감도와 특이도를 달성하고 있습니다. 2. 컨볼루션신경망(CNN) 기술 AI가 안저 이미지를 분석하는 핵심 기술로, 딥러닝의 한 종류입니다. ...2025.12.21
-
서강대 AI빅데이터 과제 모음2025.12.211. 딥러닝과 감성분석을 활용한 관광객 수요예측 온라인 리뷰의 감성분석과 딥러닝 기법(RNN, BPN, SVR)을 결합하여 관광객 수요를 예측하는 모형을 개발했다. TripAdvisor의 국내 관광지 리뷰를 크롤링하여 월별 감성값을 계산하고, 1개월 시차를 두고 예측모형에 반영했다. Senti-RNN 모형이 가장 우수한 성과를 보였으며, 감성값을 반영한 모형이 관광객 수만 사용한 모형보다 예측성능이 우수함을 확인했다. 2. 객체지향 프로그래밍(OOP)의 4가지 특성 캡슐화는 객체의 상태와 행위를 하나로 묶고 외부 접근을 제어하는 개...2025.12.21
-
AI 기반 컴퓨터 비전 기술을 활용한 의료 서비스 평준화2025.01.021. AI 기반 컴퓨터 비전 기술의 의료 적용 고령화 사회에서 건강과 의료에 대한 관심이 높아지고 있지만, 실질적으로 양질의 의료 서비스를 받기 위해서는 특정 병원에 대한 의존도가 높아지고 있습니다. 이에 컴퓨터 비전 기술을 활용하여 지역과 관계없이 동일한 진료 기준으로 질환을 판정할 수 있는 시스템을 구축하여 모두가 평등한 의료 서비스를 받을 수 있는 환경을 만드는 것이 필요합니다. 1. AI 기반 컴퓨터 비전 기술의 의료 적용 AI 기반 컴퓨터 비전 기술은 의료 분야에서 매우 유망한 기술로 주목받고 있습니다. 이 기술은 의료 영...2025.01.02
-
합성곱 신경망의 원리와 이미지 인식 응용2025.12.191. 합성곱 신경망(CNN)의 기초 원리 합성곱 신경망은 인간의 시각 피질에서 착안한 혁신적 기술로, 작은 크기의 필터를 이미지에 슬라이딩하며 특징 맵을 생성한다. CNN의 기본 구조는 합성곱 계층, 활성화 함수(ReLU), 풀링 계층, 완전연결 계층으로 이루어져 있다. 합성곱 연산은 이미지의 지역적 패턴을 효과적으로 포착하며, 가중치 공유를 통해 학습 파라미터를 줄인다. 이는 전통적 인공신경망과 달리 이미지의 공간 구조를 고려하여 연산 효율성과 학습 안정성을 높인다. 2. CNN의 발전 과정과 대표 모델 CNN의 기원은 1980년...2025.12.19
-
컴퓨터비전의 개념과 발전 과정2025.12.191. 컴퓨터비전의 개념 및 연구 영역 컴퓨터비전은 디지털 영상이나 비디오로부터 유용한 정보를 자동으로 추출하고 분석하여 의사결정에 활용하는 기술이다. 영상 처리, 패턴 인식, 인공지능과 밀접하게 연관되어 있으며, 객체 검출, 이미지 분할, 동작 인식, 3차원 재구성 등의 연구 영역으로 나뉜다. 인간의 시각적 인지 과정을 모방하기 위해 복잡한 수학적 알고리즘과 데이터 기반 학습 기법을 필요로 한다. 2. 딥러닝 혁신과 성능 향상 2012년 AlexNet이 ILSVRC 대회에서 기존 기법을 압도하면서 컴퓨터비전은 새로운 전기를 맞이했다...2025.12.19
-
AI 오디오 파일 학습을 통한 자동 검사 모델 개발2025.11.131. LSTM 신경망 모델 RNN 모델의 Vanishing Gradient 문제를 개선한 LSTM(Long Short-Term Memory) 모델은 시계열 데이터 분석에 효과적입니다. 오디오 데이터는 시간에 따라 변하는 연속적인 신호로서 시계열 데이터이며, STFT_dB 데이터셋을 사용한 LSTM 모델이 99.0%의 정확도로 가장 우수한 성능을 보였습니다. 이 모델은 Precision 100.0%, Recall 93.3%, F1 Score 96.7%, AUC 99.6%의 평가 지표를 달성했습니다. 2. 오디오 신호 전처리 기법 원본...2025.11.13