해피캠퍼스 토픽위키

토픽위키

총 19개

연관순
조회순

- 연관순
- 조회순

VQGAN 논문 (인공지능) 발표 및 대본

2025.05.07

1. VQGAN 모델 VQGAN은 VQ-VAE 구조를 따르며 CNN과 Transformer의 장점을 결합한 모델입니다. CNN으로 Locality를 잘 반영하는 codebook을 학습하고, Transformer의 풍부한 표현력으로 Image Synthesis를 이룹니다. VQGAN은 2-stage 모델로, 첫번째 stage에서 codebook을 학습하여 Transformer에 사용하기 위한 이미지의 구성요소를 학습하고, 두번째 stage에서 이러한 codebook을 바탕으로 Transformer를 이용하여 이미지를 구성합니다. 2....

2025.05.07
객체 인식 기술의 원리와 응용 분야

2025.12.19

1. 객체 인식의 개념과 기본 구조 객체 인식은 영상에서 개별 사물을 식별하고 분류하거나 위치를 찾아내는 과정이다. 영상 전처리, 특징 추출, 분류의 세 단계로 구성되며, 초기에는 사람이 직접 특징을 설계했으나 현대 딥러닝 기반 기법에서는 모델이 자동으로 특징을 학습한다. 이는 컴퓨터비전 분야의 핵심 기술로서 이미지나 영상 속에서 특정 대상이 무엇인지 식별하는 과정을 의미한다. 2. 딥러닝 기반 객체 인식 모델의 혁신 2012년 알렉스넷 등장 이후 합성곱 신경망(CNN)이 객체 인식 분야의 판도를 바꾸었다. VGG, ResNet, ...

2025.12.19
서강대 AI빅데이터 과제 모음

2025.12.21

1. 딥러닝과 감성분석을 활용한 관광객 수요예측 온라인 리뷰의 감성분석과 딥러닝 기법(RNN, BPN, SVR)을 결합하여 관광객 수요를 예측하는 모형을 개발했다. TripAdvisor의 국내 관광지 리뷰를 크롤링하여 월별 감성값을 계산하고, 1개월 시차를 두고 예측모형에 반영했다. Senti-RNN 모형이 가장 우수한 성과를 보였으며, 감성값을 반영한 모형이 관광객 수만 사용한 모형보다 예측성능이 우수함을 확인했다. 2. 객체지향 프로그래밍(OOP)의 4가지 특성 캡슐화는 객체의 상태와 행위를 하나로 묶고 외부 접근을 제어하는 개...

2025.12.21
의료 영상 분석에서의 컴퓨터비전 활용

2025.12.19

1. 딥러닝 기반 의료 영상 분석 합성곱 신경망(CNN)은 방대한 영상 데이터로부터 자동으로 특징을 학습하여 기존 기법을 압도하는 성능을 보여주었다. U-Net은 의료 영상 분할에 특화된 구조로 종양이나 병변의 위치를 픽셀 단위로 정밀하게 예측할 수 있다. 3차원 CNN은 CT나 MRI와 같이 다차원 데이터를 처리하는 데 효과적이며, 최근에는 트랜스포머 기반 네트워크와 자기지도학습이 적용되어 데이터 효율성을 높이고 있다. 2. 의료 영상 모달리티와 응용 엑스레이는 폐 질환, 골절 진단에 활용되며 AI가 폐결절 검출을 자동화한다. C...

2025.12.19
텐서플로우 딥러닝 (CNN)

2025.05.05

1. 데이터 세트 학습 데이터에 사용할 영상은 Google에서 이미지 검색으로 꽃을 검색하고, FatKun이라는 크롬 확장 프로그램을 사용하여 영상을 다운로드 받았다. 테스트 데이터에 사용할 영상은 꽃을 직접 구입하여 촬영한 영상 데이터를 사용했다. 학습 데이터는 총 234개, 테스트 데이터는 총 150개이며, 검증 데이터는 훈련데이터의 20%를 사용하여 총 57개이다. 2. 합성곱 신경망 (CNN) 기본적으로 이미지 분류를 하기 위해서는 합성 곱 신경망(CNN)이 필요하다. 2차원 CNN의 특징 추출 부분은 MaxPool2D층과 ...

2025.05.05
CNN을 이용한 이미지 분류-일반 농산물과 GMO의 구분

2025.01.28

1. GMO 농산물 구분 연구에서는 CNN(Convolutional Neural Network)을 이용하여 일반 농산물과 GMO 농산물을 구분하는 방법을 제안하고 있습니다. 연구자는 샤인머스캣 잎과 포도 잎의 이미지를 수집하여 CNN 모델을 학습시켰고, 이를 통해 약 68%의 정확도로 GMO와 일반 농산물을 구분할 수 있었습니다. 이를 통해 소비자들이 GMO 식품 여부를 쉽게 확인할 수 있도록 하고자 하였습니다. 2. 딥러닝을 이용한 이미지 분류 연구에서는 딥러닝 기술 중 하나인 CNN을 활용하여 이미지 분류 문제를 해결하고자 하였...

2025.01.28
AI 오디오 파일 학습을 통한 자동 검사 모델 개발

2025.11.13

1. LSTM 신경망 모델 RNN 모델의 Vanishing Gradient 문제를 개선한 LSTM(Long Short-Term Memory) 모델은 시계열 데이터 분석에 효과적입니다. 오디오 데이터는 시간에 따라 변하는 연속적인 신호로서 시계열 데이터이며, STFT_dB 데이터셋을 사용한 LSTM 모델이 99.0%의 정확도로 가장 우수한 성능을 보였습니다. 이 모델은 Precision 100.0%, Recall 93.3%, F1 Score 96.7%, AUC 99.6%의 평가 지표를 달성했습니다. 2. 오디오 신호 전처리 기법 원본...

2025.11.13
컴퓨터비전의 개념과 발전 과정

2025.12.19

1. 컴퓨터비전의 개념 및 연구 영역 컴퓨터비전은 디지털 영상이나 비디오로부터 유용한 정보를 자동으로 추출하고 분석하여 의사결정에 활용하는 기술이다. 영상 처리, 패턴 인식, 인공지능과 밀접하게 연관되어 있으며, 객체 검출, 이미지 분할, 동작 인식, 3차원 재구성 등의 연구 영역으로 나뉜다. 인간의 시각적 인지 과정을 모방하기 위해 복잡한 수학적 알고리즘과 데이터 기반 학습 기법을 필요로 한다. 2. 딥러닝 혁신과 성능 향상 2012년 AlexNet이 ILSVRC 대회에서 기존 기법을 압도하면서 컴퓨터비전은 새로운 전기를 맞이했다...

2025.12.19
AI 기반 컴퓨터 비전 기술을 활용한 의료 서비스 평준화

2025.01.02

1. AI 기반 컴퓨터 비전 기술의 의료 적용 고령화 사회에서 건강과 의료에 대한 관심이 높아지고 있지만, 실질적으로 양질의 의료 서비스를 받기 위해서는 특정 병원에 대한 의존도가 높아지고 있습니다. 이에 컴퓨터 비전 기술을 활용하여 지역과 관계없이 동일한 진료 기준으로 질환을 판정할 수 있는 시스템을 구축하여 모두가 평등한 의료 서비스를 받을 수 있는 환경을 만드는 것이 필요합니다. 1. AI 기반 컴퓨터 비전 기술의 의료 적용 AI 기반 컴퓨터 비전 기술은 의료 분야에서 매우 유망한 기술로 주목받고 있습니다. 이 기술은 의료 영...

2025.01.02
합성곱 신경망의 원리와 이미지 인식 응용

2025.12.19

1. 합성곱 신경망(CNN)의 기초 원리 합성곱 신경망은 인간의 시각 피질에서 착안한 혁신적 기술로, 작은 크기의 필터를 이미지에 슬라이딩하며 특징 맵을 생성한다. CNN의 기본 구조는 합성곱 계층, 활성화 함수(ReLU), 풀링 계층, 완전연결 계층으로 이루어져 있다. 합성곱 연산은 이미지의 지역적 패턴을 효과적으로 포착하며, 가중치 공유를 통해 학습 파라미터를 줄인다. 이는 전통적 인공신경망과 달리 이미지의 공간 구조를 고려하여 연산 효율성과 학습 안정성을 높인다. 2. CNN의 발전 과정과 대표 모델 CNN의 기원은 1980년...

2025.12.19

1 / 2