총 3개
-
파이썬을 이용한 불법 사이트 탐지 및 차단2025.04.281. 불법 사이트 탐지 이 프로젝트는 파이썬을 사용하여 불법 사이트를 탐지하고 차단하는 기능을 제공합니다. 주요 기능으로는 구글 검색을 통해 불법 사이트 URL을 추출하고, 이를 hosts 파일에 차단하는 것입니다. 또한 머신러닝 기술을 활용하여 URL의 악성 여부를 판단하고, meta 태그의 키워드 필터링을 통해 유해 사이트를 탐지하는 기능을 포함하고 있습니다. 2. 구글 검색 및 URL 추출 이 프로젝트는 구글 검색을 통해 불법 사이트 URL을 추출하는 기능을 제공합니다. 특정 키워드로 구글 검색을 수행하고, 검색 결과에서 불법...2025.04.28
-
계절학기 수강신청 추천 프로그램 개발2025.11.171. 데이터 전처리 및 크롤링 BeautifulSoup과 Pandas 라이브러리를 활용하여 웹페이지에서 계절학기 교과목, 학사일정, 공지사항 데이터를 수집하고 정제했습니다. urllib를 이용한 정적 웹페이지 크롤링, HTML 파싱을 통해 필요한 정보를 추출하고, 결측값 처리 및 데이터 가공을 수행했습니다. CSV 형식의 교과목 데이터와 HTML 형식의 학사일정 데이터를 통합하여 분석 가능한 형태로 변환했습니다. 2. 프로그램 알고리즘 및 함수 설계 학생 정보 입력을 통해 전공/일선/교양 구분을 수행하고, 관심 분야 입력에 따라 과...2025.11.17
-
자연어 처리를 통한 학술논문 처리 방법2025.11.161. 자연어처리(NLP) 자연어처리는 일상생활에서 사용되는 자연어를 기계가 이해할 수 있도록 처리하는 것으로, 컴퓨터가 자연어를 이해하고 출력하도록 하는 처리 과정을 의미한다. 본 연구에서는 Python의 KoNLPy 라이브러리를 활용하여 한글 형태소 분석을 수행했으며, 꼬꼬마, 한나눔, 코모란, Okt 등 다양한 형태소 분석기를 비교 검토하여 한나눔 형태소 분석기의 정확성이 가장 높다고 판단했다. 2. 웹 크롤링 및 텍스트 추출 Google Colab 환경에서 BeautifulSoup 라이브러리를 이용하여 KCI 등재 논문 사이트...2025.11.16