
총 75개
-
머신러닝에서의 차원축소2025.05.101. 차원 축소 차원 축소는 고차원 데이터를 저차원으로 변환하는 과정으로, 데이터의 복잡성을 줄이고 특징을 추출하거나 시각화하기 위해 사용됩니다. 주요 방법으로는 특징 선택과 특징 추출이 있으며, 차원 축소의 이점은 데이터 시각화, 계산 효율성 향상, 잡음 제거 등입니다. 2. 차원의 개념 차원은 데이터를 표현하기 위해 필요한 축의 수를 의미하며, 각 차원은 데이터의 특정 특성을 나타내는 변수 또는 속성이 됩니다. 차원이 높을수록 데이터의 복잡성과 계산 비용이 증가하므로 차원 축소가 필요합니다. 3. 특징(feature)의 개념 특...2025.05.10
-
정보의 사회화와 데이터 해석 및 시각화의 필요성2025.01.041. 정보의 사회화와 문명사적 대전환 토플러는 정보의 사회화를 농업사회에서 산업사회로의 전환과 비교할 만한 문명사적 대전환이라고 규정했다. 정보의 사회화는 인터넷과 네트워크 기술의 발달로 인해 우리의 삶 전반에 큰 변화를 가져왔다. 이는 농업혁명과 산업혁명만큼 인류 역사상 가장 큰 변화 중 하나로 볼 수 있다. 정보의 사회화로 인해 정보의 생산, 유통, 접근 방식이 크게 달라졌으며, 이는 국가 간 경쟁력, 개인정보 보호, 가짜뉴스 등 새로운 문제를 야기하고 있다. 따라서 정보의 사회화에 대한 이해와 대처 능력을 지속적으로 향상시켜야...2025.01.04
-
데이터 시각화의 윤리적 고려사항2025.01.041. 데이터 시각화의 현혹적 사례 최근 일부 매체에서 데이터 시각화를 통해 독자의 주목을 끌기 위해 과장된 색상 사용, 축 범위 조정, 비율 조작 등의 현혹적인 기법을 사용하는 사례가 있다. 이는 데이터의 실제 의미를 왜곡하여 독자의 인식과 판단에 부정적인 영향을 미칠 수 있다. 2. 데이터 시각화의 윤리적 고려사항 데이터 시각화 과정에서는 정보의 정확성과 공정성 확보가 매우 중요하다. 데이터 출처와 정확성에 대한 투명성 보장, 과장된 표현 및 오해 요소 지양, 개인이나 집단에 대한 편견 및 피해 방지, 독자의 비판적 사고 촉진 등...2025.01.04
-
전산개론_빅데이터의 정의와 특징 그리고 분석기술을 조사하여 제출하시오.2025.05.021. 4차 산업혁명 4차 산업혁명의 특징은 초연결성, 융합, 초지능, 노동력 위기, 심각한 불균형과 양극화 현상 등 5가지로 분류할 수 있다. 이러한 4차 산업혁명의 배경 속에서 빅데이터의 개념, 특징, 분석기술이 등장하게 되었다. 2. 빅데이터의 개념 빅데이터는 많은 양의 데이터로, 속도가 빠르고 다양한 종류의 데이터를 포함하고 있다. 기존의 관리 방법이나 분석 체계로는 처리하기 어려운 방대한 양의 데이터 집합을 저장, 수집, 분석, 관리, 시각화하는 정보통신 기술 분야라고 볼 수 있다. 3. 빅데이터의 특징 빅데이터의 대표적인 ...2025.05.02
-
2023년 1학년 1학기 방통대 데이터정보처리입문 출석수업 중간과제(만점)2025.01.251. 출생성비 출생성비는 여아 100명당 남아의 수를 나타내는 지표로, 1990년부터 2021년까지의 연도별 전국 총출생성비를 시계열도표로 나타내고 경향을 설명하였다. 1990년부터 1997년까지 다소 급격한 하락을, 이후로는 완만한 하락세를 보이고 있다. 또한 서울과 부산의 총출생성비를 비교하여 설명하였는데, 1990년부터 1998년까지 부산이 서울보다 높았으나 이후 점진적으로 감소내지 약화되다가 2002년부터 서울이 부산보다 높아지는 역전현상이 발생하였다. 2. 합계출산율 합계출산율은 한 여자가 가임기간 동안 낳을 것으로 예상되...2025.01.25
-
공공데이터를 활용한 프로젝트 결과보고서2025.01.161. 데이트 장소 추천 코로나 19 로 인해 사회적 거리두기가 생활화되면서 연인들이 데이트를 즐기는 방법이 변화하고 있다. 사람이 많은 실내 공간보다는 감염 위험이 낮은 야외 공간을 선호하게 되었다. 이 프로젝트에서는 서울시 내 코로나 19 를 피해 데이트할 수 있는 최적의 야외 장소를 추천하기 위해 기온, 강수량, 대기오염도, 유동인구 등의 데이터를 활용하여 분석하고 시각화하였다. 2. 데이터 수집 및 전처리 이 프로젝트에서는 기상청, 서울시 대기환경정보, SKT Data Hub, 서울 열린데이터광장, 망고플레이트 등 다양한 공공...2025.01.16
-
로그 정규분포 실습해보기 (파이썬예제 포함)2025.05.101. 로그-정규분포 로그-정규분포는 양수값을 모델링하기에 적합한 분포입니다. 불량율을 로그 변환한 후, 정규분포를 사용하여 모델링할 수 있습니다. 이 분포는 자연로그를 취한 값이 정규분포를 따른다고 가정하는 것이기 때문에, 불량율이 양수인 경우에 유용합니다. 로그 정규분포는 실제로 많은 현상에서 관찰되는 분포로서, 소득 데이터와 같은 경제적인 현상에서 자주 사용됩니다. 소득 분포의 경우, 대부분의 개인들이 상대적으로 낮은 소득을 가지지만, 일부 특정 개인들이 다른 사람들보다 훨씬 높은 소득을 가지는 경우가 발생할 수 있습니다. 로그...2025.05.10
-
2024년 1학기 방송통신대 출석수업대체과제물 다변량분석) R과 파이썬을 각각 이용하여 작성하시오. 교재 연습문제 1장 3번, 4번 2장 3번 4장 3번 (1)-(3)2025.01.251. t-분포 난수 생성 및 분석 자유도가 5인 t-분포를 따르는 난수 100개를 R과 파이썬을 이용하여 생성하고, 히스토그램, 상자그림, 줄기-잎 그림을 그려 t-분포의 특성을 분석하였다. 히스토그램에서는 0을 중심으로 대칭의 모습을 보이지만 완전한 대칭은 아니며, 상자그림에서는 평균값이 0보다 약간 작은 것으로 나타났다. 줄기-잎 그림에서도 0점대를 중심으로 대칭의 구조를 보이고 있으나 일부 이상치가 확인되었다. 2. Longley 데이터 분석 R에 내장된 Longley 데이터를 이용하여 산점도행렬, 별그림, 얼굴그림을 그려 변...2025.01.25
-
한국방송통신대학교 통계데이터과학과 엑셀데이터분석 2024년 출석과제(만점)2025.01.251. 연도별 강수량 분석 A지역과 B지역의 1990년부터 2020년까지의 연강수량 자료를 엑셀과 KESS로 분석하여 두 지역의 연도별 강수량 추세 변화, 기술통계량 비교, 줄기-잎 그림과 상자그림 비교 등을 통해 두 지역의 강수량을 비교하였다. 분석 결과, A지역의 평균 및 총 강수량이 B지역보다 많았지만 연도별 편차가 컸다. 2. 이항분포와 포아송분포 자유투 성공률이 80%인 농구선수의 20번 자유투 성공 횟수와 4지선다형 문제 10문항에 대한 정답 수를 확률변수로 정의하고, 이항분포와 포아송분포를 이용하여 각각의 확률을 계산하였...2025.01.25
-
30점 만점 방통대 데이터정보처리입문 2023-1학기2025.01.261. 출생성비 추이 1990년부터 2021년까지의 전국, 서울, 부산의 연도별 출생성비 추이를 시계열 도표로 나타냈다. 전국적으로 1990년 116.5에서 점차 감소하여 2021년 105.1까지 감소하는 경향을 보였으며, 서울과 부산도 유사한 추이를 보였다. 다만 2000년대 중반 이전에는 부산의 출생성비가 서울보다 높았으나 이후 큰 차이가 없어졌다. 2. 합계출산율 추이 1993년부터 2021년까지의 전국 합계출산율 추이를 시계열 도표로 나타냈다. 합계출산율은 1993년 1.654에서 점차 감소하여 2021년 0.808까지 감소하...2025.01.26