
총 15개
-
파이썬과R 2024년 2학기 방송통신대 출석수업과제물) 교재 연습문제 3장 1번, 2번, 3번 4장 7번, 8번, 9번 8장 2번2025.01.261. R 데이터프레임 생성 R에서 데이터프레임은 data.frame 함수로 생성한다. 데이터프레임을 구성할 원소를 설정하고, 행의 이름을 지정할 수 있다. 또한 문자열을 'factor'로 처리할지 여부를 선택할 수 있다. 2. 파이썬 딕셔너리 생성 파이썬에서 딕셔너리는 키(key)와 값(value)을 매핑시킨 자료형이다. 키는 불변객체의 자료형이어야 하며, 값은 자료형의 제한이 없다. 리스트나 튜플과 같은 가변객체는 키가 될 수 없다. 3. 파이썬 데이터프레임 생성 파이썬의 판다스 라이브러리를 사용하여 데이터프레임을 생성할 수 있다...2025.01.26
-
R데이터분석 출석수업 과제물 (2023, 만점)2025.01.241. R datarium 패키지 내 jobsatisfaction 데이터셋 분석 1) 직업만족도점수의 상자그림을 성별로 나란히 그렸고, 상자그림을 통해 남성의 직업만족도점수의 중앙값은 여성보다 낮으며, 분포는 여성보다 넓게 퍼진 모습을 확인할 수 있었다. 2) 남성의 직업만족도점수 평균은 7.06, 여성의 직업만족도점수 평균은 6.87이었다. 3) 성별에 따른 직업만족도점수 평균의 차이는 없다고 할 수 있었다. 4) 교육수준에 따른 직업만족도점수 평균에서 적어도 하나 이상은 교육수준에 따라 유의미한 차이가 있다고 결론 내릴 수 있었다...2025.01.24
-
데이터 시각화, 출석수업 과제물 (2023 1학기, 30점 만점)2025.01.251. 데이터 시각화의 사례 1970년부터 2022년까지 발생한 학교 총기 사건의 피해자 데이터를 시각화한 사례는 효율적이며 명료하다. 많은 데이터를 하나의 지도에 나타내어 어느 지역에서 어떤 규모의 사고가 났는지를 한눈에 볼 수 있다. 2. 데이터 시각화의 역할 한스 로슬링의 TED 강의에서는 다양한 지표들을 활용한 동적 데이터 시각화를 통해 잘 된 데이터 시각화가 방대하고 복잡한 자료를 한눈에 명료하게 볼 수 있게 하며 데이터를 잘 인지할 수 있게 도와준다는 것을 확인할 수 있었다. 3. 포유동물의 몸무게와 뇌 무게 msleep ...2025.01.25
-
서울시 공공자전거 이용현황 분석 및 활성화 방안(R을 이용한 빅데이터 분석)2025.05.021. 서울시 공공자전거 이용현황 분석 서울시 공공자전거 이용정보 데이터를 분석하여 이용 현황을 파악하고 문제점을 발견했습니다. 주요 이용자는 직장인이며 출퇴근 목적으로 이용하는 것으로 나타났습니다. 서울 중심부보다 외곽지역에서 많이 이용하며, 특히 한강을 따라 동서 지역에서 이용이 집중되어 있습니다. 2. 서울시 공공자전거 활성화 방안 분석 결과를 바탕으로 다음과 같은 활성화 및 개선방안을 제안했습니다. 1) 평일 낮 시간대 이용 장려를 위한 시간별 할인요금 적용, 2) 출퇴근 시간 집중지역으로 자전거 반납 시 쿠폰 지급, 3) 기...2025.05.02
-
2023년 1학년 1학기 방통대 데이터정보처리입문 출석수업 중간과제(만점)2025.01.251. 출생성비 출생성비는 여아 100명당 남아의 수를 나타내는 지표로, 1990년부터 2021년까지의 연도별 전국 총출생성비를 시계열도표로 나타내고 경향을 설명하였다. 1990년부터 1997년까지 다소 급격한 하락을, 이후로는 완만한 하락세를 보이고 있다. 또한 서울과 부산의 총출생성비를 비교하여 설명하였는데, 1990년부터 1998년까지 부산이 서울보다 높았으나 이후 점진적으로 감소내지 약화되다가 2002년부터 서울이 부산보다 높아지는 역전현상이 발생하였다. 2. 합계출산율 합계출산율은 한 여자가 가임기간 동안 낳을 것으로 예상되...2025.01.25
-
R데이터분석 2024년 2학기 방송통신대 출석수업대체과제물)R ggplot2 패키지에 내장된 mtcars 데이터셋은 32개의 차종에 대한 정보를 담고 있다2025.01.261. 변속기 종류에 따른 연비 차이 검정 변속기의 종류(am)에 따라 연비(mpg)의 평균이 달라지는지 검정한 결과, p-value가 0.001374로 유의수준 0.05보다 작으므로 변속기 종류에 따라 연비가 차이가 있다는 것을 확인하였다. 2. 실린더 수에 따른 연비 분포 차이 실린더 수(cyl)에 따른 연비(mpg)의 분포 차이를 상자그림으로 나타내었다. 실린더 수가 증가할수록 연비가 감소하는 경향을 확인할 수 있다. 3. 실린더 수에 따른 연비 평균 차이 검정 실린더 수(cyl)에 따라 연비(mpg)의 평균이 달라지는지 검정한...2025.01.26
-
프로그램 언어의 역사, 특징, 장.단점2025.05.061. 프로그래밍 언어 프로그래밍 언어는 기계와 인간이 이해할 수 있는 형태로 문제를 해결하기 위해 사용되는 도구입니다. 저급언어와 고급언어의 차이점은 사용자 중심의 언어인지, 하드웨어 중심의 언어인지에 있습니다. 저급언어는 기계어와 어셈블리어로 구성되며 컴퓨터만 이해할 수 있는 언어입니다. 고급언어는 절차지향 언어와 객체지향 언어로 구분되며 사용자가 이해하기 쉽고 이식성이 높습니다. 2. C 언어 C 언어는 1972년 데니스 리치에 의해 개발되었으며, 시스템 프로그래밍과 응용 프로그래밍에 널리 사용되는 범용 프로그래밍 언어입니다. ...2025.05.06
-
2024년 1학기 방송통신대 출석수업대체과제물 다변량분석) R과 파이썬을 각각 이용하여 작성하시오. 교재 연습문제 1장 3번, 4번 2장 3번 4장 3번 (1)-(3)2025.01.251. t-분포 난수 생성 및 분석 자유도가 5인 t-분포를 따르는 난수 100개를 R과 파이썬을 이용하여 생성하고, 히스토그램, 상자그림, 줄기-잎 그림을 그려 t-분포의 특성을 분석하였다. 히스토그램에서는 0을 중심으로 대칭의 모습을 보이지만 완전한 대칭은 아니며, 상자그림에서는 평균값이 0보다 약간 작은 것으로 나타났다. 줄기-잎 그림에서도 0점대를 중심으로 대칭의 구조를 보이고 있으나 일부 이상치가 확인되었다. 2. Longley 데이터 분석 R에 내장된 Longley 데이터를 이용하여 산점도행렬, 별그림, 얼굴그림을 그려 변...2025.01.25
-
30점 만점 방통대 다변량분석 2024-1학기2025.01.261. t-분포 난수 생성 및 분석 R과 파이썬을 이용하여 자유도가 5인 t-분포를 따르는 난수 100개를 생성하고 히스토그램, 상자그림, 줄기-잎 그림을 그려 분석하였다. 난수 생성 시 학번 뒤 4자리로 seed를 설정하였으며, R에서는 rt() 함수, 파이썬에서는 np.random.standard_t() 함수를 사용하였다. 히스토그램 결과 -4부터 4 이상 범위에 분포하며 오른쪽 꼬리가 긴 모양이었고, 상자그림 결과 중앙값이 0에 가깝고 제1사분위수와 제3사분위수가 각각 -2보다 크고 2보다 작았다. 줄기-잎 그림 결과 -1과 1...2025.01.26
-
2024년 1학기 방송통신대 출석수업대체과제물 데이터정보처리입문2025.01.251. 연도별 전국 총출생성비 분석 1990년부터 2022년까지의 연도별 전국 총출생성비를 시계열도표로 나타내고 전체적인 경향을 설명하였다. 총출생성비는 여아 100명당 남아의 수를 나타내는 것으로, 1990년 이후 지속적으로 감소하는 추세를 보이고 있다. 다만 1990년대 중후반 이후에는 하락 속도가 다소 완화되고 있는 것으로 나타났다. 2. 서울과 부산의 총출생성비 비교 1990년부터 2022년까지의 연도별 서울과 부산의 총출생성비를 하나의 시계열도표에 나타내고 비교하였다. 대체로 2005년 이전에는 부산이 서울보다 총출생성비가 ...2025.01.25