2023.06.24 빅데이터분석기사 – 기출문제 6회 데이터셋 경로 https://raw.githubusercontent.com/YoungjinBD/data/main/exam/ COPY https://raw.githubusercontent.com/YoungjinBD/data/main/exam/ 빅분기 기출문제 6회 (2023.06.24)01. 작업형 제 1유형 [30점] [1] 다음 데이터에서 ProductA 가격과 ProductB 가격이 모두 0원이 아닌 데이터를 필터링하고, ProductA와 ProductB의 가격 차이를 정의하시오. 각 도시별 가격 차이의 평균 중 가장 큰 값을 구하시오. (소수점 첫째 자리까지 반올림)‧ 데이터 : 6_1_1.csv[2] 100명의 키와 몸무게를 조사하여 적정 체중인지 판단할 수 있는 BMI를 산출하려 한다. 아래 표를 참고하여 BMI를 기준으로 저체중, 정상, 과체중, 비만을 구분하고, 저체중인 사람과 비만인 사람의 총 합을 구하시오.‧ 데이터 : 6_1_2.csv[3] 다음 데이터에서 연도별로 가장 큰 순생산량(생산된 제품 수 – 판매된 제품 수)을 가진 공장을 찾고, 순생산량의 합을 계산하시오.‧ 데이터 : 6_1_3.csv02. 작업형 제 2유형 [40점] 훈련 데이터로 학습한 모델을 테스트 데이터에 적용하여 예측한 결과를 제출하시오. (Target: DBP)※ 제출 형식은 ID, pred 두 칼럼만 존재해야 한다. (평가 지표: RMSE) ‧ 데이터 : 6_2_train.csv 6_2_test.csv2-103. 작업형 제 3유형 [30점] [1] 어느 회사에서 100명의 직원들을 대상으로 하루 업무 수행 시간을 조사하였다. K-S 검정을 통해 업무 수행 시간이 정규분포를 따르는 지 검정하고자 한다.‧ 데이터 : 6_3_1.csv① 직원들의 업무 수행 시간의 평균과 표준편차를 구하시오. (소수점 셋째 자리까지 반올림)② 직원들의 업무 수행 시간이 정규분포를 따르는 지 K-S 검정을 실시하고, 검정통계량을 계산하시오. (소수점 셋째 자리까지 반올림)③ p-value를 바탕으로 유의수준 5%에서 귀무가설의 기각/채택 여부를 결정하시오. (p-value는 소수점 셋째 자리까 지 반올림)[2] 다음의 데이터는 주택들의 가격(price), 면적(area), 방의 개수(rooms), 연식(age)을 조사하여 기록한 것이다. ‧ 데이터 : 6_3_2.csv① 주택 가격을 종속 변수로 하고, 면적, 방의 개수, 연식을 독립 변수로 하는 다중회귀 분석을 수행하여, 회귀 계수가 가장 높은 변수를 구하시오. (다중회귀모형 적합 시 절편 포함)② 유의수준 5% 하에서 각 독립 변수가 주택 가격에 미치는 영향이 통계적으로 유의미한 지 판단하고, 유의미한 변수 개수를 구하시오.정답 제출 빅데이터분석기사 실기 수강신청 교재 구매하기