2022.12.03 빅데이터분석기사 – 기출문제 5회 데이터셋 경로 https://raw.githubusercontent.com/YoungjinBD/data/main/exam/ COPY https://raw.githubusercontent.com/YoungjinBD/data/main/exam/ 빅분기 기출문제 5회 (2022.12.03)01. 작업형 제 1유형 [30점] [1] 다음 데이터에서 conventional 칼럼의 특수문자를 제거하고, IQR(3분위수 – 1분위수)를 구하시오.(소수점 첫째 자리에서 반올림)‧ 데이터 : 5_1_1.csv[2] 위 데이터에서 흑인 또는 히스패닉 비율(minority) / 빈곤율(poverty) > 2이며, 도시 유형(city)이 state인 도시의 범죄율(crime) 평균을 구하시오. (소수점 첫째 자리에서 반올림)‧ 데이터 : 5_1_2.csv[3] 다음 데이터에서 2016년 9월 이후, 온도(actual)의 평균을 구하시오. (소수점 첫째 자리에서 반올림)‧ 데이터 : 5_1_3.csv02. 작업형 제 2유형 [40점] 훈련 데이터로 학습한 모델을 테스트 데이터에 적용하여 예측한 결과를 제출하시오. (Target: 1일 확률)※ 제출 형식은 ID, prob 두 칼럼만 존재해야 한다. (평가 지표: AUC) ‧ 데이터 : 5_2_train.csv 5_2_test.csv2-103. 작업형 제 3유형 [30점] [1] 어느 학교에서 학생들의 공부 시간과 시험 점수 간의 상관관계를 조사하고자 한다. 50명의 학생을 대상으로 하루 평균 공부 시간과 최근 시험 점수를 조사하였다.‧ 데이터 : 5_3_1.csv① 학생들의 공부 시간과 시험 점수의 평균, 표준편차를 구하시오. (소수점 둘째 자리까지 반올림)② 공부 시간과 시험 점수 간의 상관관계를 조사하기 위한 피어슨 상관계수를 계산하시오. (소수점 셋째 자리까지 반 올림)③ p-value를 바탕으로 유의수준 5%에서 귀무가설의 기각/채택 여부를 결정하시오. (p-value는 소수점 셋째 자리까 지 반올림)[2] 어느 마케팅 회사에서 세 가지 마케팅 캠페인(A, B, C)의 효과가 유의미하게 다른지를 조사하고자 한다. 각 캠페인에 대해 각각 50명의 고객을 랜덤으로 추출하여 만족도를 조사하였다. ‧ 데이터 : 5_3_2.csv① 각 캠페인의 만족도 점수의 평균, 표준편차를 구하시오. (소수점 둘째 자리까지 반올림)② 세 캠페인의 평균 만족도 점수가 유의미하게 다른지 검정하기 위해 ANOVA 검정을 수행하고, 검정통계량을 계산 하시오. (소수점 셋째 자리까지 반올림)③ p-value를 바탕으로 유의수준 5%에서 귀무가설의 기각/채택 여부를 결정하시오. (p-value는 소수점 셋째 자리까 지 반올림)정답 제출 빅데이터분석기사 실기 수강신청 교재 구매하기