2022.06.25

빅데이터분석기사 – 기출문제 4

데이터셋 경로

https://raw.githubusercontent.com/YoungjinBD/data/main/exam/

빅분기 기출문제 4회 (2022.06.25)

01. 작업형 제 1유형 [30점]

 

[1] 다음 데이터에서 결측치가 존재하는 행을 모두 삭제하시오. 데이터의 상위 70%에 해당하는 데이터를 추출하고, PTRATIO 칼럼의 1분위수를 구하시오. (소수점 둘째 자리까지 반올림)

‧ 데이터 : 4_1_1.csv

[1] 건축연도(yearBuilt)가 1991~2000년이면서 평균 학교등급(avgSchoolRating)이 평균 이하인 주택 id(uid)와 건축연도 2001~2010년에 평균 학교등급이 평균 이상인 주택 id의 수를 구하시오.

‧ 데이터 : 4_1_2.csv

[3] 위 데이터의 각 칼럼 중 결측치가 가장 많은 칼럼을 출력하시오.




02.
작업형 제 2유형
[40점]

 

훈련 데이터로 학습한 모델을 테스트 데이터에 적용하여 예측한 결과를 제출하시오.
(Target: 이탈 여부(Attrition_Flag)가 Attrited Customer일 확률)

※ 제출 형식은 ID, prob 두 칼럼만 존재해야 한다. (평가 지표: AUC)

‧ 데이터 : 4_2_train.csv

                   4_2_test.csv




03.
작업형 제 3유형
[30점]

 

[1] 어느 회사에서 두 부서(A와 B) 직원들의 주간 근무 시간 평균이 유의미하게 다른지를 조사하고자 한다. 각 부서에서 각각 30명의 직원을 랜덤으로 추출하여 주간 근무 시간을 조사하였다

‧ 데이터 : 4_3_1.csv




[2] 어느 제조업체에서 세 공장(A, B, C)에서 생산된 제품의 품질 점수가 유의미하게 다른지를 조사하고자 한다. 각 공장에서 각각 30개의 제품을 랜덤으로 추출하여 품질 점수를 조사하였다.

‧ 데이터 : 4_3_2.csv

빅데이터분석기사 실기

수강신청

교재 구매하기