2021.12.04

빅데이터분석기사 – 기출문제 3

데이터셋 경로

https://raw.githubusercontent.com/YoungjinBD/data/main/exam/

빅분기 기출문제 3회 (2021.12.04)

01. 작업형 제 1유형 [30점]

 

[1] 다음 데이터에서 lotSizeSqFt이 큰 top 10을 구하고, top 10 값 중 가장 작은 값으로 해당 값을 대치하시오. 또한, 건축 연도(yearBuilt)가 2000년도 이상인 lotSizeSqFt의 평균값을 구하시오. (소수점 첫째 자리에서 반올림, 대치된 lotSizeSqFt 기준)

‧ 데이터 : 3_1.csv

[2] 칼럼별 결측치 존재 여부를 확인하고, 결측치가 존재하는 경우 해당 칼럼의 중앙값으로 결측치를 대치하시오. 결측치 대치 전과 후 표준편차 차이의 절댓값을 구하시오. (소수점 둘째 자리까지 반올림)

[3] 평균으로부터 1.5×표준편차만큼 벗어나는 경우를 이상치로 판단할 때, MedianStudentsPerTeacher의 이상치를 구하고, 이상치의 개수를 구하시오.




02.
작업형 제 2유형
[40점]

 

훈련 데이터로 학습한 모델을 테스트 데이터에 적용하여 예측한 결과를 제출하시오. (Target: Outcome이 1일 확률)
※ 제출 형식은 pred 칼럼만 존재해야 한다. (평가 지표: f1_score)

‧ 데이터 : 3_2_trainX.csv

                   3_2_trainy.csv

                   3_2_testX.csv




03.
작업형 제 3유형
[30점]

 

[1] 어느 고등학교의 수학 교사는 학생들의 시험 점수가 평균 75점 이상이라고 주장한다. 이를 검증하기 위해 랜덤으로 100명의 학생을 추출하여 시험 점수를 조사하였다.

‧ 데이터 : 3_3_1.csv




[2] 어느 고등학교에서 학생들의 성별과 동아리 가입 여부 간의 연관성을 조사하고자 한다. 이를 위해 200명 의 학생을 대상으로 조사를 실시하였다.

‧ 데이터 : 3_3_2.csv

빅데이터분석기사 실기

수강신청

교재 구매하기