2024.11.30

빅데이터분석기사 – 기출문제 9

데이터셋 경로

https://raw.githubusercontent.com/YoungjinBD/data/main/exam/

빅분기 기출문제 9회 (2024.11.30)

01. 작업형 제 1유형 [30점]

 

[1] 각 연도 및 성별의 총 대출액의 절댓값 차이를 구하고, 절댓값 차이가 가장 큰 지역코드를 구하시오.
데이터 : 9_1_1.csv

[2] 각 연도별 최대 검거율을 가진 범죄유형을 찾아서 해당 연도 및 유형의 검거건수들의 총합을 구하시오.
(검거율 = 검거건수 / 발생건수)
데이터 : 9_1_2.csv

[3] 제시된 문제를 순서대로 풀고, 해답을 제시하시오.
데이터 : 9_1_3.csv

 결측치 처리 

평균만족도 : 결측치는 평균만족도 컬럼의 전체 평균으로 채우시오.

근속연수 : 결측치는 각 부서와 등급별 평균 근속연수로 채우시오. (평균값의 소수점은 버림 처리)

 

 조건에 따른 평균 계산 

A : 부서가 ’HR’이고 등급이 ’A’인 사람들의 평균 근속연수를 계산하시오.

B : 부서가 ’Sales’이고 등급이 ’B’인 사람들의 평균 교육참가횟수를 계산하시오.

A와 B를 더한 값을 구하시오.




02.
작업형 제 2유형
[40점]

 

훈련 데이터로 학습한 모델을 테스트 데이터에 적용하여 예측한 결과를 제출하시오
(Target: 농업 유형(다중분류, {0, 1, 2})). 
※ 제출 형식은 ID, pred 두 칼럼만 존재해야 한다(평가 지표: Macro F1 Score).




03.
작업형 제 3유형
[30점]

 

[1] 한 제조 회사에서 생산성을 높이고자 직원들의 주요 생산성 요인을 분석하기로 결정하였다. 이를 위해 200명의 직원 데이터를 수집했으며, 직원들의 근무 기간, 특성 정보, 그리고 개인적인 속성을 조사하였다.
데이터 : 9_3_1.csv

  • Data description
    id : 데이터의 고유 식별자
    tenure : 사용 기간
    f2 : 고객의 두 번째 특성
    f3 : 고객의 세 번째 특성
    f4 : 고객의 네 번째 특성
    f5 : 고객의 다섯 번째 특성
    design : 생산성 점수

 

  • 데이터 분리 조건
    훈련 데이터 : id1 ~ id140
    테스트 데이터 : id141 ~ id200




[2] 한 통신 회사에서는 고객 이탈을 줄이고자 주요 요인들을 분석하기로 결정하였다. 이를 위해 500명의 고객 데이터를 수집했으며, 고객의 서비스 이용 및 가입 정보, 그리고 일부 개인적인 속성을 조사하였다.

데이터 : 9_3_2.csv

  • Data description
    col1 : 고객의 첫 번째 특성
    col2 : 고객의 두 번째 특성
    Phone_Service : 폰 서비스 가입 여부
    Tech_Insurance : 기술 보험 가입 여부
    churn : 이탈 여부

빅데이터분석기사 실기

수강신청

교재 구매하기