본문 바로가기
일상

빅데이터 분석기사 실기 후기 및 공부방법

by 민벗 2022. 12. 4.
반응형

 

 

빅데이터 분석기사 필기시험 후기. 비전공자도 할 만한 시험

10월 1일 빅데이터 분석기사 필기 5회 차를 마치고 바로 쓰는 글이다. 필자는 컴퓨터공학 전공이지만, 빅데이터 분석기사는 컴공과 관련이 전혀 없다고 단언할 수 있다. 아직 결과는 안 나왔지만

msk2021.tistory.com

 

 이전 글에서 빅데이터 분석기사 필기 시험에 대한 리뷰를 해봤다. 그리고 오늘 실기를 보고왔는데, 예상보다 많이 쉽게 나와서 할만했다고 느껴졌다.

 

 빅데이터 분석기사 실기는 R언어와 Python언어로 볼 수 있다. 아마 대부분의 문제집은 R로 되어있는데, 필자는 파이썬으로 공부했다. R을 새로배우는게 내키지 않았고, R은 분석에서만 쓰이지만 파이썬은 웹 개발이나 코딩테스트등 여러분야에서 쓰이기 때문이다.

 

 이 글에서는 빅데이터 분석기사 실기 공부방법을 적어놓았다. 결론부터 말하자면 파이썬으로 공부하고자 한다면, 어떠한 교재도 살 필요없이 인터넷 자료로 충분하다. 파이썬에 대해 기본지식이 있어서 4일정도 공부했지만, 기초가 없더라도 넉넉잡아 2~3주면 충분히 합격할만 하다.

 

22.12.17 - 합격예정으로 나왔다.

 


 

실기 시험 구성

 먼저 빅데이터 분석기사 시험의 구성을 알아보자. 총 14문제로 되어있으며, 모든 작업은 컴퓨터로 진행된다. 정보처리기사 같은 경우 답안지를 직접 적는 형식이지만, 빅데이터분석기사는 컴퓨터상으로 진행하므로 따로 필기도구가 필요없다. 오히려 컴퓨터내 메모장 이외의 모든 필기를 금지하므로 수험표와 신분증외에는 가져갈 물건이 없다.

 

 빅데이터 분석기사의 문제 유형은 이렇다.

  • 단답형 (10문제, 각 3점) : 필기시험에 나온 개념을 단답형 형식으로 주어진다.
  • 작업형1 (3문제, 각 10점) : 제공된 데이터의 특정한 통계를 출력한다.
  • 작업형2 (1문제, 40점) : 제공된 데이터를 가지고 분류 또는 회귀 모델을 만들고, 예측한 결과물을 저장한다.

 100점 만점중 60점이상이면 실기시험에 합격하게 된다. 단답형은 예측이 가지만, 작업형의 경우 직접 어떤 유형의 문제인지 확인해보는것이 좋다. 데이터자격검정 사이트에서 직접 올려둔 예시페이지가 존재한다.

 

 해당 시험은 과락이 없으므로, 단답형을 전부 틀리고 작업형1 한문제를 빼고 전부 맞추면 합격한다. 그래서 필자는 단답형은 필기시험때 정리해둔 내용중 요점만 확인했다. 그리고 나머지 모든시간을 작업형만 공부했다.

 

 

실기 시험 준비

 먼저 실기시험의 공지를 확인해보자. 이 링크로 가서 '빅데이터분석기사 실기'를 검색하면 확인할 수 있다. 

 

시험 언어는 R 또는 Python을 사용할 수 있다.

 위 공지를 확인해봤다면 작업형은 R 또는 Python 언어를 사용할 수 있다. 그리고 대부분의 문제집은 R언어를 사용한다. R은 통계분석에 특화된 언어이기 때문에 대다수 교재에서 채택하는 듯 하다.

 

 하지만 필자는 Python(파이썬)으로 공부하는 것을 추천한다. 이유는 두 가지다.

 

 먼저 파이썬은 배우기 가장 쉬운 프로그래밍 언어다. 현재 존재하는 프로그래밍 언어 중 가장 쉬운 언어를 뽑으라면, 당연코 파이썬이 1위일 것이다. 대부분 코딩을 처음 할 때, 파이썬으로 시작하는 이유가 이것이다.

 

 또한 파이썬은 통계분석 뿐 아니라 백엔드 개발, GUI프로그래밍, 코딩테스트 등 다양한 분야에서 사용할 수 있다. 물론 다른 분야로 간다면 배우는 내용이 달라지겠지만, 기본적으로 같은 언어를 쓰는 만큼 공통된 부분이 많이 존재한다.

 

 파이썬으로 공부를 하기로 결정했다면, 이후 공부해야 될 내용을 적어봤다. 많은 도움이 되었으면 좋겠다.

 

Python 준비 과정

  1. 파이썬 언어 공부 (기초)
  2. 작업형1, 2유형 실습

 아마 이 과정만 따른다면 실기시험을 어렵지 않게 통과할 수 있을 것이다. 하나씩 자세히 알아보자.

 

파이썬 언어 공부

 

점프 투 파이썬

이 책은 파이썬이란 언어를 처음 접해보는 독자들과 프로그래밍을 한 번도 해 본적이 없는 사람들을 대상으로 한다. 프로그래밍을 할 때 사용되는 전문적인 용어들을 알기 쉽게 풀어서 …

wikidocs.net

 파이썬 공부의 경우 점프 투 파이썬을 보는 걸 추천한다. 오프라인 교재로도 팔고 있지만 온라인 교재와 거의 차이가 없고, 온라인에서 무료로 볼 수 있다.

 

 이 교재에서 모든 내용을 공부할 필요는 없다. 여기서는 1장, 2장 그리고 욕심이 난다면 3장까지 정도만 공부하면 충분하다. 완전히 이해하려 하지않아도 된다. 어짜피 작업형을 실습하면서 이 부분의 내용을 다시금 확인하게 된다.

 

 여기서 파이썬을 더 깊게 공부하고 싶다면, 코딩테스트에 도전해 보는 것도 좋다. 빅데이터 분석기사를 통해 취업을 하고자한다면, 이참에 코딩테스트도 병행하는 것도 좋은 생각이다.

 

코딩 테스트, 어떻게 대비해야 할까?

개발 관련 분야로 취업을 하려면 서류통과 이후 코딩 테스트가 필수입니다. 대기업은 물론이고 대다수의 스타트업도 취업문턱에 코딩 테스트가 준비되어 있습니다. 이처럼 개발 분야에 취업하

msk2021.tistory.com

 

작업형 1, 2 유형 실습

 작업형은 모두 데이터를 다루는게 중심이 된다. 여기서 파이썬의 Pandas라는 패키지를 사용하게 된다. 작업형1은 pandas만 잘 다뤄도 30점 만점을 챙기는게 가능하다. 작업형2는 모델 훈련이 포함되어 있으므로 scikit-learn 패키지를 사용하게 된다. 다시말해 pandas, scikit-learn만 다뤄도 작업형에서 만점을 받을 수 있다.

 

 

Big Data Certification KR

빅데이터 분석기사 실기 (Python, R tutorial code)

www.kaggle.com

 

 필자는 이 사이트에서 작업형문제를 공부했다. 실제 시험보다 약간 어려운 수준으로 문제가 나와있다. 또한 유튜브에서 해당 문제의 풀이를 볼 수 있다. 케글 사용법 또한 영상으로 나와있으니 참고하길 바란다.

 

 

 작업형1유형의 경우 데이터분석이 주를 이룬다. 그래서 pandas 모듈만 잘 다룬다면 어렵지 않게 풀 수 있다. 그리고 작업형2의 경우 pandas와 sklearn 둘다 다루는데, 여기서도 규칙이 존재한다.

 

 작업형2는 데이터전처리 => 데이터스케일링(선택) => 모델훈련 => 정답예측 과정으로 진행된다. 나의 경우 데이터 스케일링까지 했지만, 굳이 안해도 합격할 수 있을 것이다. 아래의 경우 작업형2에서 자주사용하는 모듈이다.

 

  • from sklearn.preprocessing import LabelEncoder (문자형 데이터를 숫자형으로 바꿔줌)
  • from sklearn.impute import SimpleImputer (null 값을 쉽게 채워줌)
  • from sklearn.preprocessing import StandardScaler, MinMaxScaler (스케일링)
  • from sklearn.ensemble import RandomForestClassifier, RandomForestRegression (분류에서는 Classifier, 회귀에서는 Regression 모델을 사용)

 

 작업형을 실습하면 알겠지만, 아마 매 시험마다 이 모듈을 다 사용할 것이라 확신한다. 스케일링 같은 경우 꼭 필요는 없지만, 대체로 모델의 성능을 올려주므로 알아두는 것도 나쁘지 않다.

 

 모델의 경우 의사결정트리, 다항회귀, 로지스틱 회귀, 서포트 벡터머신등 여러 모델이 있지만, 대체로 랜덤포레스트가 가장 높은 점수를 보여주었다. 실습때는 여러모델을 한번 사용해보고, 최종적으로 랜덤포레스트를 사용하는게 좋을 것이다.

 


 

마치며

 기사 자격증인 만큼 난이도가 있다고 생각했지만, 생각보다 어렵지 않은 시험이다. 비전공자라도 꺾이지 않는 마음 어느정도 노력만 있다면 충분히 합격할 수 있는 시험이다.

 

 하지만 빅데이터 분석기사에서 통계분석부분이 없다는 것이 조금 아쉬웠다. 상위자격증인 ADP의 경우 matplotlib를 사용해서 도표를 그리고, 통계를 출력하는 내용이 시험에 나온다. 필자의 경우 이 부분이 없는게 아쉬워서 아마 ADP를 준비할 거라 생각이 된다. 만약 좀 더 깊이있는 내용을 알고 싶다면, kaggle을 방문하며 실력을 쌓거나 ADP를 공부해보는 것도 좋다 생각된다.

반응형

댓글