ADsP 데이터분석 60% — 3과목 핵심과 학습 우선순위

ADsP 데이터분석 60% 과목을 R 기초·통계분석·정형 데이터 마이닝으로 나눠 챕터별 우선순위와 과락 회피선을 정리합니다. KDATA 공식 출제기준 기반으로 개발자·분석가·기획자·마케터·사무직별 약점과 8주·3주 학습 흐름, CBT·기출 복습 연결까지 함께 확인합니다.

글쓴이 DAYLAB ·

ADsP 데이터분석은 전체 100점 중 60점을 차지하는 3과목이며, 합격권을 만들려면 R 기초보다 통계분석과 정형 데이터 마이닝의 누수를 먼저 관리해야 합니다.

ADsP 데이터분석 60% — 왜 이 과목이 합격을 가른다

ADsP는 한국데이터산업진흥원(KDATA)이 시행하는 데이터분석 준전문가 시험입니다. 전체 시험은 객관식 50문항, 90분, 100점 만점이며 총점 60점 이상이어야 합격입니다. 동시에 과목별 40% 미만이면 과락이므로, 총점만 보는 전략은 위험합니다. KDATA 공식 출제기준은 데이터분석 과목을 전체 60점, 30문항으로 안내하고, 하위 범위를 R 기초와 데이터 마트, 통계분석, 정형 데이터 마이닝의 3개 챕터로 둡니다. 출처: 한국데이터산업진흥원 ADsP 출제기준

이 구조에서 ADsP 3과목은 단순히 많은 과목이 아니라 합격 점수의 중심입니다. 데이터 이해와 데이터분석 기획을 안정적으로 맞혀도, 데이터분석 30문항에서 누수가 크면 총점 60점에 닿기 어렵습니다. 반대로 3과목에서 충분한 점수를 확보하면 나머지 과목의 작은 실수를 흡수할 여지가 생깁니다. 전체 과목 구조는 ADsP 3과목 한눈에에서 함께 비교하면 흐름이 더 분명해집니다.

챕터 3.1 R 기초와 데이터 마트

챕터 3.1은 R 기초와 데이터 마트, 결측값 처리와 이상값 검색을 다룹니다. R 기초에는 변수, 자료형, 데이터 구조, R 패키지, 기본 함수가 포함됩니다. 데이터 마트에서는 요약, 전처리 함수, dplyr, plyr, reshape 같은 도구의 역할을 구분해야 합니다. 결측값 처리와 이상값 검색은 실제 데이터를 다룰 때도 중요한 영역이지만, 시험에서는 처리 순서와 함수 의미를 묻는 객관식으로 보는 편이 안전합니다.

이 챕터는 코드를 많이 짜는 시험이 아닙니다. 핵심은 특정 함수가 어떤 입력을 받고 어떤 결과를 만드는지, 옵션이 무엇을 바꾸는지, 자료구조가 어떻게 해석되는지를 판단하는 것입니다. 개발자는 코드 친화성이 있어 진입 장벽이 낮을 수 있지만, R이 평소 쓰던 언어와 다르면 벡터, 데이터프레임, 패키지 사용 방식에서 혼동이 생길 수 있습니다. 처음에는 문법 암기보다 자료형, 기본 함수, 결측 처리 표현을 한 표로 정리하는 편이 좋습니다.

챕터 3.2 통계분석

챕터 3.2 통계분석은 ADsP 데이터분석 안에서 가장 큰 누수 영역이 되기 쉽습니다. 범위는 통계학 개론, 기초 통계분석, 다변량 분석, 시계열 예측까지 이어집니다. 통계학 개론에서는 모집단, 표본, 확률분포, 중심극한정리를 다루고, 기초 통계분석에서는 기술 통계, 추정, 가설검정, t-test, 분산분석, 상관분석, 회귀분석을 구분해야 합니다.

다변량 분석은 다중회귀, 요인분석, 주성분분석(PCA), 판별분석, 다차원척도법(MDS)을 포함합니다. 시계열 예측은 정상성, 자기회귀, 이동평균, ARIMA, 계절성, 분해 같은 용어가 연결됩니다. 비전공자는 이 챕터를 공식 암기만으로 처리하려다 선택지에서 흔들리는 경우가 많습니다. 마케터는 캠페인 성과나 세그먼트 분석에는 익숙할 수 있지만, 통계 검정과 회귀의 전제 조건은 별도로 봐야 합니다. 기획자도 분석 결과를 읽는 경험과 검정 절차를 구분하는 능력은 다르므로, 용어 정의와 사용 상황을 함께 묶어야 합니다.

챕터 3.3 정형 데이터 마이닝

챕터 3.3 정형 데이터 마이닝은 데이터 마이닝 개요, 분류 분석, 군집 분석, 연관 분석으로 구성됩니다. 데이터 마이닝 개요에서는 목적, 프로세스, 평가 지표를 봅니다. 평가 지표는 정확도, 정밀도, 재현율, F1, ROC, AUC, 이익도표까지 이어지므로 이름만 외우면 부족합니다. 각 지표가 어떤 오류를 줄이려는지, 어떤 상황에서 더 중요해지는지를 구분해야 합니다.

분류 분석에는 의사결정나무, 로지스틱 회귀, 인공신경망, SVM, 앙상블, 랜덤포레스트, 부스팅이 포함됩니다. 군집 분석은 k-means, 계층적 군집, DBSCAN, 실루엣을 보고, 연관 분석은 지지도, 신뢰도, 향상도, Apriori를 다룹니다. 분석가 경험자는 도구 사용 경험 덕분에 통계와 마이닝 개념을 비교적 빨리 연결할 수 있습니다. 다만 Python, SQL, BI 도구 중심으로 일했다면 R 기초와 ADsP식 용어 표현에서 실수가 날 수 있습니다. 기출 흐름 점검은 ADsP 기출문제 앱을 참고해 챕터별 비중을 확인하는 방식이 좋습니다.

직군별 약점 매핑

직군별 약점은 같은 3과목 안에서도 다르게 나타납니다. 개발자는 코드 친화성이 있어 R 기초의 변수, 자료형, 함수 의미를 빠르게 받아들이는 편입니다. 하지만 통계분석에서는 수식, 확률분포, 가설검정 구조가 별도 장벽이 될 수 있습니다. 개발자라면 R 문법을 오래 붙잡기보다 통계학 개론과 회귀, 분산분석의 선택지 표현을 반복해서 보는 편이 안전합니다.

분석가 경험자는 통계분석과 정형 데이터 마이닝에서 강점을 가질 수 있습니다. 이미 분류, 군집, 지표를 실무에서 접했다면 알고리즘 이름과 평가 지표를 연결하기가 수월합니다. 약점은 R 기초입니다. 다른 분석 도구를 주로 썼다면 dplyr, plyr, reshape의 역할이나 R 자료구조 표현을 시험 언어로 다시 맞춰야 합니다. 기획자와 PM은 평가 지표의 의사결정 의미를 이해하는 강점이 있지만, R과 통계 수식이 약점이 되기 쉽습니다. 사무직·운영 직군은 학교 통계를 오래 다루지 않았을 가능성이 있어 3과목 전반을 작은 단위로 나누어야 합니다.

챕터별 학습 순서 추천

비전공자 8주 모델에서는 R 기초와 데이터 마트에 1.5주, 통계분석에 4주, 정형 데이터 마이닝에 1.5주를 배정하는 흐름이 적합합니다. 순서는 R 기초, 통계분석, 정형 데이터 마이닝이 좋습니다. R 기초로 시험의 코드 표현을 먼저 보고, 가장 넓은 통계분석에 충분한 시간을 둔 뒤, 마이닝에서 알고리즘과 지표를 정리하는 방식입니다. 과목 전체 개요가 필요하면 ADsP 시험 요약을 먼저 보는 것도 도움이 됩니다.

경험자 3주 모델에서는 통계분석 1.5주, 정형 데이터 마이닝 0.5주, R 기초 0.5주를 권합니다. 분석 경험자는 R 기초를 처음부터 길게 보기보다 통계와 마이닝의 ADsP식 표현을 먼저 점검하는 편이 효율적입니다. 다만 R을 거의 쓰지 않았다면 마지막 0.5주를 단순 복습으로만 두지 말고, 함수 의미와 옵션 의미를 객관식으로 확인해야 합니다. 전체 학습 루틴은 ADsP 공부법과 함께 조정하면 개인 일정에 맞추기 좋습니다.

과락 회피 (12점/30점 미만 시 과락)

데이터분석 과목은 30문항 중 과목별 40% 기준을 넘겨야 하므로, 12점 미만이면 과락 위험이 생깁니다. 여기서 중요한 점은 12점만 넘기면 된다고 챕터를 버리는 전략이 안정적이지 않다는 것입니다. R 기초, 통계분석, 정형 데이터 마이닝은 서로 독립된 암기 과목이 아니라, 자료구조 이해, 통계 해석, 알고리즘 평가가 연결됩니다. 한 챕터를 비워 두면 선택지에서 복합적으로 흔들릴 수 있습니다.

최소 학습 시간은 비전공자 기준 R 1.5주, 통계 4주, 마이닝 1.5주를 권합니다. 경험자는 R 0.5주, 통계 1.5주, 마이닝 0.5주로 시작하되, 오답이 많은 챕터는 즉시 시간을 재배분해야 합니다. ADsP CBT 학습은 챕터별 오답 위치를 확인하는 데 쓸 수 있고, DAYLAB ADsP 학습 앱은 FSRS 망각 곡선 기반으로 약점 문항의 반복 시점을 잡는 한 가지 경로입니다. 앱이 점수를 대신 만들지는 않지만, 잊는 단위를 놓치지 않도록 돕습니다.

자주 묻는 질문

비전공자인데 R 코드를 한 번도 짜본 적이 없습니다. 챕터 3.1을 어떻게 시작해야 하나요?

챕터 3.1은 프로그래밍 실력을 평가하는 코딩 시험으로 접근하지 않는 편이 안전합니다. 먼저 변수, 자료형, 벡터, 데이터프레임, 패키지, 기본 함수의 의미를 구분합니다. 그다음 dplyr, plyr, reshape가 데이터 마트와 전처리 맥락에서 어떤 역할을 하는지 봅니다. 결측값 처리와 이상값 검색은 함수 이름보다 처리 목적과 결과 해석을 중심으로 정리합니다. 객관식에서는 코드 자체를 길게 작성하라는 요구보다, 함수 의미와 옵션 의미를 묻는 문제가 중요합니다. 따라서 처음부터 긴 예제를 따라 치기보다, 작은 코드 조각을 보고 결과를 말로 설명하는 연습이 더 맞습니다.

통계분석 챕터가 너무 광범위해 보입니다. 30문항 안에서 어디서 누수가 가장 큰가요?

제공된 공식 범위 안에서는 통계분석이 비전공자 약점 1위이며 가장 큰 누수 영역입니다. 특히 통계학 개론에서 확률분포와 중심극한정리를 건너뛰면, 추정과 가설검정의 전제를 이해하기 어렵습니다. 기초 통계분석에서는 t-test, 분산분석, 상관분석, 회귀분석의 사용 상황을 구분해야 합니다. 다변량 분석과 시계열 예측은 이름이 비슷하게 보이는 기법이 많아, 한 줄 정의만 외우면 선택지에서 혼동이 생깁니다. 우선순위는 통계 개념의 뼈대, 가설검정과 회귀, 다변량 분석의 목적, 시계열 용어 순서로 잡는 편이 안정적입니다.

3과목에서 과락이 가장 잘 나는 부분은 어디인가요? 12점만 넘기면 되는데 어느 챕터를 버려도 괜찮을까요?

공식적으로 챕터별 과락률은 공개되어 있지 않으므로 특정 챕터가 가장 과락을 많이 만든다고 단정할 수는 없습니다. 다만 제공된 기준에서는 통계 기초가 비전공자 약점 1위이고, 가장 큰 누수 영역으로 제시됩니다. 그렇다고 R 기초나 정형 데이터 마이닝을 버리는 전략은 권하지 않습니다. 데이터분석 과목은 30문항이며 12점 미만이면 과락 위험이 있으므로, 한 챕터를 비우면 남은 챕터에서 실수가 거의 없어야 합니다. R은 기본 점수 방어, 통계는 점수 누수 관리, 마이닝은 지표와 알고리즘 구분 역할을 하므로 세 챕터 모두 최소 학습선을 확보해야 합니다.

챕터별 약점을 반복 관리하려면 앱 홈에서 ADsP 학습 경로를 확인할 수 있습니다.