수리통계 분석 코딩 실습

[ADP] 제 35회 필기 문제 복기 및 공부 방법 본문

기타

[ADP] 제 35회 필기 문제 복기 및 공부 방법

얼려먹는 요구르트 2025. 2. 25. 01:07
✔️ 35회 필기 문제 복기 및 공부 방법

 

[process]

[문제 복기] - [후기 및 피드백]

 

1. 문제 복기

문제 복기 및 피드백에 앞서, ADP 시험은 총 5개의 챕터로 구성되며 각각 문항수 대비 최소 40%는 맞추고 총 70점 이상이어야 합격할 수 있습니다.

예를 들어, 데이터 이해의 경우 4문제 이상을 맞춰야 과락을 면할 수 있다는 것을 반드시 인지하고 있어야 합니다. 

 

따라서, 이 챕터에 따라 공부 방법이랑 문제 복기를 나누어 작성하고자 합니다. 

ADP 시험 챕터별 문항수와 배점

 

 

※ 문제의 답은 제가 생각한 답으로 틀릴 수 있습니다. 알려주시면 수정하도록 하겠습니다!

시험을 본 기억에 의존해 복기한 내용으로 보기 내용이나 문제가 100% 일치하지 않을 수 있습니다. 이런식으로 나오는 구나 감 잡는 데 사용하면 좋을 것 같습니다

 

1) 데이터 이해

2) 데이터 처리 기술 이해 

문제: 분석 거버넌스 체계로 맞지 않는 것을 고르시오

1. 분석 인력 2. 프로세스 3. 분석 조직 4. 분석 기법

답: 1

 

문제: EAI vs ESB를 비교하여 다음 중 설명으로 가장 옳지 않은 것은?
- EAI는 서비스를 중심으로 연계하는 ~~ ( ESB 설명이라고 생각해 고름)

* EAI 와 ESB 비교는 자주 출제되는 문제 유형인 듯 

 

 

3) 데이터 분석 기획 

4) 데이터 분석

 

문제: Carseats 데이터의 피어슨 상관 행렬 해석
- p.210-37 문제 세팅과 동일 ( 보기만 약간 수정됨)

1. Sales는 Price와 가장 높은 상관관계를 지닌다.
2. Sales와 Comprice는 유의수준 5%에서 유의하지 않다.
3. Price가 올라갈수록 Sales는 낮아지는 경향이 있다.
4. Sales와 Price는 양의 선형관계를 가진다.

답: 4
문제: 이산형 확률 분포로 0과 1의 2개의 결과값을 갖는 확률 분포 모형을 고르시오

1. 베르누이 분포 2. 다항 분포 3. 카이제곱 분포 4. 포아송 분포

답: 1

 

문제: X = 0,1,2와 각 확률값 (P(X=x))값이 주어져 기대값 E[X] 구하기
- p.200 - 15 유사 문제

 

문제: Wage 데이터에 대한 t-test 문제, 다음 설명 중 부적절한 것은?
- p.203 - 23 동일 문제 ( 문제, 보기 모두 동일)

1. 한 집단의 평균에 대한 t-test(one sample t-test) 결과이다.
2. 유의수준 5%에서 p-value가 유의하다고 할 수 있다.
3. t의 자유도는 2999이다.
4. 평균에 대한 95% 신뢰구간은 귀무가설에서 설ㄹ정한 평균의 참값을 포함한다.

답: 4
문제: IQR + min, max 값이 각 수면제1,2에 대해 주어지고 수면제 1,2에 대한 값 해석 및 비교

1. 수면제 2가 평균적으로 1보다 수면 시간이 증가했다.
2. 수면제 1은 적어도 하위 25%는 수면 시간이 감소했다.
3. 수면제 1,2 모두 수면 시간이 감소하는 경우가 있다.
4. 수면제 2가 1보다 수면 시간 증가에 통계적으로 유의하다고 할 수 있다.

답: 4

 

문제: 다음 변수 선택법에 대한 설명으로 옳은 것은?

[보기]
모든 변수를 갖고 성능이 안좋은 변수를 제거하는 방법은?

1. 전진선택법
2. 후진제거법
3. 단계적 선택법
4. 

답: 2
문제: 지지도, 신뢰도, 향상도 정의 문제

1. 신뢰도는 A제품을 구매했을 때 B제품도 구매할 확률이다.
2. A->B의 신뢰도와 B제품을 구매했을 때 A가 포함될 확률은 다르다.
3. 향상도는 A가 구매되지 않았을 때 품목 B의 구매 확률에 비해 A가 구매됐을 때 품목 B의 구매확률의 증가 비이다.
4. A->B의 향상도와 B가 구매되지 않았을 때 B의 향상도는 다르다.

답: 4
문제: 다음 중 데이터를 무작위로 학습 데이터와 검증용으로 나누어 훈련 데이터로 사용하는 방법을 고르시오.

1.
2. 회귀분석
3. 교차검증
4.

답: 3
문제: 텍스트 분석에서 말 뭉치를 의미하는 것은? (코퍼스 외엔 보기 기억이..)

1. Corpus

답: 1

 

5) 데이터 시각화

문제: 히트맵이 어떤 시각화 방법인지 고르시오

1. 시간
2. 분포
3. 관계
4. 비교

답: 4

 

서술형 - 1D 합성곱 연산

 

시간대별 관측 온도 8개값이 주어지고 해당 input을 기준으로 합성곱 연산을 계산하는 문제였습니다. 특히 label의 경우 비가옴(1), 비가 오지 않음(0)이었고 비가 온 날의 경우 16일 비가 오지 않은 날의 경우 165일로 총 181일의 관측 데이터가 주어진 클래스 불균형 문제였습니다.

 

[1] 문제 세팅

input: 8x1 [15,18,19,21,23,20,18,15]

Kernel 4x1
Pool=Padding =0
Stride =2


-1D 합성곱 레이어 : w1=[-1,0,-1,0] b1=-1
- 1D 합성곱 레이어: w2=[-2,1,0,1] b2= 1
Relu ftn
flatten

Fully connected layer w2 = (-1,0,1,0,-1,1) b2= 1
Sigmoid ftn

 

[2] 문제 

 

(1) w1,w2를 이용해서 1D 합성곱 연산의 결과를 서술하시오. (7점)
(2) 이진 엔트로피의 손실 결과를 계산하시오.(3점)
(3) 문제에서 주어진 임계정 조정 말고 추가적으로 클래스 불균형 문제를 해결할 수 있는 방법 한가지를 쓰고 그 장점을 서술하시오 (4점)
(4) 임계점이 0.3에서 0.9999로 증가했을 때, 재현율(Recall), 정확도(Accuaracy), 파라미터 학습 결과가 기존의 결과와 비교하여 어떻게 바뀌는 지 각각 서술하시오. (6점) (단 비가 옴이 양성이고 비가 오지 않음이 음성임)

 

 

2. 후기 및 피드백

 

이번에 한달을 남겨두고 공부를 시작했는데, 실기도 한번에 준비하고 싶어 처음에 열심히 하다,

인턴 서류를 내면서 서류, 과제, 코테를 준비하며 3주정도 공부를 했고 솔직히 집중 기간은 10일정도로 짧은 시간밖에 공부기간이 없었습니다.

 

그러니까 헷갈린 문제가 많았던 것 같은데 문제를 복기하며 틀린 문제들을 알게 되어 아쉬움이 큰 것 같습니다.  그래도 부족한 점을 알게되었으니 다음에 더 생각해서 공부해 반드시 합격하려고 합니다.

 

이번에 각 문항 별로 시간 투자를 잘못한 것 같아, 세분화해 문제 공부 방식과 공부 순서를 정해 공부하려고 합니다. 

 

사용 교재: ADP 필기 데이터 분석 전문가 : 올패키지 (링크)

 

※ 25년 2월 이후 개정판이 새롭게 출시 된다고 하여 아래 목차가 개정본과 완전히 일치하지 않을 수 있습니다.

 

문제 풀이 위주 - 파랑
개념 > 문제 풀이 - 노랑

 

1권

 

02. 데이터 처리 기술 이해 ►  01. 데이터의 이해 + 03. 데이터 분석( ADsP, 빅분기 기출까지 풀고 오답)

 

01. 데이터의 이해 

- 문제 풀이만 진행할 것 (단, 데이터, 정보, 지식, 지혜는 암기 -> 시각화에 또 나오니까 연결 암기)

02. 데이터 처리 기술 이해 (ETL, CDC, 하둡(개괄), 클라우드 시스템)

- 하둡의 경우 각 프로그램 - 설명 문제가 많이 나오므로 연결 암기**

03. 데이터 분석 기획 

- 데이터 사이언티스트이 역량, 분석 고려서항은 ADsP 기출과 빅분기 기출에서 많이 겹치는 듯함.  

 

 

2권 

 

머신러닝 방법론 정리 + 실기 코드 정리 ►  통계분석 방법론 정리 + 실기 코드 정리 ► 비정형 데이터 마이닝(간단히 개념 정리 + 문풀 오답) 

 

통계분석 + 데이터 분석 

실기와 함께 병행 

실기 참고 교재와 참고 내용은 (링크) 참조 

* 시계열 방법론 정리 

* 머신러닝의 경우 각 개념 + 계산 과정을 명확히 인지 (저번 기출 DBSCAN, 이번 1D 합성곱연산인 것으로 보아 인공지능 계산 문제가 출제될 것으로 생각됨.)

 

 

3권 

 

시각화 디자인(정의,프로세스,방법) ►  시각화 인사이트 프로세스

 

05. 데이터 시각화 

시각화 방법과 종류가 일치되는 문제가 자주 출제됨 (반드시 표 암기)

ex 히트맵은 비교 시각화 종류 

> 데이터 전처리 과정 코드화 하기 

 

 

 

+ 네이버 카페에서 모집하는 ADP 스터디가 나름 도움이 많이 되었던 것 같습니다. 

데이터 전문가 포럼 (빅데이터분석기사, ADP, SQLP, DAP 등)에서 주관하는 스터디에 참여하는 것도 좋을 것 같습니다

 

'기타' 카테고리의 다른 글

[크롤링] statiz 선수별 일자별 데이터 크롤링  (0) 2024.03.30
코드 블럭 디자인 변경  (2) 2023.10.18