반응형

자격증/빅데이터분석기사 27

[빅데이터분석기사 필기] 주성분분석(PCA) 개념 및 기출문제

주성분 분석(PCA) 상관관계가 있는 고차원 자료를 자료의 변동을 최대한 보존하는 저차원 자료로 변환하는 차원축소 방법이다. 주성분 분석은 서로 상관성이 높은 변수들의 선형 결합으로 만들어 기존의 상관성이 높은 변수들을 요약 축소하는 기법이다. 분석을 통해 나타나는 주성분으로 변수들 사이의 구조를 쉽게 이해하기는 어렵다. 차원축소는 고윳값이 높은 순으로 정렬해서 높은 고윳값을 가진 고유벡터만으로 데이터를 복원한다. 차원축소 : 많은 변수로 구성된 고차원 자료를 축소하여 새로운 차원의 자료를 생성하는 기법이다. 고윳값 : 고유벡터의 변환되는 스케일 정도를 나타내는 상숫값이다. 고유벡터 : 행렬 변환 결과가 자기 자신의 상수 배가 되는 0이 아닌 벡터이다. 주성분 분석의 특징 누적 기여율이 85% 이상이면 ..

[빅데이터 분석기사 필기] 3과목 빅데이터모델링 요점정리 ②

이전글 보러가기 [빅데이터 분석기사 필기] 3과목 빅데이터모델링 요점정리 ① [빅데이터 분석기사 필기] 3과목 빅데이터모델링 요점정리 ① 이전글 보러가기 [빅데이터분석기사 필기] 2과목 빅데이터탐색 요약정리 이전글 보러가기 [빅데이터분석기사 필기] 1과목 빅데이터분석기획 요약정리 ⭐: 키워드 ⭐⭐:기출문제 유형 ⭐⭐⭐:출 ohaengsa.tistory.com ② 분석 기법 적용 ⭐⭐ 회귀분석 독립변수와 종속변수 간에 선형적인 관계를 도출해서 하나 이상의 독립변수들이 종속변수에 미치는 영향을 분석하고 독립변수를 통해 종속변수를 예측하는 분석 기법이다. 변수들 사이의 인과관계를 밝히고 모형을 적합하여 관심 있는 변수를 예측하거나 추론하기 위한 분석 방법이다. 유형 : 단순선형 회귀, 다중선형회귀, 다항 회귀..

[빅데이터 분석기사 필기] 3과목 빅데이터모델링 요점정리 ①

이전글 보러가기 [빅데이터분석기사 필기] 2과목 빅데이터탐색 요약정리 이전글 보러가기 [빅데이터분석기사 필기] 1과목 빅데이터분석기획 요약정리 ⭐: 키워드 ⭐⭐:기출문제 유형 ⭐⭐⭐:출제 多 ① 빅데이터의 이해 ⭐ DIKW피라미드 Data ➡️ Information ➡️ Knowledge ohaengsa.tistory.com ① 분석모형설계 ⭐ 분석모형선정 분석목적에 부합하고 수집된 데이터의 변수들을 고려하여 적합한 빅데이터 분석 모형을 선정한다. 현상에서 패턴을 발견하는 것은 탐색적 데이터 분석이며 현상에서 인과적인 결론을 도출하는 것은 통계적 추천, 현상을 예측하는 것은 기계학습(머신러닝)이다. 통계, 데이터 마이닝, 머신러닝 기반 분석 모델 기법을 고려하여 적합한 빅데이터 분석 모델을 선정한다. ⭐..

[빅데이터분석기사 필기] 한번에 합격하는 공부법

접수 데이터자격시험 카드결제/계좌이체 환불 환불 요청시 즉시환불 www.dataq.or.kr 이 글을 쓴 시점에서 시험까지 2주라는 시간이 있다. 책을 구매하지 않고 유튜브와 구글로 공부하려 했으나 시간이 없는지라 책을 샀다. 그리고 오래된 시험이 아니기에 자료가 많이 부족하다. 책 교보문고에서 수제비 빅데이터 분석기사 필기 책을 구매했다. 중고라서 12000원에 구매했다. 책 후기는 나중에 할꺼지만 빅데이터분석기사 책은 아직 좋은게 없다고 생각한다. 공부법 현재 1과목과 2과목을 공부하였고 오늘부터 진득하게 3,4과목을 공부하려한다. 1과목은 구글에 돌아다니는 기출문제로 공부하였고 2과목은 유튜브로 공부하였다. https://www.youtube.com/c/EduAtoZPython EduAtoZ - P..

[빅데이터분석기사 필기] 2과목 빅데이터탐색 요약정리

이전 글 보러가기 [빅데이터분석기사 필기] 1과목 빅데이터분석기획 요약정리 ⭐: 키워드 ⭐⭐:기출문제 유형 ⭐⭐⭐:출제 多 ① 빅데이터의 이해 ⭐ DIKW피라미드 Data ➡️ Information ➡️ Knowledge ➡️ Wisdom ⭐⭐ 데이터 바이트크기 [기출] KB(10³Bytes)➡️MB(10⁶) ➡️ GB(1.. ohaengsa.tistory.com ⭐: 키워드 ⭐⭐:기출문제 유형 ⭐⭐⭐:출제 多 ① 데이터전처리 ⭐ 데이터 전처리 데이터 분석을 위한 필수 과정, 분석 결과의 오류를 방지하고 신뢰도를 높일 수 있음 실제 분석 과정의 70~80%를 수집 및 데이터 전처리 과정에 사용 데이터 정제 ➡️ 결측값 처리 ➡️ 이상값 처리 ➡️ 분석변수처리 ⭐⭐ 데이터 정제 결측값을 채우거나 이상값을 ..

[빅데이터분석기사 필기] 1과목 빅데이터분석기획 요약정리

⭐: 키워드 ⭐⭐:기출문제 유형 ⭐⭐⭐:출제 多 ① 빅데이터의 이해 ⭐ DIKW피라미드 Data ➡️ Information ➡️ Knowledge ➡️ Wisdom ⭐⭐ 데이터 바이트크기 [기출] KB(10³Bytes)➡️MB(10⁶) ➡️ GB(10⁹) ➡️ TB(10¹²)➡️ PB(10¹⁵) ➡️ EB(10¹⁸) ➡️ ZB(10²¹) ➡️YB(10²⁴) 2¹⁰ ➡️ 2²⁰ ➡️ 2³⁰ ➡️ 2⁴⁰➡️ 2⁵⁰ ➡️ 2⁶⁰ ➡️ 2⁷⁰ ➡️ 2⁸⁰ (1byte의 아스키 코드를 넣을 수 있는 양) ⭐⭐⭐ 빅데이터특징 [기출] 가트너 3V(Volume, Variety, Velocity) 5V(Value, Veracity) 7V(Validity, Volatility) ⭐⭐ 분석 가치 에스컬레이터 [기출] 가트..

[빅데이터분석기사 필기] 2022년 제4회 기출문제

2022년 제4회 기출문제 2022년 4월 9일에 시행된 빅데이터 분석기사 필기 4회 기출문제입니다. 총 80문항이며 100점을 만점으로 하여 과목당 40점 이상, 전 과목 평균 60점 이상이면 합격입니다. 실제 시험과 100%일치하지는 않습니다. 정답 버튼을 클릭하시면 정답을 보실 수 있고 에러사항이 있으면 댓글을 달아 주시면 바로 수정하겠습니다. [1과목 빅데이터의 이해] 1. HDFS에 대한 설명으로 옳은 것은? ① 복제의 횟수는 내부에서 결정된다. ② ETL, NTFA가 상위 프로그램이다. ③ GFS와 동일한 소스코드를 사용한다. ④ 네임노드는 저장공간에 네임노드 데이터를 같이 저장한다. 더보기 ③ GFS와 동일한 소스코드를 사용한다. 2. 인공지능학습에 대한 설명으로 옳지 않은 것은? ① 훌륭한..

반응형