SQL / DataBase |
DBMS 이해 |
- DDBMS 구조 이해
- Database 유형과 구성요소
- DBMS Transaction 관리
|
SQL 을 이용한 Data 처리 |
- SELECT절 활용
- 조건(WHERE)처리와 정렬(ORDER BY)
- 그룹 데이터 처리(GROUP BY)와 그룹조건 처리(HAVING)
- 테이블간 JOIN 처리
- SUBQUERY 활용
|
Transaction 처리 |
- 데이터 입력, 수정, 삭제
- Transaction 처리
|
Object 생성 관리 |
|
SQL 기본 및 활용 |
- 정보 요구 사항
- DDL , DML , DCL, TCL
- WHERE 절 , GROUP BY, HAVING 절 , ORDER BY 절
- 표준조인
- 집합연산자
- 계층형 질의
- 서브쿼리
- 그룹 함수, 윈도우 함수
|
RDBMS (MySQL) |
- MySQL설치, 접속, 계정 만들기와 권한 부여하기
- 테이블 작성과 수정, 삭제
- SELECT 쿼리 (조건, 정렬, 조인, 서브쿼리, 함수)
- DML (데이터 조작 쿼리)
|
R 기본 & R을 활용한 데이터 분석 |
R 개요 및 설치 패키지 이해 |
|
데이터 구조 이해 및 실습 |
- 주요 데이터구조 이해
-백터, 데이터프레임, 리스트데이터 처리,병합, 가공, 데이터마트 생성
|
데이터 구조의 처리 |
- 다양한 패키지를 활용한 데이터 전처리
- 변수 생성 및 계산
|
파일 및 DB 입출력 |
|
데이터 병합 및 문자열 처리 |
- 행/ 열단위 병합
- Merge 기능
- 문자열 처리를 통한 데이터 가공
|
분석 도구를 활용한 수리적 배경 |
- 통계 주요개념의 이해
- 확률 주요개념의 이해
- 선형대수 주요개념의 이해
- 개념 리뷰 / 실데이터 대상 확률, 통계 적용
|
데이터 분석 개요 |
- 데이터 분석의 목적
- 추론과 예측 관점의 기법 정리
|
R_선형회귀 분석의 이해 및 활용 |
- 선형회귀분석 개요 및 주요 개념
- 계수의 해석 및 잔차의 이해
- 결과의 해석
- 단순회귀분석의 이해 및 적용
- 다중회귀분석의 이해 및 적용
|
R_선형모형의 활용 (포아송, 로지스틱) |
- 포아송회귀분석의 개요 및 적용 방안
- 로지스틱회귀분석의 개요 및 적용 방안
|
주요 개념 정리 및 실제 데이터 적용 실습 |
|
Python & Python을 활용한 데이터 분석 |
Python |
|
데이터 구조 이해 및 실습 |
- 주요 데이터구조 이해
-리스트/세트/테이터프레임 데이터처리/병합/가공/데이터 마트 생성
|
데이터 구조의 처리 |
- 다양한 패키지를 활용한 데이터 전처리
- 변수 생성 및 계산
|
파일 및 DB 입출력 |
|
데이터 병합 및 문자열 처리 |
- 행/열단위 병합
- Merge 기능
- 문자열 처리를 통한 데이터 가공
|
파이썬을 활용한 데이터 분석_ SW/패키지 |
- Python, Pandas, Numpy, Scipy 등
|
응용 데이터 및 웹 데이터 활용 및 분석 |
선형회귀 분석의 이해 및 활용 1 |
- 선형회귀분석 개요 및 주요 개념
- 계수의 해석 및 잔차의 이해 , 결과의 해석
|
선형회귀 분석의 이해 및 활용 2 |
- 단순회귀분석의 이해 및 적용
- 다중회귀분석의 이해 및 적용
|
선형모형의 활용: 포아송/로지스틱 |
- 포아송회귀분석의 개요 및 적용 방안
- 로지스틱회귀분석의 개요 및 적용 방안
|
주요 개념 정리 및 실제 데이터 적용 실습 |
|
웹 크롤링 이해 및 관련 함수/패키지 |
- 웹크롤링 방식 이해
- 관련 패키지, 함수 확인 및 실습
|
예제 사이트 웹크롤링 실습 |
- 예제 사이트 웹크롤링 적용
- 수집된 데이터 표현 및 정리
|
병렬처리를 활용한 웹크롤링 |
|
웹 수집 데이터 전처리 |
- JSON 형식 전처리
- XML 형식 데이터 전처리
|
데이터 시각화 기법 |
데이터 시각화의 이해 |
|
시각화 관련 함수 및 패키지의 이해 |
- 시각화 관련 주요 패키지 및 함수 이해
- 패키지, 함수 사용법 실습
|
시각화 차트 별 특징 이해 및 활용 |
- 다양한 차트의 이해 및 활용
- 단변수 차트/ 이변수 차트 등
|
Python 주요 모듈 기반 웹 시각화 |
|
시각화 사례 및 실습 |
- 우수 시각화 사례 실습
- 실제 데이터의 웹 시각화 연습
|
텍스트마이닝과 토픽모델링 |
텍스트 데이터의 이해 |
|
관련 함수 및 패키지 이해 |
- Konlpy 기반 형태소 분석 기법
- 품사 태깅 및 nltk 적용
- Gensim 모듈 활용 및 이해
|
코퍼스 생성 및 전처리 이해 및 실습 |
- 파일 및 디렉토리 내 텍스트 기반 코퍼스 생성
- 텍스트 전처리 과정(Stemming,Stopwords제거)
- DTM 생성, TF-IDF 적용
|
텍스트마이닝 및 시각화 |
- DTM 기반 머신러닝(지도/비지도학습)의 적용
- 워드클라우드
|
토픽모델링의 이해 및 적용 |
- LDA 활용 코퍼스 내 토픽 발견
- 토픽의 활용 및 머신러닝 적용
|
오픈소스기반 머신러닝 학습 및 적용 |
지도학습의 이해 |
- 분류모형, Tree 기반 분류 이해
- Decision Tree, Random Forest 기법의 이해 및 적용
- 분류 모형 성능평가
|
최신 분류모형의 이해 |
- SVM의 이해 및 파라미터 튜닝 , KNN 이해 및 적용/ NB 이해 및 적용
- 분류기법 비교 평가
|
인공신경망 기반 분류모형의 이해 및 활용 |
- 인공신경망의 구성요소 이해
- 활성화함수의 이해 및 가중치 최적화 기법 이해
- 인공신경망을 통한 분류 기법
- 텍스트 데이터 적용을 위한 인공신경망 분류
|
비지도학습의 이해 : 군집,패턴 |
- Kmeans클러스터링과 계층적 클러스터링의 이해
- 패턴 발견을 위한 Association Rule 이해
- Sequential AR의 이해
|
비지도학습의 이해 : 그래프 |
- 그래프마이닝을 통한 연결 분석 , 소셜네트워크 분석의 이해 및 적용
- 링크 예측을 위한 그래프 분석
|
분류기법을 활용한 주가예측 |
- 주가예측과 관련한 머신러닝 적용 사례
- 정형 및 비정형 데이터 큐레이션
- 데이터 전처리 및 탐색적 데이터 분석
|
분류기법 기반 스팸 필터링 |
- 스팸필터링 데이터 큐레이션 및 전처리
- 스팸필터링 분류 적용을 위한 기법 비교평가
- 성능개선을 위한 분류기법 선택
|
군집분석을 통한 고객군 발견 및 활용 |
- 고객 데이터에 대한 탐색적 데이터 분석
- 클러스터링 기법을 적용한 고객군 발견
- 최적의 클러스터링 기법 및 파라미터 선택
|
매출데이터 패턴 발견 |
- 패턴 발견을 위한 매출데이터의 전처리
- AR적용 및 파라미터 튜닝 통한 결과 발견 , 패턴 시각화
|
추천 기법의 이해 및 활용 |
- 추천 기법의 이해 : IBCF, UBCF
- 콘텐츠 사용 데이터 기반 IBCF의 적용
- UBCF의 적용 , 추천 결과 검증 및 성능 개선
|
딥러닝 알고리즘 학습 (TensorFlow2, Keras) |
AI 알고리즘의 이해 심층신경망의 이해 |
- AI 알고리즘의 이해
- 인공신경망과 심층신경망
- 심층신경망의 특징
|
딥러닝 개요 및 기본 |
- 심층신경망 학습을 위한 딥러닝
- 활성화 함수 및 최적화 기법의 이해
|
딥러닝을 위한 함수/ 패키지의 이해 |
- 다양한 오픈소스 프레임워크의 이해
- 주요 함수 및 패키지 설치 및 활용
|
DNN, RNN, CNN의 이해 |
- DNN의 이해 및 활용
- RNN의 이해 및 활용
- CNN의 이해 및 활용
|
워드임베딩의 이해 |
- 오토인코딩과 임베딩
- 워드임베딩의 이해
- Word2Vec 이해 및 활용
|
오픈소스를 활용한 딥러닝 응용 |
딥러닝 기반 주가예측 |
- 주가예측과 관련한 딥러닝 적용 사례
- 정형 및 비정형 데이터 큐레이션
- 데이터 전처리 및 탐색적 데이터 분석
- 최적 딥러닝 기법의 발견
|
딥러닝 기반 고객 리뷰 감성 분석 |
- 온라인 리뷰 관련 딥러닝 적용 사례
- 텍스트마이닝
- 탐색적 데이터 분석
- 딥러닝 기반 감성분석
|
CNN 활용 이미지 인식 |
- 이미지 인식과 분류기법
- CNN을 통한 이미지 분류
- 파라미터 튜닝 및 최적화
|
고객 리뷰 대상 word2vec의 활용 |
- 온라인 리뷰 워드임베딩 적용
- Word2vec의 이해 및 활용
|
RNN 리뷰 및 LSTM의 이해 |
- RNN의 특징 이해 및 LSTM소개
- LSTM 파라미터 및 구조 이해
|
오픈소스 기반 LSTM 구현 |
- Tensorflow 기반 LSTM 구현
- LSTM 학습 및 파라미터 최적화
|
LSTM을 위한 텍스트데이터 처리 |
|
비즈니스에 따른 빅데이터 프로젝트 |
과제 정의 및 분석기획 |
- 데이터 분석 과제 수행 방법론
- 데이터 분석 기획 및 과제 구체화
|
데이터 소싱 및 전처리 |
|
데이터 분석 프로토타이핑 |
- 분석 목적에 따른 기법 선택
- 다양한 기법 비교 평가
|
데이터 분석 및 시각화 |
|
프로젝트 |
|