DSAC (Data Scientist Academy & Certificate) 데이터 사이언티스트 인증교육 참가자 모집안내 |
Ⅰ |
사업 목적 |
▢ 4차산업혁명 시대에 따라, 시대가 요구하는 문제 해결 능력 함양을 위한 교육 진행
▢ 산업체 요구에 대항하는 문제 해결 능력 함양을 통해 DATA산업에 참여하여 활동할 수 있는 초석 마련
▢ 빅데이터 초보자들도 접근 및 활용이 가능한 범용 프로그램을 활용하여 빅데이터 분석 능력 발현할 수 있도록 교육 추진
▢ 데이터 분석 및 활용에 대한 기초, 심화 과정 진행을 통한 데이터 인재 양성 및 후속과정 (BSAC- Bio AI cluster) 교육 연계를 통한 사회 맞춤형 인재 양성 실현
Ⅱ |
사업개요 |
▢ 프로그램명: DSAC (Data Scientist Academy & Certificate) 데이터 사이언티스트 인증교육
▢ 내 용: 빅데이터 관련 M1, M2, M3, M4 교육 및 인증 진행
▢ 참가대상: 빅데이터에 관심 있는 충남대학교 학생
▢ 모집인원: 45명 내외 ※ 선착순을 우선으로 하되, 신청자가 많을 경우 자체기준에 따라 심사 후, 선발 예정
▢ 모집기간: 공고일 ~ 9. 10.(수) 13:00까지 (※ 선발발표: 9월 10일 오후 개별 문자 발표)
▢ 교육과정: DSAC과정 (M1, M2, M3, M4) 운영
▢ 주요특전
- DSAC 교육 수료증 및 인증서 수여
- 교육비 전액 100% 지원
- 연계 심화 교육과정 참여 기회 부여 (BSAC- Bio AI cluster)
- 참여수기 경진대회 진행을 통한 총장상 및 상품 부여
- 인재개발원 마일리지 적립 진행
▢ 진행방식: Zoom 활용 비대면 교육 진행
▢ 교육일정: 2021년 9월 11일, 12일 25일, 26일, 10월 2일, 3일, 23일, 24일 토,일 (09:30 ~ 16:40) 총 8회 4개과정 진행
- 접수 기한내 구글Form 작성 후 제출 |
Ⅲ |
세부 진행 일정 및 커리큘럼 |
▢ 진행일정
일 |
월 |
화 |
수 |
목 |
금 |
토 |
9월 5일 |
9월 6일 |
9월 7일 |
9월 8일 |
9월 9일 |
9월 10일 |
9월 11일 |
선발발표 및 안내 |
DSAC M1 09:30 ~ 16:40 |
|||||
9월 12일 |
9월 13일 |
9월 14일 |
9월 15일 |
9월 16일 |
9월 17일 |
9월 18일 |
DSAC M1 09:30 ~ 16:40 |
||||||
9월 19일 |
9월 20일 |
9월 21일 |
9월 22일 |
9월 23일 |
9월 24일 |
9월 25일 |
DSAC M2 09:30 ~ 16:40 |
||||||
9월 26일 |
9월 27일 |
9월 28일 |
9월 29일 |
9월 30일 |
10월 1일 |
10월 2일 |
DSAC M2 09:30 ~ 16:40 |
DSAC M3 09:30 ~ 16:40 |
|||||
10월 3일 |
- |
- |
- |
- |
- |
10월 23일 |
DSAC M3 09:30 ~ 16:40 |
- |
- |
- |
- |
- |
DSAC M4 09:30 ~ 16:40 |
10월 24일 |
- |
- |
- |
- |
- |
- |
DSAC M4 09:30 ~ 16:40 |
- |
- |
- |
- |
- |
- |
▢ DSAC M1 Data Programing 교육 인증 과정
연번 |
주제 |
내용 (DSAC M1 DATA Programing) |
실 습 |
1 |
데이터 사이언스 범위 |
통계학, 컴퓨터 사이언스, 비즈니스의 관계 |
아나콘다 설치 |
2 |
빅데이터와 AI |
빅데이터 분석과 AI 성공 사례 |
쥬피터 노트북 구동 |
3 |
데이터 사이언스 도구 |
분석 도구, 파이선, R, 프로그래밍 언어 |
github사용법 |
4 |
파이선 기초 |
파이선 시작, 변수, 함수, 파일 다루기 |
변수, if, for |
5 |
파이선 문법 |
파이선 기초 문법 |
pandas, numpy |
6 |
데이터 수집 |
파일 다운로드, 데이터 제공 사이트 |
액셀, csv 파일 다루기 |
7 |
데이터 처리 |
데이터 읽기, 저장하기 |
컬럼 처리, 인덱싱 |
8 |
데이터 탐색 |
데이터 특성 파악 |
테이블 데이터 속성 |
9 |
통계 분석 |
확률 분포, 정규분포, 로그분포 |
상관관계, 유의성 |
10 |
탐색적 분석 |
스캐터플롯, 히스토그램 |
matplotlib |
11 |
데이터 시각화 |
다양한 시각화 도구 학습 |
seaborn |
12 |
결측치 처리 |
없는 값, 틀린 값 처리 방법 |
결측치 처리 실습 |
13 |
이상치 처리 |
Outlier 검출 및 처리 방법 |
이상치 검출 실습 |
14 |
문제 해결 프로세스 |
문제정의, 데이터 분석, 머신러닝 |
프로젝트 프로세스 실습 |
15 |
결과 시각화 |
리포팅 기술 |
결과 리포팅 실습 |
▢ DSAC M2 Data Process & Anaysis 교육 인증 과정
모듈 |
주제 |
내 용 (DSAC 2 DATA Process & Analysis) |
실 습 |
1 |
데이터 분석 범위 |
데이터 분석 프로세스 |
아나콘다 설치 |
2 |
데이터 분석 기술 |
분류, 회귀, 추천, 머신러닝, 신경망 |
쥬피터 노트북 구동 |
3 |
수치 데이터 |
테이블 데이터 다루기 |
pandas, matplolib |
4 |
선형 모델 |
데이터 분석 기초, 다차원 선형회귀 |
선형회귀 실습 |
5 |
특성 공학 |
피처(feature) 선택 기술, 원핫인코딩 |
Percentile |
6 |
결정 트리 기초 |
엔트로피, gini |
결정 트리 실습 |
7 |
클러스터링 기초 |
거리기반 클러스터링 |
KMeans실습 |
8 |
고객 세분화 |
대표적인 클러스터링 기법 소개 |
고객 세분화 실습 |
9 |
모델 성능 |
성능 측정 방법 소개, 정확도 |
모델 성능 측정 실습 |
10 |
데이터 크롤링 |
HTML의 이해, bs4 |
웹 크롤링 실습 |
11 |
웹 API |
웹 API 프로그램 |
데이터 다운로드 |
12 |
텍스트 데이터 |
코퍼스, 도큐먼트 개념 이해 |
텍스트 다운로드 |
13 |
텍스트 처리 |
BoW, 기초 어근 처리 |
텍스트 변환 실습 |
14 |
데이터 분석 프로젝트 |
데이터 분석을 실제 문제에 적용하는 방법 |
프로젝트 수행 실습 |
15 |
분석 결과 적용 |
현장에 적용하는 기술 소개 |
적용후의 개선 측정 |
▢ DSAC M3 머신러닝 교육 인증 과정
모듈 |
주제 |
내 용 ( DSAC 3 머신 러닝) |
실 습 |
1 |
머신러닝 범위 |
지도학습, 비지도학습, 강화학습 |
아나콘다 설치 |
2 |
머신러닝 동작 |
학습과정, 최적화, 손실함수, 성능평가 |
쥬피터 노트북 구동 |
3 |
최적화 알고리즘 |
모델 튜닝, 과적합, 과소적합 |
최적화기 비교 |
4 |
분류 예측 |
협업필터링(kNN) |
kNN실습 |
5 |
로지스틱 회귀 |
로짓, 이진 분류 |
이진 분류 성능 |
6 |
앙상블 알고리즘 |
렌덤포레스트, 그라디언트부스팅 |
결정 트리 성능 비교 |
7 |
서포트 벡터 머신 |
서포트 벡터 이해, 분류 분석 |
SVM 실습 |
8 |
분류 성능 |
컨퓨전 매트릭스, ROC, AUC |
ROC, AUC 실습 |
9 |
회귀 예측 |
손실함수, 성능평가 지표, 시계열 |
회귀 모델 실습 |
10 |
모델 최적화 |
최적화, 랜덤 탐색, 일반화, 교차검증 |
하이퍼파라미터 튜닝 |
11 |
비지도 학습 |
비지도 학습의 종류, 스케일링, 변환 |
스케일링 실습 |
12 |
클러스터링 고급 |
클러스터링의 적용 범위 |
KMeans, DBSCAN |
13 |
데이터 변환 |
로그변환, 역수변환 |
붓꽃 데이터 분류 |
14 |
데이터 특성 추출 |
차원 축소, 주성분 분석(PCA), 시각화고급 |
t- SNE, PCA 실습 |
15 |
클러스터링 평가 |
KMeans, DBSCAN 성능 비교평가 |
- ARI, 실루엣 |
16* |
베이즈 알고리즘 |
나이브 베이즈 알고리즘 |
베이즈 알고리즘 구현 |
17* |
텍스트 분석 |
형태소 분석, 어근 분석, TF- IDF |
네이버 영화 평점 분석 |
18* |
스팸 메일 분석 |
스팸 필터링 |
스팸 분류 실습 |
19* |
SNS 분석 |
SNS 데이터 속성 파악 |
데이터 수집 및 분석 |
20* |
감성 분석 |
긍정 부정 감성 분석 |
SNS 감성 분석 |
▢ DSAC M4 딥러닝 교육 인증 과정
모듈 |
주제 |
내 용 (DSAC 4 딥러닝) |
실 습 |
1 |
딥러닝과 AI |
딥러닝과AI 특징과 성공 요인 |
아나콘다, 쥬피터 설치 |
2 |
딥러닝 도구 |
텐서플로우, 케라스, 카페, 파이토치 |
텐서플로우, 케라스 설치 |
3 |
다층퍼셉트론 |
다층퍼셉트론(MLP) 원리 이해 |
다층퍼셉트론(MLP) 구축 |
4 |
CNN 원리 |
딥러닝 구조, 계층, 유닛, 활성화 함수 |
CNN 기본 모델 구축 |
5 |
CNN 구현 |
CNN 기본 모델 |
필기체 숫자 인식 |
6 |
이미지 인식 |
이미지 인식 원리 소개 |
강아지와 고양이 분류 |
7 |
CNN 성능 향상 |
드롭아웃, 배치 정규화 |
드롭아웃 실습 |
8 |
전이 학습 |
이미지넷 학습 모델 전이학습 |
VGG- 16 모델 전이학습 |
9 |
데이터 확장 |
데이터 Augmentation |
이미지 인식 성능 향상 |
10 |
객체 인식 |
다수의 이미지 객체 인식 |
YOLO3 |
11 |
자연어 처리 |
NLP 프로세스 소개 |
자연어 처리 실습 |
12 |
RNN 원리 |
RNN 동작원리 |
단층 RNN 구축 |
13 |
LSTM |
LSTM 원리 소개 |
LSTM, GRU 구축 |
14 |
시계열 분석 |
RNN을 이용한 시계열 예측 |
에너지 사용량 예측 |
15 |
단어 임베딩 |
임베딩 원리 이해 |
단어 임베딩 실습 |
16* |
임베딩 구축 |
임베딩 직접 구축 및 활용 |
임베딩 생성 실습 |
17* |
언어 모델링 |
언어 모델링 개념 설명 |
어린왕자 소설 학습 |
18* |
챗봇 |
챗봇 구현 기술 |
챗봇 구현 실습 |
19* |
딥러닝 응용 |
GAN, 자동 번역 원리 |
사례 소개 |
20* |
강화학습 |
강화학습 원리 |
게임 프로그램 동작 |
붙임: 신청서 양식 및 결과보고서 양식 각 1부
붙임2 |
결과보고서 양식(교육생) |
DSAC (Data Scientist Academy & Certificate) 데이터 사이언티스트 인증교육 결과보고 |
성명 |
연락처 |
- - |
|
E- mail |
생년월일 |
. . . |
|
학과 |
학번 |
||
교육 수료 소감 및 향후 활용 계획 |
* 교육 수료 소감 및 향후 활용 계획에 대하여 자유롭게 기술 |
위와 같이 결과보고서를 제출합니다.
2021. . .
성명 |
서명 |
||||
충남대학교 사회맞춤형 산학협력선도대학(LINC+) 육성사업단장 귀하 |