DSAC (Data Scientist Academy & Certificate) 데이터 사이언티스트 인증교육 참가자 모집안내

사업 목적

▢ 4차산업혁명 시대에 따라, 시대가 요구하는 문제 해결 능력 함양을 위한 교육 진행

▢ 산업체 요구에 대항하는 문제 해결 능력 함양을 통해 DATA산업에 참여하여 활동할 수 있는 초석 마련

▢ 빅데이터 초보자들도 접근 및 활용이 가능한 범용 프로그램을 활용하여 빅데이터 분석 능력 발현할 수 있도록 교육 추진

▢ 데이터 분석 및 활용에 대한 기초, 심화 과정 진행을 통한 데이터 인재 양성 및 후속과정 (BSAC- Bio AI cluster) 교육 연계를 통한 사회 맞춤형 인재 양성 실현

사업개요

▢ 프로그램명: DSAC (Data Scientist Academy & Certificate) 데이터 사이언티스트 인증교육

▢ 내    용: 빅데이터 관련 M1, M2, M3, M4 교육 및 인증 진행

▢ 참가대상: 빅데이터에 관심 있는 충남대학교 학생

▢ 모집인원: 45명 내외※ 선착순을 우선으로 하되, 신청자가 많을 경우 자체기준에 따라 심사 후, 선발예정

▢ 모집기간: 공고일 ~ 9. 10.(수) 13:00까지 (※ 선발발표: 9월 10일 오후 개별 문자 발표)

▢ 교육과정: DSAC과정 (M1, M2, M3, M4) 운영 

▢ 주요특전

-  DSAC 교육 수료증 및 인증서 수여

-  교육비 전액 100% 지원

-  연계 심화 교육과정 참여 기회 부여 (BSAC- Bio AI cluster)

-  참여수기 경진대회 진행을 통한 총장상 및 상품 부여

-  인재개발원 마일리지 적립 진행

▢ 진행방식: Zoom 활용 비대면 교육 진행 

 

▢ 교육일정: 2021년 9월 11일, 12일 25일, 26일, 10월 2일, 3일, 23일, 24일 토,일 (09:30 ~ 16:40) 총 8회 4개과정 진행

▢ 접수방법

-  접수 기한내 구글Form 작성 후 제출 

-  신청 URL: https://forms.gle/xF7QHsS1QWbRxi9q6

세부 진행 일정 및 커리큘럼

▢ 진행일정

9월 5일

9월 6일

9월 7일

9월 8일

9월 9일

9월 10일

9월 11일

선발발표 및 안내

DSAC M1

09:30 ~ 16:40

9월 12일

9월 13일

9월 14일

9월 15일

9월 16일

9월 17일

9월 18일

DSAC M1

09:30 ~ 16:40

9월 19일

9월 20일

9월 21일

9월 22일

9월 23일

9월 24일

9월 25일

DSAC M2

09:30 ~ 16:40

9월 26일

9월 27일

9월 28일

9월 29일

9월 30일

10월 1일

10월 2일

DSAC M2

09:30 ~ 16:40

DSAC M3

09:30 ~ 16:40

10월 3일

-

-

-

-

-

10월 23일

DSAC M3

09:30 ~ 16:40

-

-

-

-

-

DSAC M4

09:30 ~ 16:40

10월 24일

-

-

-

-

-

-

DSAC M4

09:30 ~ 16:40

-

-

-

-

-

-

▢ DSAC M1 Data Programing 교육 인증 과정

연번

주제

내용 (DSAC  M1  DATA  Programing)

실 습

1

데이터 사이언스 범위

통계학, 컴퓨터 사이언스, 비즈니스의 관계

아나콘다 설치

2

빅데이터와 AI

빅데이터 분석과 AI 성공 사례

쥬피터 노트북 구동

3

데이터 사이언스 도구

분석 도구, 파이선, R, 프로그래밍 언어

github사용법

4

파이선 기초

파이선 시작, 변수, 함수, 파일 다루기

변수, if, for

5

파이선 문법

파이선 기초 문법

pandas, numpy

6

데이터 수집

파일 다운로드, 데이터 제공 사이트

액셀, csv 파일 다루기

7

데이터 처리

데이터 읽기, 저장하기

컬럼 처리, 인덱싱

8

데이터 탐색

데이터 특성 파악

테이블 데이터 속성

9

통계 분석

확률 분포, 정규분포, 로그분포

상관관계, 유의성

10

탐색적 분석

스캐터플롯, 히스토그램

matplotlib

11

데이터 시각화

다양한 시각화 도구 학습

seaborn

12

결측치 처리

없는 값, 틀린 값 처리 방법

결측치 처리 실습

13

이상치 처리

Outlier 검출 및 처리 방법

이상치 검출 실습

14

문제 해결 프로세스

문제정의, 데이터 분석, 머신러닝

프로젝트 프로세스 실습

15

결과 시각화

리포팅 기술

결과 리포팅 실습

▢ DSAC  M2 Data Process & Anaysis 교육 인증 과정

모듈

주제

내 용 (DSAC 2  DATA  Process & Analysis)

실 습

1

데이터 분석 범위

데이터 분석 프로세스

아나콘다 설치

2

데이터 분석 기술

분류, 회귀, 추천, 머신러닝, 신경망

쥬피터 노트북 구동

3

수치 데이터

테이블 데이터 다루기

pandas, matplolib

4

선형 모델

데이터 분석 기초, 다차원 선형회귀

선형회귀 실습

5

특성 공학

피처(feature) 선택 기술, 원핫인코딩

Percentile

6

결정 트리 기초

엔트로피, gini

결정 트리 실습

7

클러스터링 기초

거리기반 클러스터링

KMeans실습

8

고객 세분화

대표적인 클러스터링 기법 소개

고객 세분화 실습

9

모델 성능

성능 측정 방법 소개, 정확도

모델 성능 측정 실습

10

데이터 크롤링

HTML의 이해, bs4

웹 크롤링 실습

11

웹 API

웹 API 프로그램

데이터 다운로드

12

텍스트 데이터

코퍼스, 도큐먼트 개념 이해

텍스트 다운로드

13

텍스트 처리

BoW, 기초 어근 처리

텍스트 변환 실습

14

데이터 분석 프로젝트

데이터 분석을 실제 문제에 적용하는 방법

프로젝트 수행 실습

15

분석 결과 적용

현장에 적용하는 기술 소개

적용후의 개선 측정

▢ DSAC M3 머신러닝 교육 인증 과정

모듈

주제

내 용 ( DSAC 3 머신 러닝)

실 습

1

머신러닝 범위

지도학습, 비지도학습, 강화학습

아나콘다 설치

2

머신러닝 동작

학습과정, 최적화, 손실함수, 성능평가

쥬피터 노트북 구동

3

최적화 알고리즘

모델 튜닝, 과적합, 과소적합

최적화기 비교

4

분류 예측

협업필터링(kNN)

kNN실습

5

로지스틱 회귀

로짓, 이진 분류

이진 분류 성능

6

앙상블 알고리즘

렌덤포레스트, 그라디언트부스팅

결정 트리 성능 비교 

7

서포트 벡터 머신

서포트 벡터 이해, 분류 분석

SVM 실습

8

분류 성능

컨퓨전 매트릭스, ROC, AUC

ROC, AUC 실습

9

회귀 예측

손실함수, 성능평가 지표, 시계열

회귀 모델 실습

10

모델 최적화

최적화, 랜덤 탐색, 일반화, 교차검증

하이퍼파라미터 튜닝

11

비지도 학습

비지도 학습의 종류, 스케일링, 변환

스케일링 실습

12

클러스터링 고급

클러스터링의 적용 범위

KMeans, DBSCAN

13

데이터 변환

로그변환, 역수변환

붓꽃 데이터 분류

14

데이터 특성 추출

차원 축소, 주성분 분석(PCA), 시각화고급

t- SNE, PCA 실습

15

클러스터링 평가

KMeans, DBSCAN 성능 비교평가

- ARI, 실루엣

16*

베이즈 알고리즘

나이브 베이즈 알고리즘

베이즈 알고리즘 구현

17*

텍스트 분석

형태소 분석, 어근 분석, TF- IDF

네이버 영화 평점 분석

18*

스팸 메일 분석

스팸 필터링

스팸 분류 실습

19*

SNS 분석

SNS 데이터 속성 파악

데이터 수집 및 분석

20*

감성 분석

긍정 부정 감성 분석

SNS 감성 분석

▢ DSAC M4 딥러닝 교육 인증 과정

모듈

주제

내 용 (DSAC 4  딥러닝)

실 습

1

딥러닝과 AI

딥러닝과AI 특징과 성공 요인

아나콘다, 쥬피터 설치

2

딥러닝 도구

텐서플로우, 케라스, 카페, 파이토치

텐서플로우, 케라스 설치

3

다층퍼셉트론

다층퍼셉트론(MLP) 원리 이해

다층퍼셉트론(MLP) 구축

4

CNN 원리

딥러닝 구조, 계층, 유닛, 활성화 함수

CNN 기본 모델 구축

5

CNN 구현

CNN 기본 모델

필기체 숫자 인식

6

이미지 인식

이미지 인식 원리 소개

강아지와 고양이 분류

7

CNN 성능 향상

드롭아웃, 배치 정규화

드롭아웃 실습

8

전이 학습

이미지넷 학습 모델 전이학습

VGG- 16 모델 전이학습

9

데이터 확장

데이터 Augmentation

이미지 인식 성능 향상

10

객체 인식

다수의 이미지 객체 인식

YOLO3

11

자연어 처리

NLP 프로세스 소개

자연어 처리 실습

12

RNN 원리

RNN 동작원리

단층 RNN 구축

13

LSTM

LSTM 원리 소개

LSTM, GRU 구축

14

시계열 분석

RNN을 이용한 시계열 예측

에너지 사용량 예측

15

단어 임베딩

임베딩 원리 이해

단어 임베딩 실습

16*

임베딩 구축

임베딩 직접 구축 및 활용

임베딩 생성 실습

17*

언어 모델링

언어 모델링 개념 설명

어린왕자 소설 학습

18*

챗봇

챗봇 구현 기술

챗봇 구현 실습

19*

딥러닝 응용

GAN, 자동 번역 원리

사례 소개

20*

강화학습

강화학습 원리

게임 프로그램 동작



붙임: 신청서 양식 및 결과보고서 양식 각 1부

붙임1

신청서 양식(교육생)

신청 URL: https://forms.gle/xF7QHsS1QWbRxi9q6


 
 

붙임2

결과보고서 양식(교육생)

DSAC (Data Scientist Academy & Certificate) 데이터 사이언티스트 인증교육 결과보고

성명

연락처

-       -      

E- mail

생년월일

.    .    .

학과

학번

교육 수료 소감 및 향후 활용 계획

* 교육 수료 소감 및 향후 활용 계획에 대하여 자유롭게 기술



위와 같이 결과보고서를 제출합니다. 

2021.    .    .

성명

서명

충남대학교 사회맞춤형 산학협력선도대학(LINC+) 육성사업단장 귀하