상세 컨텐츠

본문 제목

활동 안내

소개

by Ty1en01 2022. 8. 30. 00:01

본문

방학 중 스터디 세션

1. Machine Learning

Machine Learning 스터디에서는 머신러닝의 기초 이론과 모델등을 학습합니다. 매주 세션 전까지 스터디원들은 <Hands ON Machine Learning>교재와 사전에 배부된 자료를 공부하고 이를 바탕으로 세션을 진행합니다.

세션에서는 직관적인 원리를 넘어 수학적 구현 원리를 다룹니다. 예를 들어 loss function에 대해 그림과 예시로 직관적인 개념이해가 가능하게 설명한 뒤, Likelyhood에서 Loss Fuction을 도출하는 과정, 최적화가 이루어지는 과정을 통계적, 수리적 내용에 집중하여 공부합니다.  
  
데이터 과학에서 사용되는 가장 기초이고 또 중요한 개념들을 직관적 이해, 수리적 이해 두가지의 차원에서 계속 공부합니다. 정규화와 표준화와 같이 데이터를 처리하는 기본적인 방식부터 차원 축소 방법(PCA,T-SNE), 결측치 처리 방식, 불균형 데이터 처리( SMOTE, ADASYN ), Classification 개론 ( Loss function, Logistic regression, KNN Classifier, LDA, QDA), Regression 개론( Loss function, Regularization )등에 대해 직관적 원리를 설명하고 수학적 구현 과정을 위주로 공부합니다.

 

SVM, Decision Tree등 기본적인 모델에 대해서도 마찬가지로 직관적인 이해와 수학적 구현 과정을 위주로 공부하게됩니다. 이후 Ensemble Learing의 개념과 종류를 배우고 Random Forest부터 GBM, Ada boost, LGBM, XG BOOST, CAT boost등을 직관적 이해와 수학적 원리를 공부합니다.

수학적 이해도 중요하지만 실제 코딩과 구현 경험도 중요하기 떄문에 매주 코딩 과제를 수행합니다. 그 주 스터디에서 배웠던 MSE, Grid Search, PCA, KNN, SVM, Decision Tree와 같은 내용이 실제로 어떻게 쓰이는지, 어떻게 결과를 바꾸는지 다양한 데이터를 직접 처리하며 파이썬으로 직접 구현하는 코딩 과제를 수행합니다.


 특히 중반부 이후부터는 매주 하나 이상의 데이터에 대해 직접 머신러닝 모델을 제작하고 예측 / 분류 결과까지 도출하는 팀과제를 진행합니다. 반복되는 팀 프로젝트를 통해 직관적, 수학적으로 배운 내용을 직접 데이터 전처리 및 모델링에 사용해보고, 동시에 프로젝트를 진행하면서 부딪히는 어려움과 실수를 미리 경험할 수 있습니다.

 

 

2. Deep Learning

Deep Learning 스터디에서는 NLP(Natural Language Processing), CV(Computer Vision) 등의 기반이 되는 여러 기초적인 딥러닝 기법들을 공부합니다. 학술부 소속 분반장이 매주 세션마다 이론 강의를 진행하며, 스터디 내 학회원들은 수강한 내용에 대한 복습 과제를 한 주에 걸쳐 수행합니다. 수업 교재로는 <PyTorch로 시작하는 딥러닝 입문>을 활용하며, Python의 PyTorch 라이브러리를 활용한 데이터 분석이 코딩 과제로 나갑니다. 스터디에서는 다층 퍼셉트론(MultiLayer Perceptron), 역전파(Backpropagation), CNN, RNN과 같은 기초 딥러닝 구조를 중심으로 AlexNet, ResNet, LSTM, GRU 등의 모델을 다룹니다. 캐글(kaggle), 유튜브와 같은 다양한 방법을 활용한 추가적인 학습 또한 권장하며, 매주 세션에서 임의의 스터디원들은 과제발표로 어려웠던 부분, 흥미로운 시도 등을 공유합니다. 정규 세션이 끝난 뒤, 배운 내용을 바탕으로 조를 나누어 소규모 프로젝트를 진행합니다.

 

 

3. Natural Language Processing

NLP 스터디에서는 언어를 컴퓨터로 처리하는 인공지능 분야인, '자연어 처리'의 기초와 적용에 관해 공부합니다. <밑바닥부터 배우는 딥러닝2>, <딥러닝을 이용한 자연어처리 입문> 등 자연어처리의 기초 이론부터 다루는 교재의 진도를 따라가며 이론을 학습하는 방식으로 스터디를 진행합니다. 이 과정에서 기초적인 인공 신경망 모델인 CNN, RNN부터 word2vec, seq2seq, attention, transformer 등의 모델을 파이썬으로 직접 구현해보고, Pytorch나 Tensorflow를 통해 데이터에 적용해봅니다. 또한, 매주 간단한 챗봇 구현, 영화 리뷰 데이터 감성 분석, 번역기 제작 등 학습한 모델을 활용해 개인 토이 프로젝트를 진행하며 자신의 아이디어를 바탕으로 직접 텍스트 데이터를 다루는 실습을 할 수 있습니다. 매주 스터디 중 각자 구현해온 개인 과제를 발표하고 서로 의견을 공유하는 시간도 함께 갖습니다. 이렇게 방학 세션 동안 자연어처리(NLP) 스터디를 진행한 뒤, NLP를 더 공부하고자 하는 팀원들은 자율적으로 모여서 NLP관련 논문 Reading 등 심화 스터디 또는 프로젝트를 진행합니다.

 

 

4. Computer Vision

Practical Computer Vision 분반은, image classification, vision transformer, object detection, segmentaion, GANs 등, 딥러닝을 이용한 컴퓨터 비전에서 인기 있는 주제들에 관하여 공부하는 스터디입니다. 각 주제에 대하여 주요 개념을 공부하고 배운 내용을 PyTorch로 실현하는 LAB세션을 가집니다. 매주 조별 과제의 주제가 바탕이 되는 응용 프로젝트에 참여하고, 매주 내용에 관하여 관련 논문을 읽고 정리하여 발표하는 과정을 통해 각 분반원들은 컴퓨터 비전에 대한 실전적인 경험과 실력을 쌓을 수 있습니다. 방학 동안 한 주제를 깊게 공부하기보다는, 컴퓨터 비전의 다양한 주제를 접하며 전반적인 맥락을 잡고, 학기 중에 자신이 더 배우고 연구하고 싶은 분야를 선택할 수 있습니다.

 

 

5. Python 기초

Python 기초 스터디는 파이썬을 처음 접해보거나, 기초를 다지고 싶은 학회원들을 대상으로 진행됩니다. 주 1회씩 총 4주간 진행되며 Datacamp를 활용합니다. Numpy, Pandas, Matplotlib, 사용자 정의 함수 등 데이터 분석 및 시각화와 관련된 파이썬 문법 을배웁니다. 매주 Datacamp의 단원을 세분화한 뒤, 스터디원들은 본인이 맡은 파트를 정리해오고 문제를 만들어옵니다. 그리고 스터디 시간에는 자신의 파트를 스터디원들에게 설명하고, 각자 만들어온 문제를 함께 풀어봅니다. 서로 자유롭게 소통하며 공부하는 방향으로 스터디가 진행되며, 본격적인 프로젝트에 들어가기에 앞서 기초적인 파이썬 문법을 익히는 것을 목표로 합니다.

 


KUBIG 데이터 분석 대회

두 달 동안 공부한 내용을 바탕으로 KUBIG 자체적인 데이터 분석 대회를 개최합니다. 머신러닝 또는 딥러닝을 이용한 분류 모델 만들기, NLP, CV를 활용한 앱 개발 등 소규모의 팀별 프로젝트를 진행합니다. 방학 세션에서 배운 내용을 복습하며, 실제 데이터에 모델들을 활용할 소중한 기회입니다. 이 경험을 통해 DataScientist로서의 역량을 한층 더 키우게 됩니다. 또한, 팀별로 소통하고 하나의 목적을 향해 달려나가면서, Co-working의 가치에 대해서도 배우게 됩니다.

 


학기 중 정규세션

심화 스터디

팀 별로 관심있는 주제에 대한 심화 스터디를 진행합니다. 팀 안에서 공부한 내용을 "KUBIG 2022-2 활동블로그"에 지속적으로 업로드하여, 학회원을 포함해 데이터분석을 공부하는 사람들과 지식을 나누며 함께 성장해나가고자 합니다. 

 

스터디 주제

  • Advanced ML & DL paper review with simple projects
  • Dive Into Deep Learning
  • 태블로 스터디
  • 시계열 스터디
  • Graph study
  • 논문 리뷰 스터디
  • CV 논문 리뷰 스터디

장기 프로젝트

KUBIG에서 공부한 내용을 바탕으로 데이터 분석 프로젝트를 진행합니다. 2023년 1월 "KUBIG 컨퍼런스"를 개최하여 프로젝트 결과를 공유하는 시간을 갖습니다.

 

장기 프로젝트 주제

  • 텍스트(NLP)
  • 이미지(CV) 스터디
  • 분류/예측 문제
  • 추천 시스템
  • 의료
  • 금융

'소개' 카테고리의 다른 글

About KUBIG  (0) 2022.08.30
학회원 소개  (0) 2022.08.30
온라인 채널 안내  (0) 2022.08.30

관련글 더보기

댓글 영역