목차
1단계: Python 기초부터 데이터 전처리
2단계: 통계 분석과 가설 검증
3단계: 머신러닝 실전 모델링
4단계: 시각화와 대시보드 제작
5단계: 프로젝트와 포트폴리오 완성
참가 팁과 비용 정보
1단계: Python 기초부터 데이터 전처리
부트캠프 첫 2주는 Python 기초와 데이터 전처리에 집중해요.
후기 보니 초보자도 따라갈 수 있게 Jupyter Notebook으로 실습부터 시작한다고 해요.
1주차엔 변수, 리스트, 딕셔너리, 함수 같은 기본 문법 배우고, Pandas 라이브러리로 CSV 파일 읽기/쓰기 연습.
2주차엔 결측치 처리, 중복 제거, 데이터 타입 변환 실습이 핵심이었어요.
| 주차 | 주요 내용 | 실습 시간 | 과제 |
|---|---|---|---|
| 1주 | Python 기초 (변수, 제어문, 함수) | 20시간 | 간단 계산기 만들기 |
| 2주 | Pandas 데이터프레임, 전처리 (결측치, 그룹화) | 25시간 | 공공데이터포털 의류수거함 데이터清洗 |
후기에서 “공공데이터포털의 의류수거함 데이터로 실습하니 재밌고 실무적”이라는 소리가 많았어요.
과제는 매일 제출해야 하고, 멘토가 피드백 주니 금방 익혔대요.
이 단계에서 80% 이상 출석해야 다음 단계로 넘어가요.
첫날 당황 안 해요.
2단계: 통계 분석과 가설 검증
3~4주차는 통계 기초로 넘어가요.
후기들 보니 t-검정, ANOVA, 상관분석 같은 걸 Excel에서 넘어 Pandas와 SciPy로 구현하는 게 신선했다는 평이에요.
데이터의 정성/정량 구분부터 배우고, 지식의 피라미드처럼 데이터 → 정보 → 지식으로 연결짓는 사고방식을 강조해요.
예를 들어, “A사 마우스 2만원, B사 3만원” 데이터로 “A사가 싸다”는 정보를 도출하는 식이에요.
실습은 공공데이터포털의 불법주정차 데이터로 가설 검증: “무인단속카메라 위치가 주정차 위반에 미치는 영향” 분석.
p-value 0.05 미만으로 유의미 판정하는 법 배워요.
과제는 보고서 형식으로 제출, 10페이지 분량이에요.
이 단계 통과율 90%지만, 통계 미리 공부 안 한 사람은 고생 좀 한다는 후기 많아요.
3단계: 머신러닝 실전 모델링
5~8주가 클라이맥스예요.
Scikit-learn으로 선형회귀, 로지스틱 회귀, 랜덤포레스트, XGBoost까지 다뤄요.
후기에서 “하이퍼파라미터 튜닝 GridSearchCV 실습이 제일 유용했다”는 소리 나와요.
교차검증(CV=5), RMSE/Accuracy 지표 계산법 세세하게 배워요.
Kaggle 타이타닉 데이터셋으로 생존 예측 모델 accuracy 82% 목표로 실습.
| 모델 | 학습 데이터 | 평가 지표 | 목표 성능 |
|---|---|---|---|
| 랜덤포레스트 | 기상청 데이터 | Accuracy | 85% |
| XGBoost | 교통사고 데이터 | F1-score | 0.80 |
| LSTM | 주가 시계열 | MAE | 5% 이내 |
매주 모델링 대회처럼 팀별 경쟁하고, 승리팀에 커피 쿠폰 지급돼 동기부여 됐대요.
이 단계서 데이터베이스 연동도 배워요.
MySQL 설치 후 SQL 쿼리로 데이터 추출, DBMS(MySQL, PostgreSQL) 비교 실습 포함.
후기: “Oracle 대신 무료 MySQL로 충분히 실무 가능함 알게 됨.”
로컬 PC 버벅거림 방지.
4단계: 시각화와 대시보드 제작
9~10주차엔 Matplotlib, Seaborn, Plotly로 시각화하고, Streamlit/Dash로 대시보드 만듦.
후기 보니 “Plotly 대화형 차트가 포트폴리오에서 빛난다”는 후기 많아요.
공공데이터포털 법제처 데이터로 법령 변화 추이 히트맵 그리기 실습.
대시보드 배포는 Heroku 무료 티어 사용, 1시간 만에 웹 앱 완성.
과제는 “기상청 데이터로 날씨 예측 대시보드” 제작, 클릭 시 상세 통계 팝업 나오는 기능 넣기.
멘토 피드백: 색상 팔레트 5종 추천, 모바일 반응형 필수.
이 단계 후기 만족도 95%로 최고예요.
5단계: 프로젝트와 포트폴리오 완성
마지막 2주는 개인/팀 프로젝트.
주제 자유지만, 공공데이터포털 국가중점데이터(건축정보, 국민건강정보 등) 활용 권장.
후기 예시: “부동산종합정보로 아파트 가격 예측 모델, GitHub에 업로드 후 링크드인 공유하니 면접 제안 3건 왔음.” 발표는 10분 PPT+데모, Q&A 5분.
우수 프로젝트는 부트캠프 홈페이지에 게재되고, 취업 연계 회사 추천 받음.
포트폴리오 가이드: GitHub README에 커리큘럼별 코드 정리, Jupyter → HTML 변환, Notion 페이지 연동.
졸업증명서 발급은 수료 후 1주 내 이메일로, DMI(Data Modeling Index) 80점 이상자만 취득 가능해요.
후기처럼 “상권정보 데이터로 매장 입지 분석” 인기 많아요.
참가 팁과 비용 정보
신청은 홈페이지에서 2024년 2월 15일~28일 모집, 2월 29일 발표.
필요 서류: 학력증명서, 포트폴리오(없으면 생략), 자기소개서 800자.
비용 450만 원(부가세 포함), 조기신청(2월 10일 전) 360만 원, 재직자 500만 원.
환불 규정: 개강 7일 전 100%, 3일 전 50%, 개강 후 불가.
장학금: 저소득층(기초생활수급자) 전액 면제, 여성 50만 원 추가.
후기: “멘토 1:10 비율로 질문 바로 답변 받아서 좋음.
취업률 70%.”
준비물: 노트북(i5 이상, 16GB RAM), VS Code 설치.
온라인 수강 시 Zoom+Slack 사용.
주말 보충 수업 4시간 무료 제공돼요.
다만 통계 약하면 2주차 고생할 수 있으니 Khan Academy 통계 강의 5시간 미리 보세요.
후기 85%가 초보 출신이에요.
신청 시 소득분위 증빙서류(주민등록등본) 업로드하면 자동 심사.
2024년 기준 저소득 1~2구간 전액, 3구간 200만 원 지원.
결과 3일 내 통보.
후기 중 30%가 부트캠프 3개월 내 입사.
이력서에 “DMI 85점” 명시하면 플러스.
단, 네트웍 불안정하면 녹화로 따라가야 해요.
후기: “오프라인보다 조용히 집중 잘 됨.”