데이터 분석 캠퍼스

[OT] 데이터분석 포트폴리오 예시 설명

바틀비 2023. 12. 30. 05:44

기본 Tip

1. 팀 차원에서 의미있는 지수를 개발하자
예시) 통일된 지수가 없음 -> 기본 지수에 지형균형지표, 충청권 e지방 지표, NABIS 국가균형발전종합정보시스템,인스파일러 데이터 활용 포털을 이용해 새로운 지수 개발

2. 주제를 정하는 방법
- 조달청 공고를 보고 제안요청서를 받았다는 가정 하에 주제를 선정하고 프로젝트를 진행함
- 공모전 주제를 사용하거나, 공모전 주제에 퀄리티, 난이도를 높여서 주제를 선정한다.
- 논문 등을 보고 선행연구를 분석하고 주제를 구체화한다.

3. 분석의 재정의가 제일 중요하다.
기존의 분석은 이랬지만 다음과 같은 이유로 재정의하고 재분석을 해야 한다~ 의 논리로 접근해야한다.

논문들을 참고하여 생소한 주제를 조사한다.
선행연구 분석을 거치고 주제를 구체화한다.
분석을 할 때 가장 중요한 건 "분석의 재정의"이다. -> 기존은 이랬지만 이러이러한 이유로 재정의하고 다시 분석해야 한다.를 어필

4.
프로젝트 보고서 마지막에 시행착오, 대체방안과 한계를 적는다.
예시) 건의사항을 답변란으로 구현하기 어려움 -> 이메일을 통한 답변으로 대체

세미 프로젝트

기대되는 역량
1. 코딩을 익히는 시간. 프로젝트를 진행하는 연습, RDS는 옵션
2. 개발환경 및 사용 툴
- django, 파이썬, 자바스크립트, CSS
- csv파일들만 가지고 진행함.
3. 예시
지하철 혼잡도 예측 및 사용자 분산 서비스
강남구 지역 상권 기반 시간대별 편의점 매출 예측

파이널 프로젝트(1달간)

기대되는 역량
1. 기획/분석 정의 능력(논문 참조 등의 수단을 활용), 결과 해석에 중점. RDS 사용
예시) 자체적으로 개발한 지수를 활용하여 색다른 해석을 도출해야 한다.
상수도 보급률의 격차가 높아질수록 도시 양극화 가능성이 거짐 -> 인프라가 중요하다는 통념을 구체화시킴
2. 개발환경 및 사용 툴
- 개발: VSCODE, colab
- Pandas, Folium, Ployly, Json
- 배포: github, streamlit
- 태블로, QGIS, seraborn, matplotlib
- DB: SQLite, Big query
- OpenAPI: 서울 열린 데이터 광장, OpenAI
- 지도 표준화 로지스탁 회귀분석
- SPSS
- 스파크 머신러닝
- GoDaddy

3. FlowChart, WBS, ERD, 요구사항정의서(구현 실패한 기능도 적기)

4. 예시
서울공공데이터 API를 활용하여 거주지 구매를 희망하는 사람들을 위한 정보 사이트
지방도시 양극화 연구 프로젝트
산불 예측 피해 최소화 프로젝트
택배 물량 예측 서비스

'데이터 분석 캠퍼스' 카테고리의 다른 글

[OT] 데이터분석 취업 관련 내용 정리  (0) 2023.12.27