
안녕하세요!

이번 주에는 팀 분석 프로젝트를 마치면서
지난 4주 동안 무엇을 했는지 정리를 해보고
느낀 점도 이야기해 보려고 합니다!
4주간의 기록✏️
🗓1st week
첫째 주에 팀원 언니 오빠들을
직접 만나 회의할 때가 생각나네요 ㅎㅎ
데이터 셋을 고르고 회의하면서
맛있는 음식🌮도 먹으니
금방 친해졌죠!💕
(어디 가서 귀엽다는 이야기는 잘 못 듣는데
언니 오빠들이 귀여워해줬어요ㅎㅎ🤭)
데이터 셋을 Insurance 데이터로 선정하고 나서
데이터에 대한 설명과
데이터 EDA에 관한 내용을 분석하고
포스팅했었죠 ㅎㅎ
아직 못 보신 분이 있으시다면🙃
아래 링크를 확인해 주세요~
📍1주 차 링크
🗓2nd week
2주 차에 저는 데이터를 활용하여
상관분석을 진행하였어요! ㅎㅎ
언니 오빠들이 너무 능력자들이라
제가 더 열심히 잘 해야겠다는 생각에
정말 열심히 공부했어요 ㅎㅎ
(시험 볼 때 그렇게 하지...ㅎㅎ)

막상 공부하다 보니까
데이터 셋에 적용할 때 헷갈리는 부분들이
마구마구 생기더라구요...!🥲
그 당시 저의 머릿속은...
'스피어만 상관관계랑 피어슨 상관관계의 차이가
있는 건 알겠지만...!
우리 데이터에서는 정확히 어떤 방식을 써야 할까?...'
레퍼런스 코드들을 보면
대부분 피어슨 상관관계를 사용한 걸 보고
더 혼란에 빠졌답니다 ㅎㅎ
그래서 멘토님께서 이런 부분에 대해
질문을 드렸고
정말 자세하게 답변해 주셨어요 ㅎㅎ

그래서 이런 flow를 가지고
상관분석을 진행할 수 있었습니다!
이 부분에 대해서 잘 몰랐는데,
팀 분석하면서 자세히 알게 되었습니다!
나중에 개인 프로젝트 할 때도
분명히 도움이 될 것 같아요😊
📍2주 차 링크
🗓3rd week
셋째 주에는 모델링&모델 평가를 실시하였는데요!
그중에서도 "Decision Tree 와 XGBoost Regression 을 활용한
성별에 따른 의료비 예측"을 하는 역할을 맡았습니다.
사실 이 프로젝트를 시작하기 전에는
분석 경험이 없다 보니
책이나 강의를 따라서
집값 예측이나 타이타닉 생존자 예측과 같은 걸 할 때는
모든 변수들을 가지고 예측을 진행했거든요!
그런데 이 분석에서는
데이터를 전체적으로 train 하고,
그룹 지어 예측을 하는 방식도 배웠습니다.
분석을 하는데 조금이지만
시야가 넓어졌달까 ㅎㅎ
모델을 train 하고 평가하는 것뿐만 아니라
평가 지표를 선정하고 분석하는 것까지
완료해서 분석을 마무리하였죠!

🗓4th week
하지만
이것이 끝이 아니죠!
4주 차에는 멘토님의 피드백에 따라
약간의 수정을 거치고
PPT를 만들었습니다!
저희는 주차별로 자신이 분석한 부분에 대한
ppt를 rough 하게 만들어놨었기 때문에
아주아주 좋았어요 ㅎㅎ

이런식으로요ㅎㅎ
분석한 것들을 모아보니...
대략 60장이더라고요????

담당이 나누어져 있어서
팀원 언니들이 ppt를 취합해서
만들어 넘겨주었는데요!
그 후에 2차 수정을 하니

대략 새벽 3시가 되었네요!ㅎㅎ
언니들도 얼마나 오래 걸렸을지 🥲
그리고 주말에는 다같이 모여
수정에 수정을 거듭해
ppt 진짜 진짜 진짜 진짜 최종본. ppt를
완성하였습니다!!🎉
모두들 열심히 노력해서
프로젝트를 진행한 만큼
결과물에 그 노력이
잘 나타났으면 하는 마음이에요ㅎㅎ
+) 마지막으로 팀원 언니 오빠들의
블로그 링크 달아둘게요!
각자가 맡은 역할들에 따라 포스팅이 되어있답니다~
📍suze_log
번외 편🙃
지난 4주 동안
온라인 회의도 많이 했지만,
직접 만나서 회의도 많이 했는데요!




오빠가 사준 맛난 케이크와 언니 오빠가 사준 커피와 빵💕
(p.s. 먹기만 한 건 아니에요 ㅎㅎ
사진이 더 많지만 초상권 보호를 위해 keep👛)
데이터 분석뿐만 아니라
비슷한 관심사를 가진
팀원 언니 오빠들을 만나
배울 점이 많다는 것도 참 좋았어요!
제 디폴트인
졸린듯한😴 텐션도
맞춰주던 언니 오빠들ㅎㅎ
고마워여💖
다음 포스팅 예고 ✨
다음 주부터는
저희가 팀 프로젝트로 진행한 것을 바탕으로
영상 기획부터 제작까지 진행할 건데요!
정말 정말 x100
재밌을 거예요 ㅎㅎ
기대 많이 해주세요~🤭
안녕~
