분류 전체보기 (21) 썸네일형 리스트형 2023년 근황 공유 약 2년간 준비한 ADP를 취득했습니다. 올해 초 원하는 부서로 옮겼습니다. 수영을 배우기 시작했습니다. 그 어떤 운동보다 배우길 잘했다고 생각됩니다. 그런데 살이 안빠집니다. 너무 많이 먹나 봅니다. 돈이 안모입니다. 여행을 너무 많이 다녔나 봅니다. 진짜 재테크 공부를 시작하려 합니다. 그동안은 공부하는척을 했습니다. (유투브 한귀로 듣고 흘리기) 그래도 올해는 나름 퀀텀점프 한 것 같습니다. 원하는 일을 많이 성취했습니다. 2023년 남은 목표는 2개입니다. - OPIC IH 취득 - 건강해지기(체중 5kg 감량) Valley AI 참가 오랜만에 블로그에 글을 씁니다. 개인 기록은 OneNote에 쓰고 있지만 특별히 기억하고 싶은 일은 왠지 블로그에 흔적을 남기고 싶어집니다. 오늘은 Valley AI 라는 프로젝트에 참여하기로 결정하였습니다. 지원하고 나서 선정 메일이 오기까지 10일정도 소요된 것 같습니다. 참가자로 선정된 후 3일을 추가로 고민했습니다. 금액적인 이유가 가장 컸습니다. (세금 포함 330만원) 깊은 고민 끝에, Valley AI의 훈련과정에 저의 많은 노력이 더해지면 아래의 목표를 이룰 수 있을거라 생각되어 최종 참여를 결정했습니다. 1. 행복한 삶을 살기 위해, 연 10% 이상 수익 실현 2. 수익과 손실에 대해 설명할 수 있는 역량 갖추기. (이유를 알고 돈을 벌거나 잃자) 3. 자산 배분 및 포트폴리오 관리 능력.. ADP 28회 합격 ADP를 준비한지 1년만에 턱걸이로 겨우 합격했습니다. 큰 숙제를 해결한듯 속이 시원합니다. 조금 이른 2022년 상반기 현황 정리 블로그에 학습 내용을 꾸준히 포스팅하려 했으나, 공부하는 시간보다 정리하는 시간이 더 많이 들어 포기하였지만, 공부를 포기한건 아닙니다. 퇴근 후에 데이터 분석가라는 목표를 향해 꾸준히 공부 중입니다. 슬슬 지쳐가는 나를 다잡기 위해 아무도 보지않겠지만 현황을 정리해서 올려봅니다. 2022 목표 1. 데이터분석 전문가(ADP) 취득 - 목표 : 데이터 분석 전문가(ADP) 취득 (~9월) - 현황 : ADP 실기 24회 첫 응시 및 탈락 - 성적 : 기계학습 30.5/50점, 통계학습 18.5/50점 - 후기 : 답안을 다 적었는데 어디서 이렇게 많이 감점됐을까? 고민해보았는데, 기계학습도 그렇고 통계학습도 깊이가 부족하다는 결론을 스스로 내림. 예를 들어, '제품 불량률의 95% 신뢰구간을 산출해보세요.. 분류 (의사결정나무) 본문의 내용은 파이썬 머신러닝 완벽가이드 (권철민, 위키북스) 참고하여 작성하였습니다. 의사결정나무 GridSearchCV feature_importances_ 티스토리에 Jupyter notebook 깨끗하게 올리기 블로그에는 업데이트 하지 못하였지만 12월 ADP 실기 시험을 준비하고 있는데요, 공부하는 것이 쌓이다보니 잊어버리는 것도 많아 블로그에 정리를 계속 해두려고 합니다. 이전 게시글들은 Jupyter notebook에서 HTML 코드를 따와서 붙여넣기 했는데, 편집도 불편하고 가독성도 낮아서 깨끗하게 올릴수 있는 방법이 없을까하다가 발견한 방법이에요. 굉장히 간단한데 왜 몰랐을까요..ㅎㅎ 본문의 내용은 아래 블로그를 참조하였구요, 나중에 잊어버리면 찾아보려고 간단하게 정리해서 올립니다. 출처 : https://databuzz-team.github.io/2018/10/21/Github-Gist/ 1. Gist 사이트로 이동해서 게시글 올리려는 노트북 파일 올리기 https://gist.github.com/ .. [Pandas] 데이터 Feature 파악 기본 (그래프) In [1]: from IPython.core.display import display, HTMLdisplay(HTML("")) 탐색적 데이터 분석¶데이터의 출처와 주제에 대한 이해데이터의 크기 확인 df.size데이터 구성요소(feature)의 속성 확인feature의 데이터를 이해하는 방법은?1. 위치 추정과 범위 추정¶위치 추정 : 데이터의 대푯값으로 feature의 특징 추정EDA 방법에서는 대푯값으로 중앙값(Median)을 많이 씀변이 추정 : 데이터의 분포로 feature의 특징 추정표준편차, 분산이 대표적은 분포 확인 값In [2]: import pandas as pddf = pd.DataFrame({ 'A' : [1, 2, 3, 4, 5, 6], .. [Pandas] plotly 사용해서 시각화 해보기 2 학습 자료는 " 처음하는 파이썬 데이터 분석[전처리, pandas, 시각화까지 전과정 기본 기술 쉽게 익히기] (Dave Lee, 인프런) " 를 바탕으로 작성했습니다.¶3. plotly.graph_objects로 시각화 사용하기¶-iplot보다는 세부적으로 설정가능In [1]: from IPython.core.display import display, HTMLdisplay(HTML("")) In [2]: # !pip install plotlyimport plotly.graph_objects as goimport plotly.offline as pyo # jupyter notebook에서 보여지도록 설정하는 부분pyo.init_notebook_mode() .. [Pandas] plotly 사용해서 시각화 해보기 1 학습 자료는 " 처음하는 파이썬 데이터 분석[전처리, pandas, 시각화까지 전과정 기본 기술 쉽게 익히기] (Dave Lee, 인프런) " 를 바탕으로 작성했습니다¶1. EDA를 위한 데이터 시각화¶ 시각화 라이브러리 matplotlib, seaborn, plotly (핫한 라이브러리) matplotlib은 오래된 전통적인 라이브러리 최신 시각화 라이브러리 : plotly pandas + plotly를 조합해서 최신/가장 빠르게 시각화 가능 pandas df.plotly(), 형태로 그래프를 바로 그릴 수 있음 https://plotly.com/python/ 2. iplot() 으로 시각화 사용하기¶ 데이터프레임.iplot(kind=그래프종류) 만으로 그래프를 그릴 수 있으므로, 매우 쉬움 단, 관련.. [Pandas] 데이터 처리 연습2 결과물 시각화 데이터 처리 연습2 게시물의 결과로 시각화한 결과. 시간에 따른 국가별 코로나 사망자 추이를 시각화한 것이다. 나중에는 Python 라이브러리로 구현할 수 있겠지? 이렇게 시간에 따라 bar chart가 변화하는걸 뭐라고 말하는지 모르겠다. 동적시각화? 이전 1 2 3 다음 목록 더보기