본문 바로가기

데이터분석/Python

(4)
데이터 포맷 (JSON) JSON이 요즘? 가장 많이 쓰이는 데이터 포맷이라는데 비전공자인 나는 CSV 말고는 솔직히 다 낯설다. JSON 뭔지도 모르겠지만 일단 시작. 1. JSON 정의 - JSON(JavaScript Object Notation)의 줄임말 , 자바를 사용하겠구나 정도만 알고 뭔소린지 모르겠다. - 예시) : { "id":"01", "language": "Java", "edition": "third", "author": "Herbert Schildt" } → 아.. 대충 Dict 타입이랑 비슷한 구조이겠거니 싶다. → python dict 타입 : {"a": 1 , "b" : 2} 2. JSON 데이터 포멧 읽기 ① import json 라이브러리 & json.loads로 오픈 import json data ..
데이터 포멧 (XML) XML, JSON 어디서 들어본것 같았는데 데이터 포멧인지 오늘 알았다... 1. XML 정의 XML(Extensible Markup Language) 이라는데 와 닿지 않는다 기본 구조는 아래와 같다. 내용 기본 구조도 어렵다. 직관적으로 뭔소린지 모르겠다. 일단 지금은 태그와 속성을 대분류, 소분류의 개념정도로 이해하고 대분류 소분류 밑에는 다른 대분류 소분류가 올 수 있다는 정도로만 이해하고 넘어간다. 2. XML 파일 읽고 데이터 추출해보자. 파이썬에서 XML 파일을 읽고 추출하는 과정은 형식화 되어있는 듯. ① bs4 라이브러리 import & Open 함수로 xml 읽기 data_file = open(./users.xml', 'r', encoding = 'utf-8-sig') ② xml 데이터..
파일 포맷 이해(CSV) Excel 때문에 익숙한 CSV 포맷, 파이썬에서는 어떻게 다룰까? 1. CSV 정의 - CSV(Comma-Seperated Values) : 콤마(,)로 구분된 데이터 파일이라는 뜻. 별 뜻이 아니다. 2. CSV 읽어오기 ① 파이썬 CSV 라이브러리 import import csv ② 기본 텍스트 파일과 여는것처럼 open 이용해서 열기 data_file = open('./sample.txt', 'r', encoding = 'utf-8-sig') ③ csv 라이브러리 이용해서 data 읽어주기 (delimeter는 콤마(,) 로 설정) data_lines = csv.reader(data_file, delimiter = ',') ④ csv 파일의 라인별로 data 가져오고 싶으면 for 문 이용하자 f..
파일 포맷 이해 (Plain Text) 이 내용은 인프런의 '처음하는 파이썬 데이터 분석(잔재미코딩)' 강의 내용을 기초로 합니다. 저는 비전공자로 프로그래밍을 막 배워가고 있는 초보자입니다. 아무도 이 글을 볼거라 생각하지 않지만, 혹시라도 누군가 글을 보신다면 내용에 오류가 매우 많을 수 있음을 양해 해주세요. ■ 파일 경로 ① 절대 경로 : 최초의 시작점부터 모든 경로를 기입하는 방식, Full 경로라 생각하면됨 예시) C:\Users\UserID\Desktop\test.txt ② 상대 경로 : 현재 주소 기준으로 파일 경로 설정 예시) 현재 폴더가, Users\UserID이면 ./Desktop/test.txt 로 test.txt 파일을 찾을 수 있음 ■ 파일 OPEN & READ 1. open 함수를 사용해서 파일을 열어주자 data_..