pandas
-
pandas 내에 있는 DataFrame을 이용하여 데이터를 다뤄보겠습니다. 들어가기 전에 행=인덱스, 열=컬럼으로 생각하시면 될 것 같습니다. 1. DataFrame 타입으로 변환 데이터 구조를 하나 생성하고 dataframe 타입으로 변환합니다. 2. 인덱스명 또는 컬럼명 변경하기 1) 인덱스는 데이터.index, 컬럼명은 데이터.columns에 값을 입력하여 변경하기 2) 데이터.rename으로 인덱스나 컬럼명을 변경할 수 있습니다. 3. 데이터 복사 데이터를 복사할 때는 copy()를 활용합니다.(라고 생각을 했는데 deepcopy를 쓰는게 좀 더 적합할 것 같네요.) 복사에 관한 자세한 설명은 https://blueshw.github.io/2016/01/20/shallow-copy-deep-co..
DataFrame을 이용한 데이터 분석①pandas 내에 있는 DataFrame을 이용하여 데이터를 다뤄보겠습니다. 들어가기 전에 행=인덱스, 열=컬럼으로 생각하시면 될 것 같습니다. 1. DataFrame 타입으로 변환 데이터 구조를 하나 생성하고 dataframe 타입으로 변환합니다. 2. 인덱스명 또는 컬럼명 변경하기 1) 인덱스는 데이터.index, 컬럼명은 데이터.columns에 값을 입력하여 변경하기 2) 데이터.rename으로 인덱스나 컬럼명을 변경할 수 있습니다. 3. 데이터 복사 데이터를 복사할 때는 copy()를 활용합니다.(라고 생각을 했는데 deepcopy를 쓰는게 좀 더 적합할 것 같네요.) 복사에 관한 자세한 설명은 https://blueshw.github.io/2016/01/20/shallow-copy-deep-co..
2020.04.07 -
pandas에 있는 series를 활용하여 데이터를 다뤄보겠습니다.(저는 jupyter lab 환경에서 실행하였습니다.) jupyter 환경이 아니어서 값이 출력되지 않는 경우에는 print("넣을 값") 과 같이 print("") 출력문을 추가해주세요. 1. series로 타입 변환 2. series에서 index와 value 추출 3. series에서 활용 가능한 요소 4. 정리 위 예제들의 경우를 보면 dictionary, list, tuple 타입들 모두 series 타입으로 변환하여 사용가능한 것을 알 수 있습니다. 이를 활용하여 타입을 변환하고 데이터에서 필요한 값만 적절히 추출하여 데이터 분석에 활용할 수 있습니다.
Series를 이용한 데이터 분석pandas에 있는 series를 활용하여 데이터를 다뤄보겠습니다.(저는 jupyter lab 환경에서 실행하였습니다.) jupyter 환경이 아니어서 값이 출력되지 않는 경우에는 print("넣을 값") 과 같이 print("") 출력문을 추가해주세요. 1. series로 타입 변환 2. series에서 index와 value 추출 3. series에서 활용 가능한 요소 4. 정리 위 예제들의 경우를 보면 dictionary, list, tuple 타입들 모두 series 타입으로 변환하여 사용가능한 것을 알 수 있습니다. 이를 활용하여 타입을 변환하고 데이터에서 필요한 값만 적절히 추출하여 데이터 분석에 활용할 수 있습니다.
2020.04.06 -
1. pandas란? python을 이용하면 빅데이터를 손쉽게 처리할 수 있는데요. 이 파이썬에서 데이터 분석과 처리를 쉽게 도와주는 것이 바로 pandas 라이브러리입니다. pandas는 numpy를 기반으로 만들어졌지만 더 복잡한 데이터 분석에 특화되어 있습니다. numpy는 같은 데이터 타입의 배열만 처리할 수 있지만 pandas는 다양한 데이터 타입이 섞여 있을 때에도 처리할 수 있습니다. 그래서 pandas가 데이터 분석에 아주 유용하게 쓰입니다. 그럼 이 pandas를 먼저 설치해보겠습니다. 2. pandas 설치 (anaconda를 설치하신 분들은 아마 설치되어 있을 것입니다.) cmd 창을 켜고 아래와 같은 명령어를 입력해주세요. 설치가 잘 되었는지 확인하고 싶다면 pip list를 입력하..
Pandas란?1. pandas란? python을 이용하면 빅데이터를 손쉽게 처리할 수 있는데요. 이 파이썬에서 데이터 분석과 처리를 쉽게 도와주는 것이 바로 pandas 라이브러리입니다. pandas는 numpy를 기반으로 만들어졌지만 더 복잡한 데이터 분석에 특화되어 있습니다. numpy는 같은 데이터 타입의 배열만 처리할 수 있지만 pandas는 다양한 데이터 타입이 섞여 있을 때에도 처리할 수 있습니다. 그래서 pandas가 데이터 분석에 아주 유용하게 쓰입니다. 그럼 이 pandas를 먼저 설치해보겠습니다. 2. pandas 설치 (anaconda를 설치하신 분들은 아마 설치되어 있을 것입니다.) cmd 창을 켜고 아래와 같은 명령어를 입력해주세요. 설치가 잘 되었는지 확인하고 싶다면 pip list를 입력하..
2020.04.01