반응형
Open Source/Koalas
-
Koalas 란?Open Source/Koalas 2019. 12. 20. 16:58
본 게시물은 Databricks의 Koalas 프레젠테이션 자료를 해석 정리 한 것 입니다. 학습 목적으로 정리된 게시물 입니다. 데이터 사이언티스트 (Data Scientist) 의 일반적인 배움의 순서 처음 학습 할 때 ( 온라인강좌(MOOC, ...) , 책, 대학 수업, ... ) -> pandas 로 배움 작은 데이터 셋을 분석 할 때 -> pandas 로 분석 큰 데이터 셋을 분석 할 때 -> spark의 Dataframe을 사용하여 분석 pandas 란? 2008 년에 Wes McKinney에 의해 개발 python 에서 데이터 조작(mainpulation) 및 분석(analysis)에 표준이 되는 도구 python data science ecosystem 에 깊게 사용되고 있음 (예, nu..