가장 직관적이고 배우기 쉽다. 프로그래밍에 대한 기초 지식이 없어도 어떤 의미인지 어느 정도 이해할 정도로 코드가 사람의 언어에 가깝게 작성되어 있다.
대량의 데이터를 빠르게 처리할 수 있다. 일반적인 수준의 데이터는 엑셀로 충분하지만, 크롤링해오는 데이터를 반복적으로 분석해야 할때는 파이썬을 사용하는 것이 나을 것이다.
머신러닝, 딥러닝 관련 다양한 분석 및 예측 라이브러리가 지원된다.
다양한 라이브러리를 지원한다. Pandas (판다스) - 데이터를 엑셀과 같은 표의 형태로 작성하고 기초통계 및 계산, 시각화 등을 지원 Seaborn (씨본) - 다양한 색상 테마와 통계용 차트를 지원하는 시각화 라이브러리, 2차원 뿐만 아니라 3차원 데이터의 시각화도 가능 Scikit-learn (사이킷런) - 분류, 회귀, 클러스터링, 차원 축소 등 다양한 머신러닝 모델링을 지원 TensorFlow (텐서플로) - 구글에서 제공하는 딥러닝 개발을 위한 라이브러리 Mysqlclient (마이에스큐엘 클라이언트) - MySQL DB에 연결하고 쿼리를 실행할 수 있는 라이브러리
파이썬 외에도 데이터 분석에 많이 사용되는 언어로 R이 있다. 파이썬이 다양한 분야에 다양하게 활용되는 언어라면 R은 통계학자들이 만든 언어로 데이터 분석과 시각화에 초점이 맞춰진 언어라고 한다.
파이썬
1991년 네덜란드 개발자 귀도 반 로섬이 만들었다.
메모리(RAM)가 허용되는 한도내에서 무한 정수를 처리할 수 있다. (다른 언어는 한계가 있다. 과학 분양에서 뛰어난 성능을 발휘하고 있다.)
비전공자도 조금의 시간과 노력을 기울리면, 사용할 수 있을 정도로 문법 구조가 쉽다. (다른 언어와 비교했을때, 문법구조와 표현이 쉽다.)