데이터분석/다섯째주
-
목차 for문 Python의 들여쓰기(intent)로 구분한다. for n in [1, 2, 3, 4] : 들여쓰기로 코드를 작성 들여쓰기가 적용되는 곳까지가 for문 그리고 들여쓰기를 중단하면 for문이 아니다. for n in [1, 2, 3, 4]: print("Number is", n) -- 출력 -- Number is 1 Number is 2 Number is 3 Number is 4 for n in range(0, 10): print(n ** 2) -- 출력 -- 0 1 4 9 16 25 36 49 64 81 for문 한줄로 코딩 (list comprehension) [ n ** 2 for n in range(1, 10) ] -- 출력 -- [0, 1, 4, 9, 16, 25, 36, 49, ..
파이썬 Python : for문목차 for문 Python의 들여쓰기(intent)로 구분한다. for n in [1, 2, 3, 4] : 들여쓰기로 코드를 작성 들여쓰기가 적용되는 곳까지가 for문 그리고 들여쓰기를 중단하면 for문이 아니다. for n in [1, 2, 3, 4]: print("Number is", n) -- 출력 -- Number is 1 Number is 2 Number is 3 Number is 4 for n in range(0, 10): print(n ** 2) -- 출력 -- 0 1 4 9 16 25 36 49 64 81 for문 한줄로 코딩 (list comprehension) [ n ** 2 for n in range(1, 10) ] -- 출력 -- [0, 1, 4, 9, 16, 25, 36, 49, ..
2023.11.06 -
목차 Google Maps API 설치 pip install googlemaps conda install -c conda-forge googlemaps 모듈설치시 에러발생 요인 python 의 모듈간 dependency 문제 개인pc 환경의 indivisual difference Google Maps API Key 발급 (무료) Google 클라우드 플랫폼( https://console.cloud.google.com/ ) 1. 탐색메뉴 > API 및 서비스 > 라이브러리 2. 검색창에 'geocoding api' 검색 3. 검색결과에서 Geocoding API 선택 4. 사용 버튼 클릭 5. 계정 정보 입력 ( 서비스 약관 동의 > 계속 > 고객정보 입력 > 카드정보 입력 > 무료로 시작하기 ) 6. 설..
파이썬 Python : Google Maps API 설치 및 Key 무료 발급받기목차 Google Maps API 설치 pip install googlemaps conda install -c conda-forge googlemaps 모듈설치시 에러발생 요인 python 의 모듈간 dependency 문제 개인pc 환경의 indivisual difference Google Maps API Key 발급 (무료) Google 클라우드 플랫폼( https://console.cloud.google.com/ ) 1. 탐색메뉴 > API 및 서비스 > 라이브러리 2. 검색창에 'geocoding api' 검색 3. 검색결과에서 Geocoding API 선택 4. 사용 버튼 클릭 5. 계정 정보 입력 ( 서비스 약관 동의 > 계속 > 고객정보 입력 > 카드정보 입력 > 무료로 시작하기 ) 6. 설..
2023.11.06 -
목차 pip 명령 Python 의 공식 모듈 관리자 windows, mac(intel), mac(M1) 환경에서는 pip 명령으로 대부분 설치가 된다. pip list : 현재 설치된 모듈 리스트 반환 pip install 모듈명 : 모듈 설치 pip uninstall 모듈명 : 설치된 모듈 제거 * 쥬피터 노트북에서는 !pip 명령 앞에 !를 쓰면 os 레벨의 명령어를 사용할 수 있으므로, pip 명령 앞에 !를 붙여서 사용하면 된다. get_ipython().system('pip 명령') conda 명령 pip 를 사용하면 conda 환경에서 dependency 관리가 정확하지 않을 수 있다. 아나콘다에서는 가급적 conda 명령으로 모듈을 관리하는 것이 좋다. windows, mac(intel) 환..
파이썬 Python : 모듈설치 pip / conda목차 pip 명령 Python 의 공식 모듈 관리자 windows, mac(intel), mac(M1) 환경에서는 pip 명령으로 대부분 설치가 된다. pip list : 현재 설치된 모듈 리스트 반환 pip install 모듈명 : 모듈 설치 pip uninstall 모듈명 : 설치된 모듈 제거 * 쥬피터 노트북에서는 !pip 명령 앞에 !를 쓰면 os 레벨의 명령어를 사용할 수 있으므로, pip 명령 앞에 !를 붙여서 사용하면 된다. get_ipython().system('pip 명령') conda 명령 pip 를 사용하면 conda 환경에서 dependency 관리가 정확하지 않을 수 있다. 아나콘다에서는 가급적 conda 명령으로 모듈을 관리하는 것이 좋다. windows, mac(intel) 환..
2023.11.05 -
목차 Pivot Table 데이터를 원하는 형태로 집계할 때 유용하게 사용할 수 있는 방법 데이터를 재정렬 https://pandas.pydata.org/docs/reference/api/pandas.pivot_table.html pandas.pivot_table( 데이터, index=[' 컬럼명 '], columns=[' 컬럼명 '] , values=[' 컬럼명 '], aggfunc=' 집계함수 ') pandas.pivot_table( 데이터, index=[' 컬럼명 '], columns=[' 컬럼명 '] , values=[' 컬럼명 '], aggfunc=' 집계함수 ' , fill_value=None , margins=False , dropna=True , margins_name='All' , obs..
파이썬 Python : Pivot Table목차 Pivot Table 데이터를 원하는 형태로 집계할 때 유용하게 사용할 수 있는 방법 데이터를 재정렬 https://pandas.pydata.org/docs/reference/api/pandas.pivot_table.html pandas.pivot_table( 데이터, index=[' 컬럼명 '], columns=[' 컬럼명 '] , values=[' 컬럼명 '], aggfunc=' 집계함수 ') pandas.pivot_table( 데이터, index=[' 컬럼명 '], columns=[' 컬럼명 '] , values=[' 컬럼명 '], aggfunc=' 집계함수 ' , fill_value=None , margins=False , dropna=True , margins_name='All' , obs..
2023.11.05 -
목차 데이터 과학 현상, 인식, 가정을 확인하는 도구로 사용할 수 있다. 데이터 과학의 목적 : 가정 (혹은 인식) 을 검증하고 표현하는 것 [ 기사 ] '부자동네' 서울 강남 3구(강남,서초,송파)의 체감안전도가 대체로 높은것으로 나타났다. [ 검증 ] 강남 3구가 실제로 범죄로 부터 안전하다고 할 수 있는지 확인해보자. 서울시 범죄 현황 데이터 : 공공데이터포털, 2020년도 데이터 파일명 : crime_in_Seoul.csv 데이터 불러오기 : read_csv( ) thousands 옵션에 ',' 을 설정하여 천단위 구분자인 콤마를 제외하고 숫자형으로 읽어들인다. import pandas as pd import numpy as np # csv파일에서 숫자값들에 콤마(,)를 사용하고 있어서 문자로 인..
EDA : 서울시 범죄 현황(1) 데이터 정리목차 데이터 과학 현상, 인식, 가정을 확인하는 도구로 사용할 수 있다. 데이터 과학의 목적 : 가정 (혹은 인식) 을 검증하고 표현하는 것 [ 기사 ] '부자동네' 서울 강남 3구(강남,서초,송파)의 체감안전도가 대체로 높은것으로 나타났다. [ 검증 ] 강남 3구가 실제로 범죄로 부터 안전하다고 할 수 있는지 확인해보자. 서울시 범죄 현황 데이터 : 공공데이터포털, 2020년도 데이터 파일명 : crime_in_Seoul.csv 데이터 불러오기 : read_csv( ) thousands 옵션에 ',' 을 설정하여 천단위 구분자인 콤마를 제외하고 숫자형으로 읽어들인다. import pandas as pd import numpy as np # csv파일에서 숫자값들에 콤마(,)를 사용하고 있어서 문자로 인..
2023.11.04 -
목차 Numpy를 이용한 1차 직선 만들기 numpy가 제공하는 간단한 함수를 이용해서 1차 직선을 만들어 그래프로 비교하자 [ 절차 ] numpy.polyfit( ) : 직선을 구성하기 위한 계수(기울기, 절편) 계산 numpy.poly1d( ) : polyfit으로 찾은 계수로 python에서 사용할 함수로 만들어 준다. import numpy as np import matplotlib.pyplot as plt # 직선 그리기: 기울기가 3이고, 흔히 말하는 y 절편이 5 t = np.arange(0, 10, 0.01) y = 3*t + 5 plt.figure(figsize=(12,8)) plt.plot(t, y) plt.show() # 노이즈 추가 y_noise = y + np.random.rand..
데이터 경향 : 선형 회귀(Linear Regression)목차 Numpy를 이용한 1차 직선 만들기 numpy가 제공하는 간단한 함수를 이용해서 1차 직선을 만들어 그래프로 비교하자 [ 절차 ] numpy.polyfit( ) : 직선을 구성하기 위한 계수(기울기, 절편) 계산 numpy.poly1d( ) : polyfit으로 찾은 계수로 python에서 사용할 함수로 만들어 준다. import numpy as np import matplotlib.pyplot as plt # 직선 그리기: 기울기가 3이고, 흔히 말하는 y 절편이 5 t = np.arange(0, 10, 0.01) y = 3*t + 5 plt.figure(figsize=(12,8)) plt.plot(t, y) plt.show() # 노이즈 추가 y_noise = y + np.random.rand..
2023.11.04 -
목차 Matplotlib 에서 한글 폰트를 지원하지 않기 때문에 한글 깨짐이 발생합니다. 사용하는 OS에서 설치된 폰트 파일 폴더 확인 윈도우에서는 "C:\Windows\Fonts" 폴더 맥에서는 "/Library/Fonts" 폴더 Matplotlib에서 설정 지원하는 한글 폰트 확인 윈도우에서는 " malgun.ttf " 혹은 " NanumBarunGothic.ttf " 등 맥에서는 " AppleGothic.ttf " 등 한글폰트 설정 1. rcParams import matplotlib.pyplot as plt plt.rcParams['font.family'] ='Malgun Gothic' plt.rcParams['axes.unicode_minus'] = False 한글폰트 설정 2. rc / fon..
EDA : 시각화 - 한글깨짐목차 Matplotlib 에서 한글 폰트를 지원하지 않기 때문에 한글 깨짐이 발생합니다. 사용하는 OS에서 설치된 폰트 파일 폴더 확인 윈도우에서는 "C:\Windows\Fonts" 폴더 맥에서는 "/Library/Fonts" 폴더 Matplotlib에서 설정 지원하는 한글 폰트 확인 윈도우에서는 " malgun.ttf " 혹은 " NanumBarunGothic.ttf " 등 맥에서는 " AppleGothic.ttf " 등 한글폰트 설정 1. rcParams import matplotlib.pyplot as plt plt.rcParams['font.family'] ='Malgun Gothic' plt.rcParams['axes.unicode_minus'] = False 한글폰트 설정 2. rc / fon..
2023.11.04 -
Numpy 모듈 수치 데이터를 다루는 파이썬 패키지 통상적으로 np라는 별칭으로 많이 쓴다. import numpy as np arange( ) 함수 특정 구간의 숫자 배열을 생성하는 함수 np.arange( 시작점, 끝점, step= ) 시작점 = 생략시 default값은 0이다. 끝점 = 끝점, 결과값에 미포함 된다. step = 간격, 생략시 default값은 1이다. 실행 결과의 수열이 numpy array 형태의 자료형이다. import numpy as np print( np.arange(10), '\n') print( np.arange(1, 15, 2), '\n' ) print ( np.arange(9, -2, -1.5), '\n' ) -- 출력 -- array([ 0, 1, 2, 3, 4, ..
파이썬 Python : numpy 모듈Numpy 모듈 수치 데이터를 다루는 파이썬 패키지 통상적으로 np라는 별칭으로 많이 쓴다. import numpy as np arange( ) 함수 특정 구간의 숫자 배열을 생성하는 함수 np.arange( 시작점, 끝점, step= ) 시작점 = 생략시 default값은 0이다. 끝점 = 끝점, 결과값에 미포함 된다. step = 간격, 생략시 default값은 1이다. 실행 결과의 수열이 numpy array 형태의 자료형이다. import numpy as np print( np.arange(10), '\n') print( np.arange(1, 15, 2), '\n' ) print ( np.arange(9, -2, -1.5), '\n' ) -- 출력 -- array([ 0, 1, 2, 3, 4, ..
2023.10.28