데이터분석/다섯째주
EDA : 서울시 CCTV 현황(1) 데이터 분석
핑크댕댕이
2023. 10. 25. 05:00
728x90
- 서울시 구별 CCTV 현황 데이터 확보 (Python, Pandas) ✔
- 인구 현황 데이터 확보 (Python, Pandas)
- CCTV 데이터와 인구 형황 데이터 합치기 (Python, Pandas)
- 데이터 정리하고 정렬하기 (Python, Pandas)
- 그래프를 그릴 수 있는 능력 (Matplotlib)
- 전체적인 경향을 파악할 수 있는 능력 (Regression using Numpy)
- 그 경향에서 벗어난 데이터를 강조하는 능력 (Insight and Visualization)
서울시 CCTV 현황 데이터 분석
- [데이터] 서울 열린데이터 광장
https://data.seoul.go.kr/dataList/OA-2734/F/1/datasetView.do
파일명: Seoul_CCTV.csv
< 데이터 확인해보기 >
데이터 불러오기
import pandas as pd
CCTV_Seoul = pd.read_csv('경로/~/Seoul_CCTV.csv', encoding='utf-8')
CCTV_Seoul.head()
-- 출력 --
컬럼명 변경
import pandas as pd
CCTV_Seoul = pd.read_csv('경로/~/Seoul_CCTV.csv', encoding='utf-8')
CCTV_Seoul.rename(columns={CCTV_Seoul.columns[0]: '구별'}, inplace=True)
-- 출력 --
CCTV 앞 부분 데이터 확인
CCTV_Seoul.head()
-- 출력 --
CCTV 를 가장 적게 보유한 구
CCTV_Seoul.sort_values(by='소계', ascending=True).head()
-- 출력 --
CCTV 를 가장 많이 보유한 구
CCTV_Seoul.sort_values(by='소계', ascending=False).head()
-- 출력 --
CCTV 증가율
CCTV_Seoul['최근증가율'] = (
( CCTV_Seoul['2016년'] + CCTV_Seoul['2015년'] + CCTV_Seoul['2014년'] )
/ CCTV_Seoul['2013년도 이전']
* 100
)
CCTV_Seoul.sort_values(by='최근증가율', ascending=False).head()
-- 출력 --
최근 3년간(2014~2016년) 그 전에 보유한 갯수(2013년도 이전)에 대비해서 CCTV를 많이 설치한 구는 종로구이다. 단순히 구별 CCTV개수로만은 분석의 한계가 있으므로, 인구현황과 함께 비교를 해보기로 한다. |
반응형