데이터분석/다섯째주

EDA : 서울시 CCTV 현황(1) 데이터 분석

핑크댕댕이 2023. 10. 25. 05:00
728x90

 

  1. 서울시 구별 CCTV 현황 데이터 확보 (Python, Pandas)   ✔
  2. 인구 현황 데이터 확보  (Python, Pandas)
  3. CCTV 데이터와 인구 형황 데이터 합치기  (Python, Pandas)
  4. 데이터 정리하고 정렬하기  (Python, Pandas)
  5. 그래프를 그릴 수 있는 능력 (Matplotlib)
  6. 전체적인 경향을 파악할 수 있는 능력 (Regression using Numpy)
  7. 그 경향에서 벗어난 데이터를 강조하는 능력 (Insight and Visualization)

 

서울시 CCTV 현황 데이터 분석

 

 

< 데이터 확인해보기 >

데이터 불러오기

import pandas as pd
CCTV_Seoul = pd.read_csv('경로/~/Seoul_CCTV.csv', encoding='utf-8')
CCTV_Seoul.head()

-- 출력 --

 

 

컬럼명 변경

import pandas as pd
CCTV_Seoul = pd.read_csv('경로/~/Seoul_CCTV.csv', encoding='utf-8')
CCTV_Seoul.rename(columns={CCTV_Seoul.columns[0]: '구별'}, inplace=True)

-- 출력 --

 

 

CCTV 앞 부분 데이터 확인

CCTV_Seoul.head()

-- 출력 --

 

 

CCTV 를 가장 적게 보유한 구

CCTV_Seoul.sort_values(by='소계', ascending=True).head()

-- 출력 --

 

 

CCTV 를 가장 많이 보유한 구

CCTV_Seoul.sort_values(by='소계', ascending=False).head()

-- 출력 --

 

 

CCTV 증가율

CCTV_Seoul['최근증가율'] = (
	( CCTV_Seoul['2016년'] + CCTV_Seoul['2015년'] + CCTV_Seoul['2014년'] )
	/ CCTV_Seoul['2013년도 이전']
    * 100   
)

CCTV_Seoul.sort_values(by='최근증가율', ascending=False).head()

-- 출력 --

 

최근 3년간(2014~2016년) 그 전에 보유한 갯수(2013년도 이전)에 대비해서 CCTV를 많이 설치한 구는 종로구이다.
단순히 구별 CCTV개수로만은 분석의 한계가 있으므로, 인구현황과 함께 비교를 해보기로 한다.

 

 

 

 

 

 

반응형