상세정보
미리보기
Do it! 공공데이터로 배우는 R 데이터 분석 with 샤이니
- 저자
- 김철민 저
- 출판사
- 이지스퍼블리싱 (주)
- 출판일
- 2022-05-25
- 등록일
- 2022-10-11
- 파일포맷
- PDF
- 파일크기
- 30MB
- 공급사
- YES24
- 지원기기
-
PC
PHONE
TABLET
웹뷰어
프로그램 수동설치
뷰어프로그램 설치 안내
책소개
공모전에서 수상한 R 데이터 분석 전체 과정 체험하기!
샤이니 웹 애플리케이션 개발과 배포까지
이 책은 데이터를 분석하는 전체 과정으로 R을 배운다. 실제 공모전이나 국책 사업에 선정된 수준 높은 프로젝트를 기반으로 학습하여 데이터 분석 실무를 체험해 볼 수 있다. 특히 아파트 실거래 분석 과정은 공공데이터포털(data.go.kr)에서 데이터를 자동으로 수집하는 방법부터 전처리, 분석, 시각화를 거쳐 애플리케이션으로 만들어 배포하기까지 전 과정을 자세하게 담았다. R만으로 웹 애플리케이션을 만들 수 있는 샤이니(Shiny) 패키지 사용법도 자세하게 다룬다. 또한 지역별, 요인별 아파트 가격의 상관관계, 한반도 지진 발생, 커피 전문점 접근성, 최적의 버스노선 제시 등 일상생활과 밀접한 분석 주제도 포함하였다. 차별화된 결과물을 상품화하는 방법을 배워 데이터 분석 전문가로 성장하는 데 의미 있는 경험과 통찰을 얻어 보자.
※ 이 책은 PDF 형태로 제공하므로 화면이 작은 단말기(스마트폰)에서는 보기 불편할 수 있습니다. ※
저자소개
데이터 분석가이자 스타트업 대표다. 서울대 환경대학원과 강원대에서 공간 데이터 분석을 공부했으며, 서울연구원과 LH한국토지주택공사 사업팀에서 데이터 분석 실무를 경험했다. 최근에는 대학과 연구 기관에서 부동산 데이터 분석 강의를 진행하고 있다. R과 샤이니를 이용해 애플리케이션을 구축하고 비즈니스 모델을 만드는 데 관심이 있으며, R 데이터 분석가들의 스터디 모임에 참여하고 있다.
- 2020년 중소벤처기업부 예비창업패키지 지원 사업에 ‘부동산 지역 분석 솔루션 개발’ 주제로 선정
- 2019년 LH 한국토지주택공사 제1회 데이터 분석 경진 대회에 ‘최적 시내버스 노선제시’ 부문에 입상
- 2019년 SH 서울주택도시공사의 신진 연구자 지원 사업에 ‘시공간 특성을 고려한 주택 하위시장 분석 플랫폼 구축과 활용’ 주제로 당선
목차
=======================
01 데이터 분석가로 성장하기
=======================
01-1 경쟁력 있는 데이터 분석가 되기
01-2 데이터 분석 환경 만들기
01-3 R 스크립트 실행해 보기
01-4 프로젝트 수행 과정 훑어보기
==========================
02 자료 수집 전에 알아야 할 내용
==========================
02-1 자료는 어디서 구할까?
02-2 API 인증키 얻기
02-3 API에 자료 요청하기
02-4 API 응답 확인하기
=========================
03 자료 수집: API 크롤러 만들기
=========================
03-1 크롤링 준비: 무엇을 준비할까?
03-2 요청 목록 생성: 자료를 어떻게 요청할까?
03-3 크롤러 제작: 자동으로 자료 수집하기
03-4 자료 정리: 자료 통합하기
=====================
04 전처리: 데이터를 알맞게
=====================
04-1 불필요한 정보 지우기
04-2 항목별 데이터 다듬기
04-3 전처리 데이터 저장하기
==========================
05 카카오맵 API로 지오 코딩하기
==========================
05-1 지오 코딩 준비하기
05-2 주소를 좌표로 변환하는 지오 코딩
=======================
06 지오 데이터 프레임 만들기
=======================
06-1 좌표계와 지오 데이터 포맷
06-2 주소와 좌표 결합하기
06-3 지오 데이터프레임 만들기
==========================
07 분석 주제를 지도로 시각화하기
==========================
07-1 어느 지역이 제일 비쌀까?
07-2 요즘 뜨는 지역은 어디일까?
07-3 우리 동네가 옆 동네보다 비쌀까?
=================
08 통계 분석과 시각화
=================
08-1 관심 지역 데이터만 추출하기
08-2 확률 밀도 함수: 이 지역 아파트는 비싼 편일까?
08-3 회귀 분석: 이 지역은 일년에 얼마나 오를까?
08-4 주성분 분석: 이 동네 단지별 특징은 무엇일까?
===============
09 샤이니 입문하기
===============
09-1 처음 만나는 샤이니
09-2 입력과 출력하기
09-3 반응형 웹 애플리케이션 만들기
09-4 레이아웃 정의하기
==============================
10 데이터 분석 애플리케이션 개발하기
==============================
10-1 반응형 지도 만들기
10-2 지도 애플리케이션 만들기
10-3 반응형 지도 애플리케이션 완성하기
10-4 서울시 아파트 실거래 애플리케이션 만들기
====================
11 애플리케이션 배포하기
====================
11-1 배포 준비하기
11-2 샤이니 클라우드에 배포하기
11-3 애플리케이션 이용하기
==========================
12 샤이니 애플리케이션 활용 사례
==========================
12-1 아파트 가격 상관관계 분석하기
12-2 여러 지역 상관관계 비교하기
12-3 지진 발생 분석하기
12-4 커피 전문점 접근성 분석하기
======================
[경진 대회 수상작 소개]
교통 카드 데이터 분석 사례
======================
1. ‘최적 시내버스 노선제시’ 과제 소개
2. 데이터 전처리 1: 지역 정보
3. 데이터 전처리 2: 교통 카드 데이터
4. 기초 분석 1: 노선별·시간대별 이용량
5. 기초 분석 2: 집계구별 이동 특성
6. 교통 흐름 분석 1: 통근 시간대
7. 교통 흐름 분석 2: 비통근 시간대
8. 종합 분석하기
찾아보기