로그인

  • 잠깐! 비회원구입을 원하시나요?!
  • 부크크의 회원가입은 다른 곳의 비회원 구매보다 간단합니다.

회원가입

처음 시작하는 빅데이터 분석 및 활용

0개

|

후기 0

  • 배송일 : 영업일 기준 2-8일 내로 배송됩니다.
  • 환불규정 : 주문 후 인쇄되므로 배송이 준비된 후에는 환불이 불가능합니다
분야기타 > 과학/IT
작가허진경
출판형태종이책
페이지수 588 Pages
인쇄컬러표지-컬러, 내지-흑백
판형 B5
출판사부크크
ISBN979-11-272-4241-1
출판일2018.06.27
총 상품 금액 39,800

저자 소개

저자 허진경은 대학에서 전산을 전공했으며, 석사과정에는 자바를 이용한 영상처리, 박사과정에는 자바를 이용한 분산처리로 박사 학위를 취득하였습니다. 썬마이크로시스템즈 전임강사를 역임했고, 호원대학교 사이버수사경찰학부 교수로 재직했으며 현재 IT 교육 컨설턴트와 기업 IT 전문강사로 활동하고 있습니다.

저자의 강의 분야는 자바, C/C++, HTML5, 웹프로그래밍, XML, 스프링프레임워크, 데이터베이스, Hadoop 클러스터 구축, 빅데이터 분석, R, 파이썬, 머신러닝, 딥러닝 등입니다.

저자는 데이터 사이언티스트 강의를 통해 데이터 분석에 대해 명확한 정의를 내렸습니다. 그리고, 데이터 분석과 머신러닝 그리고 딥러닝 등을 프로젝트와 강의 경험을 기반으로 원리와 현업의 사례를 정확히 전달합니다. 저자는 데이터 분석에 대한 강의 노하우를 이 책을 통해 전달하고자 합니다. '머신러닝', '데이터 분석' 등과 관련된 단어에 관심을 갖는 여러분이라면 이 책을 선택한 것에 대해 후회가 없을 것입니다.

번역자 소개 (번역서인 경우 입력해주세요.)

목차

1장. BigData 분석 환경 구성
1. R 개요
2. 윈도우에 R 설치하기
2.1. 다운로드
2.2. 설치
3. 윈도우에 RStudio 설치하기
3.1. 다운로드
3.2. 설치
3.3. 기본 설정
4. RStudio 실행 및 기본 설정
5. CentOS 7에 R/RStudio 설치

2장. R Language 기초
1. 도움말 기능
1.1. 도움말
1.2. 검색
1.3. 패키지 도움말
1.4. 함수 도움말
1.5. 정보 조회
1.6. 주석과 자동완성
2. 패키지
2.1. 패키지 설치 및 사용
2.2. 패키지 데이터셋 로드
3. 변수
3.1. 선언
3.2. 할당
3.3. 변수 목록조회
4. 출력
4.1. print
4.2. cat
4.3. paste
5. 변수 삭제
6. R 기본 확장자

3장. R 데이터 종류 및 구조
1. R 데이터 종류 및 구조
1.1. R 데이터 종류
2. R 기본 데이터타입
3. 특별한 값들
4. 팩터(Factor)
5. 구조형 변수와 복합형 변수
6. 벡터
6.1. character
6.2. numeric
6.3. logical
6.4. 벡터 연산
6.5. 순서객체를 위한 seq
6.6. 반복객체를 위한 rep
7. 리스트
8. 행렬
9. 배열
10. 데이터 프레임
10.1. 데이터 프레임 생성
10.2. 열 추가 및 삭제
10.3. 열 타입 변경
10.4. 열 이름 변경
10.5. 데이터 테이블 합치기
10.6. 부분 데이터 조회
10.7. 데이터 편집기를 이용한 편집
11. 타입 판별 및 타입 변환
11.1. 타입 확인
11.2. 타입 변환
12. 문자열과 날짜
12.1. 문자열 다루기
12.2. 날짜 다루기
13. 실습 문제
13.1. 데이터 탐색 실습
13.2. 데이터 종류 및 구조 실습

4장. R 프로그래밍
1. 제어문
1.1. 조건문
1.2. 반복문
1.3. 탈출문
2. 연산자
2.1. 산술 연산자
2.2. 관계 연산자
2.3. 벡터의 연산
2.4. 논리 연산자
2.5. 할당 연산자
2.6. 중위 연산자
3. 함수
3.1. 함수 정의 및 사용
3.2. 리턴문
3.3. 가변인자
3.4. 재귀 호출
4. 변수 저장환경과 유효범위
4.1. R 환경
4.2. 유효 범위
5. R 클래스와 객체
5.1. S3 클래스
5.2. S4 클래스
5.3. 참조(Reference) 클래스
5.4. 상속
6. R 프로그래밍 실습

5장. 데이터 전처리
1. 파일 입출력
1.1. 문자셋과 인코딩
1.2. write.table
1.3. read.table
1.4. write.csv
1.5. read.csv
1.6. cat
2. apply 계열 함수와 함수 적용
2.1. apply
2.2. lapply
2.3. sapply
2.4. vapply
2.5. mapply
3. 데이터 그룹화와 함수 적용
3.1. tapply
3.2. by
3.3. doBy 패키지
3.4. formula
4. 데이터 분리
4.1. split
4.2. subset
5. 데이터 합치기
5.1. cbind를 이용한 열 합치기
5.2. rbind를 이용한 행 합치기
5.3. merge를 이용한 데이터 병합
6. 데이터 정렬
6.1. sort
6.2. order
7. 데이터 프레임 이름 생략하기
7.1. with, within
7.2. attach, detach
8. 데이터 집계
8.1. table
8.2. aggregate
9. 조건으로 색인 찾기
9.1. which(), which.max(), which.min()
10. 데이터 전처리 실습

6장. 데이터베이스 이용
1. SQL을 이용한 데이터 처리
1.1. sqldf 패키지
1.2. sqldf 함수
2. RJDBC를 이용한 오라클 데이터베이스 연결
2.1. 패키지 설치 및 로드
2.2. 드라이버 클래스 로드
2.3. 데이터베이스 연결
2.4. 테이블 데이터 조회
2.5. 테이블 데이터 수정
2.6. 데이터베이스 연결 종료
2.7. HR 스키마의 employees 테이블 조회 실습
3. RPostgreSQL을 이용한 PostgreSQL 데이터베이스 연결
3.1. 패키지 설치 및 로드
3.2. 드라이버 로드
3.3. 데이터베이스 연결
3.4. 쿼리문 실행
3.5. 데이터베이스 연결 종료
3.6. 드라이버 언로드
3.7. 데이터베이스 연결 예제코드
4. RMySQL을 이용한 MySQL 데이터베이스 연결
4.1. 패키지 설치 및 로드
4.2. 드라이버 로드
4.3. 데이터베이스 연결
4.4. 쿼리문 실행
4.5. 데이터베이스 연결 종료
4.6. 드라이버 언로드
4.7. 데이터베이스 연결 예제코드
5. 데이터베이스 연결 실습

7장. 데이터 처리성능 향상
1. plyr 패키지
2. 데이터 구조 변경
2.1. 패키지 설치 및 로드
2.2. melt
2.3. cast
3. 데이터 테이블
3.1. 데이터 테이블 개요
3.2. 데이터 부분집합 만들기
3.3. 데이터 집계하기
3.4. 데이터 테이블 요약
4. 데이터 테이블과 키
4.1. Keys
4.2. j와 by를 이용한 키 조합
4.3. mult와 nomatch 인수
4.4. 이진 검색 vs 벡터 검색
4.5. 데이터 테이블에서 키 사용 요약
5. 향상된 반복문 foreach
5.1. foreach
5.2. .combine 옵션
5.3. Iterators
5.4. 병렬 실행
6. 병렬처리
6.1. doParallel
6.2. 패키지 설치 및 로드
6.3. registerDoParallel

8장. 데이터 시각화
1. 시각화 개요
1.1. 시각화를 통한 정보 전달
1.2. 그래프 함수
1.3. 그래프 파라미터
2. 고 수준 그래프 함수
2.1. plot
2.2. barplot
2.3. boxplot
2.4. hist
2.5. curve
2.6. pie
2.7. mosaicplot
2.8. qqnorm
3. 저 수준 그래프 함수
3.1. points
3.2. lines
3.3. abline
3.4. polygon
3.5. text
3.6. segments
3.7. arrows
4. ggplot2 패키지
4.1. 패키지 설치 및 로드
4.2. ggplot2 그래픽 시스템
4.3. ggplot2 구문과 주요 기하 객체 함수
4.4. 산점도 그래프
4.5. 히스토그램
4.6. 막대그래프
4.7. 밀도그래프
4.8. 챠트 분할 출력
4.9. 참고 사이트
5. 기타 시각화 함수
5.1. 산점도 행렬
5.2. 투시도
5.3. 등고선 그래프
5.4. 히트맵
5.5. 평행좌표 그래프
5.6. 스타차트
6. 시각화 실습

9장. 탐색적 데이터 분석
1. 통계 분석
1.1. 용어 정리
1.2. 실험
1.3. 확률 변수와 확률 분포
1.4. 통계적 추론
2. 데이터 탐색
2.1. 차트
2.2. 통계표
2.3. 샘플링
2.4. 분할표
3. 상관 분석
3.1. 피어슨 상관계수
3.2. 스피어만 상관계수
3.3. 독립성 검증
3.4. 적합도 검증
3.5. 유사성 척도
3.6. 다차원척도법
4. 주성분 분석
5. 연습문제

10장. 머신 러닝
1. 머신 러닝 개요
1.1. 머신 러닝 개념
1.2. Tasks
1.3. Performance measure
1.4. Experience
2. 지도학습과 비지도학습
3. 데이터 분석 단계에서 머신러닝

11장. 연관 분석
1. 연관 분석 개요
1.1. 연관 분석
1.2. 연관분석 평가
2. 트랜잭션 데이터
2.1. 트랜잭션 데이터 생성
2.2. 파일로부터 트랜잭션 데이터 생성
2.3. 항목별 상대 빈도수 그래프
3. 연관 분석
3.1. 연관 규칙 탐색
3.2. 연관 규칙 조회
3.3. 연관 분석 평가 측도
3.4. 와인을 구매한 사람은 오렌지주스를 구매할까?
4. 연관규칙 시각화
4.1. arulesViz
4.2. plot(m, method="graph")
4.3. plot(m, method="paracoord")
4.4. plot(m, method="grouped", control=list(k=5))
5. 연관규칙 저장
5.1. 텍스트 파일로 저장
5.2. XML 파일로 저장
6. 연습문제

12장. 예측 분석
1. 예측 분석 개요
2. 회귀 분석
2.1. 회귀 분석 정의
2.2. 회귀분석을 위한 전제 사항
2.3. 회귀 분석을 위한 데이터 샘플 추출
2.4. 회귀 분석에서 가설
2.5. 독립변수 선택
2.6. 분석
2.7. 이상치
3. 회귀분석 평가 그래프
3.1. Residuals vs Fitted
3.2. Normal Q-Q
3.3. Scale-Location
3.4. Residuals vs Leverage
3.5. 회귀분석을 통한 예측
4. 시계열 분석
4.1. 시계열(Time Series)
4.2. 시계열 분석
4.3. 시계열 모형
4.4. 시계열 데이터 변환
4.5. 시계열 분석을 위한 데이터 준비
4.6. 변환(Transformation)
4.7. 차분(Difference)
4.8. ARIMA 모형 결정하기
4.9. Auto Arima 함수를 사용한 ARIMA 모형 결정
4.10. ARIMA 모형으로 미래 데이터 예측
4.11. 분해 시계열

13장. 분류 분석
1. 분류 분석 개요
2. 데이터 분할과 표본 추출
2.1. 데이터 분할
2.2. 표본 추출 방법
3. 분류 모형
3.1. 베이즈 분류
3.2. 로지스틱회귀
3.3. 판별분석 모형
3.4. 인접이웃 분류 모형
3.5. 의사결정 나무
3.6. 인공신경망 모형
3.7. 앙상블 모형
3.8. 서포트 벡터 머신
4. 분류 모형의 평가 측도
4.1. 혼돈 메트릭스
4.2. 모형 평가 측도
14장. 텍스트 마이닝
1. 텍스트 마이닝 개요
2. 코퍼스
2.1. Corpus의 종류
2.2. 코퍼스 생성
2.3. Corpus의 정보 조회
2.4. Corpus를 파일로 저장
2.5. 코퍼스 전처리
2.6. XML 파일로 코퍼스 생성
3. TermDocumentMatrix
3.1. TermDocumentMatrix 생성
3.2. 기본 정보 조회
3.3. 탐색
4. 빈도분석
4.1. 빈도분석
4.2. 워드 클라우드
4.3. 군집분석
5. 한글 형태소 분석
5.1. 자연어 처리
5.2. 형태소
5.3. 형태소 분석
5.4. KoNLP 패키지
15장. 머신러닝 프로젝트
1. 분석 프로젝트 방법론
1.1. KDD
1.2. SEMMA
1.3. CRISP-DM
2. 분석 프로젝트
2.1. 프로젝트 목적
2.2. 데이터 설명
2.3. 데이터 탐색 및 전처리
2.4. 결측치 추정 및 파생변수 추가
2.5. 모델링
2.6. 분류 예측 및 평가
16장. 주요 데이터셋
1. R 주요 데이터셋
2. ChickWeight datasets
3. airquality in datasets
4. iris in datasets
5. VADeaths in datasets
6. AirPassengers in datasets
7. diamonds in ggplot2
8. vintages in kohonen
9. wines in kohonen
10. AdultUCI in arules
11. Adult in arules
12. Exports in googleVis
13. baseball in plyr
14. ttrc in TTR
15. Epub in arules
16. acq in tm

도서 정보

이 책은 데이터 분석을 원하는 분에게 데이터 분석의 필수 내용을 원리와 함께 실전코드까지 설명하고 있습니다. 데이터 분석을 처음 시작하는 사람이 R을 이용해 데이터 분석과 머신러닝을 이용한 분류/예측 분석을 하기 위한 기본 개념부터 실전 내용까지 자세하게 설명하고 있습니다. 이 책 한권이면 데이터 분석을 위한 R 책은 더 이상 필요 없습니다.