사회과학 연구를 위한 통계분석의 개념과 실제를 다루는 책이다. 통계의 기초개념들을 원론적으로 다루고자 노력하였다. 빈도분석과 다중응답분석, x2검증, t-검증, 일원분산분석, 이원분산분석, 공분산분석, 반복측정, 혼합설계 분산분석과 같은 차이검증 분야를 배울 수 있도록 구성하였다.
통계학을 쉽게 이해하도록 집필한 교재다. 먼저 기본적이고 중요한 개념을 설명하고, 설명에 따른 예제를 다루었다. 중요 장마다 그 장에서 다룬 내용을 혼자서도 실습을 할 수 있도록 본문에서 다룬 예제를 간단한 Excel 설명과 함께 다시 설명하였다.
딥러닝, 머신러닝, 인공지능 등 데이터사이언스 분야에서 그 역할을 확장하고 있는 통계용 언어인 Python을 사용하였다. 본 교재는 각 장의 뒷부분에 해당 장에서 언급된 통계 기법들을 통계패키지 Python을 이용하여 실습할 수 있는 실습 문제들을 실었다.
통계학 기초 수준의 이론적 내용과 통계 프로그래밍 언어 R 및 python의 명령문과 결과를 함께 수록한 교재이다. 개정판에서는 R과 python 명령문을 추가하여 학생들이 통계 이론적인 내용을 프로그래밍 실습을 통해 좀 더 쉽게 이해할 수 있도록 제작하였다.
사전 통계 지식 없이도 통계적 사고의 핵심원리를 이해하고 이를 자신의 연구에 적용할 수 있도록 해줄 책이다. 이 책은 통계 분석 과정을 단계별로 안내하고, 언어 데이터를 분석하고 시각화하는 데 통계 기법을 어떻게 사용할 수 있는지에 대한 다양한 예시를 제공한다.
필요한 내용만 가볍게 공부하면 시간을 절약할 수 있을 것 같지만, 언젠가는 그 대가를 치러야 하는 것을 우리는 자주 경험하게 된다. 따라서 공부는 시작부터 어느 정도 깊이 있게 하는 것이 좋다. 이 책은 그러한 필요에 부응하여 기초부터 자세히 설명하면서 필요한 부분은 심화 내용을 담아내려고 노력하였다.
일련의 예제들을 통하여 회귀분석에 관련된 주요 개념과 사용 가능한 기법, 그리고 분석의 결과를 서술하는 방식으로 이 분석이 지니는 내용 전반을 소개하는 책이다. 번역서에는 모든 결과(그림 및 표의 내용)들을 얻을 수 있는 R 코드를 꼼꼼하게 제시하였다.
전체 내용을 49일 동안 하루하루 공부할 분량으로 분류하여 집필하였다. 이 책에서 정해놓은 하루치 분량만큼만 매일매일 읽고, 제시된 예제를 풀이하고, 데이터를 다루기만 하면, 7주 후에는 확률과 통계, 그리고 데이터 분석에 자신감을 얻은 자신을 발견할 것이다.
최근의 빅데이터 환경에 대해 살펴보고 데이터 처리, 데이터 분석, 시각화 기법 등을 활용할 수 있는 능력을 배양하는 데 도움을 주고자 하는 목적으로 집필된 교재다. 이를 위하여 Microsoft EXCEL의 고급 기능(powerful tools)을 이용하여 데이터를 활용할 수 있는 방법을 소개한다.
수학과 컴퓨팅이 데이터 과학에서 중요한 두 요소라는 것이 저자의 소신이다. 낮은 수준에서부터도 수학적으로 접근하는 태도가 데이터 과학을 학습하고 전개함에 있어 중요하다. 컴퓨팅도 수학 못지않게 중요하다. 사용자 코딩을 해봐야 자신의 이해가 확실한지를 알 수 있다.
GDP(Gross Domestic Product, 국내총생산)와 BOP(Balance of Payment, 국제수지)를 보다 잘 이해하고자 할 때 필요한 배경지식을 차근차근 살펴보는 책이다. 제1장에서 GDP와 BOP의 기본 개념과 각 통계의 구성, 여타 국민계정과의 관계를 살펴보았다.
SPSS의 결과를 엑셀로 풀어 썼다. 중학 수준의 수학으로 설명하였고, 엑셀의 새로운 함수체계로 설명하였다. 어렵다고 판단되는 통계공식과 개념은 시각화하였으며, 확률론 및 확률분포에 대한 논의는 최소화하였다.
통계적 계산의 기초 개념을 살펴볼 수 있는 내용으로 구성된 교재다. 1장에서는 통계적 기법의 기본인 난수의 생성과 활용에 대해, 2장에서는 확률적 분포와 그에 따르는 난수들에 대해 다루었다. 3장에서는 수치적 계산의 통계적 기법인 몬테카를로 적분 및 추론에 대해 다루었다.
데이터 과학에서 시간에 따른 변화 패턴을 분석하여 다양한 예측 모델을 구축하면, 미래 예측은 물론 다양한 의사결정에 도움이 된다. 이 책에서는 파이썬 코드로 완벽하게 작동하는 시계열 예측 방법을 소개한다. 시계열 데이터를 정의하고, 베이스라인 모델을 개발하고, 통계적 모델과 텐서플로 및 최신 딥러닝 도구를 사용하여 대규모 모델 구축 방법을 학습하고, 자동화된 예측 라이브러리까지 다룬다.