BOOK SEARCH
Pythonによるビジネスデータサイエンス 1 データサイエンス入門
笹嶋 宗彦(編)
内容紹介
データの見方の基礎を身につける。サポートサイトにサンプルコードあり。〔内容〕データを見る/関係性を調べる/高度な分析(日本人の米離れ/気温からの売上予測/他)/企業の応用ケース/付録:Anacondaによる環境構築/他
編集部から
本書のサポートサイトは右記をご覧ください。
※本書第1刷の「まえがき」記載のサポートサイトURLに誤りがありました。謹んで訂正いたします。
誤 https://github.com/asakura_data_science/introduction
正 https://github.com/asakura-data-science/introduction
目次
1. データを見てみよう
1.1 学びの場と実践の現場の違い
1.2 あるデータ分析の流れ
2. データを要約すると何が見えてくる?
2.1 データを代表する値
2.1.1 平均
2.1.2 中央値
2.1.3 最頻値
2.1.4 外れ値
2.1.5 平均からいえること,言えないこと
2.2 データのばらつきを表す尺度
2.2.1 分散
2.2.2 標準偏差
2.3 四分位数と箱ひげ図
2.3.1 四分位数
2.3.2 箱ひげ図
2.4 まとめ
3. 関係性を調べる
3.1 データの相対的な関係
3.1.1 変動係数
3.1.2 Zスコア
3.1.3 偏差値
3.2 相関
3.2.1 牛肉をよく買う地域では豚肉や鶏肉もよく買われるのか?
3.2.2 相関係数と共分散
3.2.3 相関関係と因果関係
3.2.4 データがグループに分かれる場合
3.2.5 直線的ではないような相関関係
3.2.6 散布図行列
4. より高度な分析1:日本人の米離れは本当か?
4.1 オープンデータを使ってみよう
4.2 米の消費支出は減少しているの?
4.3 来年はどうなるの?
4.3.1 移動平均法を用いた傾向の可視化
4.3.2 指数平滑法を用いた予測モデルの構築
4.4 まとめ
5. より高度な分析2:気温から売り上げを予測する
5.1 線形単回帰の概要
5.2 線形単回帰の数学的説明
5.3 線形回帰による気温からの売り上げ予測
5.4 Pythonによる回帰
6. より高度な分析3:食べ物の好みで都道府県を分類する
6.1 クラスタリングとは
6.2 k-means
6.2.1 k-meansの概要
6.2.2 k-meansによるクラスタリングと結果の分析
6.2.3 パラメータの決め方
6.3 階層的クラスタリング
6.4 Pythonによるクラスタリング
7. 企業の応用ケース
7.1 あなたの好みの寿司ネタは?(スシロー:地域別に有効なキャンペーンの分析)
7.1.1 スシローの紹介
7.1.2 スシローを支えるITシステム
7.1.3 スシローのすしランキング
7.1.4 スシローの経営へのフィードバック
7.2 サテライトオフィスの立地戦略(ザイマックスグループ)
7.2.1 ZXYワーク事業の概要
7.2.2 ZXYワークにおけるデータ分析
7.2.3 新規拠点開設の検討に活かされるデータ分析1:公的統計データを用いたデモグラフィック分析
7.2.3 新規拠点開設の検討に活かされるデータ分析2:既存拠点の混雑緩和を目的とした新規開設立地の評価
7.2.5 企業の意思決定のためにデータを分析し視覚化する意義
A. 本書のプログラムを実行する環境の構築
A.1 Anacondaによる環境構築
執筆者紹介
[シリーズ監修者]
加藤直樹(兵庫県立大学情報科学研究科/社会情報科学部教授)
[編集者]
笹嶋宗彦(兵庫県立大学情報科学研究科/社会情報科学部教授)
[執筆者]
石橋 健(兵庫県立大学情報科学研究科/社会情報科学部教授)
石原健司(ザイマックス不動産総合研究所)
大島裕明(兵庫県立大学情報科学研究科/社会情報科学部教授)
加藤直樹(兵庫県立大学情報科学研究科/社会情報科学部教授)
川井康平(ザイマックス不動産総合研究所)
川嶋宏彰(兵庫県立大学情報科学研究科/社会情報科学部教授)
小林篤司(スシローグローバルホールディングス)
笹嶋宗彦(兵庫県立大学情報科学研究科/社会情報科学部教授)
山本岳洋(兵庫県立大学情報科学研究科/社会情報科学部教授)
湯本高行(兵庫県立大学情報科学研究科/社会情報科学部教授)
※所属は刊行当時