updated at 2020-10-20

難易度別AI(人工知能)を独学で学べる書籍

ブーム以降、AIに関しては、大量の本が出版されており、どれを読んで良いのか迷うところです。

中には、売りたいが為に、本の内容を無視して、「ニューラルネットワーク」「入門」「深層学習」等のキーワードを タイトルに無駄に付けている本も有る為、余計に混乱します。

実は、本屋で平積みされているような新しい本より、図書館でも書庫にしまわれているような本に良書が有ったりします。
お金をかけずにAIを学べるお勧めの書籍を紹介します。

ちなみに、AI利用の目的が画像認識であった場合は、勉強不要です。
学習用の画像を用意してGithubのコードを適当にコピペしてくるだけで実用に耐えうる精度が簡単に出せます。
環境を用意するのも面倒であれば、AWSやGCPにアップロードするだけでモデルを作ってくれるクラウドサービスも既にあります。

ちなみに、AI利用の目的が画像認識であった場合は、勉強不要です。
学習用の画像を用意してGithubのコードを適当にコピペしてくるだけで実用に耐えうる精度が簡単に出せます。
環境を用意するのも面倒であれば、AWSやGCPにアップロードするだけでモデルを作ってくれるクラウドサービスも有ります。

  • AIおすすめ書籍 入門編
  • AIおすすめ書籍 中級編
  • AIおすすめ書籍 上級編
  • 機械学習全般に役立つ本
  • 統計学は原文(英文)で学ぶべきなのか?
  • まず、レベルを図るリトマス紙代わりに読む最初の一冊

    ゼロから作るDeepLearning

    種類 : 機械学習
    出版社 : オライリー
    著者 : 斎藤康毅

    種類 : 機械学習
    出版社 : オライリー
    著者 : 斎藤康毅

    1章 Python入門
    2章 パーセプトロン
    3章 ニューラルネットワーク
    4章 ニューラルネットワークの学習
    5章 誤差逆伝播法
    6章 学習に関するテクニック
    7章 畳み込みニューラルネットワーク
    8章 ディープラーニング

    専門書ながら異例の10万部ヒットで記念グッズまで作られた一冊。
    バランスがとれていて一通り網羅しているが、 勾配法や逆伝搬に関しての解説は薄いので、他の書籍を併せて読む必要あり。

    https://www.oreilly.co.jp/books/9784873117584/

    で、これを読んだ結果、

    「だいたい理解できた」
    → 中級編から始める

    「解りません」

    どう解らないか?

    1.なんとなく解りません
    → 入門編から始める。

    2.数式が解りません
    統計学の前に高校数学を勉強し直します。
    数学IIの微分積分、数学Bのベクトルと漸化式(ぜんかしき)、数学IIIの極限と導関数あたりをおさえておけば足ります。
    尚、高校生向けの教材は公式の解き方に特化した試験用のものが多いため、大学生向けの教材をお勧めします。

    3.最後まで読めません
    カエレ(゚д゚)ノ

    AIおすすめ書籍 入門編

    線形代数セミナー ―射影,特異値分解,一般逆行列―

    種類 : 統計学
    出版社 : 共立出版
    著者 : 金谷健一

    種類 : 統計学
    出版社 : 共立出版
    著者 : 金谷 健一

    第1章 線形空間と射影
    第2章 固有値とスペクトル分解
    第3章 特異値と特異値分解
    第4章 一般逆行列
    第5章 連立1次方程式の最小2乗解
    第6章 ベクトルの確率分布
    第7章 空間の当てはめ
    第8章 行列の因子分解

    薄い本(ページ数が)で有りながら、線形代数の理解が進む一冊。

    https://www.kyoritsu-pub.co.jp/bookdetail/9784320113404

    ベイズ推論による機械学習入門

    種類 : 統計学
    出版社 : 講談社
    著者 : 須山敦志

    種類 : 統計学
    出版社 : 講談社
    著者 : 須山敦志

    1 機械学習とベイズ学習
    2 基本的な確率分布
    3 ベイズ推論による学習と予測
    4 混合モデルと近似推論
    5 応用モデルの構築と推論

    機械学習スタートアップシリーズ

    https://www.kspub.co.jp/book/detail/1538320.html

    AIおすすめ書籍 中級編

    ゼロから作るDeepLearning2

    種類 : 機械学習
    出版社 : オライリー
    著者 : 斎藤康毅

    種類 : 機械学習
    出版社 : オライリー
    著者 : 斎藤康毅

    1章 ニューラルネットワークの復習
    2章 自然言語と単語の分散表現
    3章 word2vec
    4章 word2vecの高速化
    5章 リカレントニューラルネットワーク(RNN)
    6章 ゲート付きRNN
    7章 RNNによる文章生成
    8章 Attention

    ゼロから作るシリーズの続編。
    前書で足りなかった箇所を補足しつつ、 リカレントネットワークからAttentionまで理論に沿って踏み込んでいきます。

    https://www.oreilly.co.jp/books/9784873118369/

    PythonとKerasによるディープラーニング

    種類 : 機械学習
    出版社 : マイナビ出版
    著者 : FrancoisChollet、他

    種類 : 機械学習
    出版社 : マイナビ出版
    著者 : FrancoisChollet、他

    Part 1 ディープラーニングの基礎
    1章 ディープラーニングとは何か
    2章 予習:ニューラルネットワークの数学的要素
    3章 入門:ニューラルネットワーク
    4章 機械学習の基礎
    Part 2 ディープラーニングの実践
    5章 コンピュータビジョンのためのディープラーニング
    6章 テキストとシーケンスのためのディープラーニング
    7章 高度なディープラーニングのベストプラクティス
    8章 ジェネレーティブディープラーニング

    TensorFlowのライブラリであるKerasの開発者が執筆した書籍。
    数式ではなくコードでの表現を試みておられます。

    R版もありますが、コード以外、全て同じ内容です。

    https://book.mynavi.jp/ec/products/detail/id=90124

    Pythonではじめる機械学習

    種類 : 機械学習
    出版社 : オライリー
    著者 : AndreasC.Muller、他

    種類 : 機械学習
    出版社 : オライリー
    著者 : AndreasC.Muller、他

    1章 必要なライブラリとツール
    最初のアプリケーション:アイリスのクラス分類
    2章 教師あり学習
    3章 教師なし学習と前処理
    4章 データの表現と特徴量エンジニアリング
    カテゴリ変数、ビニング、離散化、線形モデル、決定木
    5章 モデルの評価と改良
    交差検証 グリッドサーチ 評価基準とスコア
    6章 アルゴリズムチェーンとパイプライン
    7章 テキストデータの処理
    8章 機械学習問題へのアプローチ

    併用による使用頻度がもっとも高いであろうscikit-learnについての解説書。
    理論を一通り理解し、コードを打ってみる段階で読む一冊。

    https://www.oreilly.co.jp/books/9784873117980/

    ガウス過程と機械学習

    種類 : 統計学
    出版社 : 講談社
    著者 : 持橋大地、他

    種類 : 統計学
    出版社 : 講談社
    著者 : 持橋大地、他

    第0章 たった5分でガウス過程法が分かってしまう
    第1章 線形回帰モデル
    第2章 ガウス分布
    第3章 ガウス過程
    第4章 確率的生成モデルとガウス過程
    第5章 ガウス過程の計算法
    第6章 ガウス過程の適用
    第7章 ガウス過程による教師なし学習

    ベイズな回帰モデルの理解に不可欠なガウス過程(無限次元の正規分布)についての一冊。

    https://www.kspub.co.jp/book/detail/1529267.html

    ベイズ深層学習

    種類 : 統計学
    出版社 : 講談社
    著者 : 須山敦志

    種類 : 統計学
    出版社 : 講談社
    著者 : 須山敦志

    第1章 はじめに
    第2章 ニューラルネットワークの基礎
    第3章 ベイズ推論の基礎
    第4章 近似ベイズ推論
    第5章 ニューラルネットワークのベイズ推論
    第6章 深層生成モデル
    第7章 深層学習とガウス過程

    講談社のMLPシリーズ 入門編の次に読む本

    https://www.kspub.co.jp/book/detail/5168707.html

    データ解析のための統計モデリング入門

    種類 : 統計学
    出版社 : 岩波書店
    著者 : 久保拓弥

    種類 : 統計学
    出版社 : 岩波書店
    著者 : 久保拓弥

    1 データを理解するために統計モデルを作る
    2 確率分布と統計モデルの最尤推定
    3 一般化線形モデル(GLM)
    4 GLMのモデル選択
    5 GLMの尤度比検定と検定の非対称性
    6 GLMの応用範囲をひろげる
    7 一般化線形混合モデル(GLMM)
    8 マルコフ連鎖モンテカルロ(MCMC)法とベイズ統計モデル
    9 GLMのベイズモデル化と事後分布の推定
    10 階層ベイズモデル
    11 空間構造のある階層ベイズモデル

    https://www.iwanami.co.jp/book/b257893.html

    データサイエンスのための統計学入門

    種類 : 統計学
    出版社 : オライリー
    著者 : Peter Bruce、他

    種類 : 統計学
    出版社 : オライリー
    著者 : Peter Bruce、他

    1章 探索的データ分析
    位置の推定、2つ以上の変量の探索
    2章 データと標本の分布
    無作為抽出と標本バイアス、ブートストラップ、信頼区間
    3章 統計実験と有意性検定
    仮説検定、統計的有意性とp値、t検定
    4章 回帰と予測
    単回帰、重回帰
    5章 分類
    ナイーブベイズ、判別分析、ロジスティック回帰
    6章 統計的機械学習
    k近傍法、木モデル、バギングとランダムフォレスト、ブースティング
    7章 教師なし学習
    主成分分析、k平均、クラスタリング、階層クラスタリング

    掲載されているコードはRですが、理論が体系的に説明されています。
    尚、タイトルに統計学入門とありますが、明らかに誤りです。

    https://www.oreilly.co.jp/books/9784873118284/

    統計的学習の基礎―データマイニング・推論・予測―

    種類 : 統計学
    出版社 : 共立出版
    著者 : Trevor Hastie、他

    種類 : 統計学
    出版社 : 共立出版
    著者 : Trevor Hastie、他

    第2章 教師あり学習の概要
    第3章 回帰のための線形手法
    第4章 分類のための線形手法
    第5章 基底展開と正則化
    第6章 カーネル平滑化法
    第7章 モデルの評価と選択
    第8章 モデル推論と平均化
    第9章 加法的モデル,木,および関連手法
    第10章 ブースティングと加法的木
    第11章 ニューラルネットワーク
    第12章 サポートベクトルマシンと適応型判別
    第13章 プロトタイプ法と最近傍探索
    第14章 教師なし学習
    第15章 ランダムフォレスト
    第16章 アンサンブル学習
    第17章 無向グラフィカルモデル
    第18章 高次元の問題:p ≫ N

    税抜価格14,000円ですが、世界的に有名な一冊。
    必ず読むべし

    https://www.kyoritsu-pub.co.jp/bookdetail/9784320123625

    自然科学の統計学

    種類 : 統計学
    出版社 : 東京大学出版会
    著者 : 東京大学教養学部統計学教室

    種類 : 統計学
    出版社 : 東京大学出版会
    著者 : 東京大学教養学部統計学教室

    第1章 確率の基礎
    第2章 線形モデルと最小二乗法
    第3章 実験データの分析
    第4章 最尤法
    第5章 適合度検定
    第6章 検定と標本の大きさ
    第7章 分布の仮定
    第8章 質的データの統計的分析
    第9章 ベイズ決定
    第10章 確率過程の基礎
    第11章 乱数の性質

    大学生向け教材。
    古い書籍ながら統計学の応用が解りやすく説明されています。

    http://www.utp.or.jp/book/b300859.html

    機械学習のための特徴量エンジニアリング

    種類 : 機械学習
    出版社 : オライリー
    著者 : AliceZheng、他

    種類 : 機械学習
    出版社 : オライリー
    著者 : AliceZheng、他

    1章 機械学習パイプライン
    2章 数値データの取り扱い
    スカラ/ベクトル/ベクトル空間
    3章 テキストデータの取り扱い
    4章 特徴量スケーリングによる効果
    5章 カテゴリ変数の取り扱い
    6章 次元削減:膨大なデータをPCAで圧縮
    7章 非線形特徴量の生成:k-meansを使ったスタッキング
    8章 特徴量作成の自動化:画像特徴量の抽出と深層学習
    9章 学術論文レコメンドアルゴリズムの構築

    特徴量の抽出や精度向上に着目した一冊。
    基本的なメソッドに留まっているが、ネット上で情報を得るための基礎にはなる。

    https://www.oreilly.co.jp/books/9784873118680/

    AIおすすめ書籍 上級編

    パターン認識と機械学習(上・下)

    種類 : 統計学
    出版社 : 丸善出版
    著者 : Christopher M. Bishop

    種類 : 統計学
    出版社 : 丸善出版
    著者 : ChristopherM.Bishop

    第1章 序論
    確率論、次元の呪い、決定理論
    第2章 確率分布
    第3章 線形回帰モデル
    第4章 線形識別モデル
    第5章 ニューラルネットワーク
    第6章 カーネル法
    第7章 疎な解を持つカーネルマシン
    第8章 グラフィカルモデル
    第9章 混合モデルとEM
    第10章 近似推論法
    第11章 サンプリング法
    第12章 連続潜在変数
    第13章 系列データ
    第14章 モデルの結合

    原書名「Pattern Recognition and Machine Learning」の頭文字をとってPRMLの名称で呼ばれる 「統計的学習の基礎」と並んで有名な必読本。
    上巻は比較的親しみやすい内容になっています。

    著者が本の中身を全て公開してくれている為、PDF版が無償でダウンロードできます。
    原書のタイトルとfiletype:pdfで検索してください。

    https://www.maruzen-publishing.co.jp/item/b294524.html

    情報量規準 (シリーズ・予測と発見の科学)

    種類 : 統計学
    出版社 : 朝倉書店
    著者 : 小西貞則、他

    種類 : 統計学
    出版社 : 朝倉書店
    著者 : 小西貞則、他

    1. 統計的モデリングの考え方
    2. 統計的モデル
    3. 情報量規準
    カルバックーライブラー情報量、情報量規準AIC
    4. 一般化情報量規準GIC
    5. ブートストラップ情報量規準
    6. ベイズ型情報量規準
    7. 様々なモデル評価基準

    「情報量規準」でピンとこなければ、 この本の前に1980年代に発売された「情報量統計学 (情報科学講座 A・5・4) 」を読むことをお勧めします。

    http://www.asakura.co.jp/books/isbn/978-4-254-12782-9/

    ノンパラメトリックベイズ

    種類 : 統計学
    出版社 : 講談社
    著者 : 佐藤一誠

    種類 : 統計学
    出版社 : 講談社
    著者 : 佐藤一誠

    第1章 確率分布に関する基礎知識
    第2章 確率的生成モデルと学習
    第3章 ベイズ推定
    第4章 クラスタリング
    第5章 ノンパラメトリックベイズモデル入門からクラスタリングへの応用
    第6章 構造変化推定への応用
    第7章 因子分析・スパースモデリングへの応用
    第8章 測度論の基礎
    第9章 点過程からみるノンパラメトリックベイズモデル

    https://www.kspub.co.jp/book/detail/1529151.html

    岩波データサイエンスシリーズ

    種類 : 統計学
    出版社 : 岩波書店
    著者 : 岩波データサイエンス刊行委員会

    種類 : 統計学
    出版社 : 岩波書店
    著者 : 岩波データサイエンス刊行委員会
    現在、V6まで発売されています。
  • V1「ベイズ推論とMCMC」
  • V2「自然言語処理」
  • V3「因果推論」
  • V4「地理空間情報処理」
  • V5「スパースモデリング」
  • V6「時系列解析」
  • https://www.iwanami.co.jp/book/b258169.html

    カーネル多変量解析

    種類 : 統計学
    出版社 : 岩波書店
    著者 : 赤穂昭太郎

    種類 : 統計学
    出版社 : 岩波書店
    著者 : 赤穂昭太郎

    第1章 現代の多変量解析とは
    第2章 カーネル多変量解析の仕組み
    第3章 固有値問題を用いたカーネル多変量解析
    第4章 凸計画問題を用いたカーネル多変量解析
    第5章 カーネルの設計
    第6章 カーネルの理論
    第7章 汎化と正則化の理論

    https://www.iwanami.co.jp/book/b257891.html

    機械学習全般に役立つ本

    前処理

    両方ともコードはPythonです。
    データベースの経験があまりない人は、先にSQL(RDBMS)やNoSQLの勉強をしておくとPandasの有難みが解ります。

    Pandasデータ前処理入門
    著者 : 株式会社ロンバート
    https://www.shoeisha.co.jp/book/detail/9784798160672

    Python実践データ分析100本ノック
    著者 : 下山輝昌、他
    https://www.shuwasystem.co.jp/book/9784798058757.html

    一般向けAI書籍

    エンジニアが読む必要性は有りませんが、売れている本なのでAI案件に携わる客が予習がてら読んでたりします。
    話のネタに。

    AIの広報役として、お二人と捉えると、松尾先生はAIの技術も導入の上で課題となっている事柄も正しく認識されていますが、 新井女史は、古い知識を前提として語られているのにも関わらず、断言論調なので、読後にモヤモヤとした気分になります。

    人工知能は人間を超えるか
    著者 : 松尾豊
    https://www.kadokawa.co.jp/product/321410000316/

    AI vs. 教科書が読めない子どもたち
    著者 : 新井紀子
    https://str.toyokeizai.net/books/9784492762394/

    統計学は原文(英文)で学ぶべきなのか?

    SEならば、オライリー等の書籍で触れる変な翻訳は馴染み深いものです。
    翻訳本は、章によって翻訳者が異なるケースも有るため、用語や定義に揺らぎも有り、理解の妨げにもなります。

    しかし、統計学の書籍には論文でしかお目にかからないような単語が多用されている為、 辞書を引きながら時間を書けてでも原文で読むべきなのか迷うところです。

    以下は、「パターン認識と機械学習」から

    For instance, Cox showed that if numerical values are used to represent degrees of belief, then a simple set of axioms encoding common sense properties of such beliefs leads uniquely to a set of rules for manipulating degrees of belief that are equivalent to the sum and product rules of probability.
    This provided the first rigorous proof that probability theory could be regarded as an extension of Boolean logic to situations involving uncertainty .

    これの翻訳は下記のようになっています。

    例えば、Coxは、信念の度合いを数値で表そうとする際、信念に関する常識の性質を公理の単純な度合いで表すと 信念の度合いを操作する法則の集合が一意的に導かれ、それが確率の加法・乗法定理と等価であることを示した。
    これは確率論がブール論理を不確実性を含む場合に拡張したものとみなせることの最初の厳密な証明である。

    文章の難解さは日本語であっても変わらない気がします。

    赤池弘次氏が1973年に発表した赤池情報量規準は世界中の統計の教科書に載っていますが、 この後、日本の統計学や人工知能の研究はデスバレー(死の谷)を迎え、学問として途絶えたようです。
    日本製のAIフレームワークとして期待されたプリファードネットワークスのChainerも2019年12月に開発終了しています。

    新しい技術情報は日本語以外で参照することとなるでしょう。

    中級編の読後以降はネットで情報収集する機会が増える為、用語も最初から英語で馴染んでいた方が手間が少ないです。