updated at 2021-11-17
ブーム以降、AIに関しては、大量の本が出版されており、どれを読んで良いのか迷うところです。
中には、売りたいが為に、本の内容を無視して、「ニューラルネットワーク」「入門」「深層学習」等のキーワードを タイトルに無駄に付けている本も有る為、余計に混乱します。
実は、本屋で平積みされているような新しい本より、図書館でも書庫にしまわれているような本に良書が有ったりします。
お金をかけずにAIを学べるお勧めの書籍を紹介します。
ちなみに、AI利用の目的が画像認識であった場合は、勉強不要です。
学習用の画像を用意してGithubのコードを適当にコピペしてくるだけで実用に耐えうる精度が簡単に出せます。
環境を用意するのも面倒であれば、AWSやGCPにアップロードするだけでモデルを作ってくれるクラウドサービスも有ります。
まず、レベルを図るリトマス紙代わりに読む最初の一冊
種類 : 機械学習 |
出版社 : オライリー |
著者 : 斎藤康毅 |
種類 : 機械学習
1章 Python入門
2章 パーセプトロン
3章 ニューラルネットワーク
4章 ニューラルネットワークの学習
5章 誤差逆伝播法
6章 学習に関するテクニック
7章 畳み込みニューラルネットワーク
8章 ディープラーニング
専門書ながら異例の10万部ヒットで記念グッズまで作られた。
バランスがとれていて一通り網羅しているが、
勾配法や逆伝搬に関しての解説は薄いので、他の書籍を併せて読む必要あり。
https://www.oreilly.co.jp/books/9784873117584/
で、これを読んだ結果、
「だいたい理解できた」
→ 中級編から始める
「解りません」
どう解らないか?
1.なんとなく解りません
→ 入門編から始める。
2.数式が解りません
統計学の前に高校数学を勉強し直します。
数学IIの微分積分、数学Bのベクトルと漸化式(ぜんかしき)、数学IIIの極限と導関数あたりをおさえておけば足ります。
尚、高校生向けの教材は公式の解き方に特化した試験用のものが多いため、大学生向けの教材をお勧めします。
(「理系の為の~」や「大学1年生~」のようなタイトルが付けられた数学本です。)
3.最後まで読めません
カエレ(゚д゚)ノ
種類 : 統計 |
出版社 : ソシム |
著者 : 江崎貴裕 |
第1章 データ分析と数理モデル
第2章 数理モデルの構成要素・種類
第3章 少数の方程式によるモデル
第4章 少数の微分方程式によるモデル
第5章 確率モデル
第6章 統計モデル
第7章 時系列モデル
第8章 機械学習モデル
第9章 強化学習モデル
第10章 多体系モデル・エージェントベースモデル
第11章 モデルを決めるための要素
第12章 モデルを設計する
第13章 パラメータを推定する
第14章 モデルを評価する
全ページカラーで図も多く、膨大な統計学の全体像を広く浅く掴めます。
また、基礎中の基礎で有りながら省かれていることが多いモデリングについて、ページ数を割いて丁寧に解説されています。
https://www.socym.co.jp/book/1249
種類 : 統計学 |
出版社 : 共立出版 |
著者 : 金谷健一 |
第1章 線形空間と射影
第2章 固有値とスペクトル分解
第3章 特異値と特異値分解
第4章 一般逆行列
第5章 連立1次方程式の最小2乗解
第6章 ベクトルの確率分布
第7章 空間の当てはめ
第8章 行列の因子分解
薄い本(ページ数が)で有りながら、線形代数の理解が進む一冊。
https://www.kyoritsu-pub.co.jp/bookdetail/9784320113404
種類 : 実用 |
出版社 : オライリー |
著者 : 有賀康顕 |
1章 機械学習プロジェクトのはじめ方
2章 機械学習で何ができる?
3章 学習結果を評価しよう
4章 システムに機械学習を組み込む
5章 学習のためのリソースを収集しよう
6章 効果検証
7章 映画の推薦システムをつくる
8章 Kickstarterの分析、機械学習を使わないという選択肢
9章 Uplift Modelingによるマーケティング資源の効率化
AIシステム立案からデータの集め方やWebシステムに組み込んで運用して行くまでを
広く浅く抑えてます。
実装する人より提案する立場の向きにお勧め
https://www.oreilly.co.jp/books/9784873118253/
種類 : 統計学 |
出版社 : 講談社 |
著者 : 須山敦志 |
1 機械学習とベイズ学習
2 基本的な確率分布
3 ベイズ推論による学習と予測
4 混合モデルと近似推論
5 応用モデルの構築と推論
機械学習スタートアップシリーズ
https://www.kspub.co.jp/book/detail/1538320.html
種類 : 機械学習 |
出版社 : オライリー |
著者 : 斎藤康毅 |
1章 ニューラルネットワークの復習
2章 自然言語と単語の分散表現
3章 word2vec
4章 word2vecの高速化
5章 リカレントニューラルネットワーク(RNN)
6章 ゲート付きRNN
7章 RNNによる文章生成
8章 Attention
ゼロから作るシリーズの続編。
前書で足りなかった箇所を補足しつつ、
リカレントネットワークからAttentionまで理論に沿って踏み込んでいきます。
https://www.oreilly.co.jp/books/9784873118369/
種類 : 機械学習 |
出版社 : マイナビ出版 |
著者 : FrancoisChollet、他 |
Part 1 ディープラーニングの基礎
1章 ディープラーニングとは何か
2章 予習:ニューラルネットワークの数学的要素
3章 入門:ニューラルネットワーク
4章 機械学習の基礎
Part 2 ディープラーニングの実践
5章 コンピュータビジョンのためのディープラーニング
6章 テキストとシーケンスのためのディープラーニング
7章 高度なディープラーニングのベストプラクティス
8章 ジェネレーティブディープラーニング
TensorFlowのライブラリであるKerasの開発者が執筆した書籍。
数式ではなくコードでの表現を試みておられます。
R版もありますが、コード以外、全て同じ内容です。
https://book.mynavi.jp/ec/products/detail/id=90124
種類 : 機械学習 |
出版社 : オライリー |
著者 : AndreasC.Muller、他 |
1章 必要なライブラリとツール
最初のアプリケーション:アイリスのクラス分類
2章 教師あり学習
3章 教師なし学習と前処理
4章 データの表現と特徴量エンジニアリング
カテゴリ変数、ビニング、離散化、線形モデル、決定木
5章 モデルの評価と改良
交差検証 グリッドサーチ 評価基準とスコア
6章 アルゴリズムチェーンとパイプライン
7章 テキストデータの処理
8章 機械学習問題へのアプローチ
併用による使用頻度がもっとも高いscikit-learnについての解説書。
理論を一通り理解し、コードを打ってみる段階で読む本。
https://www.oreilly.co.jp/books/9784873117980/
種類 : 統計学 |
出版社 : 講談社 |
著者 : 持橋大地、他 |
第0章 たった5分でガウス過程法が分かってしまう
第1章 線形回帰モデル
第2章 ガウス分布
第3章 ガウス過程
第4章 確率的生成モデルとガウス過程
第5章 ガウス過程の計算法
第6章 ガウス過程の適用
第7章 ガウス過程による教師なし学習
ベイズ回帰モデルの理解に不可欠なガウス過程(無限次元の正規分布)について。
難解な概念なのに、2次元グリットに配置した基底関数の形状をムーミンのニョロニョロに例えたような解説が有ったりして抜け感ある一冊。
https://www.kspub.co.jp/book/detail/1529267.html
種類 : 統計学 |
出版社 : 講談社 |
著者 : 須山敦志 |
第1章 はじめに
第2章 ニューラルネットワークの基礎
第3章 ベイズ推論の基礎
第4章 近似ベイズ推論
第5章 ニューラルネットワークのベイズ推論
第6章 深層生成モデル
第7章 深層学習とガウス過程
講談社のMLPシリーズ 入門編の次に読む本
https://www.kspub.co.jp/book/detail/5168707.html
種類 : 統計学 |
出版社 : 岩波書店 |
著者 : 久保拓弥 |
種類 : 統計学
1 データを理解するために統計モデルを作る
2 確率分布と統計モデルの最尤推定
3 一般化線形モデル(GLM)
4 GLMのモデル選択
5 GLMの尤度比検定と検定の非対称性
6 GLMの応用範囲をひろげる
7 一般化線形混合モデル(GLMM)
8 マルコフ連鎖モンテカルロ(MCMC)法とベイズ統計モデル
9 GLMのベイズモデル化と事後分布の推定
10 階層ベイズモデル
11 空間構造のある階層ベイズモデル
https://www.iwanami.co.jp/book/b257893.html
種類 : 統計学 |
出版社 : オライリー |
著者 : Peter Bruce、他 |
1章 探索的データ分析
位置の推定、2つ以上の変量の探索
2章 データと標本の分布
無作為抽出と標本バイアス、ブートストラップ、信頼区間
3章 統計実験と有意性検定
仮説検定、統計的有意性とp値、t検定
4章 回帰と予測
単回帰、重回帰
5章 分類
ナイーブベイズ、判別分析、ロジスティック回帰
6章 統計的機械学習
k近傍法、木モデル、バギングとランダムフォレスト、ブースティング
7章 教師なし学習
主成分分析、k平均、クラスタリング、階層クラスタリング
掲載されているコードはRですが、理論が体系的に説明されています。
尚、タイトルに統計学入門とありますが、明らかに誤りです。
https://www.oreilly.co.jp/books/9784873118284/
種類 : 統計学 |
出版社 : 共立出版 |
著者 : Trevor Hastie、他 |
第2章 教師あり学習の概要
第3章 回帰のための線形手法
第4章 分類のための線形手法
第5章 基底展開と正則化
第6章 カーネル平滑化法
第7章 モデルの評価と選択
第8章 モデル推論と平均化
第9章 加法的モデル,木,および関連手法
第10章 ブースティングと加法的木
第11章 ニューラルネットワーク
第12章 サポートベクトルマシンと適応型判別
第13章 プロトタイプ法と最近傍探索
第14章 教師なし学習
第15章 ランダムフォレスト
第16章 アンサンブル学習
第17章 無向グラフィカルモデル
第18章 高次元の問題:p ≫ N
税抜価格14,000円ですが、世界的に有名な統計学のバイブル。
必ず読むべし
https://www.kyoritsu-pub.co.jp/bookdetail/9784320123625
種類 : 統計学 |
出版社 : 東京大学出版会 |
著者 : 東京大学教養学部統計学教室 |
第1章 確率の基礎
第2章 線形モデルと最小二乗法
第3章 実験データの分析
第4章 最尤法
第5章 適合度検定
第6章 検定と標本の大きさ
第7章 分布の仮定
第8章 質的データの統計的分析
第9章 ベイズ決定
第10章 確率過程の基礎
第11章 乱数の性質
大学生向け教材。
古い書籍ながら統計学の応用が解りやすく説明されています。
http://www.utp.or.jp/book/b300859.html
種類 : 機械学習 |
出版社 : オライリー |
著者 : AliceZheng、他 |
1章 機械学習パイプライン
2章 数値データの取り扱い
スカラ/ベクトル/ベクトル空間
3章 テキストデータの取り扱い
4章 特徴量スケーリングによる効果
5章 カテゴリ変数の取り扱い
6章 次元削減:膨大なデータをPCAで圧縮
7章 非線形特徴量の生成:k-meansを使ったスタッキング
8章 特徴量作成の自動化:画像特徴量の抽出と深層学習
9章 学術論文レコメンドアルゴリズムの構築
特徴量の抽出や精度向上に着目した一冊。
基本的なメソッドに留まっていますが、ネットで検索しながら勉強できる基礎に身に付きます。
https://www.oreilly.co.jp/books/9784873118680/
種類 : 機械学習 |
出版社 : オライリー |
著者 : Aurélien Géron |
1章 機械学習の現状
2章 エンドツーエンドの機械学習プロジェクト
3章 分類
4章 モデルの訓練
5章 サポートベクトルマシン(SVM)
6章 決定木
7章 アンサンブル学習とランダムフォレスト
8章 次元削減
9章 教師なし学習のテクニック
10章 人工ニューラルネットワークとKerasの初歩
11章 深層ニューラルネットワークの訓練
12章 TensorFlowで作るカスタムモデルとその訓練
13章 TensorFlowによるデータのロードと前処理
14章 畳み込みニューラルネットワークを使った深層コンピュータビジョン
15章 RNNとCNNを使ったシーケンスの処理
16章 RNNと注意機構による自然言語処理
17章 オートエンコーダとGANを使った表現学習と生成型学習
18章 強化学習
19章 大規模なTensorFlowモデルの訓練とデプロイ
精度の向上を模索している段階で役立つ700ページ超の実用書。
Keras(tensorflow)コンポーネントのカスタマイズ方法他、機械学習プロジェクトチェックリストや自動微分の解説が載った巻末付録までも為になる保存版。
https://www.oreilly.co.jp/books/9784873119281/
種類 : 統計学 |
出版社 : 丸善出版 |
著者 : Christopher M. Bishop |
第1章 序論
確率論、次元の呪い、決定理論
第2章 確率分布
第3章 線形回帰モデル
第4章 線形識別モデル
第5章 ニューラルネットワーク
第6章 カーネル法
第7章 疎な解を持つカーネルマシン
第8章 グラフィカルモデル
第9章 混合モデルとEM
第10章 近似推論法
第11章 サンプリング法
第12章 連続潜在変数
第13章 系列データ
第14章 モデルの結合
原書名「Pattern Recognition and Machine Learning」の頭文字をとってPRMLの名称で呼ばれる
「統計的学習の基礎」と並んで有名な必読本。
上巻は比較的親しみやすい内容になっています。
著者が本の中身を全て公開してくれている為、PDF版が無償でダウンロードできます。
原書のタイトルとfiletype:pdfで検索してください。
https://www.maruzen-publishing.co.jp/item/b294524.html
種類 : 統計学 |
出版社 : 朝倉書店 |
著者 : 小西貞則、他 |
1. 統計的モデリングの考え方
2. 統計的モデル
3. 情報量規準
カルバックーライブラー情報量、情報量規準AIC
4. 一般化情報量規準GIC
5. ブートストラップ情報量規準
6. ベイズ型情報量規準
7. 様々なモデル評価基準
「情報量規準」でピンとこなければ、 この本の前に1980年代に発売された「情報量統計学 (情報科学講座 A・5・4) 」を読むことをお勧めします。
http://www.asakura.co.jp/books/isbn/978-4-254-12782-9/
種類 : 統計学 |
出版社 : 講談社 |
著者 : 佐藤一誠 |
種類 : 統計学
第1章 確率分布に関する基礎知識
第2章 確率的生成モデルと学習
第3章 ベイズ推定
第4章 クラスタリング
第5章 ノンパラメトリックベイズモデル入門からクラスタリングへの応用
第6章 構造変化推定への応用
第7章 因子分析・スパースモデリングへの応用
第8章 測度論の基礎
第9章 点過程からみるノンパラメトリックベイズモデル
https://www.kspub.co.jp/book/detail/1529151.html
種類 : 統計学 |
出版社 : 岩波書店 |
著者 : 岩波データサイエンス刊行委員会 |
https://www.iwanami.co.jp/book/b258169.html
種類 : 統計学 |
出版社 : 岩波書店 |
著者 : 赤穂昭太郎 |
第1章 現代の多変量解析とは
第2章 カーネル多変量解析の仕組み
第3章 固有値問題を用いたカーネル多変量解析
第4章 凸計画問題を用いたカーネル多変量解析
第5章 カーネルの設計
第6章 カーネルの理論
第7章 汎化と正則化の理論
https://www.iwanami.co.jp/book/b257891.html
両方ともコードはPythonです。
データベースの経験があまりない人は、先にSQL(RDBMS)やNoSQLの勉強をしておくとPandasの有難みが解ります。
Pandasデータ前処理入門
著者 : 株式会社ロンバート
https://www.shoeisha.co.jp/book/detail/9784798160672
Python実践データ分析100本ノック
著者 : 下山輝昌、他
https://www.shuwasystem.co.jp/book/9784798058757.html
エンジニアが読む必要性は有りませんが、売れている本なのでAI案件に携わる客が予習がてら読んでたりします。
話のネタに。
AIの広報役として、お二人と捉えると、松尾先生はAIの技術も導入の上で課題となっている事柄も正しく認識されていますが、 新井女史は、古い知識を前提として語られているのにも関わらず、断言論調なので、読後にモヤモヤとした気分になります。
人工知能は人間を超えるか
著者 : 松尾豊
https://www.kadokawa.co.jp/product/321410000316/
AI vs. 教科書が読めない子どもたち
著者 : 新井紀子
https://str.toyokeizai.net/books/9784492762394/
SEならば、オライリー等の書籍で触れる変な翻訳は馴染み深いものです。
翻訳本は、章によって翻訳者が異なるケースも有るため、用語や定義に揺らぎも有り、理解の妨げにもなります。
しかし、統計学の書籍には論文でしかお目にかからないような単語が多用されている為、 辞書を引きながら時間を書けてでも原文で読むべきなのか迷うところです。
以下は、「パターン認識と機械学習」から
For instance, Cox showed that if numerical values are used to
represent degrees of belief, then a simple set of axioms encoding common sense
properties of such beliefs leads uniquely to a set of rules for manipulating degrees of
belief that are equivalent to the sum and product rules of probability.
This provided the first rigorous proof that probability theory could be regarded as an extension of
Boolean logic to situations involving uncertainty .
これの翻訳は下記のようになっています。
例えば、Coxは、信念の度合いを数値で表そうとする際、信念に関する常識の性質を公理の単純な度合いで表すと
信念の度合いを操作する法則の集合が一意的に導かれ、それが確率の加法・乗法定理と等価であることを示した。
これは確率論がブール論理を不確実性を含む場合に拡張したものとみなせることの最初の厳密な証明である。
文章の難解さは日本語であっても変わらない気がします。
赤池弘次氏が1973年に発表した赤池情報量規準は世界中の統計の教科書に載っていますが、
この後、日本の統計学や人工知能の研究はデスバレー(死の谷)を迎え、学問として途絶えたようです。
日本製のAIフレームワークとして期待されたプリファードネットワークスのChainerも2019年12月に開発終了しています。
新しい技術情報は日本語以外で参照することとなるでしょう。
中級編の読後以降はネットで情報収集する機会が増える為、用語も最初から英語で馴染んでいた方が手間が少ないです。
よく読まれてる記事