韮原祐介『いちばんやさしい機械学習プロジェクトの教本人気講師が教える仕事にAIを導入する方法』（2018）

上流よりのSEおよび依頼側担当者向けの教本。技術的なことよりもプロジェクト立ち上げ時に必要となる前提知識を教えてくれる。工数計算のとき使用データの前処理に一番時間がかかるという指摘が一番心に響いた。

機械学習においてはモデル構築が最も大変と思われがちですが、多くの場合、前処理の工数に最も時間がかかります。なぜならモデル構築はデータマートさえできれば、学習アルゴリズムを適用するだけで実行できるのに対し、前処理は問題によって適切な加工方法が異なるためです。（Chapter2「機械学習の仕組みを理解しよう」　Lesson15「データと前処理について理解しよう」p59）

前処理例

モデル改善のアプローチ　図表19-1より
前処理の調整：異常値・欠損値処理、スケール変換、次元削減など
（p68）

あとは名寄せを含めた事前のデータ変換処理。

覚えておこうと思った。あとは運用・保守レベルでのモデル見直しについても頭に入れておいたほうがいいなと思った。工数増大が予想されるものに関しては、予防線はちゃんと張っておいたほうがよい。

book.impress.co.jp

目次：
Chapter1　これからのビジネスを切り拓く機械学習
Chapter2　機械学習の仕組みを理解しよう
Chapter3　機械学習に必要なリソースを理解しよう
Chapter4　プロジェクトのゴールを定める
Chapter5　プロジェクトの体制を整えよう
Chapter6　プロジェクトの実現可能性を検証する
Chapter7　機械学習システムを実装する
Chapter8　機械学習システムの運用ポイントを学ぼう
Chapter9　成功事例に学ぶ機械学習プロジェクト

韮原祐介
1983 -

読書三昧（仮免）　禹歩の痛痒アーカイブ

乱読中年、中途と半端を生きる

韮原祐介『いちばんやさしい機械学習プロジェクトの教本人気講師が教える仕事にAIを導入する方法』（2018）