上流よりのSEおよび依頼側担当者向けの教本。技術的なことよりもプロジェクト立ち上げ時に必要となる前提知識を教えてくれる。工数計算のとき使用データの前処理に一番時間がかかるという指摘が一番心に響いた。
機械学習においてはモデル構築が最も大変と思われがちですが、多くの場合、前処理の工数に最も時間がかかります。なぜならモデル構築はデータマートさえできれば、学習アルゴリズムを適用するだけで実行できるのに対し、前処理は問題によって適切な加工方法が異なるためです。(Chapter2「機械学習の仕組みを理解しよう」 Lesson15「データと前処理について理解しよう」p59)
前処理例
モデル改善のアプローチ 図表19-1より
前処理の調整:異常値・欠損値処理、スケール変換、次元削減など
(p68)
あとは名寄せを含めた事前のデータ変換処理。
覚えておこうと思った。あとは運用・保守レベルでのモデル見直しについても頭に入れておいたほうがいいなと思った。工数増大が予想されるものに関しては、予防線はちゃんと張っておいたほうがよい。
目次:
Chapter1 これからのビジネスを切り拓く機械学習
Chapter2 機械学習の仕組みを理解しよう
Chapter3 機械学習に必要なリソースを理解しよう
Chapter4 プロジェクトのゴールを定める
Chapter5 プロジェクトの体制を整えよう
Chapter6 プロジェクトの実現可能性を検証する
Chapter7 機械学習システムを実装する
Chapter8 機械学習システムの運用ポイントを学ぼう
Chapter9 成功事例に学ぶ機械学習プロジェクト
韮原祐介
1983 -