
データサイエンス力を強化したい
実験計画、データ分析方法の問題
データサイエンスワークショップの実施例
【第1回】 導入
・技術者に求められる判断:差はある? 試験後変化した?
【第2回】 重回帰分析1
・パン焼き上がり重量の条件出し
【第3回】 重回帰分析2
・コーヒー濃さの条件出し
【第4回】 実験計画1
・OFAT(One Factor At Time)実験と実験計画
・決定的スクリーニング計画DSD
【第5回】 差異の有無や変化の有無の判定方法
【第6回】 原因分析
・冷蔵庫塗装不良、電子部品A、鋳造不良
・タイタニック号の死亡者は性別、客室クラスで異なるか否か
【第7回】 サイレントチェンジの発見方法と寿命劣化予測
【第8回】 信頼性予測1
・将来の返品数を予測する
【第9回】 寿命予測:寿命試験による故障率・故障モードの推定
【第10回】 信頼性予測2
・バグ収束状況の判定と複数要因の信頼性予測
【第11回】 実験計画1
・繰り返しのあるデータの解析方法とロバスト設計手法
【第12回】 実験計画2
・交絡診断、検出力診断、拡張の方法
【第13回】 実験計画3
・カスタム計画、古典的スクリーニング計画、 L18の交絡問題
【第14回】 最小2乗法を直感的に理解する
【第15回】 交互作用と交絡を理解する
【第16回】 層別の重要性と層別のノウハウ
【第17回】 テキストマイニングによる品質傾向分析
・クルマのリコールの分析(メーカによるリコール内容の差異分析)
・不具合報告書の分析による不具合傾向の可視化
データサイエンスの落とし穴
【1】交互作用と交絡
•温度が関係する実験は交互作用がある
•交互作用があると主効果に影響を与える
•交互作用を予測できる実験計画が必要
•実験計画には交絡がつきもの(例えばL18)
•自己流実験には交絡がつきもの
•交絡は主効果の予測をあいまいにする
•交絡の少ない決定的スクリーンニング計画

【2】平均主義と2変量主義
•繰り返しのある実験は生データを使う
•安易に平均値で分析してはならない
•2変量実験で多変量を解析してはならない
•多変量の実験は適切な実験計画を使う
•実験計画作成と解析は統計ソフトを活用
【3】統計的に有意、でも・・
•統計的に有意な差や変化に注目する
・・・・しかし・・・・

•統計的に有意な変量でも実務的には無視すべきことがある
•2変量実験で多変量を解析してはならない
•有意ではない変量が層別することで有意に変わることがある
•有意ではない変量でも交互作用が有意なことがある(親子関係に従わないケース)
生産データ分析のコツ
■製造不良の 原因究明
■条件出しがうまく行かない
■現場のデータ解析のコツを知りたい
•前処理はなぜ必要か
•変数選択やスクリーニングはなぜ必要か
•型番やロット番号の前処理はなぜ必要か
•季節や週による変動発見のコツ
•解析手法の使い分けのコツ
•交互作用の発見とモデル構築のコツ

•不良の多い 型番や装置を発見するコツ
•層別分析のコツ