この記事では『仮説検定』について「だいたい分かった!」を目指します。
まず仮説検定とセットで使われる言葉としてこちらを先に覚えましょう。
cor博士
まずどんな使われ方をするか見てみよう
例えばこんな使われ方
corサルくん
社長に言われてキャンペーンメールを会員に送ったんだ。何人かは商品を買ってくて反応があったんだけど、これってキャンペーンメールの効果なのかな?先輩には偶然じゃないのかちゃんと検証しろと言われたんだけどどうやればいいのか分からないよ〜
cor博士
そういう時は統計的に有意と言えるのか?を確かめるんじゃ。その方法として仮説検定というものがあるのじゃぞ。仮説検定の目的は「それは偶然じゃない、安心して結果を信じていいぞ」と言い切る為にあるんじゃんが、ずばり仮説を立てて、その仮説が正しいとしたら、今手元にあるデータが得られる確率はかなり低いじゃないか!そしたらその仮説は正しくないと言ってしまったほうが確率は高いぞ。という論法の方法なのじゃぞ
corサルくん
や、や、や、ややこしいね・・・
考え方の順番
今回、キャンペーンメールの効果があったかどうかが検証したい内容になりますよね。この時、一番始めに設定するのが帰無仮説の設定です。一般的には帰無仮説を「キャンペーンメールを送っても効果はない(差はない)」とすることが多いです。
ここでポイントになるのが、何人に送ったのかということじゃ!
cor博士
次に同じ60%の人が反応したという場合でも、10人だけにしか送らず早々に結論づけてしまうのか、それとも10,000人に送ってじっくり結論を出すのかを考えてみましょう。
この場合、信頼性が高いのは10,000人に送った結果の方だと思いませんか?
効果があるかは半々(50%:50 %) という場合に、たった10人に送ったのではなんとなく心配ですよね。この心配を確率的に”十分に信用できる”と言い切るのが仮説検定の役目なのです。そしてその確率を”心配”から”十分”に変える為に必要なのが何人に調査したかという数なのです。
例えば100人を対象とするとこの仮説検定は棄却出来ません(=偶然の範囲であり、効果があると言えない。)仮説検定での結論は、
・偶然だろう
・偶然にしては確率が低すぎる!きっと効果があった!
のどちらかを結論づけることとなります。
何と何を:母比率 / グループ間での比較、何の数値を:差 / 比率
仮説検定を使う時には、何と何を比べて、何の数値を比べているのかを最初に整理しておくと良いぞ
cor博士
更に学習を進めたい人は何について仮説検定を行うかを場合分けして覚えることがおすすめです。その整理が終わればあとは数式に乗せて計算するだけです。
コメントを残す