随分と寒くなってきた今日この頃。更新が週に3回くらいになってきたので、頻度を上げれるように頑張りたいと思うけど、忘年会のあとに更新する元気はなく・・・。
ということで前回の続き。
問題
解説
(3)
確率分布はこうやって使うんですよという教科書的な話がそのまま試験問題に。ベクトル選ぶよりこっちが楽かもね。
まずは標本比率を求める問題。
標本比率って何だっけ?という人には、
標本比率=この調査での賛成者の比率
親切にも問題文が教えてくれているので安心だ。
素直に計算して
$\dfrac{320}{400}=0.8$
と求まる(二)。
一般に、母比率$p$に対する95%信頼区間は、標本比率を$R$として
$R-1.96 \sqrt{\dfrac{R(1-R)}{n}}\leqq p \leqq R +1.96 \sqrt{\dfrac{R(1-R)}{n}}$
が成立する。
この式がどこから登場したかと言うと、標本比率から母比率をだす方法はこれしか道具がないからだ(信頼区間をかえると値は変わるけど)。ヒラメキとか解法の必然性みたいな数学の問題を解くという姿勢よりは、検定手法がこうだということだ。
他の分野と違って、統計分野は行為の目的が数学の外にあるのが一般的だ。今回の問題も政策の賛成者を予測することが目的で計算がされている。一般的な数学の問題のようにワカラナイものに対して、あれこれと考えるという態度ではなく、母集団がわからないけど標本は存在しているというときに母集団の性質を調べる手法など、何故そう考えられるのかという根拠は当然あるものの、
こんなときにはこれで計算する
というのが大方決まっているのがこの分野だ。統計なんて数学じゃねぇという人がいたり、センターの統計は難しくなりようがないという声が聞こえてくるのはこのためだ。
95%の信頼区間でのこの評価式などの導出はそのうち公式集の方でボクなりの説明で紹介したいが、とりあえずここでは覚えている前提で用いる(本番もそうでないと時間が足りない)。
で、この$R$に最初に求めた標本比率の値$0.8$を代入して計算すると
$0.8-0.0392 \leqq p \leqq 0.8+0.0392$
$0.7608 \leqq p \leqq 0.8392$
となり
$0.76\leqq p \leqq 0.84$
と求まる(ヌネ、ノハ)。
ちなみに小さい話だけど、$0.7608$を$0.76$と書いているところ、四捨五入なんだろうけど$\leqq$って成り立つの?と思う人がいるかも知れない(不等号の下の等号部分)。
そんな人は、
$4 < 5 \Leftrightarrow 4 \leqq 5$
という事実は受け入れられるだろうか。たまに誤解している人がいるが、$\leqq$という記号の$<$と$=$の関係は当然またはである。どっちかが成り立っていればいいわけで、上の例だと$=$は成り立つはずがないが、$<$が成り立つので$\leqq$が使用可能ということになる。
で最後は、信頼区間の幅$L_{1}$、$L_{2}$、$L_{3}$の大小比較問題。
といっても、先程の評価式から一般に信頼区間の幅は、
$2 \times 1.96 \sqrt{\dfrac{R(1-R)}{n}}$
と求まるわけで、それぞれのケースで$R$も$n$も与えられているので代入して比べるだけのただの計算問題だ。
一つずつ計算していこう。ただ、ここで少しでも計算をらくにすることを考えてみる。ボクらは大小を比較できればいいわけで、それぞれの値を求めたいわけではない。
こういった態度はとても重要で、求めるものが何なのかは常々意識して楽をすることを考えないと無駄な計算地獄に陥ってしまうことになる。
$L_{1}$、$L_{2}$、$L_{3}$にある共通部分を取っ払っても大小関係は不変なので、
$2 \times 1.96$
の部分は計算することなく捨ててしまおう。
平方根も大小関係には影響ないので取り外すと、
$\dfrac{R(1-R)}{n}$
だけの比較になる。
ここから、3つのものを比較するときに同時に行うのはしんどいので、ペアで考えていきたい。どれとどれをペアで比較するかは、当然計算が楽になるように同じ値を持つ者同士となる(ゆえに$L_{2}$と$L_{3}$のペア以外)。
$L_{1}$と$L_{2}$は$n$が同じなので分子の比較だけになって
$0.8 \times 0.2$
vs
$0.6 \times 0.4$
となる。
ここでバカ正直に小数の計算はする必要はなく
$16 < 24$
となって$L_{1}<L_{2}$とわかる。
次に$L_{1}$と$L_{3}$を比較する。
$\dfrac{R(1-R)}{n}$
の分子が共通なわけだから、分母比較になる。分母は大きいほど全体は小さいので、
400<500
で$L_{3}$の方が小さいと即わかる。
ということで、
$L_{3}<L_{1}<L_{2}$
とわかった。選択肢の中で、この順になっているのは④だ(ヒ)。
んー。異常なほどに易しい問題だった。統計はなにかと他分野でも使われるので、知らない人は勉強しておくといいかもね。
そのお勉強のお手伝いとなるような記事もそのうち書いてく予定だ。
今回はここまで。
次回からは別の年度のⅡBへ。
センター試験過去問研究 数学?・A/?・B (2019年版センター赤本シリーズ)
- 作者: 教学社編集部
- 出版社/メーカー: 教学社
- 発売日: 2018/04/14
- メディア: 単行本
- この商品を含むブログを見る