main : 2016/2/8(9:42)
はしがき
最近,ビッグデータ,オープンデータという言葉に象徴されるように,統計学に対する知識 がますます必要とされるようになってきています.本書は,主に文系の大学1年生を対象とし て,統計学の基礎の部分を例を用いてわかりやすく解説した入門書です.様々なデータに対し て,統計学ではどのように考えるのかを読者に体感してもらうことを目的としています.その ため,厳密性を多少犠牲にしても,複雑な数式を用いないで,わかりやすい文章で表現するこ とを心掛けています. 統計学は大きく分けて2つあります.1つ目は初等的な考察を主な方法とする記述統計とい われるものです.本書では第1章で学ぶことになります.たとえば,ある物の重さを知りたい としましょう.100 回測ると100 個のデータが得られますが,100 個のデータを見ているだけ ではよくわかりません.そこで,データがどのようになっているのかがわかるようにデータを 整理します.度数分布表,ヒストグラム,箱ひげ図にまとめたり,標本平均,標本分散を求め たりします. 2つ目は母集団という概念を念頭に置き,確率論を伴った考察を主な方法とする推測統計と いわれるものです.推測統計は第2章以降で学ぶことになります.ある物の重さ(g)を10回 測ったら, 24.5, 22.8, 23.7, 21.7, 24.3, 22.1, 23.4, 21.8, 25.2, 20.8 というデータが得られたとしましょう.このデータには,この物の本当の重さwと観測誤差が 含まれています.本当の重さ w は未知の定数で,観測誤差は確率的に大きくなったり小さく なったりすると考えられます.このデータから,wは23 gぐらいであり,それが30 gである ということはまずありそうにありません.それは,w = 30とするよりw = 23とするほうが, このようなデータの得られる確率が大きくなるからです.w = 30 としても,このようなデー タの得られる確率はゼロではないので,w̸= 30 という判断は正しいというわけでもありませ ん.しかし,w = 30はまずないといってもいいでしょう.w = 23であり,w̸= 30という判 断は絶対に正しいとはいえませんが,まず確からしい判断です.推測統計では,このような確 からしい判断,つまり,不確実性を含む判断を導き,その不確実性を確率で測ることになりま す.このように推測統計の内容は確率論を伴うので理解するのが容易ではないかもしれません が,専門的な確率論を知らなくても本書では十分理解できるようにしてあります.main : 2016/2/8(9:42) iv はしがき 今後,読者のそれぞれの専門分野で統計学が必要になる場合に本書が少しでもその手助けに なればと願っています.最後に,本書の原稿を読んでいただき有益なコメントをしていただい た大阪府立大学高等教育推進機構の川添充教授,電気通信大学大学院情報システム学研究科の 川野秀一准教授には心よりお礼を申し上げます.また,本書の最初の構想から出版まで長い時 間を費やしてしまい,その間,我慢強く待っていただいた共立出版の信沢孝一氏,三浦拓馬氏 に心よりお礼を申し上げます. 2016年1 月 著者一同