• 検索結果がありません。

組見本(pdf)

N/A
N/A
Protected

Academic year: 2021

シェア "組見本(pdf)"

Copied!
8
0
0

読み込み中.... (全文を見る)

全文

(1)

平均値と標準偏差   翌 週、 正 規 屋 を ふ た た び 訪 れ た 文 太 は、 事 務 室 で 店 長 と 乱 子 を 前 に、 「 今 日 は デ ー タ 分 析 の 王 道 についてお話しします」と胸をはりました。   乱子は今日も、洗いたてらしい白い割烹着に白の三角巾という服装です。もっとも乱子は経理担 当で、調理をすることはないらしいので、割烹着には 1点のシミもなく、眩しいくらいに真っ白で す。膝上まである割烹着の下からは、白く素足が伸びていますが、その先は例によって下駄でした。

(2)

第 2 章 データ分析の王道?  68 の 半 分、 つ ま り 2・ 5% で す。 お お ま か な 金 額 で 108000 円を超える額です。   正規屋さんの売上が常時このレベルに達するよう になるのは、いまの段階では確率的にはとても低く て、ハードルとしてはかなり高いのですけど、目標 として頑張りたいと思うのです。 「よくは分からないけど、うちの売上高が大きく伸 びるように努力してくれるというのを、正規分布に キンジさせて、おっしゃっているわけですね」   乱子が大きく微笑みました。白いズキンからこぼ れているポニーテールが、窓から差し込む日差しに 反射して眩しく見えました。 「ところで、さっきから動かしているこのソフトは なんなの?」 お弁当売上 正規屋さんのお弁当売上の分布 売上平均 107434 円 の壁 目標 108000 円 超え

(3)

69  正規分布   文太の正面のノーパソに乱子が顔をぐっと近づけてきました。文太の顔のすぐ前で乱子のポニー テールが揺れています。シャンプーの香りが文太の鼻をくすぐります。 「え、え、え。あ、これは Rってソフトです。どんな分析もグラフ作成もこなしてくれるすごい高 性能のソフトウェアなんです」 「ふーん。こういうの入れるから、うちのシステム契約料高くなるのね」 「いや、このソフトは、じつはフリーです。つまり、 無料 です」 「は?   無料?   だとすると、あんたの会社からの請求額、高すぎるんじゃないの?」 「す、すいません、社長に伝えておきます!」 「このレポートにあるグラフなんかも、このソフトで作ったわけ?」 「はい、そうです」 「ちょっと作ってみせて?」 「え?   あ、はい。たとえば、あの箱ヒゲ図は、こんな命令を実行しました」           < boxplot ( data ) 「……なに……これ?」 「 Rというソフトでは、ユーザーが命令をプログラミング言語で書くんです。すると Rがこれを解

(4)

第 3 章 相関と回帰  82   文太はキー ボ ードを操作すると、数字の一覧のようなものを表示させて、乱子の ほ うにディスプ レイを向けました。       月 気温 消費量 1 5.5 2.38 2 6.6 3.85 3 8.1 4.41 4 15.8 5.67 5 19.5 5.44 6 22.4 6.03 7 28.3 8.15 8 28.9 8.23 9 27.8 7.35 10 18.2 5.50 11 13.7 4.90 12 8.7 4.60 「データ分析では、データをこんなふうに行と列に記録します。左端の列は月です。その隣、つま り左から 2列目の気温というのは、その月の平均気温のことです。その隣の消費量というのは各家 庭でのビールの平均消費量です。たとえば一番上の行は、平均気温が 5・ 5℃ であった 1月に、平 均的な家庭で 2・  3 8リットルのビールが消費されたということです。   データ分析では、こういう列に記録された数値を『変数』とか『変量』といいます。この場合、 『月』と『気温』と『消費量』という 3つの変数があります」 「へんすう?   変わる数ってこと」

(5)

83  相関   確かに、もうデータは集められているんですから、 これが変わったりすることはないです。でも、来年、 もう一度、気温と消費量の関係を調べても、今年と 正確に一致するとは思えないですよね。年によって 数 字 は 変 わ っ て き ま す。 そ れ で、 デ ー タ 分 析 で は 「変数」といういい方をするのです。   こ の デ ー タ で は、 「 気 温」 と「 ビ ー ル 消 費 量」 に 注目してみます。この表からは、気温が高くなると 消費量も伸びるという関係があることに気がつくと 思います。この関係は、グラフにしてみると、もっ とはっきりとします。描いてみますね。   このグラフを散布図といいます。グラフの描かれ た正方形の真下にある目盛りは「気温」を表してい て、これが X軸です。正方形の左の目盛りは「ビー ル消費量」を表しています。こっちは Y軸でしたよ ね。   たとえば X軸の右の ほ うで 22・ 4℃ の位置から、 気温 消費量 ビール消費量と気温の関係図 22.4℃ 6.03 リットル

(6)

第 3 章 相関と回帰  96 「ええ、相関係数は、 2つのデータに直線以外の関係 がある場合には使えないのです。   でも実用面では バ カにしたもんでもないんです。た とえばビールのデータでは平均気温が 20℃ の場合の記 録はなかったです。でも気温と消費量に ほぼ直線の関 係があることが分かりましたから、グラフの X軸の 20 に対応する Y軸の数値を見れば、消費量が予想できる ようになります」 「グラフを目で追って判断するとか、いまどき原始的 な気もするけど、まあ、確かに役には立ちそうね」 「……いや、これから、もっとデータサイエンティス トらしい説明が始まるんです。それが最初にふれた回 帰分析なんです!」 「怪奇隕石?」 「そう、つっこんでくるだろうと予想していましたよ ……」 気温 消費量 20℃の場合 約 6.1 リットル

(7)

97  回帰分析 回帰分析 「それで、繰り返しになりますが、気温とビールの消費量関係は、次の式で表されます」       売上=a×気温+b 「やっぱり、ピンとこないんですけど」 「そうですよね。コンピューターにビールのデータを突っ込んで実際に計算させると、もっと具体 的な式に変わります」       売上= 0.19×気温+2.3 「 aが 0 ・ 1 9 に、 bが 2・ 3に変わったのは分かるけど、だいたい、この 2つはなんなの?」 「まずですね、こうした式のことを回帰式といいます。それから、 aは係数、 bは切片といいます。 係数 aの ほ うは、この式の場合、気温が 1℃ 上昇するとビールの平均消費量が 0 ・ 1 9 リットル増 えることを意味します。つまり、温度による消費量の増加分を表します。それと切片の bですが、 こちらは気温が 0℃ の場合の消費量になります」 「ちょっと、待った。 0℃ ってどういうこと?   そんな気温でも 2・ 3リットルも消費するお調子 者がいるわけ?」

(8)

参照

関連したドキュメント

に関して言 えば, は つのリー群の組 によって等質空間として表すこと はできないが, つのリー群の組 を用いればクリフォード・クラ イン形

東京都は他の道府県とは値が離れているように見える。相関係数はこう

これはつまり十進法ではなく、一進法を用いて自然数を表記するということである。とは いえ数が大きくなると見にくくなるので、.. 0, 1,

・関  関 関税法以 税法以 税法以 税法以 税法以外の関 外の関 外の関 外の関 外の関係法令 係法令 係法令 係法令 係法令に係る に係る に係る に係る 係る許可 許可・ 許可・

荒天の際に係留する場合は、1つのビットに 2 本(可能であれば 3

いてもらう権利﹂に関するものである︒また︑多数意見は本件の争点を歪曲した︒というのは︑第一に︑多数意見は

「そうした相互関 係の一つ の例 が CMSP と CZMA 、 特にその連邦政府の政策との統一性( Federal Consistency )である。本来 、 複 数の省庁がどの

それらのデータについて作成した散布図を図 15.16 に、マルチビームソナー測深を基準に した場合の精度に関する統計量を表 15.2 に示した。決定係数は 0.977