• 検索結果がありません。

3 ベイジアンネット ワーク, 決定木による 学習レベル予測

N/A
N/A
Protected

Academic year: 2021

シェア "3 ベイジアンネット ワーク, 決定木による 学習レベル予測"

Copied!
1
0
0

読み込み中.... (全文を見る)

全文

(1)

平 成 24 年 度 情 報 工 学 科 卒 業 研 究 概 要

メデ ィア系 舟橋研究室 ICカード 打刻データと修学データを用いた

学生の将来の学習レベル予測と特徴分析 No. 21115011 伊藤 雄真

1 はじめに

名古屋工業大学では,ICカード 出欠管理システムに より学生の打刻情報(IDm,打刻時間,打刻ICカード リーダ番号)がサーバにリアルタイムで蓄積されてい る.しかし学生はデータを提供するだけで何かしらの フィードバックを得られておらず大量のデータを有効 活用しているとは言えない。そこで従来の研究[1]で は学習レベルの予測をフィードバックすることを目的 とし 、そのためのデータに関して打刻情報の部分は出 欠データ(出席,欠席,遅刻,早退)しか使われていな かった. 本研究では打刻情報より得られる打刻データ に着目して学習レベル予測を行い,また打刻における 特徴の分析を行った.

2 本研究で用いる手法

本研究では,学習レベルを予測する手法として計算 過程がモデル構造より確認することができるベイジ アンネットワークと決定木を採用している.またデー タ量が多い場合,予測精度が下がる可能性があるので データの削減方法として情報利得と主成分分析を採用 している.これにより最も高い予測的中率を示す手法 によるモデルから特徴を分析する.

3 ベイジアンネット ワーク, 決定木による 学習レベル予測

本研究では2007,2008年度における学生171人の 打刻データと修学データより学習レベルの予測を行っ ている.打刻データはそのままでは情報が少ないため データの拡張を行い,各月の打刻回数·欠席回数,各曜 日の分散·平均,祝日前後の欠席回数を求めた.なお前 期は4月〜7月,後期は10月〜1月としている.また 1,2年複合のGPAを等距離で5段階(S,A,B,C,D)に 離散化したものを目的変数としている.

1,2年複合を予測するのに2年前期までのデータか ら予測するのと2年後期半学期までのデータから予測 するのでは後者のほうが少し予測精度が高かったが, 本研究では早い段階で予測を行いたいので前者を用い て予測を行った.2年前期までのデータから1,2年後期 を予測した結果,ベイジアンネットワークでは予測的 中率75.4386%,決定木では予測的中率70.1754%を 示した. さらに予測的中率を上げるため情報利得によ るデータの削減および主成分分析による次元削減をし た結果,ベイジアンネットワークでは情報利得による データの削減したとき80.117%,決定木では主成分分 析による次元削減をしたとき74.8538%を示し予測的 中率を上げることができた.これにより成績上位,中 間,下位程度ならば予測可能であることが分かった.

4 特徴分析

ベイジアンネットワークおよび決定木により構築さ れたモデルを用いて特徴を分析した. 1,2年複合の予 測において情報利得を用いてベイジアンネットワー クより構築されたモデルでは1年前期のGPAが1.98 以下だと1,2年複合の成績は中間より下位になる傾向 が見られた.また1年前期のGPAが3.13より上だと 1,2年複合の成績は中間より上位になる傾向が見られ た.全体的に2年前期金曜における打刻回数の平均が 2.31より上だと成績が良くなる傾向があることがわ かった.

主成分分析を用いて決定木により構築されたモデル は主成分データは使われず成績データのみで構築され ていることがわかった. これは細かい部分の分類につ いて打刻データのとある変数が使われている可能性が あるが,主成分分析により複数の変数が統合されてし まったため細かい分類ができなくなったことが原因と して考えられる.

ここである曜日における打刻回数の平均について考 えてみると平均が低いといっても講義をあまり取って いない,あるいは講義を休んでいる,あるいは遅刻が多 いなどさまざ まなパターンが考えられる.よって平均 のかわりにある曜日における打刻回数の最頻値とある 曜日における欠席回数を用いることである程度パター ンを絞ることにした.結果, 1,2年複合におけるベイジ アンネットワークによる予測的中率が80.117%に対 し,平均を置き換えて予測した結果80.7018%と予測 的中率を上げることができた.これより打刻データが 成績と関係があるということが言えた.

5 むすび

打刻データを用いてベイジアンネットワークと決定 木により予測した結果,成績上位,中間,下位程度の予 測ならば可能であることを示した.また打刻データを 情報利得,主成分分析を用いて削減することにより予 測的中率をあげることができた. 構築されたモデルよ り打刻データが学習レベル予測に関わっていることを 示し,説明変数をさらに詳しく調べる置き換えること により予測的中率を上げることができた. 今後は他大 学やカリキュラムの違う学年に対応できるよう大学の 人数による相対値,必須科目や選択科目の単位数を説 明変数として取り入れることにより打刻が成績とど う 関係しているか検証していきたい.

参考文献

[1] 伊藤宏隆,舟橋健司,内匠逸,松尾啓志, “ICカード 出欠 データとCMS学習データを用いたデータマイニング”,

メデ ィア教育研究,4,2, pp.15-21, 2008

参照

関連したドキュメント

年度まで,第 2 期は, 「日本語教育の振興」の枠組みから外れ, 「相互理解を進 める国際交流」に位置付けられた 2001 年度から 2003

自閉症の人達は、「~かもしれ ない 」という予測を立てて行動 することが難しく、これから起 こる事も予測出来ず 不安で混乱

第 4 四半期は、2015 年度第 2 回コンペを開催する予定。応募件数が伸び悩んで いるため、2015 年度第

モノーは一八六七年一 0 月から翌年の六月までの二学期を︑ ドイツで過ごした︒ ドイツに留学することは︑

6  の事例等は注目される。即ち, No.6

2016 年度から 2020 年度までの5年間とする。また、2050 年を見据えた 2030 年の ビジョンを示すものである。... 第1章

隙間部から抜けてく る放射線を測定する ため、測定装置 を垂 直方向から60度傾け て測定 (オペフロ表 面から検出器までの 距離は約80cm). b

これらの船舶は、 2017 年の第 4 四半期と 2018 年の第 1 四半期までに引渡さ れる予定である。船価は 1 隻当たり 5,050 万ドルと推定される。船価を考慮す ると、