平成30年度大学院
Webインテリジェンス論
やまぐち たかひら
山口 高平
内線:42673
電話:045-566-1614
FAX; 045-566-1617
メール:
[email protected]
Web:
www.yamaguti.comp.ae.keio.ac.jp 1授業内容と授業計画,講義資料,成績評価
授業内容 人工知能(AI)の現状を限界を正しく把握し、AIとインターネットを融合した 「セマンティックWeb、オントロジー、リンクトデータ」について学ぶ。 また、ゲストスピーカを招いて、AIの研究開発とビジネスについて学ぶ。 授業計画 ①4/10 AIの過去・現在・未来 ②4/17 オントロジー+セマンティックWeb概要(森田講師) ③4/24 タイプ別最新AI ④5/8 ES、BRMS、RPA ⑤5/15 RDF,RDFS ⑥5/22 OWL ⑦5/29 Protege演習1回目 ※6/5は学会出張のため休講です ⑧6/12 Protege演習2回目 ⑨6/19 SPARQL演習1回目 ⑩6/26 SPARQL演習2回目 ⑪7/3 オントロジーとLODサービス ⑫7/10 ゲストスピーカ ※7/17は学会出張のため休講です講義資料:pdf(or ppt)資料をWebに掲載 www.yamaguti.comp.ae.keio.ac.jp
成績:レポート3-4回程度で評価
2 WI論
今日の講義内容
• 現在、第3次AIブームを迎えているが、AIを細分化せず
大括りにしているために、間違った議論がみられる。
• 今回と3回目の講義では、AIをゲーム型、視覚動作型、
予測型、問題解決型、対話型の5種類に分類し、各種
AIで利用されている技術と性能限界について述べる。
AIの大分類:・知覚運動型AI:ビッグデータ+大規模並列コンピュータ +Deep Learning ・知識利用型AI(ワトソン、東ロボ君):オントロジー、記号推論群、言語理解
AI=人の知的な振る舞いを実行するSW(脳みそ)
ロボット=体、AIではない。
1956年夏 ダートマス会議(チェス、定理証明)
探索、推論
1960年~
第1次AIブーム
(
単なる期待
、Toy Problem)
1970年~
第1次冬の時代
(機械翻訳無理!基礎研究は継続)
1980年~
第2次AIブーム
(
推論と知識の時代
、
第5世代コンピュータ、エキスパートシステム、AIベンチャー)
1995年~
第2次冬の時代
(基礎研究は継続):
インターネット、クラウドサービスの時代へ
2010年~
第3次AIブーム
(AI
、IoT、Big Data, Security)
日本: Society 5.0 (2016-)
(人工)ニューラルネットワーク(神経回路網)
Another AI の歴史
脳を規範としたモデリングの研究。AI does not care so much about Brain。
AI(1956-)とNN(1958-)は、ほぼ同時期に研究開始。
人工知能学会(1986-)と日本神経回路学会(1989-)も同時期設立。
AI ≠ NN(脳を規範としないAIとは相いれないケースあり)
第1次NNブーム
1958年:パーセトプロン by Frank Rosenblatt (1928-1971)
第1次冬の時代
1969年:パーセトプロン批判 by Marvin Minsky(1927-2016)
1979年:ネオコグニトロン(猫の視覚野の研究をモデル化
→Simple細胞:図形特徴抽出、 Complex細胞:位置ずれ補正 by 福島邦彦氏
→CNN型 Deep Learningの基礎となる
第3次NNブームの背景と現状
第2次NNブーム
1982年:Hopfield Network by John Hopfield
1985年:Boltzmann Machine by Geoffrey Hinton
1986年:Backpropagation(誤差伝搬法) by David E. Rumelhart
1989年:Convolutional NN by Lecun
(1988年:日本神経回路学会発足)
※過学習&局所解が課題。学習が長時間。
第2次冬の時代
1990年-2010年:Bayesian Net, SVMなど、数理モデルベース機械学習が注目、
第2次NNブームは終焉。
第3次NNブーム
2006年:Auto-encoder by Geoffrey Hinton
2012年:Restricted Boltzmann Machine by Geoffrey Hinton
多層NNをDeep Learningと呼ぶようになり、DL>SVM, Basian…
Convolutional NN :画像認識、音声認識への応用。ベンチマークで最高性能
Recurrent NN:自然言語処理への応用
※GPUマシンの普及:並列CPUマシンと比べて1/100のコスト
※DLツールの普及:Caffe, Chainer, TensorFlow
6 WI論
第3次AIブームの背景と現状
・コンピュータの廉価、高速化(15年間で1000倍)
・HDDの廉価、大容量化(2000年1000円→現在5円)
・ネットワーク広帯域化(2008年 FTTH回線>ADSL回線)
・ソフトウェアのオープン(無料)化
AI2大トピック
①2011年 IBMクイズAIワトソン
(AI統合)
AI統合は開発コスト大きい。でも売上げは最高
②2012年 グーグルの猫
(Deep Learning)
~Deep Learningによる特化型AIが多数開発
(一部の領域で人を超える凄い性能:量は質を凌駕する。
ブラックボックスで人には理解不能。不安も起こる)
◎AI研究開発投資 ①企業:ネット5大企業GAFMA+IBM, 中国BAT, 日本トヨタ、リクルート ②政府:米国、英国、EU(独、仏)、中国、日本、韓国など WI論 7AIの誤解と混乱(1)
NHKスペシャル『AIに聞いてみた
どうすんのよ!? ニッポン』 2017.7.22
• 5000種類、700万(オープン)データ
• Deep Learning(畳込み型)適用
• 「40代ひとり暮らしが日本を滅ぼす?」
「少子化止めるには結婚よりもクルマ買え」
「病院減らせば、健康な人が増える?」
• DLの結果は、
相関関係(疑似相関)
であり、因果関係ではない。
妥当性は、人が検証しないといけない。
• マツコ・デラックス
「これが正解とは言わないけれど、
分かりやすいお告げ
」
WI論 8AIの誤解と混乱(2)
アルファー碁 シンドローム
ユーザ:囲碁で、AI(アルファー碁)が
トッププロ棋士に勝ちましたよね。
当社のこの業務、人件費がネックなんです。
AIで代行できますか。
AI担当者:調査してみないとわからないです。
ユーザ:囲碁って、普通の人には難しいでしょ。その囲碁でAI
が人を超えたんだから、こんな業務くらい、簡単でしょう?
AI担当者:そうですね?やってみましょう。
各分野の最新AI
④対話Bot
⑤知識AI
②視覚・動作AI
③予測型AI
統合AI
データ型AI
知識型AI
①ゲームAI
WI論 10人の脳(大脳)と人工知能
ゲームAI 知識型AI 視覚型AI 対話AI 感情型AI 運動型AI ビッグ データAI①ゲームAI
先読みから棋譜データ分析へ
2016.3 Google Deep Mind アルファ碁 アマチュア7段から トッププロへ躍進! 2012.1 第1回電王戦 故米長元名人vs. ボンクラーズ 1997 AIチェス Deep Blue
AIがプロに迫る&超える
10
120
10
220
10
360
※巨大数の例
観測可能な宇宙(800億の銀河)の水素原子数 約10
80RSA公開暗号鍵サイズ 1024bit 2
1000=
(2
10)
100=10
300故米長名人
ボンクラーズは50000棋譜以上から
機械学習で強くなった 。
だから、知らない手が有効なはず
2012年1月
第1回電王戦 一手目
14故米長元名人
vs.
ボンクラーズ
WI論午前:ボンクラーズは困惑 ?
午後:故米長元名人が
一つのミス
ボンクラーズ
攻撃開始!
第1回電王戦 中盤
勝者
敗者
記者
会見
ボンクラーズは、
常に、私のミスを待っていた。
ミスをした途端、攻めてきて、
大変なプレッシャーを感じた。
16第1回電王戦 終局
WI論ボナンザ(保木邦仁氏開発)の評価関数
• 各駒の価値(駒割り)
• 王、他の駒2つの位置
• 王、隣接した味方の駒、他の味方の駒3つの位置
• 隣接しあった駒2つの位置関係
• 竜馬飛角桂香の利き上にいる駒の種類
→5万棋譜データを与え、機械学習を実行し、プロの指し手
パターンを学習した結果、棋力が格段に上昇した。
さらに、新手と呼ばれるパターンも見出した。
将棋AIの機械学習で利用される評価関数
• 各駒の価値(駒割り)
• 王、他の駒2つの位置
• 王、隣接した味方の駒、他の味方の駒3つの位置
• 隣接しあった駒2つの位置関係
• 竜馬飛角桂香の利き上にいる駒の種類
→5万棋譜データを与え、機械学習を実行し、プロの指し手
パターンを学習した結果、棋力が格段に上昇した。
さらに、新手と呼ばれるパターンも見出した。
2016年 電王戦 山崎叡王vsPONANZA 2017年 電王戦 佐藤叡王vsPONANZA WI論 18Google DeepMind アルファ―碁 4勝 vs 世界ランキング2位Lee Sedol九段(韓国)1勝
韓国ソウル市、2016.3
Google DeepMind アルファ―碁 3勝 vs 世界ランキング1位 柯潔(か けつ)九段 0勝中国浙江省烏鎮、2017.5
アルファ碁→アルファ碁ゼロ
→アルファゼロへの進化
量は質を凌駕する。
• アルファー碁ゼロ
過去の棋譜データを利用しない(ゼロ)。アルファー碁
を対戦させて、強化学習(勝ちそうな手に得点を与え
る)により棋力向上。アルファー碁と100回戦全勝。
アルファーゼロ
囲碁、将棋、チェスにルールのみ教えて、強化学習に
より棋力向上。世界トップAI将棋「エルモ」、世界トップ
AIチェス「ストックフィッシュ」と対戦して勝利。
★囲碁・将棋・チェスすべてで世界最強という3冠成
WI論 20チェス選手権はフリースタイルの時代へ
混成チーム2
アマチュア+AI
混成チームⅠ プロ+AI AI プロChess Metaphors:
Artificial Intelligence and the Human Mind
22
48チーム参加
(人、コンピュータ、人+コンピュータ)
優勝:ZackSチーム
Zackary Stephen
(統計学修士,24歳,1381)
Steven Cramton
(予備校講師,28歳,1685)
使用ソフト:Shredder 8,Fritz 8,Junior 7,
Gambit Tiger
(※レーティング:初心者800, 中級者1500,
日本チャンピオン2300, グランドマスター
2500, 世界チャンピオン2800)
By Diego Rasskin-Gutman Translated by Deborah Klosky
Deep Learning
Quoc V. Le, Marc’Aurelio Ranzato, Rajat Monga, Matthieu Devin, Kai Chen,
Greg S. Corrado, Jeffrey Dean, and Andrew Y. Ng:
Building High-level Features Using Large Scale Unsupervised Learning,
ICML2012
Key note Jen-Hsun Huang
GPU Technology Conference2014
26 WI論
Error Rate
ILSVRC (ImageNet Large Scale Visual Recognition Challenge)
3.6
Auto-encoder as Pre-Training
自動符号化(原画像から復元画像)
G. E. Hinton, A. Krizhevsky & S. D. Wang: Transforming Auto-encoders, ICANN11 (2011)
原画像
復元画像
制限付きボルツマシン(RBM): 入力層と隠れ層、隠れ層と出力層間の結合。 同層の結合はない。 ユニット:確率論的二値ユニット RBMの学習:入力層データを再現できるように、 ユニット結合係数wij値を調整する。 自動符号化:隠れ層が情報圧縮となる。 多層化:一つのRBM学習終了後、 上位に重ねる→上位ユニットが 抽象度の高い特徴となる。 28 WI論プ ー リ ン グ 層 正 規 化 層 畳 み 込 み 層 プ ー リ ン グ 層 正 規 化 層 畳 み 込 み 層 プ ー リ ン グ 層 正 規 化 層 畳 み 込 み 層 32x32 入力画像 3X3フィルタをスライド適用し、 活性化関数に与えて (畳み込んで)、 特徴マップ作成する。 正規化実行可否 低次元化
※ハイパー変数決定問題
フィルターサイズ
活性化関数
正規化
ドロップアウト
などなど
出
力
層
知覚処理用Deep Learning
Convolutional Neural Network
1 1 1 0 0 0 1 1 1 0 0 0 1 1 1 0 0 1 1 0 0 1 1 0 0 1 1 1 0 0 0 1 1 1 0 0 0 1 1 1 0 0 1 1 0 0 1 1 0 0 1 1 1 0 0 0 1 1 1 0 0 0 1 1 1 0 0 1 1 0 0 1 1 0 0 1 1 1 0 0 0 1 1 1 0 0 0 1 1 1 0 0 1 1 0 0 1 1 0 0
×
×
1 0 1 0 1 0 1 0 1 1 0 1 0 1 0 1 0 1 1 0 1 0 1 0 1 0 1 1 0 1 0 1 0 1 0 1 1 0 1 0 1 0 0 0 1 1 0 0 0 1 0 1 0 1 0 0 1 0 0 0 0 0 1 1 0 1 0 1 0 1 0 0 合 計 合 計 合 計 合 計 4 4 4 4 4 2 4 4 2 4 ストライドが2の場合の畳み込み処理=
=
=
=
×
×
入力データ (5×5) フィルター (3×3) 特徴マップ(2×2)畳み込み層
30 WI論1 2 3 0 0 1 2 1 0 4 1 2 0 1 1 1 1 2 3 0 0 1 2 1 0 4 1 2 0 1 1 1 1 2 3 0 0 1 2 1 0 4 1 2 0 1 1 1 1 2 3 0 0 1 2 1 0 4 1 2 0 1 1 1 2 2 3 2 3 4 2 3 4 2 特徴マップ(4×4) (畳み込み層からの出力) 特徴マップ(4×4) (畳み込み層からの出力) 特徴マップ (2×2) 特徴マッ プ (2×2) 最大 値 最大 値 最大 値 最大 値 最大値プーリング プ ー リ ン グ 領 域 ( 2 × 2 ) ① ③ ② ④ プーリング領域2×2、ストライド=2、ゼロパディングなし
プーリング層
入力データ (224×224 ) 畳み込み層 (224×224 ) プーリング 層 (112×112 ) 畳み込み 層 (112×11 2) プーリン グ層 (56×56) 全結 合層 出力 層 (確率) 0.1 猫 0.8 犬 0.1 自 転車
畳み込みニューラルネットワークの全体像
フィルター(フィルター数4) フィルター(フィルター数8) 32 WI論AI医療画像診断(大腸がん発見)
NHK Eテレ AI超入門2017.11
医師
AIシステム
Google Hand-eye Coordination Learning
Deep Reinforcement Learning
The world's first robotic kitchen
http://www.moley.com
/
36 WI論
無人運転(パターン認識) 2012年 ネバダ州免許 2013年 カリフォルニア州免許
機械学習により運転操作の学習
入力
①LIDAR(レーザー光を使ったレーダー)
②カメラ画像
③GPS
出力
①アクセル
②ブレーキ
③ハンドル操作
2017.10
300万マイル以上走行
(バスに衝突:自責事故)
自動運転
グーグルカー
自動運転の自動化レベル
BCG Press Release 2015.1.19
http://www.bcg.co.jp/documents/file180099.pdf
(部分+完全)部分自動運転車の割合
2025年13%、2035年25%と予測
テスラ 自動運転初の死亡事故
自動運転用センサーが強い日差しと
トレーラーの白い車体を識別できず減速しなかったため
40 WI論
③予測型AI
PredPol 犯罪予測AI
42 WI論
(日本の事例1:農業)牧畜管理
• 本川牧場(大分県)5000頭の牛を飼育
年間1万トン生乳出荷量(全国4位)
• RFID(無線ICタグ)による搾乳量管理
万歩計による運動量の把握など、
牛の個体情報・作業に関する
約300項目データ収集
→ 牛の健康管理、牛乳生産量の予測
• 牛乳生産量1日あたり2トン、16万円増加
• 過剰生産による廃棄ロスの減少
From IT Pro by 日経コンピュータ 2013/10/01(日本の事例2:工業)製品の販売生産管理
リーマンショック後、コマツでは建機の在庫が急増 →機械稼働管理システム「KOMTRAX」による建機の稼働状況に加えて、 流通在庫+販売状況の管理 →◎在庫1万8000台から約1万台まで削減 →×インドネシアの建設機械の稼働順調、販売順調と予測 しかし、通貨ルピア急落により販売激減(経済予測データも必要) ①組立工場内 ②製品組立から納品までの進捗管理チャート ③グローバル販売生産管理 ④世界34万台以上の建設機械の稼働状況 ① ② ③ ④ From 日経BigData 2014.02.12 44 WI論(日本の事例3:サービス業)顧客の食欲予測
From IT Pro by 日経コンピュータ 2014/10/16 ・すべてのすし皿にRFIDタグ(無線ICチップ) →単品管理。鮮度管理(マグロは、350m 回ると廃棄。売れネタのリアルタイム把握、 ・40億の販売ビッグデータの分析 →顧客の食欲を指数化した「喫食パワー」予測 →1分後予測(顧客着席経過時間などから予測) →15分後予測(統計データ、曜日、時間帯から傾向値を算出し、 必要な寿司の量を算出する。 →廃棄寿司量が75%削減④ 対話AIアシスタント
スマフォからAIスピーカへ
Apple HomePod
1966年 ELIZA
• 入力された文章にあるパターンが含まれているか調べ反応
• 会話を理解しているように見せかける,はぐらかす– ELIZAとの対話における「意味」は,人間から与えられるか用意された
限られた数の反応のどちらか
• 事前に用意された定型的な表現の中から応答
• 俺にはみんなが俺を笑っていることはわかっていたんだ → 特に誰のことを考えていますか? • キーワードが見つからない場合 → なぜそう思うのですか?• これらの対話は非常に限定された局面でしか通用しない
– 精神病の治療面接
• 対話において、話し手の一方が、実際の世界について 殆ど何も知らないというポーズをとっても構わない数少ない例の1つ会話ボット、人工無能
AIとの共同生活!?
2011- 2015- AIスピーカ ホログラムロボット 音声アシスタントSIRI りんな Alexa by Amazon 逢妻アズマヒカリ by Apple by MS Google Home by Google by GateBox
Google翻訳
Google‘s Neural Machine Translation System
量は質を凌駕する。
• 2016年11月:
Deep Learning
により翻訳精度が
大幅向上
• 「英→仏」翻訳
1万5000時間学習
• 翻訳者の未来は?
⑤ 知識型AI
50 WI論
ナレッジナビゲータ
(アップル社の唯一のコンセプトビデオ.1987年)
英語
http://www.youtube.com/watch?v=dyFpu0P4Wek
英語(日本語字幕)
http://pantani.cocolog-nifty.com/wannabe/2008/08/iphone_6_knowle_9799.ht
ml
日本語吹替
http://www.youtube.com/
watch?v=yc8omdv-tBU&feature=related
→
https://www.youtube.com/watch?v=yc8omdv-tBU
1980年代 AIブーム(知識工学)
HPP:Heuristics
Programming Project
完全ではないがたいていの場合うまくいく知識や方法※MYCINプロジェクト
(1973~1976)
MYCIN,TEIRESIAS,GUIDN,EMYCIN
◎知識表現、知識利用、知識獲得→知識工学
There is power in the knowledge ! (1977)
by Prof. E. Feigenbaum
1980年代→知識の時代へ
エキスパートシステム
,自然言語・画像・音声理解
システム,知的教育支援システム,...
国家プロジェクト,AIハード・ソフトベンダー
52 WI論エキスパートシステム
ユーザ
知識
ベース
知識
獲得
推論
エンジン
作業
領域
対話
I/F
説明
機能
(専門家)
1990年代:知識獲得ボトルネック
知識(ルール)
→ESが専門家代行という過大な期待.
知識ベース開発のための知識獲得は大変だ!
通産省:第5世代コンピュータ(1982-1994)の失敗?
→推論マシンに特化しすぎ.知識が余りにも不十分.
1990年代: 大規模知識ベース,大規模辞書プロジェクト
CYC, EDR,
WordNet
(フリーなので現在も広く使われる)
でも,あまり変化しない静的知識だけ.現実には動的知識が
多い.使えないなぁ.AIブームは完全にさめて下火へ
54 WI論
対話型AI(AIスピーカ・対話ロボット )の限界
言葉の意味理解、文脈理解、常識推論は、今のAI
では無理。対話型AIに why, howを尋ねても回答
できない。深いレベルの対話は、構造化知識が
必要があり、研究段階である。
昨日、電話を食べて、
おいしかったよ
電話は食べ物じゃないから、
食べれないよ!馬鹿!
昨日、浅草に演劇を見に行ったけど、
脇役の人が主役の人を食ってたよ!
人は食べ物ではないので、
食えませんよ。
WI論 562003年 QA Challenge !(1) IBM PIQUANT
• 2003~ IBM,PIQUANT プロジェクト
(Practical Intelligent Question Answering Technology)
★閉じた問題ではなく、事前に分からないクイズに解答する
という開いた悪構造問題に挑戦
深い論理形式分析と浅い機械翻訳ベースのアプローチを統合
この難しい問題にチェレンジするには、AI技術が未熟で、
2011年 QA Challenge ! (2) IBM Watson
・IBM Deep Question Answering
Project(ジョパディで,ワトソンが
チャンピオンに挑戦して勝利)
Open-Domain Question Answering
PIQUANTから時代が進み,
技術が成熟、マシンパワーが拡大
58 WI論
IBM Watsonシステム構成
★大規模知識の獲得(100万冊,2億ページ)
百科事典、辞書、シソーラス、ニュース記事、著 作物などを情報源。自動的にコーパスを拡大。 ★徹底した質問文解析:LAT(Lexical Answer Type) と重要語抽出 ★突出した一つのAI技術ではなく,言語理解,情 報検索,不確実性推論,仮説生成,仮説統合と ランキング、機械学習,知識表現(オントロジー), 構造化データなど,100以上の従来AI技術(20年 前の技術もある)の集大成 ★精度、確信度、速度を考慮したAIインテグレー ション ★計算力:並列計算による計算パワー ★展開性: 医療、金融、行政、マーケティングに も適用可能
クイズAIワトソン NHKサイエンスゼロ
2011年4月 7分40秒~10分20秒
11分20秒~18分40秒
Watsonの質問応答
2017.4.16 日経新聞
NII 東大ロボットプロジェクト
2021年東大入試合格を目指して
東ロボくんの各教科アプローチ
• 国語:含意関係認識。評論の問題で、設問に合致する選択肢を選ぶ問題がよく 出題されるが、設問文で指定された本文から、選択肢を選ぶ根拠となる部分を抽 出し、その根拠部分と選択肢を比較照合し、最もよく「含意する」選択肢を選ぶ手 法を開発したところ、50%程度の精度を達成できた。(名古屋大学佐藤研究室) • 世界史・日本史:情報検索と新しい含意関係認識の統合。Wikipediaや教科書に あるテキストt1を事実と仮定し、問題文にあるテキストt2が事実であるか否かを判 断する含意関係認識問題について、文の意味を集合間関係の代数式で表現し、 その集合間関係を論理演算や機械学習で認識する手法を開発中。 • 英語:発音や文法などの短文問題は70%程度、読解や会話文の長文問題は30% 程度の正答率。長文問題に対して、粒度の異なる語句の類似度判定、事実性の 判定、述語項構造解析と照応解析(主語特定とイベント参照)、映画スクリプトか ら対話自然性判定解析、ConceptNet5を利用した常識推論などの課題に取り組 んでいる(NTT-CS研等との共同研究)。 • 数学:自然言語解析と論理と数式処理の統合を目指しており、日本語で記述され た問題文と同等のZF (Zermelo-Fraenkel)表現を一階述語論理式に変換し、限量 子消去 (quantifier elimination: QE)などを含む数式処理を適用して問題を解く。QE は、二次関数、不等式・領域の問題、平面図形の問題など、多くの入試問題 を解くことができる.ただ数学でも、問題文を読んで式を立てる過程が課題である (富士通研究所との共同研究)。
66 WI論
200 86.0 80.0 48.4 50 24.6 16.0 40.5 200 105.4 90.0 45.1 100 45.5 75.0(40) 64.0(46.9) 100 42.8 77.0(55) 65.8(51.9) 100 45.9 76.0(52) 66.5(56.1) 100 46.6 55.0(44) 54.8(48.2) 物理 100 49.4 42.0(31) 46.5(49.0) 950 416.4 511.0 57.8 受験番号 氏名 科目 満点 全国 平均点 本人得点 (昨年) 本人偏差値 (昨年) 英語(筆記) 英語(リスニング) 国語 数学IA 数学ⅡB 世界史B 日本史B 5教科合計
東ロボくん 進研模試 総合学力マーク模試成績(2015.11)
大学・学部・学科 合格可能性80%以上の大学・学部・学科 国公立大 170大学 570学部 2,139学科 33大学 39学部 64学科 私立大 580大学 1,723学部 4,305学科 441大学 1,055学部 2,406学科WI論 68
2016年度マーク模試
NHK News Watch
意味(セマンティクス)とは?
• Semantics(意味論と訳される)
→数学において「論理式の真理値」を扱う
→言語学において「言葉の意味」を扱う
→
①内包的意味(Sense)
→記号と記号(具体例+概念)の関係
②指示的意味(Reference)
→記号と「もの・こと」の関係
70 WI論内包的意味(Sense)の理解
クイズグランプリ 1978(from Youtube) Q:ピンクレディ,ミリオンダラー,マンハッタンといったら何の種類? A:カクテル ※コンピュータに解答せるには、 ピンクレディ,ミリオンダラー,マンハッタンが具体物(インスタンス)として 含まれるカテゴリー(クラス,概念)を検索できるようなデータベースを 用意すればよい教員:プロジェクターを直しといて.
学生:どこか壊れましたか?
教員:???
指示的意味(Reference)の理解
(打ち上げ花火を見に行って) 子供:花火,綺麗やったなぁ.明日も見に行こう. 親:明日はやってないから,花火を買って,家でやろう. 子供:わーい,わーい. (翌日) 子供:こんなん花火とちゃう,ちゃう. 親:何でや.これは花火やで.???? 子供:....... 僕はバナナがいい. 私はりんご. NAOとってきて. 72 WI論①言葉(概念) 分類階層木 ②言葉(=固有表現、 具体物)ネットワーク 織田 信長 本能 寺 墓所 濃姫 妻 法華 宗本 門流 日本 の 寺院 建築 物 日本 の神 農民 武士 宗派 1415年 創建年 歴史 上の 身分 神 天文3年5月12日 生誕 豊臣 秀吉 主君 本蓮 寺 宗派 日本 の城 岐阜 城 建立 1347年 創建年
人・もの・
こと分析
分け方
オントロジー
Wikipediaからオントロジー(言葉階層木,言葉の ネットワーク)に自動変換して, 人工物に言葉の意味(Sense)を理解させる →日本語Wikipediaオントロジー 人間には,ウィキペディアの内容(意味) が判るけど人工物(コンピュータ,スマ フォ,ロボット...)には判らない
日本語Wikipediaオントロジー
74 WI論76
さらにズームアップ(模式図)
日本の 小説家 小説家 作家 人物 文学 文化 芥川龍之介 文化活動 家族 日本史 の人物 代表作 職業 職業 プロパティ定義域 クラス-インスタンス関係 Is-a関係・プロパティ上位下位関係 トリプル プロパティ値域 日本の 大学 日本の 小説 日本 存命人物 羅生門 蜘蛛の糸 鼻 小説家 塚本文 芥川也寸志 芥川貴之志 短編小説 日本 東京帝国 大学英文科 日本の映 画作品 作曲家 日本のクラ シック音楽 の作曲家 オペラ 作曲家 夏目漱石 明治の 人物 明治大学 の人物 門下生 津田青楓 坊っちゃん こゝろ 小説 時代小説・ 歴史小説 作家 誕生 最終学歴 配偶者 子供 著作 国籍 親族 ジャンル 死没 東京都出 身の人物 日本出身 の人物 文庫本 クラス プロパティ インスタンス 俳人 WI論日本語Wikipediaオントロジー
オントロジー人型ロボットNAO
と子供達・シニア
78