/IL rit op [- _1 ?a," 52
Knowledge editor for chemical synthetic design
Satoshi Kuwahara
* N T T A PTFFAPJ
NTT Communication and Information Processing Laboratories
Recent advances in Knowledge engineering technology have
resulted in a rapid progress of chemical compound design
expert-system. This paper describes a design overview of
the knowledge editor used in the chemical compound design
expert-system which contains two design paradigms,
traditional logic base design mechanism, and information
oriented design method using fact data bases.
In this editor,two new technologies are implemented as
the above information oriented design method. One is the
chemical synthetic equivalent substitution and another is
the knowledge acquisition from human experts by using
analogical inference which mechanism is based on the
similarity value between two characteristics of design
objective compound and existing one in fact data-bases.
A graphical interface between human expert and design
system is also introduced, and is very effective for
synthetic knowledge acquisition from chemical experts and
fact data-bases.
Several small synthetic experiments were tried under the
cooperation with chemical experts. Although the kinds of
chemical reaction treated in this prototype-system were
limited to fragment substitution on the single aromatic
ring,the essential mechanisms were confirmed.
Finally,in order to enhance this system toward supporting
other complex compounds,more effort should be taken for
establishing the perception algolism such as an analyzing
fine structure and characteristics of molecular, and
connecting with large scale fact data-bases.
1.は じめ に
科 学 技 術 庁 で は1986年 か ら5か 年 計 画 で 複 数 の 機 関 を 集 め てYr化 学 物 質 設 計 の た め の 知 識 ベ ー ス技 術 の 研 究 」 を 進 め て お り 、 NTTは そ の 一 環 と し て 知 識 ベ ー ス シ ス テ ム 構 築 の 基 本 的 ッ ー ル と して エ キ ス パ ー トシ ス テ ム 構 築 支 援 ッ ー ルKBMS(Knowledge‐
BaseManagementSystem)を 利 用 した 共 通 基 盤 シ ス テ ム の 開 発 を 分 担 して き た 。 こ の 共 通 基 盤 シ ス テ ム は 各 機 関 個 別 の 知 識 ベ ー ス シ ス テ ム を 構 築 す る際 に 、 共 通 的 機 能 群 を 提 供
し効 率 的 開 発 を 可 能 に す る だ け で な く、 最 終 的 な シ ス テ ム 統 合 の 時 点 で は 、 シ ス テ ム を 有 機 的 に 連 携 さ せ て 働 か せ る管 理 シ ス テ ム に も
な り得 る こ と を 想 定 した もの で あ る。
こ こで は こ の よ う な 共 通 基 盤 シ ス テ ム に必 要 な 技 術 の う ち 、 反 応 設 計 知 識 ベ ー ス シ ス テ
ム に 必 要 な 知 識 獲 得 支 援 技 術 、 知 識 利 用 技 術 、 に つ い て 述 べ る 。
2.反 応 設 計 知 識 ベ ー ス シ ス テ ム に 対 す る 要 求 条 件
知 識 ベ ー ス シ ス テ ム の 構 築 に 際 して は 、 対 象 業 務 の 分 析 、 及 び 整 理 が 必 要 で あ る 。
反 応 設 計 の 場 合 に は 、 現 在 、 専 門 家 は 膨 大 な 量 の 化 学 文 献 や 反 応 デ ー タ ベ ー ス を 検 索 し な が ら 、 化 学 者 が 持 っ て い る 豊 富 な 知 識 や 経 験 を 屈 指 し 、 最 適 な 反 応 経 路 の選 定 を 行 って い る 。 化 学 物 質 の 構 造 が 複 雑 な 場 合 に は 、 考 え な け れ ば な ら な い 反 応 経 路 の 数 は 膨 大 に な り 、 反 応 設 計 に は 多 額 の コ ス トと長 期 の 時 間 が か か り、 最 近 ま す ま す 化 学 物 質 の 構 造 が
複 雑 化 して い く傾 向 の た め 、 こ の よ う な 業 務 を 計 算 機 支 援 す る 必 要 性 は 益 々 増 大 して い る 反 応 設 計 用 の 計 算 機 支 援 シ ス テ ム は 数 多 く 開 発 され て き て お り、LHASAte、SEC
S2⊃ 、SYNCHEM3⊃ 等 の シ ス テ ム が 良 く 知 られ た も の で あ る 。 今 後 開 発 す る シ ス テ ム に お い て は 、 これ ら の 欠 点 を 改 善 し、 か っ 近 年 の 計 算 機 工 学 の 進 歩 を 考 慮 し た 先 端 的 な も の で あ る べ きで あ る。 こ の よ う な 観 点 か らAI(人 工 知 能)研 究 の 一 環 と して 研 究 開 発 が 進 ん で い る 知 識 ベ ー ス技 術 を 使 った 計 算 機 支 援 シ ス テ ム の 開 発 を 本 研 究 で は 最 大 の狙
い と して い る 。
化 学 物 質 の 反 応 設 計 を 計 算 機 で 支 援 す る た め に は 、 反 応 ア ル ゴ リズ ム が 充 分 得 られ る こ と、 及 び 化 学 的 デ ー タ(フ ァ ク トデ ー タ)が 充 分 蓄 積 され て い る が 必 要 で あ る 。 しか し 化 学 物 質 は 数 百 万 種 も あ り、 物 質 問 の 反 応 デ 0タ は そ れ を 組 み 合 わ せ た もの で あ る か ら天 文 学 的 な 数 に な り 、 反 応 ア ル ゴ リ ズ ム を 体 系 的 に 得 る の は非 常 に 困 難 で あ る 。 一 方 、 フ ァ ク トデ ー タ つ い て は 専 門 家 か ら比 較 的 容 易 に 得 や す い だ け で な く、 各 方 面 で は精 力 的 に デ ー タ ベ ー ス(DB)化4,5)が 進 め ら れ て お り、 一 部 商 業 ベ ー ス で 利 用 可 能 な 段 階 に あ る こ れ に 対 応 して 、 化 学 反 応 の 設 計 の 方 法 論 と し て は 、 反 応 ア ル ゴ リ ズ ム を 体 系 化 し て 得 た 反 応 規 則 を 用 い た 論 理 指 向 型 設 計 方 法 と フ ァ ク トデ ー タ か ら得 ら れ る知 識 を 利 用 して 設 計 す る情 報 指 向 型 設 計 方 法 の2種 に 大 別 で き る が6,、 前 者 は新 規 な 反 応 設 計 に は 有 効 で あ る が 、 反 応 規 則 を 正 確 に 、 網 羅 的 に 獲 得 す る
こ と は 困 難 と い う欠 点 を 持 ち 、 後 者 は 比 較 的 既 知 の 反 応 の組 合 せ か らな る反 応 設 計 に は 有 効 で あ る が 、 一 定 の枠 組 み か ら は ず れ た 反 応 に つ い て は無 力 で あ る と い う欠 点 を 持 っ 。 従 って 、 現 状 で は上 記 の 情 報 指 向 型 設 計 方 法
と 論 理 指 向 型 設 計 方 法 を 組 み 合 わ せ ハ イ ブ リ ッ ドな 方 法 論 を 採 用 す る こ とが 実 用 的 で あ る と い わ れ て い る。
化 学 者 が 反 応 設 計 を 行 う場 合 、 ま ず 対 象 と な る 化 学 物 質 を 構 造 図 、 分 子 式 、 名 称 等 で 認 識 す る 必 要 が あ る。 次 の ス テ ッ プ で は 、 経 験 的 な 知 識 、 及 び 化 学 文 献 か ら得 た 知 識 に基 づ き 、 設 計 対 象 の 化 学 物 質 の 特 徴 を 認 識 し、
合 成 の 単 位 に 分 割 す る 。 合 成 単 位 で 結 合 を
切 断 し、 フ ラ グ メ ン トに分 け 、 各 フ ラ グ メ ン ト毎 に 、 経 験 的 な 反 応 規 則 、 理 論 的 な 反 応 規 則 を 用 い て 反 応 前 の 化 学 物 質 構 造 を 求 め る。
そ こで 求 め た 反 応 前 の 構 造 を 結 合 して 、 前 駆 体 を 求 め る。 さ らに この 前 駆 体 を 対 象 化 学 物 質 と して 考 え 、 前 駆 体 の 化 学 物 質 が 既 知 の 原 料 と な り得 る化 学 物 質 に な る ま で 繰 り返 す 。 反 応 経 路 は複 数 得 られ 、 最 終 的 に は 実 験 に よ り確 認 さ れ る。
以 上 の 化 学 者 の 反 応 設 計 作 業 モ デ ル を 図1 に 示 し、 そ れ を シ ス テ ム化 す る 際 の 知 識 ベ ー ス シ ス テ ム に 要 求 さ れ る要 求 条 件 に つ い て 以 下 に述 べ る。
./,一
肉o一
00中)CHg
蕪 一 ㌃濡
Aktavinone乳 無 、
')/●
目漂 化合 物
<
茅 価 体 置 換 頻 推 事 例 評 価
舗 単位分霜
経 路 選 定 理 論 評 儀
i i
̲̲[壷]
事 例 知 識
反 応 冨 例 等 価 体 グ ル ー ア
反 応 条 件 触 媒
理 論 知 識
反 応 理 論 戦 路 ポ ン ド 前 駆 体 生 成 量 子 力 学
o(属 「もH2 CHZCH3
00H
図1反 応 経 路 選 定 の 専 門 家 モ デ ル
(1)抽 象 度 に 応 じた 柔 軟 な 知 識 表 現
化 学 反 応 に 関 す る 知 識 は 専 門 家 の頭 の 中 、 あ る い は 化 学 の 専 門 書 に 記 述 さ れ た 体 系 的 に 整 理 さ れ た 反 応 理 論 に あ た る知 識 か ら、 化 学 者 の 頭 の 中 や 、 あ る い は 反 応 デ ー タ ベ ー ス 等 に 蓄 積 さ れ た フ ァ ク ト知 識 等 に 分 類 さ れ る 。 計 算 機 に こ れ ら様 々 な 知 識 を 格 納 す る 場 合 に は 、 そ の 知 識 の 量 や 利 用 法 に 応 じて 、 適 切 な 表 現 法 を 採 用 す る必 要 が あ る 。 例 え ば 、 条 件 と実 行 か らな る よ う な 規 則 的 な 知 識 は 比 較 的 ル ー ル 表 現 に 適 し 、 主 語 一 述 語 か ら な る よ う な フ ァ ク ト型 知 識 は フ レ ー ム 表 現 に 適 し て い る と考 え られ る。
さ ら に 知 識 の 格 納 、 利 用 性 を 考 慮 す る と知 識 の 汎 用 的 な 表 現 方 法 も重 要 で あ る 。
(2)ハ イ ブ リ ッ ドな 設 計 手 法 前 述 したLHASA、SECS、SYNC
HEM等 は 論 理 指 向 型 の 反 応 経 路 設 計 シ ス テ ム と言 わ れ る もの で あ る。 ま た 、REAC
CS7)やINSRED$等 は 情 報 指 向 型 反 応 設 計 シ ス テ ム と よ ば れ る も の で あ る が 、 両 者 の 設 計 方 法 論 を と も に 使 っ た シ ス テ ム は 余 り 報 告 が 無 い 。 新 規 化 学 物 質 の 反 応 経 路 を 設 計 で き るた め に は 、 理 論 と経 験 を 併 用 す る必 要 が あ るが 、 理 論 に つ い て は 、 獲 得 す る の に 莫 大 な コ ス トを 要 す る。 さ ら に 、 反 応 理 論 に は 必 ず と言 っ て 良 い ほ ど例 外 が 付 き ま と う
と言 わ れ 。 こ れ ら知 識 を 正 確 に 網 羅 的 に 構 築 す る の は 難 しい 。 従 っ て 、 経 験 的 な 知 識 を 最 大 限 に 利 用 して 設 計 を 進 め る こ と を 原 則 と し な が ら、 理 論 が 経 験 を 補 完 す る よ う に 構 成 す る こ とが 最 良 で あ る。 経 験 的 知 識 の 利 用 に つ い て は 、 新 規 化 学 物 質 の 設 計 を 前 提 に
す る と、 そ の も の の 経 験 的 デ ー タ が 存 在 す る は ず は 無 い か ら、 単 に 事 例 の マ ッ チ ン グ で は 設 計 が で き ず 、 反 応 部 位 と か 反 応 に 着 目 した 等 価 性 、 類 似 性 を 考 慮 した 設 計 を 行 う必 要 が あ る。
(3)マ ンマ シ ン イ ン タ フ ェ ー ス
利 用 者 の 利 便 を 考 え 、 設 計 対 象 の 化 学 物 質 の 構 造 が 化 学 者 が 日常 使 っ て い る化 学 構 造 図 で 入 力 で き る必 要 が あ る 。
こ の た め に は 、 利 用 者 が 入 力 した グ ラ ッ フ ィ ク イ メ ー ジの 構 造 を 計 算 機 が 自動 的 に 部 分 構 造 を 抽 出 し、 さ ら に 特 徴 を 認 識 し、 計 算 機 処 理 が 可 能 な よ う な 内 部 表 現 形 式 に変 換 す る 必 要 が あ る。 しか し、 こ の 処 理 は 計 算 機 が 最 も不 得 手 とす る所 で あ り、 か っ こ の 認 識 の 精 度 が そ の 後 の シ ス テ ム の 処 理 を 決 め て し ま う の で 、 最 も注 意 して シ ス テ ム構 築 す べ き と こ ろ で あ る 。
ま た 、 化 学 物 質 の 構 造 表 現 に つ い て は 計 算 機 が 使 う内 部 表 現 形 式 の 他 に 、 他 シ ス テ ム と の 交 換 情 報 に も使 わ れ 外 部 表 現 形 式 も重 要 で あ る。 こ の 外 部 表 現 形 式 に っ い て は 、 標 準 形 式 と し て 取 り決 め て お く必 要 が あ り、 しか る べ き機 関 で 決 定 す る 必 要 が あ る 。
具 体 的 な マ ンマ シ ン イ ン タ フ ェ ー ス は グ ラ フ ィ ッ ク デ ィ ス プ レ イ上 で ア イ コ ンや マ ウ ス あ る い は ラ イ トペ ン を 使 っ た 操 作 性 の 良 い も の が よ く、 さ らに 、 部 分 構 造 等 は ユ ー ザ の 指 定 に よ り 、 任 意 に 変 更 ・追 加 で き る こ と が 望 ま しい 。 ま た 、 全 て の 操 作 は オ ン ラ イ ンで 自 動 的 に 情 報 が 管 理 され る必 要 が あ る 。
(4)DBと の 連 結
反 応DBか ら フ ァ ク ト知 識 を 入 手 す る以 外
に 反 応DBを 整 理 して 規 則 知 識 を 獲 得 す る シ ス テ ム と して 、 化 学 の 膨 大 なDBか ら知 識 を 自 動 的 に 抽 出 す る こ と を 目 的 と した シ ス テ ム の 研 究 が 多 く進 め ら れ て い る 。9)
こ の 場 合 の 問 題 は 、 対 象 と す る知 識 の 抽 出 カ テ ゴ リを あ ら か じ め 定 義 して お く必 要 が あ る た め 、 カ テ ゴ リ分 類 の 難 しい 化 学 分 野 の 知 識 抽 出 シ ス テ ム の 多 くは 、 比 較 的 簡 単 な 反 応
に っ い て の 知 識 しか 抽 出 で きな い が 、DBの 不 完 全 性 が 計 算 機 に よ る 知 識 自 動 抽 出 の 障 害
に な る。 そ こ でDBか ら の 知 識 抽 出 シ ス テ ム に は 、 な ん らか の 不 正 な デ ー タ や 例 外 的 な デ ー タ の 除 去 を 知 能 的 に 行 え る 枠 組 み19)が 必 要 で あ る 。
3.KBMSを 用 い た 反 応 設 計 支 援 シ ス テ ム KBMSは 知 識 べ 一 ス シ ス テ ム を 構 築 支 援 す る た め の 汎 用 ッ ー ル で あ り 、 各 種 知 識 ベ ー ス シ ス テ ム に共 通 す る 知 識 蓄 積/管 理 、 推 論 マ ンマ シ ン イ ンタ フ ェー ス 等 の 機 能 群 を シ ス テ ム構 築 者 に 提 供 す る も の で あ る 。1n
こ のKBMSを 用 い た 反 応 経 路 設 計 支 援 知 識 ベ ー ス シ ス テ ム の 全 体 構 成 を 図2に 示 す 。
化 学 物 質 の 設 計 支 援 を 行 うた め に 、KBM Sの 機 能 に 化 学 物 質 が 構 造 図 で 取 り扱 う こ と の で き る マ ン マ シ ン イ ン タ フ ェ ー ス と 、 専 門 家 、 及 び 反 応DBか ら知 識 を 獲 得 す る た め の 知 識 獲 得 エ デ ィ タ を か ぶ せ た 構 成 と な る。
圃 愈
⑧
構 造 図 エ デ ィ タ
匝
(部分 構遣f\.
)\
←《璽
専 門 家 工 デ イ タ
〉 構 遺 謬 識 ぐ
1
E
F
E
<
( 特 懲
〉 フレーム ) (
Trans‑
for )
( 事 例 再一ル ) (
等 価 )置 換
KB
!
! ノ 1
ノ
←唖1
㊥
1持 徴 表現 }論 理 指 向
情 鞭 指 向 一
1
←c価 体)
i
TRANSFORM 等 価 体 置 換
反 応 DB
レ
<一 … …
知 識 獲 得 棲 構 賦
類 推
l
i
結 果 表 示 KBMS K
一
図2シ ス テ ム 構 成
3.1KBMSの 概 要
NTTが 開 発 した 知 識 ベ ー ス シ ス テ ム 構 築 支 援 ッ ー ルKBMSの 概 要 に っ い て 図3に 示
す 。
(1)知 識 表 現
知 識 を フ レー ム 、 ル ー ル 、 及 び ワ ー キ ン グ メ モ リ等 の 組 合 せ で 表 現 し、 特 に 、 フ レー ム 間 に 利 用 者 独 自 の 関 係 を 定 義 す る こ と で 、 知 識 の 表 現 や 体 系 化 が 容 易 に で き る。 ま た ル ー ル は ル ー ル セ ッ トに よ り、 モ ジュー ル化 、 及 び 階 層 化 で き、 ル ー ル の 体 系 化 を 可 能 と し
て い る 。
(2)パ フ ォー マ ン ス
推 論 で は 多 くの 可 能 性 を 知 識 の 中 か ら探 索 す る た め 、 大 き な マ シ ンパ ワ ー が 必 要 で あ り、
大 規 模 な 知 識 ベ ー ス か ら な る シ ス テ ム で は 実 行 の 高 速 化 が 要 求 さ れ る 。KBMSで は 予 め ル ー ル を コ ンパ イ ル して 最 適 化 す る方 式 を 用 い る こ と に よ り、 推 論 を 高 速 化 で き、 リ ア ル タ イ ム の シ ス テ ム に も使 用 で き る。
ま た パ ソ コ ン版KBMSの 場 合 に は 、15 MBと い う メ モ リ空 間 を 使 用 で き 、 さ ら に 、 二 次 記 憶 の 併 用 に よ り、 知 識 ベ ー ス の 規 模 を 事 実 上 制 限 無 しで 使 用 可 能 で あ る。
(3)マ ン マ シ ン イ ン タ フ ェ ー ス
知 識 シ ス テ ム で は多 様 な 知 識 を 利 用 す る た め に 、 マ シ ン と そ と の 知 識 源 と の 表 現 の ギ ャ ッ プ を 極 力 短 縮 す る必 要 が あ る。 化 学 者 の
日 常 使 わ れ る表 現 方 式 が 化 学 構 造 図 で あ れ ば 計 算 機 が こ れ を 直 接 扱 え る こ と が 必 要 で あ る さ ら に 、 ス ペ ク トル デ ー タ等 の よ う に ア ナ ロ グ 信 号 等 を 扱 う必 要 が あ れ ば 、KBMSの よ う な 記 号 を 処 理 す る シ ス テ ム に ア ナ ロ グ処 理 部 を 付 加 す る必 要 が あ る 。KBMSで は 汎 用 的 な 知 識 ベ ー ス エ デ ィ タ を 持 っ て お り 、 マ ル チ ウ ィ ン ドウ 、 メ ニ ュ ー や マ ウ ス等 を 利 用 で き る 他 、KBMSツ ー ル キ ッ トや ス ク リ ー ン デ ザ イ ナ ー に よ る グ ラ フ ィ ッ ク作 成 支 援
ッ ー ル を 利 用 して ユ ー ザ 独 自 の イ ン タ フ ェ ー ス の 容 易 な構 築 が 可 能 で あ る 。
(4)知 識 ベ ー ス の 流 通 性
KBMSはPC9801か ら大 型 マ シ ン ま で 多 様 な マ シ ンで 動 作 で き る が 、 知 識 ベ ー ス の 表 現 と マ ン マ シ ン イ ン タ フ ェ ー ス を 統 一 し て い る た め 、 異 機 種 間 の シ ス テ ム 移 行 が 容 易 で あ る 。 利 用 者 の 開 発/実 行 環 境 に 合 わ せ て 、 各 種 形 態 が とれ る こ と は効 率 的 シ ス テ ム 構 築 に 不 可 欠 で あ る 。
(5)そ の 他
以 上 の 他 に 、KBMSは 標 準 的 なCommon‑
LISP言 語 で 記 述 され て い る が 、 シ ス テ ム のC 言 語 へ の 変 換 ッー ル やDBを 知 識 源 と して 利 用 で き る よ う に 、DB‑KB変 換 ツ ー ル が 用 意 さ れ て い る 。
/ KBMS マ ウ ス や マ ル チ ウ ィ ン ドウ
に よ る 使 い 易 い 知 識 エ デ ィタ
《 知 識 デ パ ・ カ
、 、噛 、、
〉
知識獲得支援 知識の投入 ・修正 や検証 を支援す る
推論磯構
知識ベ ースを利用 し推論 を実行す る 奪
一 傭 嵩 撫 塗
一 一91
一=
知識 表現 ・管理磯溝 事実や 規則に関す る知識 を 一定の形式で表現 し,知 職 ベ ースに蓄積 ・管理す る 専 門家
● 職 の投入
匹 一璽 ぐ惣 検証
'ノ/ 〆 /!
!/
//
//
/!
ノ
イi繭 凝 パ ソ,ン に よ る 実 用 的 な 実 行 環 箋
・CommonLisPoi?述 に よ
∠一\ ∠\ \
、
\
\
'利 用 者
質問 〉 ●
推論結果 コ』
、
禰 姦 漿鵠
くyみ
知 識 ベ ー ス
・規 則 知 識
・事 実 知 識
\
\\\
\\
\\
\
ノ 利 用 者 作 成 部
拡 張性 ・移植 性 の 良 卑
図3エ キ ス パ ー ト シ ス テ ム 構 築 支 援 ッ ー ルKBMSの 特 徴
3.2各 種 機 能 概 要
(1)化 学 構 造 図 入 出 力 エ デ ィ タ
本 エ デ ィ タ はLISPを 用 い て 作 成 さ れ 、 、 設 計 対 象 や 知 識 獲 得 の 際 に 、 化 学 物 質 の 化 学 構 造 を シ ス テ ム に 入 力 す る た め 、 ま た 処 理 途 中 や 設 計 結 果 の 出 力 に 使 用 さ れ る。 操 作 性 を 良 くす る た め に 、 化 学 物 質 を 構 成 す る 部 分 構 造 等 の 各 パ ー ッ や 操 作 コ マ ン ドを ア イ コ ン
で 用 意 し 、 利 用 者 は マ ウ ス で そ れ を 選 択 す る よ う に 構 成 し た 。 さ ら に 、 名 称 等 の 投 入 に は キ ー ボ ー ドを 併 用 し た 。
本 エ デ ィ タ が 持 っ 主 な メ ニ ュ ー を 表1に 示 す 。 図4は こ れ を 操 作 し て い る 画 面 の1例
で あ る 。
表1構 造 図 エ デ ィ タ の 操 作 メ ニs‑一
メニ ヱー サプ メニュー メニ ヱー サプ メニュー メニュー サプ メニヱー
拡 大 ・縮 小 定率拡大 範囲指定 定率縮小 全体表示 復帰
移動
要素移動 部分移動フ ァ イ ル ロ ー ド マ ー ジ セ ー ブ ー 覧 検 索
部分構造 入力 名称一覧
印刷 開始
スクmル 停止 付加情報 分子式
分子量 登録者 名
検索
名称検索薔義 レベル
要素検索消去
要素消去 部分消去 全消去グ リ ッ ド 設定
置換 要素置換 解除
削除
要素削除
部分削除 全削除
終了複写 要素複写
部分複写
検査〈 入 力 モ ー ド〉
ロ ー ド マ ー ジ セ ー ブ フ ァ イ ル ー 覧 要 素 消 去 全 消 去 ハ ー ドコ ピ ー 終 了
図4化 学構造 図入力の例
(2)特 徴 認 識
化 学 物 質 の 構 造 認 識 は 図5で 示 す 手 順 に よ り行 わ れ る 。
薪
構 造 の 認 識図5構 造 認 識 の 手 順
① 部 分 構 造 の 認 識
入 力 さ れ た 化 学 物 質 は 一 旦 原 子 結 合 表 の 形 に 表 現 さ れ 、 正 準 化 さ れ た 後 、LIST表 現 に 変 換 す る 。 正 準 化 は 代 表 的 な モ ル ガ ン ァ ル ゴ リ ズ ム12)を 使 用 した 。 次 に 、 環 や
ア ル キ ル を 認 識 す る 。 環 の 認 識 に はSSS Rの ア ル ゴ リ ズ ム(TheSmallestSetof
SmallestRing)を 利 用 した 。 環 、 骨 格 以 外 は 部 分 構 造 と して 登 録 さ れ て い る構 造 が 認 識 さ れ る 。
最 後 に 、 これ ら を 特 徴 フ レ ー ム に表 現 す る 。
② 部 分 構 造 間 の 結 合 状 態 の 認 識
部 分 構 造 間 の ボ ン ドの 状 態 、 即 ち 単 結 合 、 二 重 結 合 、 共 役 結 合 等 を 特 徴 フ レ ー ム に 表 現 す る 。 但 し、 現 在 は立 体 は 認 識 で き な い 。
③ 各 部 分 構 造 の 位 置 関 係 の 認 識
部 分 構 造 相 互 の 位 置 関 係 を 認 識 す る 。 位 置 関 係 は 予 め シ ス テ ム構 築 者 が 定 義 した 関 係 を 探 索 し 、 あ れ ば 特 徴 フ レー ム に 表 現 す る。
位 置 関 係 は 化 学 反 応 の 分 野 に 依 存 す る 知 識 で あ り 、 場 合 に よ っ て は 、 遠 く離 れ た2っ の 部 分 構 造 間 の 位 置 を 把 握 す る必 要 が あ る。
こ れ ら位 置 関 係 を 探 索 す る 固 有 の 手 続 き に っ い て は シ ス テ ム 構 築 者 が 作 成 す る必 要 が あ
る。
④ 各 部 分 構 造 の 性 質 の 認 識
各 部 分 構 造 の 電 気 的 性 質 等 を 認 識 し、 特 徴 フ レー ム に 表 現 す る。 例 え ば 、 官 能 基 の 電 子 供 与 性 や 電 子 吸 引 性 等 で あ る 。
こ の 性 質 の 認 識 シ ス テ ム に つ い て も、 化 学 反 応 に 依 存 す る の で 、 シ ス テ ム 構 築 者 自 身 が 予 め 作 成 す る 必 要 が あ る。
以 上 の う ち 、 か な りの 認 識 手 続 き が 化 学 者 自 身 の 作 成 を 要 求 さ れ る。 但 し、 こ れ ら の 多 くは 化 学 者 自 身 が 既 に利 用 して い る も の で あ り 、 今 後 は しか る べ き機 関 で 標 準 的 な 認 識 項 目 、 及 び フ ォー マ ッ トが 審 議 さ れ 、 シ ス テ ム 間 の 交 換 情 報 と して も利 用 さ れ る こ と が 、 望 ま しい 。
本 シ ス テ ム で は 、 実 験 的 シ ス テ ム な の で 比 較 的 単 純 な 反 応 しか サ ポ ー ト して い な い が 、 実 用 シ ス テ ム構 築 に は 、 今 後 多 くの 化 学 的 な 認 識 プ ロ グ ラ ム が 追 加 せ さ な け れ ば な ら な い
(3)知 識 表 現
① フ レー ム
設 計 対 象 の 化 学 物 質 は フ レー ム で 表 現 さ れ る。
フ レー ム に は 知 識 の 構 造 を 定 義 す る ク ラ ス と知 識 デ ー タ そ の も の の イ ン ス タ ン ス か ら構 成 さ れ る 。 ク ラ ス は ス ー パ ー ク ラ ス と通 常
の ク ラ ス に 階 層 化 さ れ 、 ク ラ ス 、 ス ー ペ ク ラ ス で 定 義 さ れ た 情 報 は イ ン ス タ ン ス に 引 き継 が れ る 。 図6は こ れ らの 関 係 を 使 って 化 学 物 質 の 特 徴 フ レー ム を 表 現 した 例 を 示 す 。
フ レ ー ム の イ ン ス タ ン ス の 各 ス ロ ッ トに は 特 徴 認 識 の 結 果 が 記 述 さ れ る。
ス ー パ ー ク ラ ス
へ6ンセ●ン環;無 シケロヘキサン3,無 鋤 ボ ン酸;無 ア乃デ ヒド;無
"琵 餐 電 子供 与 基;無 電子 吸 引 基;無 ハロゲ ン;焦
...,.,:∵:.:.:.績.登i関i係:.;.
へ・ンセ・ン ーC;無 C一 へ・ンセ.ン ーC;無 Cヨ へ.ン セ●ン ーC;無
電 子 吸 引 基 一3‑X;無 電 子 供 与 基 一4‑X;無 加 ボ ン酸;無
アルテ.ヒト.;無 ミ
ク ラ ス
特 徴 ク ラス
ペ ンt'ン環 シケロAキサン 加 ボ ン酸 ア乃デ ヒト'
電 子 供 与 基 電 そ 吸 引 基 ハロイゲ ン
へ咀ンセ・ンーC
無無無無無無無
C一 ヘ ンLン ーC C=へ.ン セ・ンーC
電 子 吸 引 基 一3‑X;
電 子 供 与 基 一4‑X;無
無無無
イ ン ス タ ン ス
一
特 徴 ク ラ ス ペ ンゼ ン環 シ90ヘキサン 加 ボ ン酸 ア乃テ●ヒド
電 子 供 与 基 電 そ 吸 引 基 ハadゲ ン
へ●ンセ.ンーC C一 へ.ンセ●ンーC C=A.ン セ・ンーC
有無無無然有有無有
電 子 吸 引 基 一3‑X:無 電 子 供 与 基 一4‑X;有
図6特 徴 フ レー ム の 記 述 例
② ル ー ル
ル ー ル 知 識 に は 論 理 指 向 型 設 計 を 行 うた め の 反 応 理 論 知 識 と情 報 指 向 形 設 計 の た め の 反
応 事 例 に基 づ く フ ァ ク ト知 識 の2種 類 が あ る 反 応 理 論 知 識 は各 反 応 の プ リ ミテ ィ ブ な オ ペ レ ー シ ョ ンを 化 学 物 質 の 特 徴 を 示 す 各 種 シ
ン ボ ル を 使 用 して 条 件 と実 行 を 表 現 し た も の で 、1っ の 反 応 オ ペ レ ー シ ョ ン は原 則 と して 、 複 数 の プ リ ミテ ィ ブ な ル ー ル の 連 結 に よ り達 成 され る 。 図7は 本 シ ス テ ム の 実 験 で 用 い た ル ー ル 例 で あ る 。 ル ー ル の 条 件 部 は 特 徴 フ レ ー ム に 記 述 さ れ て い れ る 化 学 物 質 の 構 造 特 徴 が 記 述 され 、 対 象 化 学 物 質 に こ の 特 徴 が
あ れ ば 、 実 行 と し てTransform実 行 関 数 が コ ー ル さ れ る 。Transform実 行 関 数 は 標 準 的 な 関 数 と 化 学 反 応 を 想 定 し て 、 シ ス テ ム 構 築 者 が 予 め 作 成 し て お く 関 数 と が あ り 、 切 断 、 付 加 、 置 き 換 え 等 の プ リ ミ テ ィ ブ な オ ペ レ ー シ ョ ン に っ い て は シ ス テ ム が 予 め 用 意 し た 。
(defurle(trans2r4)
(frame(部 分 構 造 入 力 構 造(ペ ンゼ ンー単 結 合 一電 子 吸 引 基 有 〉)) (frame(部 分 構 造 入 力 構 造(ペ ンゼ ンー単 結 合 一X基 有)))
(frame(部 分 構 造 入 力 構 造(電 子 吸 引 基 一4‑x基 有))) 一 一 〉
(cal1(changex基'H))… ・…taransform
図7tarnsformル ー ル の 記 述 例
他 方 の フ ァ ク ト知 識 に つ い て は 、 専 門 家 と 対 話 に よ り取 得 す る方 法 と、 反 応DBか ら 自 動 獲 得 す る 方 法 が あ る 。 前 者 は 反 応 を 前 駆 体 、 生 成 体 と 反 応 条 件 か らな る反 応 方 程 式 と
み た 時 、 対 話 的 に そ れ らを 専 門 家 に 入 力 さ せ 計 算 機 内 で そ れ を ル ー ル の 形 に 表 現 す る も の で あ る 。 図8に 事 例 ル ー ル の 例 を 示 す 。
(defruletrlr12(:priority50)
(frame(入 力 テ㌔ タ 入 力 構 造(環 種 類 環 の モ励 φン名) (位 置 パ ターン(023>) (反 応 種 類 求 電 子)
(置 換 基 名(CH3‑一 一CHO‑000
(性 質(R‑一 一 一Z‑〉)
(試 薬CHO))) 一 一 〉
(CALL(change'CHO'H))
図8反 応 事 例 ル ー ル の 記 述 例
本 事 例 ル0ル は反 応 が 芳 香 族 性 単 環 の 置 換 反 応 の 例 で あ り 、 化 学 物 質 の 構 造 特 徴 は 置 換 基 の 種 類 と位 置 、 性 質 に 限 定 した 簡 単 な 表 記 を 用 い た 。 さ ら に 、 反 応 条 件 と して は 求 電 子 、 あ る い は求 核 置 換 反 応 の 別 、 試 薬 を 入 力 で き る よ う に した 。 さ ら に 、 ル ー ル の 競 合 解 決 や 類 推 に 使 用 す る プ ラ イ オ リ テ ィを 各 ル ー ル に 付 与 した 。 プ ラ イ オ リテ ィ は ル ー ル の 重 要 度 を 示 す もの で 、 例 え ば 、 工 業 的 に 著 名 な 反 応 の 値 を 高 くす る こ と に よ って 、 こ の 反 応 が 優 先 的 に 使 用 さ れ る よ う制 御 す る も の で あ る。
DBか ら の フ ァ ク トル ー ル の 獲 得 で はDB 内 に 記 述 され て い る原 子 結 合 表 、 あ る い は特 徴 テ ー ブ ル か ら前 駆 体 と生 成 体 の 構 造 知 識 を 得 、 ま た 反 応 条 件 に つ い て はDB中 の テ キ ス トか ら抽 出 す る よ う に した 。 こ れ らの 手 続 き は 対 象 とす る 反 応DBに よ って 異 な る 。
化 学 で は こ の 反 応DBの 作 成 は 古 くか ら行 わ れ て い る が 、 各 々 形 式 が 異 な る た め 、 相 互 流 通 が な さ れ て い な い 、 化 学 物 質 の 種 類 は 今 後 も増 大 す る と 思 わ れ 、 反 応DBの 標 準 化 が 行 わ れ れ ば 、 こ の よ う な 知 識 獲 得 は容 易 に で き る も の と考 え られ る。
③ 等 価 体
本 シ ス テ ム で は 反 応 知 識 の 他 に 、 教 科 書 的 な フ ァ ク ト知 識 と して 、 合 成 等 価 体 知 識 を 専 門 家 か ら取 得 す る機 構 を 設 け た 。 後 で も述 べ る が 、 合 成 等 価 体 知 識 は ル ー ル を 用 い た 設 計 を 進 め て 行 く過 程 で 部 分 構 造 を 等 価 体 に 置 き 換 え て 、 あ らた め て ル ー ル 適 用 を 行 う も の で 、 これ を す る こ と に よ っ て よ り現 実 的 な 反 応 経 路 を 設 計 す る こ と が で き る よ う に な る。
④ そ の 他
知 識 表 現 は して い な い が 、 グ ル ー プ フ ァ イ ル を 有 し、 専 門 家 に グ ル ー プ を 入 力 さ せ る こ と が で き る 。 これ は 、 電 子 供 与 基 、 電 子 求 引 基 、X基 、M基 と い っ た 官 能 基 の 性 質 を 定 義 す る も の で 同 一 の 性 質 を 持 っ 部 分 構 造 は 同 一 の グ ル ー プ に 所 属 す る こ と を 登 録 す る
。 グ ル ー プ 表 示 子 に は各 々 シ ン ボ ル を 与 え 、 必 要 な ら専 門 家 は グ ル ー プ シ ン ボ ル を 使 って ル ー ル 入 力 が 可 能 で あ る 。 こ の よ う に グ ル ー プ シ ン ボ ル を 使 え ば 、 よ り汎 用 的 な ル ー ル の 記 述 が で き、 ル ー ル の 適 用 可 能 性 を 増 大 す る と と も に 、 ル ー ル 量 の 圧 縮 も 可 能 で あ る 。
4.推 論
知 識 に 対 応 して 論 理 指 向 型 設 計 の た め の 推 論 と情 報 指 向 型 設 計 の 推 論 か ら構 成 さ れ る 。 こ こ で は 情 報 指 向 型 設 計 で 使 用 さ れ る等 価 体 置 換 、 及 び 類 推 に つ い て 述 べ る。
4.1等 価 体 置 換
化 学 合 成 的 に み て 、 極 め て 容 易 に 相 互 に 置 き 換 え 可 能 な 複 数 の 部 分 構 造 の 組 合 せ を 等 価 体 と 呼 び 、 これ を 実 際 の 設 計 時 に 対 象 と な る 化 学 物 質 の 一 部 を 等 価 な 別 の 部 分 構 造 に 置 き 換 え る。 設 計 は こ の 置 き換 え た 化 学 物 質 に 基 づ い て 行 い 、 こ れ ら を 合 成 等 価 体 置 換 と い う。 こ の よ う な等 価 体 置 換 は 日常 専 門 家 が 多 用 して い る もの で 、 こ れ だ け で か な り の 反 応 設 計 が 可 能 で あ る 。
等 価 体 置 換 に は相 互 に 可 逆 性 の あ る も の と 単 方 向 の も の が 考 え ら れ る が 、 こ れ は 次 の 制 約 リ ス トに よ っ て 制 御 さ れ る。
化 学 反 応 が 化 学 物 質 の一 部 の 反 応 で は な く、
他 の 部 分 構 造 に影 響 され る場 合 が 多 い が 、 等 価 体 の 考 え に も 、 こ の よ うな 制 限 を 知 識 化 し た 制 約 リ ス トが 必 要 に な る 。 な お 、 本 シ ス テ ム で は 設 計 結 果 に 対 して 、 単 位 反 応 評 価 を 行 う シ ス テ ム が 付 加 さ れ 、 そ の 中 で 等 価 体 置 換 の 制 約 チ ェ ッ ク を 行 う こ と を 前 提 と して い る の で 、 制 約 リ ス トを イ ン プ リ メ ン トし な か っ た 。 しか し、 候 補 を 予 め 絞 り込 む た め に 制 約 リス トの 表 現 方 法 、 利 用 法 に つ い て 検 討
を 要 す る と 考 え る 。
4.2類 推
新 規 化 学 物 質 の 設 計 を 仮 定 す る と、 そ れ に 対 応 す る 事 例 知 識 は 獲 得 さ れ て い な い が 、 過 去 の 事 例 を 利 用 して 対 象 の 化 学 物 質 に 対 す る 設 計 結 果 を 推 定 す る な ん らか の 知 識 を 生 成 す る 方 法 が 考 え ら れ る 。 そ の 代 表 的 な 方 法 と し て 類 推 と い う方 法 が あ る 。 化 学 反 応 事 例 に こ れ を 適 用 す る とす れ ば 、 既 に 知 識 と して 獲 得 さ れ て い る反 応 事 例 の 中 か ら 、 設 計 対 象 の 化 学 物 質 に 類 似 し た 化 学 物 質 の 設 計 事 例 を 探 索 し、 こ れ を テ ン プ レー トに して 、 設 計 対 象 に適 合 す る よ う に 反 応 事 例 を 変 形 し、 新 規 な 事 例 知 識 を 獲 得 、 及 び 推 論 を 行 う も の を 類 推 と 呼 ぶ こ と が で き る。
類 推 に よ り生 成 さ れ た 知 識 は必 ず し も 、 正 し い と は 限 ら な い 。 化 学 反 応 の 場 合 、 正 し く て も、 コ ス ト、 収 率 、 安 全 性 等 の 要 因 で 実 用 に な ら な い 知 識 もあ り 、 こ れ ら は正 し く な い 知 識 と 判 断 す べ き もの も存 在 す る はず で あ る 。 類 推 の 精 度 を 高 め る に は 、 単 一 の 事 例 の み に 基 づ い て 、 変 形 類 推 を 行 い 、 新 規 知 識
を 生 成 す る方 法 で は 、 精 度 を高 め る こ と は で き な い 。 精 度 向 上 策 と して は 、 複 数 の 似 か よ った 過 去 の 事 例 を 学 習 す る こ と に よ り 、 新 規 の 知 識 を 生 成 す る方 法 が と られ る べ きで あ る。 っ ま り 、 類 推 と学 習 は組 み 合 わ せ て 使 用 す る こ と に よ り、 類 推 の 効 果 を 高 め る こ と が 可 能 に な る。 そ の 他 に 、 よ り本 質 的 に 、 類 推 の 精 度 を 左 右 す る フ ァ ク タ が 存 在 す る。
1つ は 、 設 計 対 象 の 化 学 物 質 と 事 例 中 の 化 学 物 質 との 類 似 性 判 定 方 法 で あ り、 他 方 は 探 索 さ れ た 事 例 を も と に 、 設 計 対 象 化 学 物 質 に 対 応 した 新 規 知 識 を 生 成 す る た め の変 形 方 法 で あ る。 い ず れ も、 類 推 シ ス テ ム の トー タ
ル 精 度 を 決 め る ベ ー ス と な る も の で 、 こ の 正 当 性 が 類 推 シ ス テ ム 構 築 上 の キ ー ポ イ ン トに な る 。
(1)類 推 原 理
反 応 設 計 と は 、 新 規 化 学 物 質 の 化 学 構 造C tjに つ い てSjを 決 定 す る こ とで あ る。 っ ま り、Sj={CpjCtjKj}に お い て 、 前 駆 化 学 物 質 の 構 造 式Cpjと 反 応 条 件 式Kj
を 求 め る 問 題 と定 義 で き る 。 そ こで 化 学 反 応 に お け る類 推 と は 何 か に っ い て の 考 え 方 を 述 べ る 。
図9は 類 推 の 考 え 方 を 図 示 した も の で あ る Sは 全 反 応 知 識 の 集 合 で あ る が 、 こ れ を 分 類 す る と 、 化 学 反 応 と して 意 味 の あ るPosit ive(正)なSと 化 学 反 応 と して は 意 味 が 無 い か 、 あ る い は 間 違 っ て い るNegative(負) なSに 分 け ら れ る 。 設 計 す る場 合 に は 、P ositive‑Sの み で 設 計 す る の が 順 当 で あ ろ う が 、 場 合 に よ って は 、Negative‐Sを 制 約 と して 、 設 計 を 進 め る こ と も考 え られ る 。
Poa」tjvQ曝s
図9類 推 の考 え方
全 て のSはPositive‐SとNegative‐Sの 足 し 合 わ せ た 集 合 で あ る が 、 類 推 が 必 要 な 場 合 は こ のSが 得 ら れ て い な い 場 合 、 即 ちSの 部 分 集 合 で あ る 既 に 獲 得 さ れ て い るObtained‐
Sの み が 得 ら れ て い る 場 合 で あ る 。
類 推 は こ のObtained‐Sを 利 用 し て 行 わ れ る 。 類 推 す る 場 合 、 先 ずObtained‑Sの 中 か ら 、 設 計 結 果 のNeW‑Sに 類 似 性 の あ るSを 探 索 す る こ と を 行 な わ な け れ ば な ら な い 。
図9の 場 合 、 黒 丸 が1っ の 反 応 知 識 を 示 し て お り 、Obtained‑Sの な か のS1、S2、 及 びS3が 探 索 さ れ た 類 似 性 の あ るSで あ る 。
こ れ ら のSか ら は 、New‑Sが 対 応 し て お り 、 そ れ ぞ れS1'、S2'、S3'がNew‑S
に な り 得 る 。 こ こ で 注 意 し な け ら ば な ら な い の は 、 全 て がNew‑Sに な る 保 証 は 無 く 、 図9の 場 合 に はS3はNew‐Sに な ら ず 、Ne gative‑Sに 登 録 さ れ る こ と を 示 し て い る 。
最 悪 の 場 合 に は 、 全 てNegative‑Sに な る こ と も有 り 得 る 。 類 推 を 充 分 の 精 度 で 行 え る た め に は 、 既 に 獲 得 さ れ て い るObtained‑
Sが 充 分 で あ る こ と 、 及 び 類 似 性 有 り と し た Sの 探 索 が 確 実 で あ る こ と が 必 要 で あ る 。
(2)類 似 性
Sの 探 索 に 必 要 な 類 似 性 判 定 方 法 に つ い て 述 べ る 。 上 述 し た よ う に 、 類 似 性 はNew‑
SとObtained‑S間 に っ い て 定 義 さ れ る 。 し か し 、 類 似 性 判 定 段 階 で は 、New‑Sの 全 て が 判 明 し て い な い の で 、 両 者 間 の 部 分 照 合
(Partial‐Machinng)に よ り判 断 す る こ と に な る 。 部 分 照 合 の 考 え 方 に つ い て 述 べ る 。
今 、SoをObtained‑Sと し 、SnをNew‐S と す る と 、 反 応 知 識Soと 反 応 知 識Snは 、 そ れ ぞ れ 以 下 の リ ス トで 構 成 さ れ る 。
So={CpoCtoKo}F‑Obtained‑S Sn={CpnCtnKn}E‑‑New‑S
Soは 全 て 判 明 し て い る が 、Sn中 のCpn、 及 び Knは 判 明 し て い な い 。Ctnは 設 計 対 象 の 化 学 物 質 構 造 式 で あ る か ら判 明 し て い る 。 従 っ て 、 照 合 は 同 じ カ テ ゴ リ 間(化 学 構 造 式 と い う カ テ ゴ リ)で 行 な わ な け れ ば な ら な い か ら 、Cpo、Ctoと 及 びCtn間 の 部 分 照 合 を 行 う こ と に な る 。
反 応 は 構 造 式 の 変 化 と み る 。 っ ま りCpo
→Cto、 及 びCpn→Ctnの 構 造 変 化 で あ る 。 部 分 マ ッ チ ン グ は 原 子 レ ベ ル の マ ッ チ ン グ (atom‑by‑atommachinng)を 行 い 、 類 似 性 の 判 定 に は 極 大 一 致 度 の 計 算 を 行 う こ と を 基 本 と す る 。 し か し 、 原 子 レ ベ ル の マ ッ チ ン
グ は か な り の 計 算 量 で あ る た め 通 常 の 計 算 機 で は 、 実 用 的 な 性 能 を確 保 で き な い こ と が 予 想 さ れ る。 従 って 、 実 用 性 の た め に は 、 計 算 量 の 削 減 を 図 った 方 法 の 導 入 が 必 要 で あ る。
そ こ で 、 近 似 的 な 方 法 と して 、 既 知 化 学 物 質 、 及 び設 計 対 象 化 学 物 質 双 方 と も 、 い くっ か の イ ンデ ッ ク ス に 分 類 して 、 イ ン デ ッ ク ス 問 の 一 致 度 を 求 め 、 これ らを 合 計 す る こ と に
よ っ て 、 類 似 性 を 判 定 す る 方 法 を 用 い る 。 こ の イ ンデ ッ ク ス は 構 造 の 特 徴 と 電 気 的 な 性 質 の 特 徴 か ら構 成 さ れ る 。 構 造 の 特 徴 と して は 、 極 め て 安 定 性 の 強 い 、 即 ち そ れ 自体 が 変 形 し な い 部 分 構 造 記 述 子 と部 分 構 造 問 の 結 合 を 示 す な ん ら か の 結 合 パ タ ー ン の2種 か ら構 成 さ れ る 。 ま た 、 性 質 に は 各 部 分 構 造 の 結 合 点 に お け る電 気 的 性 質 、 及 び 部 分 構 造 そ の も の の 電 気 的 性 質 等 に 分 類 され る 。 例 え ば 、 電 子 吸 引 性 、 あ る い は 電 子 供 与 性 等 で あ る 。
例 え ば 、 芳 香 族 単 環 の 置 換 反 応 に お い て は 、 構 造 、 及 び 性 質 の イ ンデ ッ ク ス を 図8の 事 例
ル ー ル 例 に対 応 し て 以 下 の よ う に捉 え る こ と が で き る 。
〈 構 造 の イ ン デ ッ ク ス 〉
① 環 の 種 類
② 置 換 基 の 位 置 パ タ ー ン
③ 置 換 基 の 種 類
く 性 質 の イ ン デ ッ ク ス 〉
④ 置 換 基 性 質
以 上 の 部 分 マ ッ チ ン グ を 全 て の 知 識 に っ い て 試 験 す る必 要 は な い 。 化 学 反 応 が 類 似 し
て い る と は 、 化 学 構 造 が 類 似 し て い る だ け で な く、 化 学 反 応 そ れ 自体 の 反 応 メ カ ニ ズ ム も 類 似 、 あ る い は 同 種 で あ る こ と が 必 要 で あ る 従 って 、 こ の 場 合 の 部 分 マ ッ チ ン グ は 、 化 学 反 応 中 心 か ら近 傍 の 類 似 性 を 判 定 す る こ と で 充 分 で あ る。 しか しな が ら設 計 対 象 のC tnを 見 て 、 ど こが 反 応 中 心 で あ る か は 決 定 で
き な い 。 全 て の 既 知 反 応 に は 反 応 中 心 点 が あ り 、 類 似 性 判 定 の 前 に 、 そ の 反 応 中 心 が 設 計 対 象 の 化 学 物 質 に 持 ち 得 る か ど う か 検 査 す る 。 持 ち 得 な い 場 合 に は 該 当 の 既 知 反 応 と 設 計 対 象 の 化 学 物 質 に 関 す る新 規 反 応 は 同 じ 反 応 中 心 に な ら な い か ら、 こ の 既 知 反 応 は類 推 に利 用 で きな い 。 反 応 中 心 を 同 一 と す る
こ と が で き る既 知 化 学 反 応 が 見 っ か れ ば 、 こ の 反 応 中 心 の 近 傍 に つ い て 部 分 マ ッチ ン グ を 行 う。
(3)類 似 度 計 算
類 推 は 、 反 応 部 位 を 同 じ くす る 全 て の 反 応 に っ い て 、CtoとCtnの 上 記 の イ ン デ ッ ク ス 毎 の 一 致 度 が 計 算 さ れ る。
・環 の種 類 に っ い て は 、 一 致 す る 場 合 をa 点 と す る。
・位 置 パ タ ー ンの 場 合 に は 、一 致 す る場 合 をb点 とす る 。
・置 換 基 種 類 に つ い て は 、一 致 す る置 換 基 個 数 をn個 と す る と 、 類 似 度 はcn点 と す る 。
・置 換 基 性 質 に つ い て も 、 一 致 す る 置 換 基 個 数 をm個 とす る と 、 類 似 度 はdm点 と
す る。
全 体 の 類 似 度 は 、 類 似 度=a+b+cn+dm と 計 算 さ れ る。
類 似 度 が 大 き い ほ ど 、 反 応 が 似 て い る と判 断 さ れ 、 類 推 は類 似 度 が 大 き い ほ うか ら行 わ れ る こ と を 原 則 と す る が 、 反 応 に は 、 構 造 や 性 質 の 類 似 性 の 他 に 、 重 要 度 とい っ た フ ァ ク タ が あ る 。 例 え ば 、 収 率 、 経 済 性 、 及 び 反 応 の 安 全 性 と い っ た 点 は 、 実 用 的 な 反 応 か ど
う か を 評 価 す る 重 要 な パ ラ メ ー タ で あ り 、 類 似 な ル ー ル を 類 似 度 で 判 定 す る 際 に も 、 こ の 要 素 を 加 味 す る 必 要 が あ る。
こ の 方 法 と して は 、 各 反 応 に っ い て 上 記 の aか らdの 値 を こ の 観 点 か ら幅 を もた せ る必 要 が あ る 。 こ れ らの 反 応 の 重 要 度 は 各 反 応 の 反 応 条 件 に記 述 さ れ る他 、 各 反 応 に 付 与 可 能 な プ ラ イ オ リテ ィ の 値 が これ を 反 映 す る こ
こ と した 。
従 っ て 、 具 体 的 なaか らdは プ ラ イ オ リテ ィ をpと した 時 、 下 表 の よ う に 設 定 し た 。
表2類 似度計算例
1くpく50 51くp<100
a 6 10
b 6 10
C 8 15
d 5 5
(4)類 推 反 応 の 生 成
生 成 は 類 似 な 反 応 を テ ン プ レ・一 トに 、 こ れ を 設 計 タ ー ゲ ッ トの 化 学 物 質 に適 合 す る よ う に ア ッ プ デ ー トす る こ と に よ っ て 行 わ れ る 。
そ の 基 本 はSoのCtoをSnのCtnに 合 致 さ せ 、 か っSoのCpoを 変 形 し 、SnのCpnを 生 成 す る こ と で あ る 。 そ の 他 のKnはKoに 合 致 さ せ る 。 芳 香 族 単 環 に お け る 置 換 反 応 に 限 定 し た プ ロ トタ イ プ で の 類 推 反 応 の 例 で は 、Snの の 生 成 は 以 下 の 方 法 で 行 わ れ る 。
項 目 参 魎
・環 の 種 類;Ctn
・位 置 パ タ ー ン;Ctn
・置 換 前 置 換 基 種 類;Ctn
・置 換 前 置 換 基 性 質;Ctn
・置 換 後 置 換 基 種 類;Cto
・置 換 後 置 換 基 性 質;Cto
・反 応 種 別;Ko
・反 応 条 件;ko
(5)類 似 性 判 定 の 高 度 化
反 応 事 例 を 利 用 した 推 論 方 式 は 、 比 較 的 事 例 知 識 が 専 門 家 、 な い しは 反 応 事 例DBか ら 入 手 しや す い こ とか ら、 有 効 な 方 式 で あ り 、 そ の 一 実 現 例 と して 事 例 知 識 の 類 推 に よ る方 法 を 示 した 。
類 推 を シ ス テ ム 化 す る場 合 の 最 大 の ポ イ ン トは 、 設 計 対 象 の 化 学 物 質 に 類 似 す る化 学 物 質 の 類 似 性 の 判 定 で あ り、 さ ら に 構 造 の 類 似 性 だ け で な く、 反 応 メ カ ニ ズ ム の 類 似 性 を も 考 慮 す べ き で あ る こ と を 示 した 。
類 似 度 の 計 算 で は 、 原 子 レ ベ ル の 部 分 マ ッ チ ン グ を 行 う こ と は 、 計 算 量 の 膨 大 性 か ら採 用 で き ず 、 構 造 、 及 び 性 質 を イ ンデ ッ ク ス分 類 した 各 要 素 毎 の 一 致 度 の 合 計 点 で 判 定 す る こ と を 提 案 した 。 ま た 、 最 終 的 に 複 数 の 新
規 な 反 応 を 提 示 す る際 に は 、 各 々 の 事 例 に 付 与 さ れ た 優 先 順 位 を 利 用 して 、 あ る程 度 の 順 位 付 を 行 う こ とが で き る こ と を 示 した 。
こ こ で は 、 反 応 事 例 を 利 用 した 推 論 方 式 に っ い て 、 基 本 的 な 枠 組 み を 提 案 した が 、 対 象 と す る化 学 物 質 、 あ る い は専 門 家 に デ ペ ン ド
し た よ り き め 細 か な 推 論 方 式 の 実 現 に 向 け て は 、 こ の 枠 組 み に厳 密 な 化 学 ア ル ゴ リ ズ ム の 付 加 が 必 要 で あ る 。 こ れ ら化 学 に よ り密 着 した プ ロ グ ラ ム 群 の 開 発 に つ い て は 、 化 学 専 門 家 の 今 後 の 努 力 に 期 待 す る も の で あ る 。
5.候 補 の 順 位 付
1っ の 化 学 物 質 の 合 成 経 路 を 求 め る と複 数 の 経 路 を 出 力 す る こ と が 考 え られ る。 専 門 家 は こ の うち 、 専 門 家 が 持 って い る 固 有 の 判 断 知 識 で 優 先 順 位 を 付 け て 経 路 を 設 計 す る こ
と に な る 。 こ こで 、 優 先 順 位 が 必 要 な 理 由 は 、 一 般 に 新 規 化 学 物 質 の 場 合 に は 、 複 数 段 の 経 路 を 設 計 す る こ とが 必 要 で あ る が 、 優 先 順 位 な し に 経 路 設 計 を 全 組 合 せ に つ い て 行 う
と膨 大 な 経 路 を 設 計 して し ま う こ と が 容 易 に 想 定 さ れ る。 こ の な か の 多 く は 合 成 化 学 的 に 意 味 の 無 い 経 路 を 選 定 す る こ と が 多 く、 シ
ス テ ム が 段 階 毎 に 優 先 順 位 付 を して 、 最 終 的 に あ る 程 度 の 優 先 順 位 付 を し て 経 路 を 提 示 で き る よ う に す る こ と が 考 え ら れ る 。
優 先 順 位 付 の 判 断 は 理 想 的 に は 反 応 が 専 門 家 に 意 味 が あ る こ と を 認 識 す る メ カ ニ ズ ム を シ ス テ ム 化 す る必 要 が あ る が 、 これ ら認 識 の 知 識 は 専 門 家 固 有 の 知 識 で あ り、 獲 得 す る こ と が 極 め て 困 難 で あ る こ と、 ま た 専 門 家 に よ っ て そ の 知 識 の 質 が 全 く異 な る こ と が 予 想 さ
れ る こ と な ど か ら 、 経 路 選 定 段 階 で は 厳 密 な 優 先 順 位 付 は 行 わ ず 、 経 路 評 価 シ ス テ ム を 別 途 、 経 路 選 定 後 に使 用 す る こ と を 前 提 と して お お ま か な 優 先 順 位 付 を シ ス テ ム化 す る こ と で 充 分 と考 え た 。
(1)優 先 順 位 付 の手 法
優 先 順 位 付 の 代 表 的 な 手 法 と して 、 統 計 的 な 知 識 学 習 方 法 の 導 入 が 考 え ら れ る 。
全 て の 反 応 事 例 知 識 に は プ ラ イ オ リ テ ィp が 付 与 さ れ 、 こ のpは 知 識 構 築 段 階 で 、 あ ら か じめ 初 期 設 定 して お くべ き もの で あ る 。
例 え ば 、pが1か ら100ま で 付 与 可 能 で あ る と して 、 知 識 構 築 時 に は 専 門 家 の 責 任 で pを 設 定 す る。 専 門 家 に よ って は 反 応 の 収 率 を 判 断 ポ イ ン トと す る場 合 も あ ろ う し、 あ
る い は コ ス トを 判 断 ポ イ ン トとす る 場 合 も考 え ら れ る 。 い ろ ん な要 素 を 組 み 合 わ せ てp を 設 定 す る の で あ る が 、 厳 密 な 数 値 を 設 定 す る の で は な く、 例 え ば 、pを 高 、 中 、 低 程 度 に 分 け 、 そ れ ぞ れ 、100、50、10の よ
う に設 定 す る。
(2)自 動 生 成 す る 優 先 順 位
類 推 に よ っ て 新 規 に得 ら れ る 事 例 知 識 に っ い て は 、 シ ス テ ム がpを 生 成 す る必 要 が あ る 類 推 の 場 合 に は 、 知 識 を 生 成 す る た め の テ ン プ レ ー ト知 識 が あ り、 そ の 知 識 のPを 新 規 知 識 に 適 用 す る。
(3)優 先 順 位 の 変 動
知 識 構 築 段 階 で お お ま か に 与 え ら れ たpに 対 して 、 シ ス テ ム の 運 用 段 階 で 運 用 状 況 を シ
ス テ ム が 判 定 して 、pを 変 動 す る機 能 を 付 加 し、 よ り適 切 な 事 例 知 識 が 反 応 経 路 設 計 に 利 用 さ れ る よ うに す る 。
変 動 方 法 と し て 、 シ ス テ ム の 利 用 者 の 事 例 知 識 の 使 用 頻 度 に 応 じた 統 計 的 な 方 法 を 採 用 す る 。 シ ス テ ム で は 各 事 例 知 識 の 使 用 頻 度
を 記 録 して お き 、pの 変 動 幅 を 計 算 す る 。 通 常 、pは 数 値 で あ り、 正 の 整 数 で 与 え ら れ る の で 、 再 計 算 の 際 に は 、pが 上 限 、 あ る い は 下 限 を 越 え な い よ う に す る必 要 が あ る 。 こ の 為 に は 、 再 計 算 結 果 にpを50を 中 点 に1か ら100の 間 に 値 を 分 散 さ せ る 必 要 が あ る。
pの 再 付 与 に 対 し て は 、 以 下 の 機 能 を さ ら に 必 要 とす る 。
① 利 用 者 が 再 付 与 を 指 示 で き る 機 能 。
② 特 殊 な 反 応 事 例 に っ い て は 再 計 算 の 対 象 外 とす る 機 能 。
③p決 定 ア ル ゴ リ ズ ム を ユ ー ザ 定 義 で き る可 能 性
(4)事 例 の 参 照 回 数
pの 再 計 算 の 基 に な る の が 事 例 の 参 照 回 数 で あ る。 反 応 事 例 が 参 照 さ れ る ケ ー ス を 以 下 に 示 す 。
① 実 際 の 設 計 に 使 用 され る 反 応 事 例 が 参 照 さ れ た 時 。
② 類 推 に使 用 さ れ 、 か つ 新 規 ル ー ル と して 登 録 さ れ た 場 合 の 反 応 事 例 が 参 照 さ れ た 時 。
(5)高 度 な推 論 制 御 の 検 討
反 応 事 例 の 個 々 にpを 付 与 し、 こ のpに 従 って 、 反 応 事 例 知 識 の 利 用 順 番 を 制 御 す る メ カ ニ ズ ム に つ い て 示 した 。
化 学 合 成 設 計 の 分 野 で あ っ て も、 対 象 とす る 化 学 物 質 に よ っ て 、 そ の手 法 は様 々 な も の が あ る 。 専 門 家 に よ て は 、 利 用 す べ き反 応 事 例 の 順 番 は シ ス テ ム に よ る 画 一 的 な 制 御 だ
け で は不 十 分 で あ る。
得 られ た 結 果 の 反 応 が 正 当 な もの か ど うか は 、 さ らに 厳 密 な 評 価 シ ス テ ム を 利 用 す る必 要 が あ る 。 以 上 の 制 御 方 式 に つ い て は 、 反 応 事 例 の 参 照 回 数 に 応 じた 統 計 的 な 方 式 を採 用 して あ る が 、 シ ス テ ム と して は 、 専 門 家 固 有 の 優 先 制 御 ア ル ゴ リ ズ ム を 組 み 込 め る 手 段
も考 慮 す る べ き と考 え ら れ る 。
さ ら に 高 度 な 制 御 方 式 を 推 論 シ ス テ ム に 求 め る と した ら、 メ タ 知 識 制 御 の 基 本 的 機 能 を 具 備 す る 必 要 が あ る 。 知 識 ベ ー ス 構 築 支 援 ツ ー ル の 中 に は メ タ 知 識 を 記 述 で き る も の が あ る が 、KBMSに は該 機 能 が 組 織 化 さ れ た 仕 様 で イ ン プ リ メ ン トさ れ て お らず 、 か っ 該 知 識 は 専 門 家 が 明 確 に は 持 っ て い な い 知 識 で あ る た め に 、 本 シ ス テ ム で は 今 後 の 検 討 課 題
と した 。
6.そ の 他
知 識 獲 得 を効 率 良 く行 わ せ る た め に は 、 本 シ ス テ ム に は 次 の よ うな 機 能 を 実 験 的 に イ ン プ リ メ ン トして み た 。
6.1負 知 識 ベ ー ス
専 門 家 か らの 知 識 投 入 時 、 及 び類 推 に よ る 新 規 知 識 登 録 時 、 シ ス テ ム は専 門 家 と対 話 的 に 登 録 の 是 非 を 問 う方 式 を 採 用 して い 。 こ の 時 点 で 登 録 す る知 識 が 正 し い 場 合 に は 、 そ の ま ま知 識 べ 一 ス に 登 録 す る が 、 正 し くな い
場 合 で も、 同 じ誤 り を 生 じ た 時 に 、 判 断 を 再 び 専 門 家 に 求 め る こ と の な い よ う に 、 誤 り知 識 を 知 識 ベ ー ス 化 して い る。 これ を 負 知 識 べ 一 ス と呼 ん で い る 。
6.2部 分 構 造 名 称 の 内 部 表 現 方 法 本 シ ス テ ム で 認 識 して い る部 分 構 造 は 反 応 知 識 獲 得 時 に 新 規 な 部 分 構 造 が 出 現 した ら、
シ ス テ ム 内 の 部 分 構 造 フ ァ イ ル に 自動 的 に 追 加 さ れ る よ う に な っ て い る 。 そ の た め に 、 シ ス テ ム は 自 動 的 に 部 分 構 造 の 名 称 を 発 生 す る 方 式 を と っ て い る。 そ の 方 法 と して は モ ル ガ ンの 規 範 化 に よ る線 形 表 記 を 用 い た 。
こ れ に よ り、 専 門 家 は グ ラ フ ィ ッ ク ス で 自 由 に 構 造 入 力 し さ え す れ ば 良 く、 知 識 投 入 時 の 煩 わ し さ が 減 少 す る 。
7.経 路 選 定 実 験
本 シ ス テ ム の 基 本 構 想 と具 体 的 イ ン プ リメ ン トの 仕 様 に っ い て は 、 化 学 の 専 門 家 と協 議 し 取 り決 め た 。 プ ロ トタ イ プ は 開 発 の 費 用 と 期 間 の 制 限 で 基 本 的 枠 組 み を 確 認 す る範 囲 に と ど め た 。
確 認 実 験 で は 化 学 の 専 門 家 、 及 び 反 応DB か ら約200種 の 反 応 知 識 を 入 手 し た 。
非 化 学 専 門 家 な の で 、 実 験 の 良 否 判 定 は充 分 に は で き な い が 、 図10に 規 則 知 識 を 使 っ
た 論 理 型 設 計 手 法 に よ る イ ソ フ ィ トー ル の 合 成 経 路 選 定 を 行 っ た 例 を 示 す 。 さ ら に 、 事 例 知 識 の 類 推 を 使 っ た 情 報 指 向 型 設 計 手 法 に よ る 芳 香 族 性 単 環 の 置 換 反 応 の 場 合 で は 、 合 成 の 教 科 書 程 度 の 約40種 程 度 の 反 応 経 路 を 推 定 で きた 。 い ず れ の 場 合 に も、 意 味 の 無
い 、 あ る い は 誤 っ た 反 応 が 多 く出 力 さ れ た が こ れ は主 と して 、 本 シ ス テ ム を 構 成 して い る 構 築 プ ロ グ ラ ム の 制 限 に よ る も の で あ る。
本 シ ス テ ム は現 在 化 学 専 門 家 に 提 供 し、 機 能 の 一 部 高 度 化 と知 識 の 投 入 等 を 進 め て お り 近 々 に そ の 結 果 が 報 告 で き る予 定 で あ る。
な お 、 今 後 の 実 用 的 な 化 学 反 応 設 計 支 援 知 識 べ 一 ス シ ス テ ム の 開 発 に際 して は 、 前 節 ま
で に述 べ た 種 々 の 高 度 化 と検 証 す るた め の 必 要 充 分 な 知 識 の 確 保 が 必 要 で あ る。 こ れ ら
多 くの 作 業 は専 門 家 自 身 が 寄 与 す べ き部 分 で あ り、 化 学 専 門 家 の 努 力 に 期 待 す る も の で あ る。
8.お わ り に
化 学 物 質 設 計 用 知 識 ベ ー ス シ ス テ ム を 構 築 す る に あ た って の 共 通 基 盤 シ ス テ ム の プ ロ ト タ イ プ に つ い て 述 べ た 。 本 シ ス テ ム の 構 想 及 び そ れ に 具 備 した 各 種 機 能 に っ い て は 、 本 プ ロ ジ ェ ク トに 参 加 して 頂 い て い る 化 学 専 門 家 と 協 議 して 決 定 した もの で あ る。 ま た 、 プ ロ トタ イ プ の 作 成 に あ た っ て は 、 費 用 と期 間 の 制 限 の 中 で 大 部 分 はNTTが 作 成 した も の で あ る が 、一 部 分 は 実 際 に 化 学 専 門 家 が 作 成 した プ ロ グ ラ ム を 利 用 して い る 。 本 プ ロ
トタ イ プ は 化 学 物 質 、 及 び 化 学 反 応 が ま だ 限 ら れ た もの に しか 対 応 で き な い 状 況 で あ り 、 最 も重 要 な シ ス テ ム に 蓄 積 され る べ き化 学 の 知 識 も小 量 で あ る た め に 、 実 用 に 供 す る に は い ま まで 以 上 に 多 くの 専 門 家 の 協 力 が 必 要 で あ る 。 さ らに 、 反 応DBに つ い て は 、 反 応 事 例 知 識 の 獲 得 と規 則 知 識 の獲 得 に有 効 で は あ る が 、 本 シ ス テ ム で は 試 み と して 、 専 門 家
が 実 験 的 に 作 成 した 小 規 模 なDBを 利 用 した た め に 、 得 ら れ た 知 識 量 は少 な く、 今 後 は さ ら に 大 規 模 なDBの 連 結 を 検 討 す る必 要 が あ る。
本 シ ス テ ム の 高 度 化 は 、 実 際 に化 学 専 門 家 に 提 供 し、 化 学 専 門 家 自 身 が 高 度 化 を 図 れ る た め の 機 能 増 強 で き る よ う に 、 提 供 者 と して は ツ ー ル 類 の 整 備 等 の 各 種 支 援 を 行 うつ も り で あ る。 科 学 技 術 庁 の 全 体 プ ロ ジ ェ ク トは 残 り2か 年 を 実 用 的 シ ス テ ム の 作 成 と シ ス テ ム 統 合 が メ イ ン の 研 究 課 題 と な って お り、 こ れ ま で 以 上 に 、 化 学 専 門 家 と情 報 工 学 関 係 者 の 協 力 体 制 が 重 要 に な りつ つ あ る。
designprogram(SECS》,11回 情 報 化 学 討 論 会 予 稿 集,6117,72‑75,1988
(10)山 崎 毅 文 、 桑 原 敏 、 服 部 文 夫;例 外 事 例 を 含 むDBか ら の 化 学 知 識 の 自 動 抽 出,知 識 工 学 と 人 工 知 能 研 究 会,65‑6,1989
(11>NTTソ フトウェア編;エ キスハ●一トシステム構 築 支 援 ツール KBMS/PCマ ニュアル,1989
(12)H.L.Morgan;Thegenerationof uniquemachinedescriptionfor chemicalstructure
(参 考 文 献) (1)E.J.Corey,W.T.Wipke:Science.166,178
‑192 ,1969
(2)W.T.wipke,H.Braun,G.Smith,F.Chopin, W.Sieben:ACSSymposium61,97,1977 (3)K.K.Agarwal,D.L.Larson,H.L.Gelernter
Comput.Chem.2,75‑84,1977 (4)CAS(ChemicalAbstractService) (5)CIS(ChemicalInformationSystem)
(6)国 際 科 学 振 興 財 団 編:「 反 応 設 計 テ㌔ タの 収 集 、 整 理 、 分 析 、 評 価 」 調 査 研 究 報 告 書,1985.3
(7)REACCS(MolecularDesignLtd.)
(8)松 浦 育 敏:テ ㌔ タへ㌔ ス型 反 応 設 計 支 援 システム ,MolecularDesign,vo17,no.5
(9>谷 中 幹 郎 、 中 村 和 彦 、 棚 沢 あ ず さ 、W.T.
Wipke:Automaticknowledgebase buildingfortheorganicsunthesis
̲.欄 ・一 一ルP
図10反 応 経 路 選 定 実 験(Transformル ー ル 使 用 例)