• 検索結果がありません。

Vol. 25, No. 1, (2004) Early Detection of Important Safety Information Recent Methods for Signal Detection 1 2, Hiroyuki Watanabe

N/A
N/A
Protected

Academic year: 2021

シェア "Vol. 25, No. 1, (2004) Early Detection of Important Safety Information Recent Methods for Signal Detection 1 2, Hiroyuki Watanabe"

Copied!
24
0
0

読み込み中.... (全文を見る)

全文

(1)

総 説

重要な安全性情報を早期に検出する仕組み

シグナル検出の最近の手法について

Early Detection of Important Safety Information

– Recent Methods for Signal Detection –

渡邉 裕之∗1・ 松下 泰之∗2,∗3・ 渡辺 篤∗4・ 前田 敏郎∗5・ 温井 一彦∗6・ 小川 嘉正∗7・ 澤 淳悟∗8・ 前田 博∗9

Hiroyuki Watanabe∗1, Yasuyuki Matsushita∗2,∗3, Atsushi Watanabe∗4, Toshiro Maeda∗5, Kazuhiko Nukui∗6, Yoshimasa Ogawa∗7,

Jungo Sawa∗8 and Hiroshi Maeda∗9

∗1万有製薬株式会社 臨床医薬研究所 臨床統計部 ∗2 三共株式会社 医薬開発本部臨床解析部 ∗3 東京理科大学 工学研究科 経営工学専攻 ∗4 日本イーライリリー株式会社 医薬情報部 ∗5 三菱ウェルファーマ株式会社 保証本部医薬情報部門 PMS 情報管理部 ∗6 住友製薬株式会社 医薬情報部 ∗7 ヤンセン ファーマ株式会社 市販後調査部 ∗8 シェリング・プラウ株式会社 研究開発本部臨床統計解析部 ∗9 藤沢薬品工業株式会社 臨床統計企画部

∗1Data Management and Biostatistics, Clinical Development Institute,

BANYU PHARMACEUTICAL CO., LTD.

∗2Clinical Pharmacology and Biostatistics Department,

New Drug Development Division, SANKYO CO., LTD.

∗3Management Sciences Department, Faculty of Engineering,

Tokyo University of Science

∗4Medical and Drug Information, ELI LILLY JAPAN K.K.

∗5 Post-Marketing Data Management Development, Pharmacovigilance Unit,

Pharmacovigilance & Quality Assurance Division, Mitsubishi Pharma Corporation.

∗6Drug Safety & Post Marketing Surveillance Department,

Sumitomo Pharmaceuticals Co., Ltd.

∗7Post Marketing Surveillance Department,

JANSSEN PHARMACEUTICAL K.K.

∗8Biometrics Department, R & D Institute, Schering-Plough K.K. ∗9Biostatistics and Planning, Development Division,

FUJISAWA PHARAMACEUTICAL CO., LTD. e-mail: hiroyuki watanabe@merck.com

(2)

It is very important to provide safety information of new drugs to physicians and pa-tients as soon as possible after the early postmarketing period. For that purpose, it is important to appropriately collect and analyze the spontaneous reports accumulated in databases of companies and regulatory agencies. This paper reviews the analyt-ical methods to assess spontaneous reports. Bate et al. (1998) presented Bayesian Confidence Propagation Neural Network (BCPNN) Method used by Uppsala Moni-toring Centre (UMC) of the World Health Organization (WHO). DuMouchel (1999) presented Gamma-Poisson Shrinker (GPS) Program of U. S. Food and Drug Admin-istration (FDA), and Evans et al. (2001) presented Proportional Reporting Ratios (PRR) of the Medicines Control Agency (MCA). Furthermore, DuMouchel and Preg-ibon (2001) extended the GPS Program, proposing the Multi-Item Gamma Poisson Shrinker (MGPS) Program, which then became the standard method for the FDA. This report also reviews the practical problems (e.g. database, duplication cases, code of Medical Dictionary for Regulatory Activities (MedDRA)) encountered in Japan. Key words: Post-Marketing Surveillance; Pharmacovigilance Method; Signal Detec-tion; Spontaneous Reports

1. は じ め に 日本製薬工業協会 医薬品評価委員会 統計特別小委員会 (2001)は,2001 年 3 月に市販後におけ る『適正使用情報に係わる計画の検討(その 1)』として,統計学的諸問題や適正使用に必要となる 情報マトリックス及びそれを埋めるために必要な手段・方法,疫学的手法の活用について,適正使 用情報の提供に関する提言を行った.しかし,その後,市販後調査(Post-Marketing Surveillance; PMS)を取り巻く環境が以下のように大きく変化した. 平成 13 年 10 月 1 日施行の「医薬品の市販後調査の基準に関する省令の一部を改正する省令」(平

成 12 年 12 月 27 日,平成 12 年厚生省令第 151 号)(Good Post-Marketing Surveillance Practice;

GPMSP)により,「市販直後調査」が開始され,一方で「使用成績調査」の実施が必須では無く

なった.さらに,平成 14 年 7 月 31 日には薬事法の改正が告示され,医療機関等からの「副作用等

報告」が法制化されるなど,市販後安全対策の充実が図られた.なお,「副作用等報告」は医師を中

心とする医療従事者が,副作用等の発生状況等について必要であると認めた時に,直接あるいは 製薬企業を通じて自発的に規制当局に報告を行うものであり,自発報告(Spontaneous Reports)

とほぼ同義である.「使用成績調査」とは,未知の副作用(Adverse Drug Reaction; ADR),使用

実態下における副作用の発生状況,および安全性又は有効性等に影響を与えると考えられる要因 等を把握することを主な目的とした調査である.これに対し「市販直後調査」とは,使用成績調 査のような調査を市販直後に実施するものではなく,以前より製薬企業に科せられていた「副作 用等報告」を,新医薬品の販売開始直後の 6ヶ月間においてはさらに重点的に行うことにより,重 要な副作用及び感染症の情報の早期検出と適正使用情報の提供を行うというものである. これら一連の制度の改正は,副作用等の報告を強化し,臨床試験や使用成績調査では見出すこ とが困難であった安全性を中心とした適正使用情報を,より早期に確実に収集・検討し医療現場

(3)

に提供することによって,必要な安全対策を講ずることを意図としている.その一方で,調査対 象や目的を絞った「特別調査」や「市販後臨床試験」等により,適正使用情報の確認や仮説に対 する検証を求めることも強化された. 副作用等報告で収集された症例の情報から発現率を求めるためには,当該薬剤が投与された患 者全体が対象集団であるが,その総数を正確には知り得ない.したがって,正確に発現率を評価 することは困難である.これまで製薬企業の安全性部門では,収集したこれらの情報から注目す べき副作用を見つけ出すために暗黙の指標を設けてきた.しかしそれは,例えば因果関係の否定 できない有害事象(すなわち副作用)が,およそ 3 例収集されたかどうかといったような,症例 の蓄積数に注目した科学的根拠に乏しい指標である. 収集された莫大な情報は製薬企業や国にデータベースとして蓄積されているが,そこから危険 性の予見,あるいは危険性の早期検出に関して,統計的裏付けに基づく定量的な評価(指標の利 用)は実施されてこなかった.しかし,これらの蓄積された症例情報を有効に活用する方法が最 近考案され,欧米では既に使用され始めている.

Bate et al.(1998)は World Health Organization(WHO)の Uppsala Monitoring Centre (UMC)で用いられている Bayesian Confidence Propagation Neural Network(BCPNN)Method を発表した.DuMouchel(1999)は米国の Food and Drug Administration(FDA)の Gamma-Poisson Shrinker (GPS)Program を,Evans et al.(2001)は英国の Medicines Control Agency (MCA)(2003 年 4 月 1 日,Medicines and Healthcare products Regulatory Agency(MHRA)

に組織変更された)の Proportional Reporting Ratios(PRR)の方法を発表した.さらに,Du-Mouchel and Pregibon(2001)は,GPS Program を拡張して Multi-Item Gamma Poisson Shrinker (MGPS)Program を提案し,この手法は現在 FDA の標準に置き換わっている.

これらはシグナル検出(Signal Detection)を行うための手法である.シグナル検出とは,自発 報告のデータベースに格納されている数多くの薬剤と副作用との組合せから,詳細調査が必要な

自発報告の発見と,調査の必要性の優先順位を意味する語として使用されている(久保田, 2001).

日本では,DuMouchel が,1999 年 10 月の応用統計学会チュートリアルセミナーにて GPS Program の方法(DuMouchel, 1999)を紹介・解説した.さらに,久保田(2001)は MCA,FDA, WHO によるシグナル検出の方法を比較・検討した.

2001 年 6 月には,英国サザンプトンで英国医薬品安全性研究ユニットが主催するシンポジウム 「Signal Generation Symposium」が開催され,自発報告からのシグナル検出の方法が議論の焦点

となった.

2003 年 11 月には,International Conference on Harmonisation of Technical Requirements for Registration of Pharmaceuticals for Human Use(ICH)E2E(Pharmacovigilance Planning)が Step2(ICH 調和ガイドライン案の決定,承認,各国におけるガイドライン案の内示,意見聴取段 階)に移行した.このガイドラインの「3.2.2 Routine pharmacovigilance practices」内に,承認後 薬剤の安全性プロファイルを継続的にモニタリングする方法の一つとしてシグナル検出が取り上 げられており,別添の Pharamacovigilance Methods にはシグナル検出を行うための Systematic methods として,本総説で取り上げた手法も紹介されている.

(4)

本総説では,データマイニングの手法を用いたシグナル検出のための方法を出来るだけ具体的 に解説し,新たな安全性情報の評価指標としての実用性の検討結果を報告する.

2. シグナル検出について

「シグナル(Signal)」とは,「それまで知られなかったか,不完全にしか証拠付けられていな

かった有害事象と薬との因果関係の可能性に関する情報」と WHO では定義されている(Edvards and Aronson, 2000).そして,「シグナル検出(Signal Detection)」とは,「詳細な調査が必要な自 発報告の発見と調査の必要な優先順位付け」のことをいう(久保田, 2001). シグナル検出の手法には単純なものから複雑なものまで多数存在するが,ここでは,MHRA, FDA,WHO の手法を中心に述べる. 2.1 シグナル検出の 4 つの手法とその他の手法 表 1 と表 2 の記号を用いて表記を行う.各セルの数値は,報告件数である. 表 1. 2 × 2 表における記号(報告件数) 注目するイベント その他イベント 合計 注目する薬剤 n11 n12 n1+ その他薬剤 n21 n22 n2+ 合計 n+1 n+2 n++ 表 2. 2 × 2 表における記号(確率) 注目するイベント その他イベント 合計 注目する薬剤 P11 P12 P1+ その他薬剤 P21 P22 P2+ 合計 P+1 P+2 P++(= 1) 特定のデータベース(薬剤とイベントの情報を含む)を集団とした際の,「注目する薬剤」と「そ の他薬剤」及び「注目するイベント」と「その他イベント」にそれぞれ分けて分割表を作成する. 以下に紹介する手法は,薬剤とイベントとの組合せごとに nijが独立に報告されることを仮定し ている.しかしながら,実際にはあるイベントに対して複数の被疑薬が報告されたり,症例重複 や症状重複の可能性もあるので,nijは完全には独立ではない.したがって,結果の解釈を行う 際には注意が必要である.ここで,最も興味のあるセルは,「注目する薬剤の注目するイベント」: n11である.また,この表を層別して表記するときは,3 つ目の添え字を用いて表示する(例えば, k 層の「注目する薬剤の注目するイベント」のセルの場合: n11k).そして,イベントとしては, 通常 ADR や有害事象(Adverse Event; AE)が用いられる.

ほとんどの手法は,2 × 2 分割表の連関または,各行を群とした場合の行間の比較を示す指標 である.シグナル検出に用いられるデータは,非常にアンバランスであることが予測されるので, 推定値の安定を得る等の工夫が行われているが,ほとんどは一般的な手法の拡張である.

(5)

2.1.1 Proportional Reporting Ratios (PRR)

PRR は現在 MHRA で用いられている方法であり,期待値とその標準誤差及び 95% 信頼区間は 以下の通りである(Evans et al., 2001; van Puijenbroek, 2002).これは報告割合の比(通常のリ

スク比に相当する指標)であり,報告割合が小さい(n11, n21がそれぞれ n1+, n2+に対して相対 的に小さい)場合には,近似的にオッズ比と等しくなる. P RR =n11/n1+ n21/n2+ = P11/P1+ P21/P2+, SE(logP RR) = s 1 n11 1 n1++ 1 n21 1 n2+  95%CI = elog(P RR)±1.96 r 1 n11−n1+1 +n211 −n2+1  そして,以下の 3 つの条件を満たす場合に,「シグナルあり」と判断する. (1) P RR= 2 (2) χ2=n++(|n11n22− n12n21| − n++/2)2 n1+n2+n+1n+2 = 4 (大雑把に近似すると,p < 0.05 に対応) (3) n11= 3

なお,van Puijenbroek et al.(2001)は P RR − 1.96SE > 1 の基準を提案している. 2.1.2 Bayesian Confidence Propagation Neural Network(BCPNN)Method

BCPNN は WHO で用いられている方法であり,ベイズ(Bayes)流のアプローチを用いている (Bate et al., 1998; Lindquist et al., 2000; Bate et al., 2002).事前分布と尤度から計算される事 後分布 ICij(information component: log2(Pij/Pi+P+j))(ここで,Pi+, P+j は周辺確率,Pij

はセル確率)に基づき評価を行う. ICijは,基本的には注目するセルの実測値と期待値との比に対する推定であり,情報量のため 底を 2 としている.「注目する薬剤の注目するイベント」の推定を行うのが目的のため,IC11の推 定が重要となる. IC の推定値では,標本サイズの少ないセルでの 1 例の影響を小さくするためにベイズ流のア プローチを用いている.具体的には,Pi+(i = 1, 2) と P+j(j = 1, 2) に関する分布に関しては,そ

れぞれベータ分布(Beta distribution)を用いて,Pij((i, j) = (1, 1), (1, 2), (2, 1), (2, 2)) に関する

同時分布としては,ディリクレ分布(Dirichlet distribution)(ベータ分布を多変量に拡張したも のとみなすことができる)を用いている.Pi+に関するベータ分布のパラメータとしては,α1α2(ここで,α1+ α2= α とする)を,P+jに関するベータ分布のパラメータとしては,β1と β2 (ここで,β1+ β2= β とする)を,Pijに関するディリクレ分布のハイパーパラメータとしては, γ11, γ12, γ21, γ22を用いている.IC11を求めるためには,事後分布の P1+, P+1及び P11を推定す ればよい.ここで,P11の事後分布の期待値と分散に関しては,事前分布に用いた 4 つのパラメー タではなく,2 つのパラメータ(γ11と γ)で表すことができる. そして,これらの事前分布としては無情報事前分布を用いており,α1= β1= 1, α = β = 2, γ11= γ12= γ21= γ22= 1 である. さて,理解を深めるために,通常使われるオッズ比を用いて説明する.オッズの推定において, 4 つのセルのうち 1 つでも 0 のセルがある場合,オッズは 0 または ∞ になり,周辺和に 0 がある 場合,オッズ比が定義できない.また,あるセルでの標本サイズが少ない際にオッズ比を推定す

(6)

る場合,標本の少ないセルでの 1 例の影響が非常に大きくなるため,推定が不安定になる.各セ ルに 1/2 を加えるのは,Haldane-Anscombe 1/2 correction として知られる,対数オッズ比のバ イアス修正の方法であるが,これをゼロセルがあるときだけ行うのは,かえってバイアスを招く ことはよく知られている(Breslow, 1981).また,小標本でのバイアス修正としては,各セルに 1 を加えるなどがあり,ベイズ流の解釈ができる(Greenland, 2000).今回のベイズ流のアプロー チも一致性はないが,パラメータの推定を安定させるメリットがある.

事後分布における IC11の期待値とその分散は,以下の通りになる(Orre et al., 2000).

E(IC11) = log2(n11+ γ11)(n+++ α)(n+++ β) (n+++ γ)(n1++ α1)(n+1+ β1) V (IC11) =  1 log2 2  n++− n11+ γ − γ11 (n11+ γ11)(1 + n+++ γ)+ n++− n+1+ α − α1 (n1++ α1)(1 + n+++ α)+ n++− n+1+ β − β1 (n+1+ β1)(1 + n+++ β)  ここで, γ = γ11 (n+++ α)(n+++ β) (n1++ α1)(n1++ β1), γ11= 1, α1= β1= 1, α = β = 2 そして,(おおよその)95% 信頼区間の下限が 0 より大きい場合

E(IC11− 2SE11) = E(IC11− 2 p V (IC11)) > 0 に,「シグナルあり」と判断する. 2.1.3 Gamma-Poisson Shrinker(GPS)Program GPS は FDA で用いられていた方法(DuMouchel, 1999)であり,現在では,薬物相互作用も 考慮できる MGPS を用いている(Szarfman et al., 2002).基本的に,GPS は BCPNN の IC と 類似しているが,層を調整した推定値になっている.GPS も標本サイズの少ないセルでの 1 例の 影響を少なくするために,ベイズ流によるアプローチを用いているが,背景の情報を加味するた めに,2 つのガンマ分布(Gamma distribution)の混合分布を利用している. まず,興味のある指標として,以下に示す RRijを考える.DuMouchel(1999)は RRijを相対リ

スク(Relative Risk)と呼んでいるが,これは疫学で用いられる標準化死亡比(SMR; Standardized Mortality Ratio)に近い指標である(Breslow and Day, 1987).

RRij= nij/Eij ここで,期待値 Eijは以下の式となる.FDA では,性(男,女,不明),年齢,報告された日(5 年毎,あるいは 1 年毎)を用いて s 層としている. Eij= X sni+sn+js/n++s シグナル検出に用いるデータは,サンプリングバイアスと信頼性の欠如によるレポーティング のバイアスのため,RRijの信頼性は低いのが一般的である.したがって,サンプリングのばらつ きを最小にするために Empirical Bayes を用いた指標を用いる.具体的には,2 つのガンマ分布の

(7)

混合分布を事前分布とデータから計算する尤度を組み合わせて計算する事後分布から求める.平 均 µijのポアソン分布からの観測値を nijとする.そして,興味のある値として,λij= µij/Eij を考える.λijは共通の事前分布からではなく,2 つのガンマ分布の混合分布からの観測値である と仮定している.ガンマ分布族は,ポアソン分布をより一般化したものによく用いられており,通 常の分割表に用いられるポアソンサンプリングよりも複雑な状況を仮定している.λ の事前分布 と尤度,そして,事後分布は以下の式となる. λ の事前分布 π(λ; α1, β1, α2, β2, P ) = P g(λ; α1, β1) + (1 − P )g(λ; α2, β2) 平均: P α1/β1+ (1 − P )α2/β2 分散: P (1 − P )(α1/β1− α22)2+ P α1/β12+ (1 − P )α2/β22 ここで,g(λ; α, β) = βαλα−1e−βλ/Γ(α), Γ(α) =R 0 e −ttα−1dt である. 尤度 L(θ) = Πij{P f (Nij; α1, β1, Eij) + (1 − P )f (Nij; α2, β2, Eij)} f (n; α, β, E) = (1 + β/E)−n(1 + E/β)−α×Γ(α + n)/Γ(α)n! : f ( ) は負の二項分布を表す. λ の事後分布 Qn= P f (n; α1, β1, E)/[P f (n, α1, β1, E) + (1 − P )f (λ; α2, β2, E)] E[λ | N = n] = Qn(α1+ n)/(β1+ E) + (1 − Qn)(α2+ n)/(β2+ E)

E[log(λ) | N = n] = Qn[Ψ (α1+ n) − log(β1+ E)] + (1 − Qn)[Ψ (α2+ n) − (β2+ E)]

ここで,Ψ (x) は log[Γ(x)] の導関数であるディガンマ(digamma)関数(Ψ (x) = Γ0(x)/Γ(x)) である.

計算方法としては,反復法によって L(θ) を最大にすることにより,5 つのハイパーパラメータ

θ = (α1, β1, α2, β2, P ) を推定する.DuMouchel(1999)は 5∼15 回反復で最大化させるために,θ の初期値を θ = (α1= 0.2, β1= 0.1, α2= 2, β2= 4, P = 1/3) としている.

λ の幾何平均(Empirical Bayes Geometric Mean; EBGM)は以下の通りである. EBGMij= exp{E[log(λij) | nij]}

EBGMijは,Eij→ ∞ の場合には RRijと一致するが,Eijが小さい場合には縮小(shrink)

する.そして,λ の事後分布の累積分布関数を用いて 5% 点(EB05;95% 片側信頼下限と解釈可

能)を算出し,EB05 を signal score とする.FDA ではシグナル検出規準を EB05= 2 としてい

る(Szarfman et al., 2002).

また,Dumouchel and Pregibon(2001)は,EBGM , EB05 を降順に並び替えて,各薬剤と注 目するイベントとの組み合せに対して順位付けを行う方法の他に,各薬剤と注目するイベントと の組み合わせが独立であった場合と比較する超過報告数(EXCESS)を用いて評価する方法を 提案している.以下に EXCESS を示す.

(8)

2.1.4 Multi-Item Gamma-Poisson Shrinker(MGPS)Program

MGPS は現在 FDA で用いられており,GPS Program を薬物相互作用等も検出できるように拡 張した方法である(DuMouchel and Pregibon, 2001; Szarfman et al., 2002).GPS, MGPS を総 称して Empirical Bayes Screening(EBS)と呼ぶこともある(Hauben and Zhou, 2003; Kubota et al., 2004).

まず,2 薬剤の薬物相互作用の検討として用いる三次の連関について述べる.ここで,イベント E に 対する薬剤 A, B の薬物相互作用を考える.層 s における薬剤 A, B とイベント E の報告割合をそれぞ れ PAs, PBs, PEs,層 s における総報告数を nsとする.A, B, E が独立の下での期待値 E0 は,二因子

の場合,E0ij=PsnsPisPjs(i, j = A, B, E, i 6= j),三因子の場合,E0ABE=PsnsPAsPBsPEs

である. 次に,対数線型モデルを当てはめる.期待値を mABEとし,A, B, E を 0(なし),1(あり), モデルのパラメータを a, b1, b2, b3, c12, c13, c23とすると,全ての二因子の交互作用を考慮したモデ ルは, logmABE= a + bA1 + bB2 + b3E+ cAB12 + cAE13 + cBE23 で表される.これは均一連関モデルと呼ばれる(渡邉他, 2003).対数線型モデルでの推定の際に 用いる各セルの数値は,報告数の代わりに縮小推定値 (EBGMij× Eij) から求める. このモデルで得られた A = 1, B = 1, E = 1 の場合の期待値 E[m111] を E2ABE とし,薬物

相互作用は,EXCESS2ABE= EBGMABE× E0ABE− E2ABEで評価する.そして,EBGMij,

EBGMABEは,GPS と同様の方法で推定する.

3 剤以上の薬物相互作用の検討に対応する四因子以上の場合も上述のモデルの拡張で評価できる. 2.1.5 そ の 他 の 手 法

その他として数多くの手法があるが,例えば,ROR,Yule’s Q,Poisson,Chi square(Yates の補正)がある(van Puijenbroek et al., 2002).これらは,いずれも 2 × 2 分割表における一般 的な連関の手法である.また,モデルを用いたシグナル検出の手法も説明する.

1) Reporting Odds Ratio(ROR)

ROR は,通常のオッズ比であり,期待値とその標準誤差及び 95% 信頼区間は,以下の通りに なる. ROR =(n11/n21) (n12/n22)= n11n22 n12n21, SE(logROR) = s 1 n11+ 1 n12+ 1 n21+ 1 n22  95%CI = eln(ROR)±1.96 r 1 n11+n121 +n211 +n221  そして,95% 信頼区間の下限が 1 より大きい場合に,「シグナルあり」と判断する. 2) Yule’s Q Yule’s Q は,連関を表す指標であり,期待値とその標準誤差及び 95% 信頼区間は,以下の通り になる.

(9)

Q =n11n22− n12n21 n11n22+ n12n21 , SEQ=1 2(1 − Q 2 ) s 1 n11 + 1 n21 + 1 n12 + 1 n22  95%CI = Q ± 1.96SEQ そして,95% 信頼区間の下限が 0 より大きい場合に,「シグナルあり」と判断する. 3) Poisson Poisson 分布に基づく p 値は,以下の通りになる. p = 1 − a−1X k=0 e−µ× µk k! (a は観測度数,µ は期待度数) そして,p 値が 0.05 以下の場合に,「シグナルあり」と判断する. 4) Chi square(Yates の補正) Chi square(Yates の補正)は,2 × 2 分割表の検定統計量であり,以下の通りになる. χ2=n++(|n11n22− n12n21| − n++/2)2 n1+n2+n+1n+2 そして,検定統計量に基づく p 値が 0.05 以下,すなわち χ2値が 3.84 より大きい場合に,「シグ ナルあり」と判断する. 5) ロジスティック回帰分析(1 薬剤の検討の場合) 今まで示した手法の他に,モデルを用いてシグナル検出を行うことも出来る.一般的なロジス ティック回帰分析を用いた手法を紹介する. 対数オッズを用いたモデルとして,下記のロジスティック回帰式を用いて,β1を推定し,指数 変換することによりオッズ比 exp(β1) の推定が可能である. logit(y) = β0+ β1x1 ここで,x1: 注目する薬剤のときに 1,その他薬剤のときに 0 をとる変数 y: 注目するイベントのときに 1,その他イベントのときに 0 をとる変数 β0, β1: モデルのパラメータ β1の 95% 信頼区間の下限が 0 より大きい場合に,「シグナルあり」と判断できる. また,共変量の影響を調整することも可能である.性,年齢,報告された日を共変量とした対 数オッズ比を用いて説明する.以下のロジスティック回帰式を考える. logit(y) = β0+ β1x1+ β2x2+ β3x3+ β4x4 ここで,x1: 注目する薬剤のときに 1,その他薬剤のときに 0 をとる変数 x2, x3, x4: 性,年齢,報告された日の共変量 y: 注目するイベントのときに 1,その他イベントのときに 0 をとる変数 β0, β1, β2, β3, β4: モデルのパラメータ

(10)

β1を推定した後の手順は,共変量を調整しない場合と同じである.また,他の共変量も同様に 調整が可能である. 6) ロジスティック回帰分析(薬物相互作用の検討の場合) ロジスティック回帰分析を用いた薬物相互作用の検討では,「注目する薬剤の組合せと注目する イベントとの組」を注目する.まず,2 薬剤の薬物相互作用の場合を考える.薬物相互作用は,以 下のロジスティック回帰式を用いて検討を行う.β12を推定し,指数変換することにより薬物相互 作用のオッズ比 exp(β12) の推定が可能である. logit(y) = β0+ β1x1+ β2x2+ β12x1x2 ここで,x1:注目する薬剤(薬剤 1)のときに 1,注目する薬剤(薬剤 1)以外の薬剤のとき に 0 をとる変数 x2:注目する薬剤(薬剤 2)のときに 1,注目する薬剤(薬剤 2)以外の薬剤のとき に 0 をとる変数 y: 注目するイベントのときに 1,その他のイベントのときに 0 をとる変数 β0, β1, β2, β12: モデルのパラメータ そして,β12の 95% 信頼区間の下限が 0 より大きい場合に,「シグナルあり」と判断できる.3 剤以上の薬物相互作用に関しても上記の式を拡張することにより検討が可能である. ロジスティック回帰を用いて薬剤相互作用の検討を行った事例として,NSAIDs と利尿薬との 併用による鬱血性心不全の発現・悪化の分析がある(van Puijenbroek et al., 2000; Egberts et al., 2002). 2.2 シグナル検出の手法を用いた解析の紹介 「注目する薬剤(あるいは主たる被疑薬,以下同じ)と注目するイベント」との組合せの報告 数 n11がその期待値 E11に比べて相対的に高いか否かを検討する.これによって見逃していたイ ベント,発現件数等を過小評価していたイベントを見出すこと,あるいは「この薬剤は xxxxx が 発現しやすいのではないか?」と言った疑問に対する定量的指標を与えること,ができる. 分析の際には,四半期ごとに区切り,累積したデータを用いる手法が考えられる.Bate et al. (1998)は,早期シグナル検出の例として,WHO のデータベースを用いて captopril と咳との関 係を後ろ向きに分析した結果を紹介している.図 1 に結果を示す.1981 年第三四半期において 3 例の報告がなされたため,95% 信頼下限は 0 を超えている.このシグナルが初めて公表されたの は 1983 年 7 月であったが,実際に広く知られるようになったのは 1986 年以降であり,BCPNN により,早期にシグナルが検出できる可能性があることが分かる.

GPS では,Szarfman et al.(2002)が 1985 年から 1996 年までに CDER のモニタリング有害 事象検知システム(Monitoring Adverse Reports Tracking System; MART)で検出された 95 薬 剤,160 の薬剤 イベントのシグナルに関して,GPS を用いた場合との検出時期の違いを後ろ向 きに分析している.MART は安全性専門家がマニュアルによりシグナル検出を行うシステムであ り,1997 年 11 月まで用いられていた.図 2 に結果を示す.図 2 では,97 のシグナルが MART でシグナルとして検出される 1∼4 年前に GPS にて検出され,36 のシグナルが同年,27 のシグ ナルが 1∼3 年遅れで検出された.

(11)

図 1. 経時的な IC の変化

1979∼1996 年における captopril と咳との関係を IC の変化で示した.IC は四半期毎 にプロットし,95% 信頼区間を示した.(European Journal of Clinical Pharmacology 1998; 54: 315-21)

図 2. MART と GPS の検出時期との比較

MART においてシグナルとして検出された 95 薬剤,160 の薬剤 イベントの関連を検 出する時期を MART と GPS 間で比較した.線の長さは手法間の検出時期の違いを示 す.円の大きさは GPS によるシグナル検出時点の報告数に比例している.四角はシグ ナルが MART に組み込まれた時点を表す(報告数不明).(Drug Safety 2002; 25(6): 381-92)

(12)

以上のように,データマイニングの手法を用いると,人間の感覚より早期にシグナルを検出で きる可能性が高いことが分かる.しかしながら,これらの解析では,シグナル検出の方法の感度 (真に薬剤因果関係があるときに正しく早く検出できる)を検討しているだけで,特異度(薬剤因 果関係がないときに正しく検出しない)を検討していない.次に MGPS の例で感度と特異度を検 討した例を紹介する. 図 3 は,薬剤 A の現在の添付文書記載情報を真のシグナルとして,4 つの異なるカットオフ値 (EB05 = 1.5, 2, 4, 8)を用い,受信者動作特性(Receiver Operating Characteristic; ROC)曲線

により評価を行った例である(Szarfman et al., 2002).

図 3. ROC 曲線による評価

大規模臨床試験で良く特徴付けられている薬剤 A について,1978∼2000 年に MGPS を実施し,経年的変化を感度[true positive(TP), y 軸],1 − 特異度[false positive (FP), x 軸]を用いて評価した.●は警告あるいは禁忌情報,○は添付文書記載情報 を真のシグナルとした結果である.(Drug Safety 2002; 25(6): 381-92) 添付文書記載情報と比べて警告あるいは禁忌情報を真のシグナルとした時の感度は高く,どの 基準を用いても特異度は高い結果となっているが,この検討では,添付文書情報の記載基準にあわ せるため,複数の用語を一つの用語にまとめて,つまり用語をグループ化して分析している.ま た,添付文書情報全てが真のシグナルであるかは分からないため,これらの検討には限界がある. したがって,データマイニングの手法を用いてシグナルが検出された場合には,それを機械的 に捉えるのではなく,現象を解釈し評価する必要がある. 2.3 GPS を用いた検討 GPS に関しては,インターネット上で公開されている,FDA 自発報告データを用いた検討結 果(ftp://ftp.research.att.com/dist/gps)(DuMouchel, 1999)を使用した.提供されている結果 は,EBGM 順の上位 10 万件の薬 イベントの表である.本検討では,この結果から,ACE 阻害 薬と咳,スタチン系薬剤と筋痛との関連を取り上げ,EBGM= 5 をシグナルとして定義して考察 を行った.

(13)

ACE 阻害薬と咳との関係での抽出結果を表 3 に示す.報告数(N)に関わらず,各薬剤ともシ グナルとして抽出されていた.なお,表内の Rank は,EBGM の順位であり,他の「薬 イベン ト」も含まれる.このような関連用語が少ないイベントに関しては,シグナルの特定も容易であ ると考えられる.

表 3. ACE 阻害薬と咳

Rank N E RR EBGM EBlog2 Drug 4315 2033 157.88 12.88 12.87 3.686 enalapril 5832 154 15.10 10.20 10.14 3.342 benazepril hydrochloride 6353 910 96.06 9.47 9.46 3.242 lisinopril 8772 99 13.74 7.21 7.15 2.837 ramipril 9642 136 20.51 6.63 6.59 2.719 quinapril hydrochloride 9978 58 8.92 6.50 6.38 2.674 fosinopril sodium 11971 609 113.62 5.36 5.35 2.419 captopril スタチン系薬剤と筋痛との関係では,lovastatin を用い,筋痛関連の用語で抽出した.結果を 表 4 に示す.筋痛には,クレアチンキナーゼ(CK)上昇等関連用語が複数存在するため,7 種類 のイベントがシグナルとして検出されている.コーディングにより,注目すべきシグナルが分散 されてしまう可能性が示唆された.今回検討したデータは論文の報告時期から Coding Symbols for Thesaurus of Adverse Reaction Terms(COSTART)でコーディングされていると判断でき る.今後,製薬企業で活用する場合は COSTART より遙かに用語が多い Medical Dictionary for Regulatory Activities(MedDRA)Terminology にてコーディングされたデータベースを用いるこ とになる.MedDRA は,器官別大分類(System Organ Class; SOC),高位グループ用語(High Level Group Term; HLGT),高位語(High Level Term; HLT),基本語(Preferred Term; PT) 及び下層語(Lowest Level Term; LLT)の 5 階層構造からなっている.Szarfman et al.(2002) は,MGPS を用いて MedDRA の PT ベースで分析を行った例を提示しているが,FDA のような 大規模なデータベースだからこそ PT ベースでの分析が可能であるとも考えられる.本問題点の 詳細は後述する.

表 4. スタチン系薬剤と筋痛

Rank N E RR EBGM EBlog2 Event 2690 368 20.56 17.90 17.83 4.156 筋炎 4425 1131 89.67 12.61 12.60 3.655 CK 上昇 4838 16 1.27 12.60 11.81 3.562 皮膚筋炎 5696 417 40.25 10.36 10.34 3.370 ミオパシー 6559 1425 154.32 9.23 9.23 3.206 筋痛 8118 58 7.46 7.77 7.66 2.938 横紋筋融解症 11747 428 78.06 5.48 5.47 2.450 筋無力症

(14)

2.4 手 法 間 の 比 較

Kubota et al.(2004)は,日本の自発報告データを用いて,BCPNN, GPS, PRR (MHRA 基

準),PRR(P RR − 1.96SE > 1),ROR について κ 係数を用いた評価や報告数とシグナルの割合

を検討した.κ 係数に関しては,PRR(MHRA 基準)と BCPNN は一致度が高いと報告してい る.また,報告数別シグナルの割合では GPS はシグナルとされる割合は低いが,報告数 2 件のも のでも 7.5% はシグナルと認識された一方で,BCPNN, PRR(MHRA 基準)は報告数 2 件では 検出されなかったと報告している.

Van Puijenbroek et al.(2002)は,PRR, ROR 等の指標と BCPNN とを感度・特異度等を用 いて評価を行い,注目する薬剤・注目するイベントの組み合わせで 4 件以上の報告がある場合は, どの方法でも感度・特異度が高いという結論を出している. Gould(2003)は,DuMouchel(1999)と同じデータを用いて BCPNN と GPS の比較を行い, 十分な報告数のあるイベントに関しては,同様な結果が得られると報告している. 渡邉・松下(2003)は,製薬企業で保有する安全性データベースでの活用の可能性を探るため, 10,000 件程度の報告数が格納されているデータベースを想定して,BCPNN と PRR との比較を 報告している.これは,年間 25,000 件以上の自発報告がある厚生労働省(厚生労働省, 2003),年 間 30 万件を超える報告がある FDA(Szarfman et al., 2002),250 万件を超えるデータベースを 保有している WHO(Bate et al., 2002)よりも少ない.このような比較的小さなデータベースに おいても,注目するイベントが 1,000 件,注目する薬剤イベントが 100 件のデータベースであれ ば,PRR, BCPNN とも十分活用可能であると結論付けている.しかしながら,国内自発報告にて シグナルを検出できると言われている範囲(1/100∼1/50,000)(Meyboom et al., 1997)より低 い,注目するイベントの発現率が 1/250,000 の場合には,リスク比が 5 程度以上でなければ,十 分にシグナルを検出できないので,可能な限り WHO のような国際的なデータベースでの検討が 必要としている. シグナル検出のまとめとして,2002 年の「Drug Safety」誌にてシグナル検出の特集が組まれてい る(Bate et al., 2002; Brown, 2002; Coulter, 2002; Egberts et al., 2002; Kubota, 2002; Meyboom et al., 2002; Nelson et al., 2002; Peachey, 2002; Purcell and Barty, 2002; Shakir and Layton, 2002; Szarfman et al., 2002).しかしながら,手法に関しては,まだ Gold Standard が存在しな いのが現状である. 3. シグナル検出の適用対象 日本においてシグナル検出の手法を使用するときの一番の問題点は,ベースとなるデータをど こから得るかである.欧米では,規制当局のデータベースが公開されているが,日本では使用可 能な形式で公開されていない.日本の現状を考えると,規模の点から厚生労働省に蓄積された自 発報告のデータベースを使用することが望まれる. 3.1 個々の製薬企業が運用しているデータベース ICH E2B-M2(個別症例安全性報告標準)が平成 15 年 10 月 27 日に施行され,各製薬企業にお いては Standard Generalized Markup Language(SGML)での報告に対応するべく,何らかの形

(15)

でデータベースシステムを構築・運用している. そこで,ある程度の製品数(情報量)を有する製薬企業の場合,まずは自社内のデータベース を用いてシグナル検出を実施することが有用である.なぜならば, シグナル検出の手法の利用価値 や問題点がより明確に認識できると思われるからである. 3.2 製薬企業が運用しているデータベースを集積(次のステップ) 個々の製薬企業が運用しているデータベースは,その製薬企業が得意とする分野の薬剤に情報 が偏在している可能性が高い.もしそうであれば,データベースの大部分は注目する薬剤の情報 や注目する薬剤と類似した薬剤の情報となる.この場合,解析に用いるその他薬剤がバックグラ ウンドデータとして適切でなくなる. そこで,各社のデータを持ち寄って統合し,より大きなデータベースにすることによって,比 較対照であるその他薬剤の情報がより一般化する.その結果,シグナル検出がより適切になる可 能性が高まる. 3.3 行政主導で運用しているデータベース(将来) 厚生労働省では,現在も独立行政法人医薬品医療機器総合機構が管理する医薬品医療機器情報 提供システムのホームページで同省および同機構に報告された情報を,未知症例,すなわち「副 作用が疑われるとして報告された重篤な症例のうち未だ十分な情報がなく,当該被疑薬の使用上 の注意への記載に至っていないため,今後注目して同様の症例報告をお願いしたい症例」を中心 に公開している(http://www.info.pmda.go.jp/). さらに,平成 14 年 7 月に成立した改正薬事法で従来自発的に実施されていた医療機関副作用報 告制度が義務化されたことや,生物由来製品感染症定期報告制度の導入等で報告される副作用件 数の大幅な増加が見込まれている.このデータはシグナル検出に使用可能な形式で公開されるこ とが望まれる.だたし,行政主導のデータベースは蓄積対象が医療機関や製薬企業からの報告で 集まったものであるため,医療全体の実態と比較して重篤や未知に偏りやすい傾向がある.加え て,同一症例の情報が複数の経路で報告される可能性が製薬企業単体のデータベースに比べて高 いと思われるので特に注意が必要である. 将来個人の薬歴・病歴が包括的に管理される時代が到来すれば,通常では見逃されがちな兆候も ピックアップできる可能性があると言う意味からも本格的なシグナル検出が可能となるであろう. 4. データ収集からシグナル検出までの諸問題 4.1 データの非均一性(質・量) 4.1.1 収 集 時 期 製薬企業が入手する副作用件数が年々増加するにつれて,厚生労働省に報告される副作用件数 も増加してきた.これは,薬(あるいは医療行為そのもの)の安全性に対する社会的要求水準の 向上に伴うものと考えられる.また,再審査や近年導入された市販直後調査制度に基づき製薬企 業が情報収集を積極的に実施している時期では,入手する情報量が一時的に増加することが挙げ られる. 最近の科学的進歩により,疾患定義に関する概念が変化したり,検査方法が変わることは頻繁

(16)

である.その際,変化の前後のデータをまとめることが難しくなる. 上記のように,データの収集方法やデータの分類等の変化があると,データが非均一性になり, 年毎の比較が単純にはできなくなるので注意が必要である. 4.1.2 収集対象(有害事象は新しい概念) シグナル検出を実施する本来の目的を考えれば,有害事象を含めて収集対象とすべきである. しかしながら有害事象の概念は,日本の規制では,ICH E2A(治験中に得られる安全性情報の取 り扱いについて)の成果として,「治験中に得られる安全性情報の取り扱いについて」(平成 7 年 3 月 20 日,薬審第 227 号)の通知を受け構築された.したがって,PMS の分野で有害事象を取り 扱うようになったのは,「最近のこと」である. 一方,有害事象の普及に伴って収集情報の裾野が広がってきていることは事実であるが,医療従 事者の隅々に至るまで有害事象情報を集積することの必要性が浸透しているとは言いがたく,さ らに,安全対策に係る規制に対応する必要性の有無,情報収集に対する労力の増加といった現実 的要因等も加わって,因果関係を問わぬ有害事象とそれを疑う副作用とを同等の精度で情報収集・ 集積出来るかと言う点については疑問がある. したがって,有害事象の収集にあっては,データの質の低下を招かないように留意する必要が ある. 4.1.3 入手経路(あるいは調査方法) 市販後における症例の情報入手経路は大まかに使用成績調査等の調査由来と,あるいはそれ以 外のいわゆる自発報告関連の 2 種類に大別できる.自発報告関連で入手される症例の場合,報告 対象となった事象が発生した限定的な期間内の情報に限られる.したがって,予め観察期間を設 定し,その間に発現した事象や併用薬剤を収集する調査の情報に比べて,AE・ADR 及び併用薬 剤の記載数が少ない傾向にある. 4.1.4 事象の重大性・興味度 自発報告関連の情報は,重篤や未知の場合,話題の事象の場合には特に積極的に追加情報収集 を行い,また報告者(医師等)も協力的な場合が多い.その結果,AE・ADR 及び併用薬剤の報 告数や報告内容が充実する傾向にある. 4.2 ランダムサンプリング,バイアス,症例重複,症状重複(再発を含む) 4.2.1 ランダムサンプリングとバイアス 収集された症例情報の蓄積結果が,医療実態を正確に反映していることが望ましい.しかしな がら,自発的な報告を主な情報源とする限り,ランダムサンプリングは期待できない.また,シ グナル検出に限らないが,医療従事者が経験した事象を製薬企業等に報告するか否かの判断を始 めとして,情報収集段階の当事者(製薬企業等の情報収集担当者も含む)の思い込み等により収 集される情報にバイアスが入り込むのは避けがたい.例えば,医療従事者が被疑薬として認識し ていない薬剤に係る事象が報告されない状況下では,未知の AE・ADR,薬物相互作用のシグナ ルは検出が遅れるであろう. 自発報告の性質を認識した上で,その有効な活用法と限界を考え,その利用を考えるべきである.

(17)

4.2.2 症例重複と症状重複(再発を含む) 症例重複は,製薬企業単体のデータベースにおいても以下の理由等で発生している. 1) 複数の情報源(報告者,報告施設等)からの報告 2) 同一症例について時期をずらした複数の報告 3) 複数の情報入手方法(自発報告,調査,文献・学会),入手経路 4) 同一品を共同販売していた会社の合併により,データベースを統合 厚生労働省のデータベースは,同一症例が複数の報告者(医療従事者,製薬企業)から報告さ れるため,製薬企業単体のデータベース以上に症例重複が多いと予想される. これらの症例重複の影響は,注目薬剤における注目事象の情報が十分蓄積された状況下ではあ まり影響しないノイズであるかもしれないが,報告症例数が少ない段階では特にシグナル検出に 対して影響が大きいので,重複症例のチェックを行うのが大切になる. 同一症例では,被疑薬投与期間中に「発現 ⇒ 短期に回復」のパターンを繰り返す場合がある. 特に,定期的に投与される薬剤ではその傾向が強いので注意が必要である.これは,観察期間を 事前に設定している調査・試験の対象症例で散見され,治療を実施する時期毎に投与薬剤構成が 変わる疾患では事象発現毎に被疑薬が異なることもある.また,事象発現により投与を一旦中止 したが,再投与したら再発した場合もある.これは,薬剤 事象間の因果関係評価に大きく影響す る所見である. 症例重複や症状重複の情報は,データベースの用途・設計に依存して,電子化する際の取り扱 いは変化する.例えば,ICH E2B-M2 の定義では再投与による再発事象は,医薬品情報のデータ 項目「B.4.k.17 再投与又は再曝露の結果(被疑薬のみ対象)」で入力し,被疑薬の属性の一部とな る.ただし,重複を無視して(つまり何回再発しても計算上の事象発生数は 1 例として)処理す ればシグナル検出そのものに対する影響はない. 4.3 データベース運用時に発生する問題 4.3.1 コーディングのブレ コーディングのブレを生む主な原因は,医学概念としての妥当性を欠く表記,不正確な報告内 容,不十分な調査,報告内容に対する医学的な不正確さを伴う勝手な解釈,コーディング担当者 の医学・薬学並びに使用するコード辞書そのものに対する知識や訓練の不足である. 以上のような原因により,本来は同一の医学概念上の事象にもかかわらず,使用コードがまち まちとなり,シグナル検出に失敗する可能性がある. 4.3.2 シグナル検出方法を適用する際の問題点 4.3.2.1 「注目する薬剤」及び「注目する薬剤以外」をどう定義するか 注目する薬剤の範囲は, 1) 被疑薬とされている場合のみ 2) 被疑薬とはされず併用薬剤(場合によっては輸血等を含む)や併用療法とされた場合を含む のいずれを選択するのかを定める必要がある.また,コードを使用して集計する際,そのコード と集計レベルとして, 1) どんなコードを使用するのか

(18)

医療用医薬品名データファイル,WHO Drug,その他 2) どのレベルで集計するのか 一般名,薬剤名,販売名,その他のグループ化したコード他 のいずれで行うのかを定める必要がある. 例えば,医療用医薬品名データファイルの場合,同じ有効成分の薬剤であっても投与経路や薬 効分類が異なれば複数の薬剤コードが付与される(全体の 7% 存在する).これらを 1 つの薬剤と してシグナルを検出したい場合は,薬剤コードをグループ化する必要がある. 4.3.2.2 「注目する事象」をどう定義するか 使用する用語のレベル,グループ化は薬剤の定義以上に複雑な問題がある. 一般的に「咳」の様な明示的事象は扱いやすいが,「肝機能障害」の様に検査値の異常として報 告されたり,黄疸等の症状名で報告されたりするものは扱いにくい.このように,報告時期等に より名称・用語が変化して一意に捉えることが困難な事象の場合には,コードをグループ化して 解析する等の必要がでてくる.

従来から PMS で使用されてきた Japanese Adverse Reaction Terminology(J-ART)を用いて シグナルを検出する場合,基本語を使用するのが妥当である.しかし,データベース毎の入力状 況やコーディング時の読替え規則等を考慮した上で,必要に応じてコードをグループ化しないと シグナル検出の感度・特異性に悪影響を及ぼすであろう.

さらに,副作用症例報告においては ICH E2B-M2 で MedDRA の使用が必須となっているが,「安

全性定期報告別紙様式およびその記載方法について」(平成 14 年 11 月 11 日 医薬審発第 1111004

号,医薬安発第 1111001 号)の通知により,安全性定期報告への使用も平成 15 年 4 月 1 日から 義務付けられた.これらへの対応が進むにつれて MedDRA の使用が本格化すると思われる.

ここでは,次の 3 点について記述する.

1) MedDRA を使用することによって一般的に予想される問題点

2) 5 階層ある用語のどの階層を使用するのか,特別検索カテゴリー(Special Search Categories; SSC)は使えるか 3) J-ART と MedDRA との対応関係と予想される問題点 まず,一般的に予想される問題点として,MedDRA は収載用語数が多く,安易に報告用語に近 い表記の用語を選択・入力すると,シグナルとして捕らえるべき事象に対して付与されるコード が分散し,結果としてシグナル検出の感度が低下することが予想される.そして,シグナル検出 の初期段階において,シグナル検出の遅延という形であらわれるであろう. MedDRA は定期的なバージョンアップ毎に用語の降格・昇格,表記やリンク先の変更等が発生 する不安定な段階にある.このため,コーディングに使用するバージョンを変更したり,他のデー タベースとデータ交換・統合を行う際にデータメンテナンスが必要となる(いわゆるバージョンコ ントロール問題).これも MedDRA を用いる際の懸念材料である.次に,5 階層ある用語のどの階 層を使用するのか,特別検索カテゴリーは使えるかという点である.MedDRA の階層定義から言 えば PT の使用が基本であるが,集約した形での検出を考えるならば HLT 以上の使用が適切であ ろう.MedDRA については,用語体系の曖昧さを World Health Organization Adverse Reaction

(19)

表 5. 特別検索カテゴリーにリンクする PT と HLT の数 (V5.1J,PRIMARY SOC に制限) SSC コード SSC 日本名 PT HLT 10002219 アナフィラキシー 28 16 10003107 心停止 16 5 10005497 血液疾患/骨髄機能低下 46 12 10007583 心虚血 83 27 10018966 出血 281 151 10020758 過敏反応 32 12 10043608 血栓症 77 27 10046283 上部消化管出血/穿孔 53 11 10047114 血管炎 29 15 10052522 疼痛 174 78 10052523 続発性免疫不全状態 107 50 10052524 浮腫 64 41 10052525 前悪性病変 67 45 計(正味計) 1057(981) 490(357) 表 6. 2 種以上の特別検索カテゴリーにリンクする PT の例(69 件から一部抜粋) PT コード PT 日本名 特別検索カテゴリー 10002198 アナフィラキシー反応 アナフィラキシー 過敏反応 10002473 血管神経性浮腫 アナフィラキシー 過敏反応 浮腫 10002967 再生不良性貧血 血液疾患/骨髄機能低下 続発性免疫不全状態 10003560 喘息 NOS アナフィラキシー 過敏反応 10005987 骨髄抑制 NOS 血液疾患/骨髄機能低下 続発性免疫不全状態 10006485 気管支痙攣 NOS アナフィラキシー 過敏反応 10007515 心停止 心停止 心虚血 10033661 汎血球減少症 血液疾患/骨髄機能低下 続発性免疫不全状態 Terminology(WHO-ART)と比較して指摘した報告(Brown, 2002)もあり,個々のコードをそ のままシグナル検出に使用できるか疑問が残る. MedDRA には特別検索カテゴリーがあり,これはある疾患や症候群に関連する PT や,複数 の SOC にまたがるある注目する疾患または診断に関連する症状及び徴候をひとまとめのグルー プにするために用いられる.表 5 に特別検索カテゴリーにリンクする PT と HLT の数を示す.こ の特別検索カテゴリーをシグナル検出に使用することも考えられるが,2 種以上の特別検索カテ ゴリーにリンクする PT が存在する問題もある.表 6 にこれらの一部の例を示す.さらに最近に なって,用語をグループ化する SMQ(Standardised MedDRA Queries)が開発されてきている.

最後に,J-ART と MedDRA との対応関係と予想される問題点である.J-ART で入力した過去 のデータが存在するデータベースでシグナル検出を行う場合,J-ART を MedDRA に変換する必 要がある.

(20)

表 7. J-ART の MedDRA(V5.1)に対する mapping 状態 mapping された階層 PT LLT 英語カレンシーサイン (Y) Y N 総計 日本語カレンシーサイン (Y) Y N N J-ART 区分 基本語 812 693 414 67 1986 慣用語 563 1594 727 180 3064 総 計 1375 2287 1141 247 5050 注. 2 種の LLT に mapping された J-ART が 2 件あるため正味は 5,048 件

(従って MedDRA に mapping されなかった J-ART は 62 件) 日・英のカレンシーサインの関係は MedDRA のバージョン間で一定で ない(V5.0 から V5.1 で 43 件の変更があった)

カレンシーサインは LLT の属性で,PT は本質的にカレンシーサイン N は存在しない

カレンシーサイン Y とは現在推奨される用語を指す

する場合,J-ART の内 62 用語は MedDRA に mapping されなかったため,変換もれが発生する 可能がある.1,711 用語では J-ART と MedDRA の日本語表記に差異があること,副作用用語と 共に入力していた器官別大分類は通常変換できないこと,そして,仮に mapping 先の PT や LLT がリンクする primary の SOC に変換しても期待した結果が得られるとは限らない点も考慮しなけ ればならない.さらに,MedDRA の LLT は漠然とした用語,あいまいな用語,スペル違いの用 語,複数の意味を持つ用語に対し,カレンシーサインで区別することで対処している.mapping 先の LLT には,過去の蓄積データ利用の場合等を除き使用をさけるべき用語である,英語カレン シーサインや日本語カレンシーサインが N のものがある.表 7 に J-ART の MedDRA(V5.1)に 対する mapping 状態を示す. 上記の様に,カレンシーサインが N の用語は新規に症例データを入力する場合は使用を避ける べきである.しかしながら,J-ART が mapping された日本語カレンシーサインが N の用語の中 には,同一表記を持つ日本語カレンシーサイン Y の用語が無いものが 1 割程度存在(バージョン によって異なるが V5.1 では 152 件)し,同一表記を持つ日本語カレンシーサイン Y の用語が N の用語とは別の PT にリンクしている場合(V5.1 では 26 件)もあるので,日本語カレンシーサ イン Y の用語を単純に検索・コーディングするとシグナル検出が低下する恐れがある. なお,「注目する事象」をどう定義するかに関連するシグナル検出のアイデアとしては次のよう なものがある. 1) コードそのものを集計するのではなく,そのコードの辞書における「言語表記」に置き換 えて集計する.これによってコーディングに使用する用語辞書の種類に関係なくデータが利 用できる可能性が出る.

2) MedDRA を使って集計する際に,SOC を primary に限定しない.そうすれば,例えば PT でシグナル検出を行う場合,PT に対する計算結果がその PT のリンク先である全 SOC にも 繰り返し表示されるので,見落としの危険性が減る.

(21)

4.3.3 ルーチン業務とするためには 4.3.3.1 アウトプット上の工夫 検出されたシグナルが小さくても,未知の事象に関するものの場合は重大なシグナルとなり得 る.したがって,現時点の添付文書等に記載があるか否かを機械的に判定してアウトプットする ことが日常業務には必要である.そのためには,添付文書等の記載用語とデータ入力・シグナル 検出に使用する用語との対応関係を明確に定義した情報が必要となる. 一方,既知の事象に関するシグナルは,経時変動を評価する場合やシグナルが大きく変動した 場合以外は表示しない,または重篤な事象に限定した結果のみをアウトプットするなどの工夫が 望まれる. 重篤な事象に限定する場合は,医師と製薬企業内のいずれが判断を行うのかを定める必要があ る.製薬企業内で判断する場合には,更に,どの時点で誰が行うのか等の判定アルゴリズムも必 要である. 4.3.3.2 データベースシステムへの組込み シグナル検出の方法を広く普及させるためには,市販のデータベースシステムパッケージに標 準機能として組み込ませ運用を目指すのが早道である.「注目する薬剤」,「注目する事象」に関す る定義付け,並びにアウトプット等を仕様として明確にする必要がある.早期のシグナルの検出 が目的であるから,感度は特異度よりも優先される必要があろう. シグナルの検出においては,まず計算の簡単な PRR の使用を勧める.実際,PRR の計算をシ ステムに組み込んでシグナル検出を自動化している欧米の製薬企業もある. 統計家には,シグナル検出に用いる各手法の分かりやすい解説や簡単に計算・報告できるソフ トウエアの開発が求められている. 5. お わ り に 本総説では市販後調査の自発報告という,従来統計手法がほとんど使用されてこなかった分野 に焦点を当て,蓄積された症例情報を有効に活用し,重要な安全性情報を早期に検出する仕組み であるシグナル検出の最近の手法を紹介し,運用上の各種の問題点を報告した. PRR, BCPNN, GPS, MGPS 等は,元来,規制当局が安全対策を行うための一つの手段として 開発されたものではあるが,製薬企業における活用の可能性も充分あると考えられる. ここで紹介した手法を用いてシグナルが検出された場合,これは安全対策の検討・実施に向け ての注意が必要であることを数字で示したに過ぎない点に注意すべきである.何故ならば,これ らの手法は検証的ではなく,探索的なスクリーニングを目的としたものであるからである.なる べく早い段階でのシグナルの検出が目的であるが,単純な 1 つのデータベースによる 1 つの解析 のみではなく,可能ならば,多数のデータベースや解析手法を用いて,間違ったシグナルの検出 やシグナルの未検出を防ぐ工夫が必要である. 結局,得られたシグナルは仮説創出の第一歩であり,シグナルの重要度を医学的見地から評価 し,その後の行動に結び付けていくのは「人」である. その後の行動の選択肢としては,

(22)

1) 個別症例の検討を初めとするより詳細な分析,あるいはより高度な統計モデルの使用 2) 仮説検証を目的とした臨床試験,薬剤疫学的調査等の実施 3) 添付文書改訂による情報の提供等の安全対策 等が考えられる. 今回紹介した具体的事例は全て事後的な検討結果である.個々の製薬企業が運用しているデー タベースのような,情報が偏在している場合の問題点については検討が不十分であり,さらなる 検討が必要である. 2002 年 11 月の日本薬剤疫学会にて,「PMS の今後のあり方に関する提言」作成の中間報告の 中にもシグナル検出の重要性が取り上げられ(PMS 検討会, 2002),2003 年 9 月に報告書が完成 された(PMS 検討会, 2003).今後はシグナル検出に関して,日本においても方法論の詳細なレ ビュー(Clark, 2001; Hauben and Zhou, 2003)や学会等で実践例に基づく議論が活発になされ, 市販後安全対策の検討手段として発展・成熟していくことを期待したいところである. 謝 辞 本総説は,2002 年 2 月から 2003 年 3 月までの日本製薬工業協会医薬品評価委員会統計 DM 部 会での活動成果を最近の話題も含めてまとめ直したものである.本活動を始めるに当たり,日本 製薬工業協会医薬品評価委員会統計 DM 部会にて「シグナル検出」についてご講演いただきまし た東京大学医学部久保田潔先生に感謝申し上げます.また,本活動をご指導いただきました医薬 品評価委員会魚井徹委員長,並びに統計 DM 部会上坂浩之副部会長,東宮秀夫副部会長,酒井弘 憲副部会長に感謝申し上げます. 参考文献

Bate, A., Lindquist, M., Edwards, I. R., Olsson, S., Orre, R., Lansner, A. and De Freitas, R. M. (1998). A Bayesian neural network method for adverse drug reaction signal generation.

European Journal of Clinical Pharmacology 54, 315-321.

Bate, A., Lindquist, M., Edwards, I. R., Orre, R. (2002). A data mining approach for signal detection and analysis. Drug Safety 25, 393-397.

Breslow, N. E. (1981). Odds ratio estimators when the data are sparse. Biometrika 68, 73-84. Breslow, N. E. and Day N. E. (1987). Statistical Methods in Cancer Research, Vol. II-Design and

Analysis of Cohort Studies. Oxford University Press.

Brown, E. G. (2002). Effects of coding dictionary on signal generation: A consideration of use of MedDRA compared with WHO-ART. Drug Safety 25, 445-452.

Clark, J. A., Klincewicz, S. L. and Stang, P. E. (2001). Spontaneous adverse event signaling methods: classification and use with health care treatment products. Epidemiologic Reviews 23, 191-210.

(23)

Coulter, D. M. (2002). Signal generation in the New Zealand Intensive Medicines Monitoring Programme: a combined clinical and statistical approach. Drug Safety 25, 433-439. DuMouchel, W. (1999). Bayesian data mining in large frequency tables, with an application to

the FDA spontaneous reporting system. The American Statistician 53, 177-190.

DuMouchel, W. and Pregibon, D. (2001). Empirical bayes screening for multi-item associations.

Proceedings of the seventh ACM SIGKDD international conference on Knowledge discovery and data mining, 67-76.

Edvards, I. R. and Aronson, J. K. (2000). Adverse drug reactions: definitions, diagnosis and management. THE LANCET 356, 1255-59.

Egberts, A. C. G., Meyboom, R. H. B. and van Puijenbroek, E.P. (2002). Use of measures of disproportionality in pharmacovigilance: three Dutch examples. Drug Safety 25, 453-458. Evans, S. W., Waller, P. C. and Davis, S. (2001). Use of proportional reporting ratios (PRRs) for

signal generation from spontaneous adverse drug reaction reports. Pharmacoepidemiology

and Drug Safety 10, 483-486.

Gould, A. L. (2003). Practical pharmacovigilance analysis strategies. Pharmacoepidemiology and

Drug Safety 12, 559-574.

Greenland, S. (2000). Small-sample bias and corrections for conditional maximum-likelihood odds-ratio estimators. Biostatistics 1. 113-122.

Hauben M. and Zhou X. (2003). Quantitative methods in pharmacovigilance. Drug Safety 26, 159-186.

厚生労働省 (2003). 厚生労働白書 (平成 15 年度版). ぎょうせい, 411.

久保田潔 (2001). 自発報告からのシグナル検出 英国 MCA, 米国 FDA, WHO の新しい方法 .

薬剤疫学 6, 101-108.

Kubota, K. (2002). Prescription-Event-Monitoring in Japan (J-PEM). Drug Safety 25, 441-444. Kubota, K., Koide, D., Hirai, T. (2004). Comparison of data mining methodologies using

Japanese spontaneous reports. Pharmacoepidemiology and Drug Safety, in press.

Lindquist, M., Stahl, M., Bate, A., Edwards, I. R. and Meyboom, R. H. B. (2000). A retrospective evaluation of a data mining approach to aid finding new adverse drug reaction signals in the WHO international database. Drug Safety 23, 533-542.

Meyboom, R. H. B., Egberts, A. C. G., Edwards, I. R., Hekster, Y. A., de Koning, F. H. and Gribnau, F. W. (1997). Principles of signal detection in pharmacovigilance. Drug Safety 16, 355-365.

Meyboom, R. H. B., Lindquist, M., Egberts, A. C. G. and Edwards, I. R. (2002). Signal selection and follow-up in pharmacovigilance. Drug Safety 25, 459-465.

(24)

Nelson, R. C., Palsulich, B. and Gogolak, V. (2002). Good pharmacovigilance practices: tech-nology enabled. Drug Safety 25, 407-414.

日本製薬工業協会 医薬品評価委員会 統計特別小委員会 (2001). 平成 11∼12 年度特別小委員会活 動報告書.

Orre, R., Lansner, A., Bate, A. and Lindquist, M. (2000). Bayesian neural networks with con-fidence estimations applied to data mining. Computational Statistics & Data Analysis 34, 473-493.

Peachey, J. (2002). From pharmacovigilance to pharmacoperformance. Drug Safety 25, 399-405. PMS 検討会 (2002). シンポジウム:PMS と薬剤疫学「PMS の今後のあり方に関する提言」作成

の中間報告. 薬剤疫学 7(Suppl.), S22-S28.

PMS 検討会 (2003). PMS 検討会による報告.薬剤疫学 8, 3-34.

Purcell, P. and Barty, S. (2002). Statistical techniques for signal generation. Drug Safety 25, 415-421.

Shakir, S. A. W. and Layton, D. (2002). Causal Association in pharmacovigilance and pharma-coepidemilogy: thoughts on the application of the Austin Bradford-Hill criteria. Drug Safety 25, 467-471.

Szarfman, A., Machado, S. G. and O’Neill, R. T. (2002). Use of screening algorithms and com-puter systems to efficiently signal higher-than-expected combinations of drugs and events in the US FDA’s spontaneous reports database. Drug Safety 25, 381-392.

Van Puijenbroek, E. P., Egberts, A. C. G., Heerdink, E. R. and Luefkens, H. G. M. (2000). Detecting drug-drug interactions using a database for spontaneous adverse drug reactions: an example with diuretics and non-steroidal anti-inflammatory drugs. European Journal of

Clinical Pharmacology 56, 733-738.

Van Puijenbroek, E. P., Bate, A., Leufkens, H. G. M., Lindquist, M., Orre, R. and Egberts, A. C. G. (2002). A comparison of measures of disproportionality for signal detection in spontaneous reporting systems for adverse drug reactions. Pharmacoepidemiology and Drug

Safety 11, 3-10.

渡邉裕之, 松下泰之 (2003). 重要な安全性情報を早期に検出する仕組み Signal Detection の最近

の手法について . 第 93 回 医薬安全性研究会予稿集.

渡邉裕之, 菅波秀規, 吉田光宏, 角野修司, 寒水孝司, 松永信人 (共訳) (2003). カテゴリカルデータ 解析入門. サイエンティスト社.

図 2. MART と GPS の検出時期との比較
図 3. ROC 曲線による評価
表 4. スタチン系薬剤と筋痛
表 5. 特別検索カテゴリーにリンクする PT と HLT の数 (V5.1J,PRIMARY SOC に制限) SSC コード SSC 日本名 PT HLT 10002219 アナフィラキシー 28 16 10003107 心停止 16 5 10005497 血液疾患/骨髄機能低下 46 12 10007583 心虚血 83 27 10018966 出血 281 151 10020758 過敏反応 32 12 10043608 血栓症 77 27 10046283 上部消化管出血/穿孔 53 11 100

参照

関連したドキュメント

The method is consisted of the following four steps : 1) Calculation of standard deviation (SD) map 2) Edge detection and removal on SD map 3) Interpolation of the removed

To evalu- ate the applicability of word analogy to the discovery of new relation between drug and disease, checked whether most of the displacement vectors

Background: The purpose of this study was to apply an artificial neural network (ANN) in patients with coronary artery disease (CAD) and to characterize its diagnostic

CONCLUSIONS: We recommend using the precuneus and hippocampus as ROIs without modulation and smoothing for DARTEL-based voxel-based morphometry as a tool for diagnosing

When Misdetection radius was large, the ID length long, or the number of devices large, the Pair method was the best since it could reduces sequential blinking by adding bits

4 Case 2: Detection of human by vertical sensors from ceiling Through measurements and approximation of sensor characteristics, finally we got the relationships between

6 HUMAN DETECTION BY TILTED SENSORS FROM CEILING Based on previous studies, this paper presents an approach to detect human 2D position, body orientation and motion by using

Yamamoto: “Numerical verification of solutions for nonlinear elliptic problems using L^{\infty} residual method Journal of Mathematical Analysis and Applications, vol.