• 検索結果がありません。

要旨 : CDASH 標準に準拠した Raw データ (CRF) から SDTM を効率的に作成するポイントと EDC の仕様が様々であることにより標準化しきれない部分を補うツール (SAS マクロ ) 開発のコンセプトを紹介する キーワード :CDISC, CDASH, SDTM 2

N/A
N/A
Protected

Academic year: 2021

シェア "要旨 : CDASH 標準に準拠した Raw データ (CRF) から SDTM を効率的に作成するポイントと EDC の仕様が様々であることにより標準化しきれない部分を補うツール (SAS マクロ ) 開発のコンセプトを紹介する キーワード :CDISC, CDASH, SDTM 2"

Copied!
42
0
0

読み込み中.... (全文を見る)

全文

(1)

CDASHからSDTMを効率的に

作成するためのTipsのご紹介

○小松 邦岳、鈴木 淳一、村岡 了一、飛石 陵子 (株式会社アスクレップ)

Introduction of Tips to make SDTM efficiently

from CDASH.

Kunitake Komatsu, Junichi Suzuki, Ryoichi Muraoka, Ryoko Tobiishi (Asklep.Inc)

(2)

要旨:

CDASH標準に準拠したRawデータ(CRF)からSDTMを効率的に作成する ポイントと、EDCの仕様が様々であることにより標準化しきれない部分を 補うツール(SASマクロ)開発のコンセプトを紹介する。

(3)

Agenda

 はじめに  CDASHと「Rawデータ→SDTM」  CDASHとSDTM  CDASHからのSDTM作成を効率化するSASマクロのコンセプト  具体的なマクロ活用法  まとめ

(4)

はじめに

RawデータからのSDTMの効率的な作成は、各社取り組んでいる大きな課 題です。 CDASH標準を利用してCRFおよびRawデータを作成することで、SDTMの効 率的な作成は可能ですが、注意すべきポイントがいくつかあります。また、 EDCの仕様上の制約などにより、Rawデータが理想の定義にならないことも あるでしょう。 本発表では、CDASH標準を利用したRawデータからSDTMを効率的に作成 するためのポイントと、そのために開発したツール(SASマクロ)のコンセプト を紹介いたします。 用語の定義: Rawデータ = CDMSまたはEDCからエクスポートしたデータ。

(5)

CDASHと「Rawデータ→SDTM」

 CDASHは「常にSDTM Mappingを最終目標としてきた」ことが明言されて います。実際、CDASH UGにはRawデータをSDTMに変換する方法も述 べられています。

(6)

CDASHと「Rawデータ→SDTM」

(7)

CDASHと「Rawデータ→SDTM」

 入力(Rawデータ)と出力(SDTM)が標準化されていれば、その間の処理 も標準化できるはずです。 Rawデータ SDTM 標準化 標準化 標準化!

(8)

CDASHと「Rawデータ→SDTM」

CDASHに準拠した場合「承認申請者等の負担軽減を考慮した、より効率的な実施を検討する」ことを通知 (承認申請時の 電子データ 提出に関する 基本的考え方について【参考・引用文献5】)

(9)

CDASHと「Rawデータ→SDTM」

 Rawデータ(CRF)をCDASHで標準化することが理想的です。

 CDASHからSDTMに変換する際に注意すべきポイントはあります。

(10)

CDASHと「Rawデータ→SDTM」

Point

 CDASHとSDTMは、定義が一致しない部分があります。  また、EDCの仕様の制約から、Rawデータを理想的な定義にできないこと もあるでしょう。 CDASH

SDTM 理想の Rawデータ定義

実際の Rawデータ定義

(11)

CDASHとSDTM

CDASHとSDTMで定義が一致しない部分  どのような部分が、どのような理由で一致しないかの理解は、マッピングを 考えるうえで重要です。相違点のうち、主なものを簡単にまとめました。 • データ構造を非正規化(水平展開)とするか正規化(垂直展開)とするかの 基準については、CDASHでは規定はされていない。(SDTMでは、正規化 が規定されている。) 【テーブルに関する定義の不一致】

(12)

CDASHとSDTM

CDASHとSDTMで定義が一致しない部分 • 変数はCDASH、SDTMともに規定されている。Rawデータにおいては、基 本的にはCDASHに従うが、CDASHで規定されておらずSDTMでのみ規 定されているものはSDTMに従う。 【変数に関する定義の不一致】 意味合いは同じだが定義が異なる変数、CDASHのみに存在する変数、 SDTMのみに存在する変数のそれぞれが存在する。 <意味合いは同じだが定義が異なる変数> 例えば、日時値について、CDASHでは日付(--DAT)変数と時間(--TIM)変数 に分かれているが、SDTMでは日付時間(--DTC)変数で定義されている。

(13)

CDASHとSDTM

CDASHとSDTMで定義が一致しない部分 <CDASHのみに存在する変数> 例えば、「有害事象が発現したか?」または「併用薬を使用したか?」など、 データ確認用の変数。(クリーニングプロンプト。) <SDTMのみに存在する変数> • CRF外から設定される項目および機械的に算出すべき項目など。 --DY :Study Day

--SEQ : Sequence番号

ほか

• 情報の特性上、Trial Design modelはCDASHには存在しない。 【変数に関する定義の不一致】

(14)

CDASHとSDTM

意味合いは同じだが定義が異なる変数?  例えば、日時について • CDASH・・・日と時が別項目 • SDTM ・・・日時が1項目

 CDASHはCRF(EDC)に最適化されており、差異は合理的。

2017-01-01T12:00 CDASH (EDC画面) SDTM  EDCでは、日付をカレンダーから選択、 時刻をプルダウンで選択などとする場 合が多い。 日時を1項目にまとめると、これができ なくなるor複雑になるため、入力しづら い。

(15)

CDASHとSDTM

 同様に、年・月・日が部分的に不明であることが想定される項目は、 CDASHでは、年・月・日を別々に収集する。 • CDASH・・・年・月・日が別項目 • SDTM ・・・日時が1項目

 やはり、CDASHとSDTMの差異は合理的。

2010-03 SDTM  不明な日付は、カレンダーから選 択できない。EDCに正しく入力して もらうためには、年・月・日が別々 の項目であることが好ましい。 意味合いは同じだが定義が異なる変数? CDASH (EDC画面)

(16)

CDASHとSDTM

 本当であれば、正規化されたデータで欲しいRawデータが、EDCの仕様の 制限のために、非正規化のデータしか手に入らない、などの状況です。 本件について詳しくは、後程マクロのコンセプトの紹介と合わせて説明いたし ます。 EDCの制約のため理想通りのRawデータ定義にできない場合

USUBJID LBPERF LBDAT LBTESTCD LBORRES

1234005 Y 2017-03-01 AST 28 1234005 Y 2017-03-01 ALT 31 1234005 Y 2017-03-01 BILI 0.7 1234005 Y 2017-03-01 CREAT 0.78

理想

USUBJID LBPERF LBDAT AST ALT BILI CREAT

1234005 Y 2017-03-01 28 31 0.7 0.78

実際

(17)

CDASHとSDTM

 CDASHとSDTMの定義の差異は、合理的であり、避けて通れません。 定義の差異に対する変換処理をいかに標準化するかが、効率化のポイン トとなります。  EDCの仕様上の制約により、Rawデータが理想的な定義とならない場合 の標準化も、効率化のポイントとなります。

(18)

CDASHからのSDTM作成を効率化する

SASマクロのコンセプト

CDASH標準を利用したRawデータからSDTM作成を効率化する

(19)

CDASHからのSDTM作成を効率化するSASマクロ

 CDASHからSDTM作成時にポイントとなる箇所 ポイントとなる箇所 具体的な箇所の例 テーブルに関する定義の不一致 下記 変数に関する 定義の不一致 意味合いは同じだが 定義が異なる変数 日付変換など CDASHのみに 存在する変数 SDTM変換不要 SDTMのみに 存在する変数 --DY変数、SEQ変数など EDCの制約のため理想通りの Rawデータ定義にできない場合 データの転置処理など 本質的に

(20)

CDASHからのSDTM作成を効率化するSASマクロ

 CDASHからSDTMを効率よく作成するため、標準化した処理をSASマクロ 化いたしました。 カテゴリ マクロ 日付関連 日付時間変換 不完全な日付時間の変換 導出・設定 --DY変数 --SEQ Visit関連変数 構造変換 転置(横→縦変換) データ適合 Length適合(最短化) 全角等、使用不能文字確認 <作成したマクロの一部> コンセプトをご紹介いたします。

(21)

SDTM Rawデータ (CDASH)

日付関連マクロ:日付時間変換

 収集された日付変数と時間変数を、日付時間変数に変換する。 不完全な日付が入力されることは前提とされない。 日付 時間 日付時間 SAS macro 一見すると簡単そうだが、実際は細かなルールがある。 EDC

(22)

日付関連マクロ:日付時間変換

【対象項目例】

SDTM Rawデータ(CDASH)

EGDAT EGTIM EGDTC LBDAT LBTIM CMSTDAT CMSTTIM LBDTC CMSTDTC • 時間変数(--TIM)は存在しなくても構わない。その場合、SDTMの日付時間値は日 付のみをセットする。 • 時間変数(--TIM)が存在するがNullの場合も、SDTMの日付時間値は日付のみを セットする。 • 日付変数(--DAT)がNullで、時間変数(--TIM)がNullではない場合、時刻のみを “---Thh:mm” “---Thh:mm:ss”のようにセットする。 SAS macro

(23)

日付関連マクロ:日付時間変換

 マクロの入出力は以下のようにした。

%DateComp(inds= ,outds= ,prefix= );

inds・・・処理対象データセット名、outds・・・処理後データセット名、 prefix・・・対象変数の接頭語を設定

SDTM Rawデータ(CDASH)

EGDAT EGTIM EGDTC LBDAT LBTIM CMSTDAT CMSTTIM LBDTC CMSTDTC SAS macro  ポイントはprefix! DAT TIM DTC 接頭語のみの指定で、 変換前・変換後の全ての 変数名が明らかに!

(24)

日付関連マクロ:日付時間変換

 使用イメージ %DateComp(inds=wEG1 ,outds=wEG2 ,prefix=EG ); データセット wEG1 データセット wEG2 EGDATを含むデータセット。 EGTIMがある場合は、そちらも処理対象となる。 処理。 --TIMの有無は自動で判別。 wEG1に、EGDTCを追加したデータセット。 CDASH

(25)

日付関連マクロ:不完全な日付時間の変換

 不完全日付が前提となり、ルールも複雑になる部分もあるが、基本コンセ プトは変わりません。 EDC SDTM Rawデータ(CDASH) MHSTMO MHSTDY MHSTDTC MHENMO MHENDY MHENDTC

SAS macro MHSTYR

MHENYR

%DateInCo(inds= ,outds= ,prefix= );

inds・・・処理対象データセット名、outds・・・処理後データセット名、

マクロパラメー ターは同じ

(26)

日付関連マクロ

 Rawデータを標準化していることで、日付・時間の変換プロセスも標準化 できました。  CDASH準拠のため、変数名の指定も簡略化でき、ミス・トラブルを予防で きます。  実際は、紹介した以外に作成した日時値のエラーチェック機能などもつい ていますが、ここでは割愛いたします。

(27)

作りたいSDTM

データの構造変換マクロ(転置)

EDCの制約のため理想通りのRawデータ定義にできない場合

<正規化されている> LBドメインの例 EDC

USUBJID LBDTC LBTESTCD LBORRES ・・・ 1234005 2017-03-01 AST 28 ・・・ 1234005 2017-03-01 ALT 31 ・・・ 1234005 2017-03-01 BILI 0.7 ・・・

(28)

データの構造変換マクロ(転置)

EDCの制約のため理想通りのRawデータ定義にできない場合

LBドメインの例

EDC

USUBJID LBPERF LBDAT LBTESTCD LBORRES 1234005 Y 2017-03-01 AST 28 1234005 Y 2017-03-01 ALT 31 1234005 Y 2017-03-01 BILI 0.7 1234005 Y 2017-03-01 CREAT 0.78 理想通りのRawデータ定義 ⇒ 正規化されている

(29)

データの構造変換マクロ(転置)

EDCの制約のため理想通りのRawデータ定義にできない場合

LBドメインの例

EDC

USUBJID LBPERF LBDAT AST ALT BILI CREAT 1234005 Y 2017-03-01 28 31 0.7 0.78 Rawデータ 1つのフォームに存在している項 目は、横(変数を増やす)方向でし か取り扱えないEDCも、存在して いる。

(30)

USUBJID LBPERF LBDAT LBTESTCD LBORRES 1234005 Y 2017-03-01 AST 28 1234005 Y 2017-03-01 ALT 31 1234005 Y 2017-03-01 BILI 0.7 1234005 Y 2017-03-01 CREAT 0.78 Rawデータ

データの構造変換マクロ(転置)

LBドメインの例 理想通りのRawデータ定義

USUBJID LBPERF LBDAT AST ALT BILI CREAT 1234005 Y 2017-03-01 28 31 0.7 0.78

このEDCを用いる以上、 必ず生じる問題

(31)

データの構造変換マクロ(転置)

 データの処理を標準化(マクロ化)するということは、Rawデータの定義の 標準化が必要。 → CDASHだけでは、標準化が足りていない状態。 ルールを追加して最適な変数の構造を考えよう!  ちなみに、処理は単純なTranspose? ⇒ 測定無しのVisitの設定機能も持たせました。

(32)

USUBJID LBPERF LBDAT LBTESTCD LBORRES 1234005 Y 2017-03-01 AST 28 1234005 Y 2017-03-01 ALT 31 1234005 Y 2017-03-01 BILI 0.7 1234005 Y 2017-03-01 CREAT 0.78 Rawデータ

データの構造変換マクロ(転置)

理想通りのRawデータ定義

USUBJID LBPERF LBDAT AST ALT BILI CREAT 1234005 Y 2017-03-01 28 31 0.7 0.78  どの情報をどこからセットするか?(マッピング) 変数の内容 からセット 変数名から セット

(33)

Rawデータ

データの構造変換マクロ(転置)

33

USUBJID LBPERF LBDAT

AST _LBORR ES ALT _LBORR ES BILI _LBORR ES CREAT _LBORR ES 1234005 Y 2017-03-01 28 31 0.7 0.78  転置対象となる変数はどのように見分ける?? • 転置したい変数、転置後 全レコードに同一値をセットしたい変数が混在。 • 標準化するのだから、データの定義から判別可能にしたい。 → Rawデータ変数名にルールを作り、標準化した。 → 転置対象変数は、--TESTCDの内容 + “_”+検査結果を格納する変 数名 とした。

(34)

データの構造変換マクロ(転置)

 マクロの入出力は以下のようにした。

%TransDS(inds= ,outds= ,suffix= ,perf= ,dsall= );

inds・・・処理対象データセット名、 outds・・・処理後データセット名、 suffix・・・対象変数の接尾語を設定、 perf ・・・--PERF変数名、 dsall・・・全項目を示すコード値

Rawデータ

USUBJID LBPERF LBDAT

AST _LBORR ES ALT _LBORR ES BILI _LBORR ES CREAT _LBORR ES 1234005 Y 2017-03-01 28 31 0.7 0.78

(35)

データの構造変換マクロ(転置)

 測定が行われなかった場合。

Rawデータ

USUBJID LBPERF LBDAT

AST _LBORR ES ALT _LBORR ES BILI _LBORR ES CREAT _LBORR ES 1234006 N (Null) (Null) (Null) (Null) (Null)

%TransDS(inds=wLB1 ,outds=wLB2 ,suffix=LBORRES ,perf=LBPERF ,dsall=LBALL ); USUBJID LBDTC LBTESTCD LBORRES ・・・

1234006 LBALL ・・・

(36)

データの構造変換マクロ(転置)

 Rawデータに取り決めを作り、情報を持たせれば、精度の高い構造変換も 可能。  EDCの制約のため、CDASHに「準拠」でのみでは標準化が足りない部分 はデータの定義を工夫することで解決。

CDASHを

利用

しよう!

CDASHを

便利な「道具」

と考えよう!

(37)

具体的なマクロ活用法

 CDASHとSDTMで定義が異なるものは、マクロの作成により効率化を行う ことができました。

 では、CDASHとSDTMで定義が同じ変数はどうすれば?

(38)

具体的なマクロ活用法

マクロをすでに組み込んだ、

SDTM作成プログラムの雛型を作成!

• CDASHとSDTMで定義が同じで、なおかつEDCの制約にも抵触しない 変数は、RawデータからSDTMへコピーするのみであり、大部分を 雛型で対応可能です。 • CDASHとSDTMで定義が異なる部分は、組み込まれたマクロで対応! CDASH SDTM SAS Program雛型

(39)

具体的なマクロ活用法

 弊社では、紹介したマクロをすでに組み込んだ雛型を作成しています。  最小のコストでRawデータから SDTMを作成できる体制を整えまし た。 転置のマクロも 組み込み済み!

(40)

まとめ

 入力(Rawデータ)と出力(SDTM)が標準化されていれば、 その間の処理も標準化できるはずです。  CDASHを利用したRawデータ(CRF、EDC)の標準化を進めることで、 省コスト化および品質の安定が推進します。 • CDASHとSDTMで異なる部分 → マクロ化 • CDASHとSDTMで同一となる部分 → 雛型化  EDCの制約等により、CDASHに「準拠」でのみでは標準化が足りないこと もありますが、ルールを追加することにより、標準化は可能です。

CDASHを

「便利な道具」

と考えて

標準化に

利用

しましょう!

(41)

参考・引用文献

[1] CDISC CDASH Team.「Clinical Data Acquisition Standards Harmonization (CDASH) Version 1.1」

[2] CDISC CDASH Project Team.「Clinical Data Acquisition Standards Harmonization (CDASH) User Guide V1-1.1」

[3] CDISC Submission Data Standards Team and CDISC SDTM

Governance Committee.「Study Data Tabulation Model Version 1.5」 [4] CDISC Submission Data Standards Team.「Study Data Tabulation

Model Implementation Guide: Human Clinical Trials Version 3.2」 [5] 厚生労働省医薬食品局審査管理課長.「承認申請時の 電子データ 提出

に関する 基本的考え方について」 薬食審査発0620第6号 平成26年6月 20日

(42)

参照

関連したドキュメント

 その後、徐々に「均等範囲 (range of equivalents) 」という表現をクレーム解釈の 基準として使用する判例が現れるようになり

テキストマイニング は,大量の構 造化されていないテキスト情報を様々な観点から

あらまし MPEG は Moving Picture Experts Group の略称であり, ISO/IEC JTC1 におけるオーディオビジュアル符号化標準の

このように、このWの姿を捉えることを通して、「子どもが生き、自ら願いを形成し実現しよう

このような情念の側面を取り扱わないことには それなりの理由がある。しかし、リードもまた

ASTM E2500-07 ISPE は、2005 年初頭、FDA から奨励され、設備や施設が意図された使用に適しているこ

基準の電力は,原則として次のいずれかを基準として決定するも

以上の基準を仮に想定し得るが︑おそらくこの基準によっても︑小売市場事件は合憲と考えることができよう︒