• 検索結果がありません。

進化を考慮したデータ基盤の設計および自動構築

N/A
N/A
Protected

Academic year: 2021

シェア "進化を考慮したデータ基盤の設計および自動構築"

Copied!
2
0
0

読み込み中.... (全文を見る)

全文

(1)情報処理学会第 82 回全国大会. 5A-01. 進化を考慮したデータ基盤の設計および自動構築 宿谷. 琴子†. 株式会社富士通研究所. 土肥. 実久†. 福山. 訓行†. スーパーミドルウエア・ユニット†. 1. はじめに 日々変化していく市場に素早く対応するため、 企業が保有するデータからの価値抽出、すなわ ち「データ利活用」が求められている。例えば、 ある駅でのカメラの映像データから人間の行動 分析を行い、時間帯や気象条件によってどんな 人が利用するのかを出力し、その結果によって 駅構内の小売店の商品の陳列を変える、という ことも可能になる。 現状、データ利活用の各処理の多くは手作業 で行われているが、データドリブンなビジネス を素早く回すためには処理の自動化が必要であ る。データ利活用を本番環境で繰り返し自動実 行する場合には分析用プログラムだけではなく、 データの処理を実行できる環境を含めたシステ ム上で、目的に応じた様々な分析手法を模索す ることになる。しかし、分析手法を取り替えた 際のシステムの再構成、制御情報の更新は手間 がかかる上にインフラ構築の専門知識を要する という課題がある。 本稿では、分析手法を模索する際に、インフ ラ構築の専門知識を必要としないためのデータ 基盤の設計について述べる。. を変更する可能性がある。このとき、変更前と 同じデータを使用したい場合はアプリシステム 全体を新規に作り替えるか、変更部分をシステ ムに合わせて個別に修正するため手間がかかっ てしまうという課題がある。. 図1:データ利活用システムの例. この課題に対する解決策として、アプリシス テムのレイヤーを「作り直す部分」と「作り直 さない部分」に分ける。 具体例として、図2に示すユーザーがデータ 分析アプリ A を別のデータ分析アプリ B に変更 2. データ利活用システムの課題分析 した場面を想定する。このとき、分析に用いる データ利活用を行うためのインフラからアプ データを蓄積したデータストア=ストレージの リの全体を含むシステムを本稿では「データ利 パスワードはランダム発生する場合もあり、単 活用システム」と呼ぶ。分析手法を模索するた 純にデータ分析アプリを取り替えようとしても めのマイクロサービスを意識した先端のデータ 同じデータストアに接続できずスムーズな再起 利活用システムは、図1に示すように、物理サ 動ができなくなってしまう。 ーバやコンテナ基盤などの「インフラ」の上に、 このケースにおいて、ユーザーが直接変更を データソースからの取込み、データ加工、デー 行う、つまり「作り直す部分」はデータ加工ア タ分析という処理を実行するデータフロー、処 プリとデータフローである。また、ユーザーが 理に用いるアプリ、データフロー上の処理を順 直接操作する必要が無い、すなわち、「作り直 番に実行させるためのデータフロー制御、使用 さない部分」であるデータフロー制御部分から するデータを蓄積するためのデータストアから インフラ部分までの間のレイヤーは、本来、意 構成される「アプリシステム」が乗っている構 識しなくても良い部分である。本稿ではこのレ 成が増えてきている。 イヤーを「データ基盤」とすることで、ユーザ このシステム上で、分析手法を取り替えるた ーにこの部分を意識させないようにできる可能 めにデータ分析アプリなどを変更する際にはデ 性があることに着目した。 ータの処理方法が変化するため、データフロー これを実現するには、データ基盤は、まずユ. 1-23. Copyright 2020 Information Processing Society of Japan. All Rights Reserved..

(2) 情報処理学会第 82 回全国大会. ーザーがインフラ部分に作成したストレージの 設定などを保管する必要がある。次に、ユーザ ーがデータ分析アプリを A から B へ変更した後、 変更前と同じデータを用いた新しい分析を行い たいとき、保管しておいた設定を用いてデータ ストアとデータ分析アプリ B との接続を構築し なければならない。これにより、ユーザーは同 じストレージからデータを使用できる。 このように、「作り直さない部分」をデータ 基盤に吸収することによって、ユーザーがデー タフローやアプリの変更を行うだけでデータ基 盤はその変更を適用し、変更前と同じデータを 用いて新しいデータフローを自動で実行できる ようになる。. のホスト名、ユーザー名、パスワード、データ ベース名などのパラメータを「記録部」に配置 した RDB に記録する。また、「再現部」はデー タフローやアプリが新しく作り替えられた際、 「記録部」に記録したパラメータを Kubernetes に渡して DBMS を起動する。この 2 つの機構によ り、ストレージの認証情報を維持することが可 能になるため、アプリが変更されても同じデー タを扱うことができる。 上記の【必須要件】に加えて【選択的要件】 では、ワークフロー管理システムと記録部/再 現部を連携させてデータフローの制御を行うこ とで、データフローの維持が可能になる。. 図3:データ基盤の実装例 図2:提案するデータ利活用システム構成 3. データ基盤の要件定義 前述のデータ基盤は、作り直さない部分を吸 収することで逆に作り直す部分を簡単に何度も 作り直せることを目的としている。このデータ 基盤を実現するための要件は以下のように定義 される。 【必須要件】 ・データフローやアプリが新しく作り替えられ た際、その変更を適用できる ・永続的なデータの蓄積ができる 【選択的要件】 データソースからの取込み、データ加工、デー タ分析という処理が確実に自動実行できる 4. データ基盤の設計 前述の要件を満たすため、図3に示す構成を 実装した。ここで、DBMS として Postgres を、コ ンテナ基盤として Kubernetes を、データの処理 を行うアプリは Docker コンテナで実装する方式 を採用した。 【必須要件】に対して、「記録部」と「再現 部」を導入する。「記録部」は初回時にユーザ ーがデータ基盤にデータストアを設定したとき. 1-24. 5. まとめ・今後の予定 本稿では、インフラ構築の専門知識を必要と せずに最適な分析手法を模索するため、アプリ システムをユーザーが作り直す部分と作り直さ ない部分とで分けることで分析手法を簡単に取 り換えられるデータ基盤の設計を行った。 この設計に従いデータ利活用システムを構築 し、アプリを変更しても変更前と同じデータが 使用できることを検証する。 また、データ基盤のレイヤーは増える可能性 があるため、実際にデータ利活用システムを用 いてデータ分析や機械学習を行なっていく中で データ基盤に必要な機能を追加し改善していく 予定である。 将来は、データストアを変更する場合におい ても永続的にデータを蓄積できる設計を目指す。. Copyright 2020 Information Processing Society of Japan. All Rights Reserved..

(3)

参照

関連したドキュメント

① セット展開機能を利用した記録の効率化

 再び心室筋の細胞内記録を行い,灌流液をテト

ちな みに定理の名前は証明に貢献した数学者たち Martin Davis, Yuri Matiyasevich, Hilary Putnam, Julia Robinson の名字に由来する. この定理により Halt0 を

注:一般品についての機種型名は、その部品が最初に使用された機種型名を示します。

2020 年 9 月に開設した、当事業の LINE 公式アカウント の友だち登録者数は 2022 年 3 月 31 日現在で 77 名となり ました。. LINE

目視によって塗膜欠陥の有無を調査し,欠陥が見られ

パスワード 設定変更時にパスワードを要求するよう設定する 設定なし 電波時計 電波受信ユニットを取り外したときの動作を設定する 通常

① 小惑星の観測・発見・登録・命名 (月光天文台において今日までに発見登録された 162 個の小惑星のうち 14 個に命名されています)