富士通の
富士通の
バイオインフォマティクスへの取り組み
バイオインフォマティクスへの取り組み
March
March
5
5
, 2002
, 2002
富士通株式会社
富士通株式会社
計算科学技術センター
計算科学技術センター
)
)
奥田
奥田
m.
Contents
Contents
l
l
富士通のバイオインフォマティクへの取り組み
富士通のバイオインフォマティクへの取り組み
Ø
Ø
歴史
歴史
・
・
実績
実績
Ø
Ø
バイオインフォマティク向けソリューション体系
バイオインフォマティク向けソリューション体系
l
l
代表的なソリューションのご紹介
代表的なソリューションのご紹介
Ø
Ø
Post Genome Platform
Post Genome Platform
Ø
Ø
アプリケーション
アプリケーション
PKG
PKG
l
アプリケーション
アプリケーション
PKG
PKG
1983
1983
年
年
化学情報管理システム
化学情報管理システム
(
(
米国
米国
MDL
MDL
社製
社製
MACCS
MACCS
)
)
1986
1986
年
年
分子モデリングシステム
分子モデリングシステム
(
(
呉羽化学
呉羽化学
工業共同開発
工業共同開発
ANCHOR
ANCHOR
)
)
構造活性相関研究支援システ
構造活性相関研究支援システ
ム
ム
(ADAPT
(
ADAPT
)
)
1991
1991
年
年
バイオ研究支援統合システム
バイオ研究支援統合システム
(
(
BIORESEARCH Series
BIORESEARCH Series
)
)
1993
1993
年
年
半経験的分子軌道法アプリ
半経験的分子軌道法アプリ
(
(MOPAC
MOPAC
)
)
1996
1996
年
年
HTS
HTS
データ管理システム
データ管理システム
(
(
英国
英国
OMG
OMG
社製
社製
RS
RS
33HTS
HTS
)
)
1997
1997
年
年
代謝マップ
代謝マップ
DB
DB
システム
システム
(
(
Biofrontier
Biofrontier
)
)
化学
化学
&
&
バイオ分野への取り組みの歴史
バイオ分野への取り組みの歴史
トピックス
トピックス
1986
1986
年
年
(
(
株
株
)
)
蛋白工学研究所
蛋白工学研究所
出資参加
出資参加
1991
1991
年
年
分子進化学解析システム
分子進化学解析システム
(SINCA)
(
SINCA)
を
を
国立遺伝学研究所殿
国立遺伝学研究所殿
と共同
と共同
研究開発
研究開発
1998
1998
年
年
JBiC
JBiC
設立、
設立
、
バイオ
バイオ
EC
EC
プロジェク
プロジェク
ト
ト
に参加
に参加
2000
2000
年
年
ライフサイエンス推進室
ライフサイエンス推進室
設立
設立
セ
セ
レスター・レキシコ・サイエンシ
レスター・レキシコ・サイエンシ
ズ
ズ
(
(
株
株
)
)
設立
設立
2001
2001
年
年
富士通研究所ナノ
富士通研究所ナノ
&
&
バイオ研究
バイオ研究
Grp
Grp
.
.
立ち上げ
立ち上げ
2002
2002
年
年
Bioinformatics
Bioinformatics
ソリューション
ソリューション
提供開始
提供開始
MOLECULAR DYNAMICS
MOLECULAR DYNAMICS
MASPHYCMASPHYCMASPHYC
MASPHYC
WinMASPHYC
WinMASPHYC
for VP for VP for Sun WS for Sun WS‘
‘
83
83
’
’
84
84
‘
‘
85
85
’
’
86
86
‘
‘
87
87
’
’
94
94
‘
‘
95
95
’
’
96
96
‘
‘
97
97
’
’
98
98
‘
‘
99
99
’
’
00
00
’
’
01
01
’
’
02
02
Main Frame computer
WS software Client/Server Soft
Web computing
for WS
for WS
for Mainframe f or SGI WS
for Mainframe f or SGI WS
ADAPT ADAPT
ADAPT ADAPT
TsarTsarTOPKAT TOPKAT
LEAD EVOLUTION
LEAD EVOLUTION
Emil
Emil
MACCS/MACCS MACCS/MACCS--IIII ISIS ISISREACCS
REACCS
ChemDraw
ChemDraw
/ ChemOffice
/
ChemOffice
RS
RS
33discovery
discovery
ChemLib
ChemLib
BioFrontier
BioFrontier
CHEMICAL
CHEMICAL
INFORMATION
INFORMATION
MANAGEMENT
MANAGEMENT
SYSTEMS
SYSTEMS
WinMOPAC WinMOPAC MOPAC93 MOPAC93for Mainframe for SGI WS
for Mainframe for SGI WS
MOPAC2000
MOPAC2000
CAChe
CAChe
MOLECULAR ORBITAL
MOLECULAR ORBITAL
MOPAC2002
MOPAC2002
富士通の計算化学
富士通の計算化学
PKG
PKG
の歴史
の歴史
KAMELO
KAMELO for WSfor WS
CHEMICAL SPREADSHEET
CHEMICAL SPREADSHEET
MOLECULAR
MOLECULAR
MODELING
MODELING
ANCHOR ANCHOR ANCHOR ANCHOR--IIIIアプリケーションパッケージ導入実績
アプリケーションパッケージ導入実績
Bioinformatics
Bioinformatics
110
110
システム
システム
Cheminformatics
Cheminformatics
40
40
システム
システム
Modeling
Modeling
・
・
解析
解析
200
200
システム
システム
パソコンパッケージ
パソコンパッケージ
(Modeling
(
Modeling
・
・
Cheminformatics
Cheminformatics
等
等
)
)
国内
国内
15,000
15,000
本以上
本以上
global 30,000
バイオ関連システム開発実績
栄研化学
栄研化学
(
(
株
株
)
)
殿
殿
LAMP
LAMP
法プライマ設計システム
法プライマ設計システム
東京都老人医療センター殿
東京都老人医療センター殿
老年病
老年病
DNA
DNA
多型
多型
DB
DB
明治製菓
明治製菓
(
(
株
株
)
)
殿
殿
MEIBIS
MEIBIS
(
(MEiji
MEiji
Integrated BioInformatics
Integrated
BioInformatics
System)
System)
Bioinformatics
Bioinformatics
30
30
社・機関
社・機関
等々
等々
プラットフォーム、アプリを含んだトータルなバイオ関
連システムを数多く構築
東京都老人医療センター殿
日本経済新聞 2001年
明治製菓
明治製菓
(
(
株
株
)
)
殿
殿
化学工業日報
化学工業日報
2001
2001
年
年
バイオ関連システム開発実績
(
例
)
共同研究への参画
共同研究への参画
H.12
H.12
年度∼
年度∼
JBiC
JBiC
「
「
SNPs
SNPs
頻度解析センター」
頻度解析センター」
東京大学医科学研究所
東京大学医科学研究所
中村先生
中村先生
H.12
H.12
年度
年度
∼
∼
「
「
遺伝子多型情報に基づく疾患遺伝子探索」
遺伝子多型情報に基づく疾患遺伝子探索」
徳島大学ゲノム機能研究センター
徳島大学ゲノム機能研究センター
板倉先生
板倉先生
NEDO
NEDO
H.12
H.12
年度
年度
「
「
P450
P450
薬物代謝酵素
薬物代謝酵素
DB
DB
」
」
九州大学
九州大学
大村先生
大村先生
NEDO
NEDO
H.11
H.11
年度
年度
「タンパク機能解析」
「タンパク機能解析」
国立遺伝学研究所
国立遺伝学研究所
五條堀先生
五條堀先生
等々
国立遺伝学研究所
国立遺伝学研究所
(
(
NIG)
NIG)
殿
殿
:
:
VPP5000/12,
VPP5000/12,
PRIMEPOWER2000/128
PRIMEPOWER2000/128
×
×
2
2
産総研
産総研
生物情報解析研究センター殿
生物情報解析研究センター殿
:
:
PRIMERGY N400
PRIMERGY N400
科学技術振興事業団
科学技術振興事業団
(
(
JST)
JST)
殿
殿
:
:
VPP300/16, PRIMEPOWER600/4
VPP300/16, PRIMEPOWER600/4
理研ゲノム科学総合研究センター
理研ゲノム科学総合研究センター
(GSC)
(
GSC)殿
殿
: GP7000F
:
GP7000F-
-M2000/52
M2000/52
等々
バイオ関連システム導入
バイオ関連システム導入
&
&
サポート実績
サポート実績
岡崎国立共同研究機構殿
岡崎国立共同研究機構殿
:
:
VPP5000/30
VPP5000/30
生物分子工学研究所
生物分子工学研究所
(
(
BERI)
BERI)
殿
殿
:
:
VX/4, PC
VX/4, PC
クラスタ
クラスタ
Internet GP7000Sm1000×2set CPU:UltraSPARC-II (400MHz)×64 Main memory:64GB Disk: 500GB Backup instrument:TIMBERWOLF(350GB)
VPP5000 / 12PE
vector processor: 9.6GFLOPS×12 Main memory :176GB Disk :576GB
PRIMEPOWER2000 ×2set
CPU:SPARC64-GP(450MHz)×128 Main memory: 128GB Disk: 5TBGraphics server Bio simulation database server
Large volume backup management Server
Network server(4set)
Database server B
Genome analysis sever
GP7000Sm350 ×4set CPU:UltraSPARC II(400MHz)×2 Main memory:1GB Disk: 150GB/500GB GP7000Sm350 CPU:UltraSPARC II(400MHz)×4 Main Memory : 4GB Disk : 500GB GP7000Sm650 CPU:UltraSPARC II(400MHz)×12 Main memory: 12GB Disk: 3TB GP7000Sm550 ×2set CPU:UltraSPARC II(400MHz)×12 Main memory: 12GB Disk: 2.3TB GP7000Sm350 CPU: UltraSPARC II (400MHz)×6 Main memory :6GB Disk:300GB Backup equipment: TIMBERWOLF (350GB) SGI Onyx3000 CPU:R12000(300MHz)×8 Main memory: 500GB Backup equipment: TIMBERWOLF (350GB) SGI Onyx3000 CPU:R12000(300MHz)× 8 Main memory:4GB Disk: 500GB Backup equipment: TIMBERWOLF(350GB) DeCypher D40 - B15 GP7000Sm350 CPU:UltraSPARCII(400MHz)×1 Main memory:1GB Disk:500GB
Backup instrument :POWDERHORN (100TB)
Homology Search
Server(2set)
SuperSINET
Super Computer
Large scale
analysis server(2set)
Genome information server
ftp
Server(2set)
国立遺伝学研究所殿
インターネットへ
インターネットへ
GigabitEthernet
GigabitEthernet
ユーザ端末
ユーザ端末
ユーザネットワーク
ユーザネットワーク
バックアップサーバ
バックアップサーバ
FUJITSU GP7000F
FUJITSU GP7000F
M400
M400
DB
DB
提供サーバ
提供サーバ
FUJITSU GP7000F M2000
FUJITSU GP7000F M2000
(52CPU/52GBMem)
(52CPU/52GBMem)
FUJITSU GR720
FUJITSU GR720
(
(
8
8
TB
TB
)
)
SOMY
SOMY
PetaSite
PetaSite
計算サーバ
計算サーバ
Compaq GS320
Compaq GS320
×
×
2
2
ファイルサーバ
ファイルサーバ
IBM p680 S85
IBM p680 S85
(
(
5TB
5TB
)
)
多目的サーバ
多目的サーバ
FUJITSU GP7000F
FUJITSU GP7000F
M200
M200
SN200 SN200理研ゲノム科学総合研究センター殿システム
理研ゲノム科学総合研究センター殿システム
Contents
Contents
l
l
富士通のバイオインフォマティクの取り組み
富士通のバイオインフォマティクの取り組み
Ø
Ø
歴史・実績
歴史・実績
Ø
Ø
バイオインフォマティク向けソリューション体系
バイオインフォマティク向けソリューション体系
l
l
代表的なソリューションのご紹介
代表的なソリューションのご紹介
Ø
Ø
アプリケーション
アプリケーション
PKG
PKG
Ø
Ø
Post Genome Platform
Post Genome Platform
l
PKG
PKG、
、
ASP
ASP
、
、
contents
contents
System Integration
System Integration
ゲノム解読
ゲノム解読
ポストゲノム
ポストゲノム
ドラッグデザイン
ドラッグデザイン
ゲノム創薬及び
ゲノム創薬及び
研究情報管理
研究情報管理
/
/
研究ワークフローの
研究ワークフローの
設計∼開発を戦略的にデザイン
設計∼開発を戦略的にデザイン
バイオ
バイオ
研究
研究
IT
IT
ベンダ
ベンダ
バイオインフォマティクスの動向
バイオインフォマティクスの動向
評価・再検討
評価・再検討
解析・研究
解析・研究
設計∼構築∼運用
設計∼構築∼運用
研究現場調査
研究現場調査
国内外動向調査
国内外動向調査
戦略
戦略
評価・再検討
評価・再検討
解析・研究
解析・研究
設計∼構築∼運用
設計∼構築∼運用
研究現場調査
研究現場調査
国内外動向調査
国内外動向調査
戦略
研究開発の
研究開発の
速度が加速
速度が加速
研究開発競争
研究開発競争
の激化
の激化
情報の動きの
情報の動きの
ウォッチが大変
ウォッチが大変
実験機器・実験手法の
実験機器・実験手法の
進歩が速い
進歩が速い
維持・運用コストが
維持・運用コストが
年々増大
年々増大
データフォーマットが
データフォーマットが
不統一
不統一
バイオインフォマティクス
バイオインフォマティクス
要員の育成
要員の育成
バイオインフォマティクス現場の課題
バイオインフォマティクス現場の課題
大規模・高速の
大規模・高速の
計算が必要
計算が必要
評価・再検討
評価・再検討
解析・研究
解析・研究
設計∼構築∼運用
設計∼構築∼運用
研究現場調査
研究現場調査
国内外動向調査
国内外動向調査
戦略
戦略
受託解析
受託解析
サービス
サービス
知識情報処理技術
知識情報処理技術
Agent
Agent
技術
技術
アウトソーシング
アウトソーシング
サービス
サービス
XML
XML
による
による
データ標準化
データ標準化
システム構築
システム構築
サービス
サービス
Bioinformatics
Bioinformatics
ソリューション
ソリューション
PKG
PKG
ソフト
ソフト
コンサルティング
コンサルティング
ITベンダが提供できる解決策
ITベンダが提供できる解決策
高速サーバ
高速サーバ
富士通の
富士通の
Bioinformatics
Bioinformatics
ソリューション
ソリューション
分子軌道計算
分子軌道計算
分子動力学計算
分子動力学計算
化学情報管理
化学情報管理
QSAR
QSAR
遺伝子探索
遺伝子探索
毒性予測
毒性予測
HTS
HTS
遺伝子
遺伝子
アノテーション
アノテーション
代謝・活性予測
代謝・活性予測
PRIMEPOWER
PRIMEPOWER
VPP5000
VPP5000
統計解析
統計解析
インターネット
インターネット
情報検索
情報検索
知識情報処理
知識情報処理
高速コンパイラ
高速コンパイラ
ベクトル
ベクトル
/
/
並列
並列
チューニング
チューニング
セキュリティ
セキュリティ
エージェント
エージェント
富士通のノウハウを結集
富士通のノウハウを結集
Web Solution
Web Solution
固有の研究フロー
固有の研究フロー
のシステム化
のシステム化
LabBook
ChemOffice WebServer
バイオ研究・創薬研究のアプリケーションソフトを統合
バイオ研究・創薬研究のアプリケーションソフトを統合
Outsourcing
Outsourcing
専門家リソースの活用
専門家リソースの活用
【受託解析・コンサルティング
受託解析・コンサルティング】
【システム運用】
【システム運用】
Application
Application
目的別専門
目的別専門
PKG
PKG
の提供
の提供
GeneDiscovery BioFrontier Genomic XML Browser RS3 HTS TOPKAT CAChe WinMOPAC ChemDraw研究所内システム
研究所内システム
富士通のバイオインフォマティックス・ソリューション体系
富士通のバイオインフォマティックス・ソリューション体系
Infrastructure
Infrastructure
バイオに最適化された
バイオに最適化された
インフラの提供
インフラの提供
Post Genome Platform
Contents
Contents
l
l
富士通のバイオインフォマティクの取り組み
富士通のバイオインフォマティクの取り組み
Ø
Ø
歴史・体制
歴史・体制
Ø
Ø
バイオインフォマティク向けソリューション体系
バイオインフォマティク向けソリューション体系
l
l
代表的なソリューションのご紹介
代表的なソリューションのご紹介
Ø
Ø
Post Genome Platform
Post Genome Platform
u
u
コンセプト
コンセプト
u
u
ソフトウエア
ソフトウエア
u
u
ハードウエア
ハードウエア
Ø
Ø
アプリケーション
アプリケーション
PKG
PKG
l
l
まとめ
まとめ
fastDN A fastDN A BLAST BLAST EM BL PD B Swiss Prot PIR GenB ank FASTA FASTA
現場のインフラの課題を情報屋が解釈すると
現場のインフラの課題を情報屋が解釈すると
l
l
大規模・広域分散データ
大規模・広域分散データ
のアクセス
のアクセス
&
&
管理問題
管理問題
l
l
データ形式変換問題
データ形式変換問題
l
l
大規模データベースの
大規模データベースの
管理
管理
&
&
高速検索問題
高速検索問題
公開データ、優れたプログラム
公開データ、優れたプログラム
が世界規模で散在、色々な形
が世界規模で散在、色々な形
で存在し、さらに爆発的に増大
で存在し、さらに爆発的に増大
して収集、更新、アクセスが大
して収集、更新、アクセスが大
変。
変。
大量のデータから自分の欲し
大量のデータから自分の欲し
い情報を早く、正確に取り出し
い情報を早く、正確に取り出し
たい。
たい。
自分の研究のためには各種
自分の研究のためには各種
のデータ、プログラムを組み合
のデータ、プログラムを組み合
わせ、連携した複雑な処理が
わせ、連携した複雑な処理が
必要
必要
複雑なタンパク質の構造・挙
複雑なタンパク質の構造・挙
動の解明、タンパク質と他の
動の解明、タンパク質と他の
化合物の相互作用の解明を
化合物の相互作用の解明を
早く・精密に行いたい。
早く・精密に行いたい。
l
l
処理プロセス
処理プロセス
&
&
情報フロー
情報フロー
の管理・制御問題
の管理・制御問題
l
l
超高速の数値シミュレー
超高速の数値シミュレー
ション問題
ション問題
解析シナリオ Motif解析Post Genome Platform
Post Genome Platform
問題解決に向けてのインフラソリューションの提案
問題解決に向けてのインフラソリューションの提案
*: *: 開発コード名開発コード名バイオ統合ブラウザ
バイオ統合ブラウザ
サービス
サービス
システム構築、アプリ最適化、システム利用
システム構築、アプリ最適化、システム利用
&
&
運用支援
運用支援
ソフトウエアプラットフォーム
ソフトウエアプラットフォーム
バイオインフォマティクス統合ソフトウエア
バイオインフォマティクス統合ソフトウエア
EIDOS
EIDOS
*
*
(
(
Web
Web
サービス連携、
サービス連携、
DB&
DB&
プログラム
プログラム
I/F
I/F
、
、
ブラウザビュー統合
ブラウザビュー統合
等
等
)
)
。
。
ハードウエアプラットフォーム
ハードウエアプラットフォーム
超高速計算・大容量データ処理を実現
超高速計算・大容量データ処理を実現
次期
次期
HPC
HPC
サーバ
サーバ
PRIMEPOWER
PRIMEPOWER
PC
PC
クラスタ
クラスタ
特許 特許 情報 情報 実験 実験 データ データ 文献 文献 情報 情報最適化された共通ライブラリ
最適化された共通ライブラリ
超高速
超高速
XML
XML
検索
検索
超高速テキスト検索
超高速テキスト検索
BSML
BSML
コンバータ
コンバータ
タンパク質解析
タンパク質解析
MOPAC
MOPAC
、
、
相同性検索
相同性検索
BLAST
BLAST
GRID
GRID
I/F
I/F
遠隔地の各種資源
遠隔地の各種資源
Contents
Contents
l
l
富士通のバイオインフォマティクの取り組み
富士通のバイオインフォマティクの取り組み
Ø
Ø
歴史・体制
歴史・体制
Ø
Ø
バイオインフォマティク向けソリューション体系
バイオインフォマティク向けソリューション体系
l
l
代表的なソリューションのご紹介
代表的なソリューションのご紹介
Ø
Ø
Post Genome Platform
Post Genome Platform
u
u
コンセプト
コンセプト
u
u
ハードウエア
ハードウエア
u
u
ソフトウエア
ソフトウエア
Ø
Ø
アプリケーション
アプリケーション
PKG
PKG
l
l
まとめ
まとめ
バイオインフォマティックに最適な
バイオインフォマティックに最適な
ハードウエアプラットフォーム
ハードウエアプラットフォーム
大規模データ処理
大規模データ処理
&
&
超高速処理を実現する
超高速処理を実現する
UNIX
UNIX
サーバ
サーバ
効率的な専用処理を実現する
効率的な専用処理を実現する
PC
PC
クラスタ
クラスタ
•
•
PRIMEPOWR
PRIMEPOWR
に
に
よる大規模
よる大規模
&
&
超高速
超高速
DB
DB
ハンドリング
ハンドリング
Ø
Ø
拡張性・信頼性に優れた
拡張性・信頼性に優れた
Solaris
Solaris
サーバ
サーバ
Ø
Ø
高信頼・超高速ファイルシステム
高信頼・超高速ファイルシステム
•
•
次期
次期
HPC
HPC
サーバ
サーバ
による超高速シミュレーション
による超高速シミュレーション
Ø
Ø
世界最高性能、
世界最高性能、
TBクラスメモリの次世代
TB
クラスメモリの次世代
HPCサーバ
HPC
サーバ
大規模
大規模
PC
PC
クラスタ
クラスタ
ホストサーハ
ホストサーハ
゙
゙
並列版専用アプリ
並列版専用アプリ
による効率的な
による効率的な
処理の実現
処理の実現
•
•
幅広い製品レンジの
幅広い製品レンジの
PRIMERGY
PRIMERGY
PC
PC
クラスタ
クラスタ
Ø
Ø
CPU : Pen3,Pen4
CPU : Pen3,Pen4
、
、
1way
1way
∼
∼
4Way
4Way
Ø
Ø
インターコネクト
インターコネクト
:
:
Myrinet
Myrinet
,
,
GigabitEthernet
GigabitEthernet
Ø
Ø
並列環境
並列環境
: Score,
:
Score, Beowolf
Beowolf型
型
次期
次期
HPC
HPC
サーバ
サーバ
高速ディスク装置
高速ディスク装置
DB
DB
大規模データ処理
大規模データ処理
超高速シミュレーション
超高速シミュレーション
次期
次期
HPC
HPC
サーバのご紹介
サーバのご紹介
•
•
ベクトルスパコンの技術と大規模スカラサーバの技術
ベクトルスパコンの技術と大規模スカラサーバの技術
を融合したバイオインフォマティックスに最適な
を融合したバイオインフォマティックスに最適な
次世代
次世代
の
の
HPC
HPC
サーバ
サーバ
を提供予定
を提供予定
VPP5000
VPP5000
•
•
ベクトル技術
ベクトル技術
•
•
命令の先行制御技術
命令の先行制御技術
•
•
高速クロスバによる
高速クロスバによる
分散メモリ並列化技術
分散メモリ並列化技術
•
•
高性能コンパイラ
高性能コンパイラ
PRIMEPOWER
PRIMEPOWER
•
•
共有メモリ並列化技術
共有メモリ並列化技術
•
•
メモリアクセス
メモリアクセス
先行制御技術
先行制御技術
次期HPCサーバ
次期
次期
HPC
HPC
サーバのご紹介
サーバのご紹介
–
–
特徴
特徴
–
–
l
l
超高速なバイオシミュレーションを実現する
超高速なバイオシミュレーションを実現する
世界最高速
世界最高速
システム
システム
over 1GHz
over 1GHz
プロセッサ
プロセッサ
1
1
ノード
ノード
: 500
: 500
Gflops
Gflops
以上
以上
、
、
システム
システム
: 60
: 60
Tflops
Tflops
以上
以上
l
l
バイオ特有な大規模計算
バイオ特有な大規模計算
&
&
複雑かつ大規模な検索を
複雑かつ大規模な検索を
実現する
実現する
世界最大規模のメモリ容量
世界最大規模のメモリ容量
1
1
ノード
ノード
: 0.5
: 0.5
TB
TB
システム
システム
: 64TB
: 64TB
l
l
大規模なバイオデータ処理を実現する
大規模なバイオデータ処理を実現する
世界最大規模の
世界最大規模の
スケーラビリティ
スケーラビリティ
1
1
ノード
ノード
: 128
: 128
CPU
CPU
、
、
システム
システム
: 16,000
: 16,000
cpu
cpu
以上
以上
ノード間高速光コネクト
ノード間高速光コネクト
l
l
大規模システムの導入を可能とした運用・設置性
大規模システムの導入を可能とした運用・設置性
メインフレーム並の
メインフレーム並の
高信頼性
高信頼性
高密度実装、省電力設計
高密度実装、省電力設計
Contents
Contents
l
l
富士通のバイオインフォマティクの取り組み
富士通のバイオインフォマティクの取り組み
Ø
Ø
歴史・体制
歴史・体制
Ø
Ø
バイオインフォマティク向けソリューション体系
バイオインフォマティク向けソリューション体系
l
l
代表的なソリューションのご紹介
代表的なソリューションのご紹介
Ø
Ø
Post Genome Platform
Post Genome Platform
u
u
コンセプト
コンセプト
u
u
ハードウエア
ハードウエア
u
u
ソフトウエア
ソフトウエア
Ø
Ø
アプリケーション
アプリケーション
PKG
PKG
l
l
まとめ
まとめ
ユーザ固有の
解析アプリ
DB
DB
実験データ
DB
DB
ユーザ固有の
DB
スパコンによる
解析処理
PCクラスタによる
データ検索&解析処理
3HPCセンター
Homology search, Alignment, Clustering,…
EIDOS
EIDOS
ソフトウエアプラットフォーム
ソフトウエアプラットフォーム
EIDOS*
EIDOS*
6
1
巨大で複雑な情報からの知識発見を加速
巨大で複雑な情報からの知識発見を加速
著名なパブリックサイトの
著名なパブリックサイトの
資源・研究所内の遠隔資源・ユーザの資源を連携さ
資源・研究所内の遠隔資源・ユーザの資源を連携さ
せたオリジナルワークフローを実現するソフトプラットフォーム
せたオリジナルワークフローを実現するソフトプラットフォーム
!
!
*: *: 開発コード名開発コード名バイオ向け統合ブラウザ
GenBank
GenBank,EMBL,PDB,PIR,
,EMBL,PDB,PIR,SwissProt
SwissProt
データ/文献
公共サイトのDB
3
4
7
2
サービススクリプティング機
サービススクリプティング機
能を持つバイオ向け
能を持つバイオ向け
ソフトウェアプラットフォーム
ソフトウェアプラットフォーム
5
service
requests
request
request
request
responses
response
UDSによるサービスの定義
(User Defined Service Script)
フ
゙
ラ
ウ
サ
゙
ー
ヒ
゙
ュ
ー 統
合
フ
゙
ラ
ウ
サ
゙
ー
ヒ
゙
ュ
ー 統
合
ハ
゙
イ
オ
ア
フ
゚
リ
ハ
゙
イ
オ
ア
フ
゚
リ
I/F
I/F
ハ
゙
イ
オ
ハ
゙
イ
オ
DB I/F
DB I/F
http
http
http
http
EIDOS
EIDOS
の
の
Web
Web
サービス連携動作イメージ
サービス連携動作イメージ
ID:
ID:
X3626
X3626
XX解析
XX解析
解析
解析
結果
結果
関連文書
関連文書
一覧
一覧
ゲノム
ゲノム
情報
情報
ID:
ID:
X3626
X3626
XX解析
XX解析
ゲノムDB
ゲノムDB
サーバ
サーバ
html
html
文献DB
文献DB
サーバ
サーバ
Servlet
Servlet
XML
XML
XX
XX
解析サーバ
解析サーバ
SOAP
SOAP
リク
エ
ス
ト
リク
エ
ス
ト
レス
ポ
ンス
レス
ポ
ンス
EIDOS
EIDOS
の機能
の機能
l
l
Web
Web
サービス連携
サービス連携
Ø
Ø
タグ形式の簡易サービス定義
タグ形式の簡易サービス定義
(UDS)
(
UDS)
Ø
Ø
複数サービス実行の自動スケジューリング
複数サービス実行の自動スケジューリング
Ø
Ø
大容量データ交換
大容量データ交換
(
(
ストリーム通信
ストリーム通信
)
)
Ø
Ø
ロングジョブ対応
ロングジョブ対応
(
(
バックグラウンド化
バックグラウンド化
)
)
l
l
ブラウザビュー統合
ブラウザビュー統合
Ø
Ø
複数サービスの結果をブラウザ上に統合
複数サービスの結果をブラウザ上に統合
l
l
各種バイオデータ
各種バイオデータ
&
&
プログラム向けインターフェイス
プログラム向けインターフェイス
Ø
Ø
代表的なバイオ
代表的なバイオ
DB
DB
、
、
プログラム向け
プログラム向け
I/F
I/F
によりシステム構築作業を軽減
によりシステム構築作業を軽減
l
l
研究開発支援サービス
研究開発支援サービス
Ø
Ø
ユーザ様のバイオインフォマティクスシステム構築を支援
ユーザ様のバイオインフォマティクスシステム構築を支援
バイオインフォマティックスに必要とされる各種プロセス
バイオインフォマティックスに必要とされる各種プロセス
(
(
データハンドリン
データハンドリン
グ、解析処理、表示処理
グ、解析処理、表示処理
)
)
を簡単な
を簡単な
UI
UI
で実現。
で実現。
研究者のコンピュータ利用の負担を大幅に削減し、効率的か
研究者のコンピュータ利用の負担を大幅に削減し、効率的か
つ高度なデータ処理を実現。
つ高度なデータ処理を実現。
EIDOS
EIDOS
の各種インターフェイスとサービス
の各種インターフェイスとサービス
l
l
ゲノム
ゲノム
DB
DB
インタフェース
インタフェース
GenBank
GenBank, DDBJ, EMBL
, DDBJ, EMBL
l
l
蛋白質
蛋白質
DB
DB
インタフェース
インタフェース
PDB, PIR, SWISS
PDB, PIR, SWISS-
-PROT
PROT
l
l
バイオ関連プログラムインタフェース
バイオ関連プログラムインタフェース
ホモロジーサーチ
ホモロジーサーチ
:
:
BLAST, FASTA
BLAST, FASTA
マルチプルアライメント
マルチプルアライメント
:
:
ClustalW
ClustalW
l
l
DB
DB
インタフェース
インタフェース
Oracle
Oracle
: RDBMS
: RDBMS
BizSearch
BizSearch
:
:
超高速
超高速
XML
XML
検索
検索
瞬索
瞬索
:
:
テキスト検索
テキスト検索
l
l
標準プログラムインタフェース
標準プログラムインタフェース
SOAP, Bean, XSLT,
SOAP, Bean, XSLT, JavaMail
JavaMail
l
l
研究開発支援サービス
研究開発支援サービス
Ø
Ø
EIDOS
EIDOS
導入支援
導入支援
Ø
Ø
EIDOS
EIDOS
を利用したユーザ様システム構築支援
を利用したユーザ様システム構築支援
on site
on site
HPC
HPC
センター
センター
EIDOS
EIDOS
の適用例
の適用例
蛋白質群のモチーフ発見
蛋白質群のモチーフ発見
SODHO
SODHO
PAT.
国立遺伝学研究所,富士通㈱
PC
PC
クラスタによる
クラスタによる
ホモロジークラスタリング
ホモロジークラスタリング
公共サイト
公共サイト
タンパク
タンパク
DB
DB
文献検索
文献検索
PC
PC
上での
上での
モチーフ探索
モチーフ探索
WEB server
WEB server
with
with
EIDOS
EIDOS
browser on
browser on
notebook PC
notebook PC
browser on
browser on
desktop PC
desktop PC
3
3
2
2
4
4
1
1
Protein
Protein
Motif
Motif
大規模サーバによる
大規模サーバによる
マルチプルアライメント
マルチプルアライメント
Post Genome Platform
Post Genome Platform
の
の
共通ライブラリ
共通ライブラリ
次期
次期
HPC
HPC
サーバ
サーバ
MOPAC
MOPAC
MASPHYC
MASPHYC
ハードウエアプラットフォームに最適された解析ソフトウエア
ハードウエアプラットフォームに最適された解析ソフトウエア
大規模データ処理を実現する検索システム
大規模データ処理を実現する検索システム
•
•
次期
次期
HPC
HPC
サーバに高速化・並列化
サーバに
高速化・並列化
された
された
解析ソフトウエアを提供
解析ソフトウエアを提供
Ø
Ø
半経験的分子軌道法アプリ
半経験的分子軌道法アプリ
MOPAC2002によ
MOPAC2002
によ
るタンパク解析
るタンパク解析
Ø
Ø
分子動力学法アプリ
分子動力学法アプリ
MASPHYCによるタンパ
MASPHYC
によるタンパ
ク解析
ク解析
•
•
PC
PC
クラスタに高速化・並列化されたソフト
クラスタに高速化・並列化されたソフト
ウエアを提供
ウエアを提供
Ø
Ø
BLAST
BLAST
大規模
大規模
PC
PC
クラスタ
クラスタ
並列版
並列版
BLAST
BLAST
による
による
遺伝子解析
遺伝子解析
•
•
超高速テキスト検索エンジン
超高速テキスト検索エンジン
&
&
XML
XML
検索エンジン
検索エンジン
Ø
Ø
BizSearch
BizSearch
(
(
富士通研究所が開発、アクセラテクノロジ
富士通研究所が開発、アクセラテクノロジ
(
(
株
株
)
)
が製品化した世
が製品化した世
界最高速レベルのテキスト検索エンジン
界最高速レベルのテキスト検索エンジン
+XML
+
XML
検索エンジン
検索エンジン
)
)
文章検索性能
文章検索性能
0.0
0.0
0.5
0.5
1.0
1.0
1.5
1.5
2.0
2.0
0
0
100
100
200
200
300
300
400
400
500
500
文書量(MB)
文書量(MB)
検索時間
(秒
)
検索時間
(秒
)
世界トップクラスの超高速検索
世界トップクラスの超高速検索
l
l
同時に多数の利用者にサービスできる超高性能設計
同時に多数の利用者にサービスできる超高性能設計
l
l
公開サイト、イントラネットなどのネットサービス仕様
公開サイト、イントラネットなどのネットサービス仕様
A A社検索エンジン社検索エンジン eAccela BizSearch eAccela BizSearchBizSearch
BizSearch
による
による
XML
XML
ドキュメント検索の実現
ドキュメント検索の実現
l
l
XMLの強みを活かした多彩な検索機能
XML
の強みを活かした多彩な検索機能
Ø
Ø
全文検索
全文検索
Ø
Ø
タグ毎の検索
タグ毎の検索
Ø
Ø
タグによる制約条件の設定
タグによる制約条件の設定
l
l
XMLドキュメントを
XML
ドキュメントを
BizSearchレポジトリに格納するため、
BizSearch
レポジトリに格納するため、
XML
XML
専用のデータベースは不要
専用のデータベースは不要
l
l
XML
XML
-
-
DBや
DB
や
XMLマニュアルなどの高速検索が可能。
XML
マニュアルなどの高速検索が可能。バイオ分野で
バイオ分野で
利用が拡大する
利用が拡大する
XML
XML
に最適な検索エンジン
に最適な検索エンジン
。
。
<?<?xmlxmlversion="1.0" encoding="UTFversion="1.0" encoding="UTF--8"?>8"?> <! <!----これはコメントですこれはコメントです---->> < <root>root> <data id="id1"> <data id="id1"> <! <!----これはこれはdata1data1ですです---->> <
<aaaaaa>>38243824</</aaaaaa>> <
<bbbbbb>>これはこれは<<keyword>&keyword>"quot;;キーワードキーワード&"quot;</keyword>;</keyword>です。です。</</bbbbbb>>
< <xxx attrxxx attr="="属性属性1">1">データデータX1</X1</xxxxxx>> < <xxx attrxxx attr="="属性属性2">2">データデータX2</X2</xxxxxx>> < <xxx attrxxx attr="="属性属性3">3">データデータX3</X3</xxxxxx>> </data> </data> <data id="id2"> <data id="id2"> <! <!----これはこれはdata2data2ですです---->>
全文フィールド
aaaフィールド
BizSearchレポジトリ
idタグフィールド
数字
text
text
Post Genome
Platform
SAN
SAN
ディスクアレイ装置
PRIMEPOWER
PRIMEPOWER
バックアップ
バックアップ
装置
装置
PRIMERGY
PRIMERGY
クラスタ
クラスタ
次期
次期
HPC
HPC
サーバ
サーバ
Post Genome Platform
Post Genome Platform
による
による
バイオ
バイオ
HPC
HPC
センターの実現
センターの実現
自動バックアップ
自動バックアップ
MEDLINE
MEDLINE
PDB
PDB
DDBJ
DDBJ
公開
公開
DBサイト
DB
サイト
インターネット
インターネット
DB
DB
自動
自動
収集
収集
•
•
システムの特長
システムの特長
–
–
複数
複数
DB
DB
への容易なアクセス,データ解析プロセスの自動化
への容易なアクセス,データ解析プロセスの自動化
–
–
大規模タンパク質解析計算の超高速処理
大規模タンパク質解析計算の超高速処理
(
(最適化・並列化されたアプリ
最適化・並列化されたアプリ+
+大規模サーバ
大規模サーバ
)
)
–
–
遺伝子機能解析の高スループット処理
遺伝子機能解析の高スループット処理
(
(
PCクラスタ
PC
クラスタ
)
)
–
–
大容量データの高速処理
大容量データの高速処理
(
(
高速・高信頼ファイルシステム
高速・高信頼ファイルシステム
)
)
EIDOS
統合
統合
DB
DB
市販
市販
DB
DB
解析
解析
DB
DB
自社
自社
DB
DB
公共
公共
DB
DB
BLAST
BLAST
:
:
MOPAC
MOPAC
MASPHYC
MASPHYC
:
:
Contents
Contents
l
l
富士通のバイオインフォマティクの取り組み
富士通のバイオインフォマティクの取り組み
Ø
Ø
歴史・体制
歴史・体制
Ø
Ø
バイオインフォマティク向けソリューション体系
バイオインフォマティク向けソリューション体系
l
l
代表的なソリューションのご紹介
代表的なソリューションのご紹介
Ø
Ø
Post Genome Platform
Post Genome Platform
Ø
Ø
アプリケーション
アプリケーション
PKG
PKG
u
Biofrontier と
Chemlib
u
u
MOPAC2002
MOPAC2002
の適用例とチューニング事例
の適用例とチューニング事例
l
l
まとめ
まとめ
MOLECULAR DYNAMICS
MOLECULAR DYNAMICS
‘
‘
83
83
’
’
84
84
‘
‘
85
85
’
’
86
86
‘
‘
87
87
’
’
94
94
‘
‘
95
95
’
’
96
96
‘
‘
97
97
’
’
98
98
‘
‘
99
99
’
’
00
00
’
’
01
01
’
’
02
02
MACCS/MACCS MACCS/MACCS--IIII ISIS ISISREACCS
REACCS
ChemDraw
ChemDraw
/ ChemOffice
/
ChemOffice
RS
RS
33discovery
discovery
WinMOPAC WinMOPAC MOPAC93 MOPAC93 MASPHYCMASPHYC
MASPHYC
MASPHYC
WinMASPHYC
WinMASPHYC
for VP for VP for Sun WS for Sun WS ANCHOR ANCHOR ANCHOR ANCHOR--IIIIfor Mainframe for SGI WS
for Mainframe for SGI WS
MOPAC2000 MOPAC2000
CAChe
CAChe
ChemLib
ChemLib
Main Frame computer
WS software Client/Server Soft
Web computing
for Mainframe f or SGI WS
for Mainframe f or SGI WS
ADAPT ADAPT
ADAPT ADAPT
for WS
for WS
Emil
Emil
KAMELOKAMELO for WSfor WS
Tsar Tsar TOPKAT TOPKAT