LSKB Version 4.3.0 リリースノート
このリリースノートには、「LSKB -Life Science Knowledge Bank」の新機能、問題点の修正などが記 載されています。
[新機能]
1. トップ画面の"Gene & Proteins"に以下のメニューの追加あるいは改良 Browser (Metabolizing) EC Classification GPCR SARfari KINASE SARfari これらの項目を追加することで、代謝酵素、その他の酵素の分類や酵素からの化合物探索と同様に GPCR や KINASE からの探索が可能になる。 各カテゴリは検索ができる他、階層構造状の管理を⾏っているので⼤分類や中分類からのターゲット 選択が容易。
2. Browser (Metabolizing) – DrugBank 由来の代謝酵素ブラウザ
Ligases の⼤分類クラス下に階層構造として表⽰、検索機能を持つ。公共データベースサイトへのリンク と構成タンパク質の LSKB 内リンクにより、当該タンパク質をターゲットとする化合物をさまざまな角 度から⾒ることができるほか、タンパク質を構成するドメインや PDB 複合体リガンド、文献を参照でき る。⼤分類項目は後述の Enzyme データベースと同様だが、DrugBank 由来の代謝酵素に絞ってあると ころが異なる。 公共データベースへのリンクアウトは以下のとおり。 IntEnz: http://www.ebi.ac.uk/intenz/ BRENDA: http://www.brenda-enzymes.info/ EC2PDB: http://www.ebi.ac.uk/ (EC->PDB) ExPASy: http://enzyme.expasy.org/ MEDLINE: http://www.ncbi.nlm.nih.gov/ KEGG: http://www.genome.jp/ PROSITE: http://prosite.expasy.org/ UNIPROT: http://www.uniprot.org/ 階層表⽰の例、下部には IntEnz でカテゴリを指定 できない Unclassified Enzyme を表⽰ 検索ではヒットした階層をすべて表⽰
3. EC Classification – IntEnz 由来の酵素ブラウザ
EBI IntEnz(Enzyme) よ り 収 集し た 約 6000 の酵 素 デ ータ を Oxidoreductases, Transferases, Hydrolases, Lyases, Isomerases, Ligases の⼤分類クラス下に階層構造として表⽰、検索機能を持つ。 公共データベースサイトへのリンクと構成タンパク質の LSKB リンクにより、当該タンパク質をターゲ ットとする化合物をさまざまな角度から⾒ることができるほか、タンパク質を構成するドメインや PDB 複合体リガンド、文献を参照できる。 公共データベースへのリンクアウトは以下のとおり。 IntEnz: http://www.ebi.ac.uk/intenz/ BRENDA: http://www.brenda-enzymes.info/ EC2PDB: http://www.ebi.ac.uk/ (EC->PDB) ExPASy: http://enzyme.expasy.org/ MEDLINE: http://www.ncbi.nlm.nih.gov/ KEGG: http://www.genome.jp/ PROSITE: http://prosite.expasy.org/ UNIPROT: http://www.uniprot.org/ 階層表⽰の例 検索ではヒットした階層をすべて表⽰
酵素のアノテーション表⽰。さまざまな外部リン クのほか、LSKB 内部リンクで選択されたターゲ ットの詳細情報を参照できる
4. GPCR SARfari – ChEMBL 由来の GPCR ブラウザ
EBI ChEMBL GPCR SARfari より収集した約 900 の GPCR(7TM1)を EBI の分類に従い、Opsin, Orphan, Peptide, SmallMol に分類し階層構造として表⽰、検索機能を持つ。これらのタンパク質に 対する BioActivity は約 1,000,000 搭載。公共データベースサイトへのリンクと構成タンパク質の LSKB リンクにより、当該タンパク質をターゲットとする化合物をさまざまな角度から⾒ることがで きるほか、タンパク質を構成するドメインや PDB 複合体リガンド、文献を参照できる。 GPCR の分類と階層表⽰ 検索ではヒットした階層をすべて表⽰ 階層下の GPCR サマリー。化合物とのアッセイ情 報などを一覧できる。 各 GPCR のアノテーション。タンパク質の LSKB 内部リンクや OMIM などの外部リンクの他、アッ セイの詳細を展開できる。
5. KINASE SARfari – ChEMBL 由来の KINASE ブラウザ
EBI ChEMBL KINASE SARfari より収集した約 1,000 の KINASE を EBI の分類に従い、AGC, CAMK, CK1, CMGC, RGC, STE, TK, TKL, その他に分類し、階層構造として表⽰、検索機能を持つ。これ らのタンパク質に対する BioActivity は約 503,000 搭載。公共データベースサイトへのリンクと構成 タンパク質の LSKB リンクにより、当該タンパク質をターゲットとする化合物をさまざまな角度から ⾒ることができるほか、タンパク質を構成するドメインや PDB 複合体リガンド、文献を参照できる。 KINASE の分類と階層表⽰ 検索ではヒットした階層をすべて表⽰ 階層下の KINASE サマリー。化合物とのアッセイ 情報などを一覧できる。 各 KINASE のアノテーション。タンパク質の LSKB 内部リンクや OMIM などの外部リンクの他、アッ セイの詳細を展開できる。
6. EBI Interpro データベース – タンパク質ドメインデータベースの搭載
同ドメインのデータベースを搭載。従来の Pfam と同時に利⽤することで、網羅性を上げることが目 的。情報量の少ないタンパク質をターゲットとする化合物を探しやすくなった。
また、Pipeline Pilot の利⽤で、距離情報を利⽤して PDB ligand とドメインの結合情報を取得するこ とができる。
7. 化合物辞書に特許情報のアノテーションを追加、構造検索対象にした
LSKB 搭載の 6000 万の化合物構造とそれらにひもづくアノテーションに特許情報を加えた。 特許情報は、SureChem, IBM, SCRIPDB をデータソースとして、整形後、特許関連化合物として約 11,524,000 エントリーに特許アノテーションを追加した。
8. インハウス実験データ管理のデータタイプに Gene Group を追加
インハウス実験データ管理で、Gene Group が管理できるようにした。本機能により、パスウエイに 含まれる遺伝⼦の管理や、qPCR ⽤の遺伝⼦セットなど複数の遺伝⼦をグループ化して管理できるよ うになり、遺伝⼦のバッチ検索や、化合物や疾患との関連性検索に直接利⽤できるようになった。 Gene Group で Entrez Gene ID を含む複数の遺
伝⼦とそのアノテーションを管理
管 理 し た デ ー タ は Batch Search と Gene Group Analysis で GO や BioAssay の検索を代 表とするアノテーションの取得や文献マイニン グをベースとした関連化合物、疾患などの情報 を取得できる。
9. インハウス実験データ管理で実験に紐づくサンプル ID を管理できるようにした 各実験データのアノテーションでひとつの実験に対し、複数のサンプル ID を管理する機能を加えた。 本機能によって、各データへサンプル ID を連携できるようになったほか、サンプル ID からすべて の実験結果を検索可能になった。 ひとつの実験に対し、複数のサンプル ID を関連 付けることができる。(マイクロアレイの比較試 験など、複数由来のサンプルを⽤いるときに利 ⽤) 同じサンプルを利⽤した他のデータタイプの実験 データも検索、表⽰できる。
10. 検索結果 Table の表⽰方式に Query モードを追加 構造検索結果リストから分⼦を選択して直接次の検索を実⾏できるように改良した。 構造検索結果の化合物から、化合物を選択(複 数可能)して”QUERY”をクリックすると、次の クエリーが準備される。 構造検索条件設定後、構造検索を実⾏
11. 化合物構造検索画面で SD ファイルの Drag & Drop に対応 ブラウザ上に SD ファイルを Drag&Drop できるように機能を拡張した。このテーブル表⽰を Query モードにすることで、SD ファイル中の複数化合物を利⽤して構造検索ができる。 複数エントリーを含む、SD ファイルの Drag&Drop に対応。 SD ファイルの内容が一覧表⽰される。さらに、 QUERY ボタンをクリックすることで直接構造検索 が可能。
12. 構造検索対象に Molecular Framework を追加
前バージョンでは Molecular Framework に対しての検索ができなかったため、これに対応する機能 を追加した。
ス ケ ッチ ャー に Framework を描 き、 ”Seek exactly same framework”を選択する
指定した Framework 一覧と同一もしくは関連す る framework を一覧表⽰
[変更] 1. DrugBank 4.0 へのバージョンアップに伴うインポートファイルの URL 変更 2014 年3⽉に DrugBank のデータベースが version 3.0 から 4.0 へバージョンアップされた。LSKB では、DrugBank よりダウンロードしたデータファイルをデータベースにインポートすることにより、 化合物情報に DrugBank の情報が付加されるが、バージョンアップに伴い、書式や内容も変更されたた め正常にインポートできなくなっている。DrugBank のウェブサイトでは、3.0 ウェブページおよびデー タファイルも、別の URL を割り当てることによって、継続して利⽤できるようになっている。LSKB へ のデータインポートには 3.0 のサイトよりデータファイルを取得する必要がある。 従来のダウンロードページ URL (version 4.0 のダウンロードページ) http://www.drugbank.ca/downloads
version 3.0 のダウンロードページ URL http://v3.drugbank.ca/downloads
admin ユーザーによる DrugBank データインポート機能へのリンクにも、version 3.0 ダウンロード ページへのリンク(http://v3.drugbank.ca/downloads)を併設した。
以上