添付資料5
DDBJ運用システムの動向
<データサービスシステムチーム>
1.登録システムSAKURA(DDBJ DNA Data Submission System)の改善 ・ 各種入力インタフェースの更新や改良
db_xref にJGIDBを追加、countryにNorth Seaを追加 Genetic Code Indexの修正
生物情報画面のhostとlab_hostの説明文を追加
CDS とその他 feature の各入力画面から db_xref の項目自体を削除 生物情報ページにおけるデータベース選択肢を大幅削除
REFERENCE画面のJOURNALの年数を1900-2100に変更 生物情報ページのcollection_dateの仕様変更
2.データベースシステムの機能拡張と修正
1)レビューシステムTSUNAMIの機能拡張と修正
・ 2009年国際実務者会議決定事項への対応(Feature/Qualifierの仕様変更等) 2)Structured Comment登録への対応
・ GenBankで先行運用されていた新しい登録形式であるStructured Commentに 対応した
3)genbank common nameの表示に対応
・ フ ラ ッ ト フ ァ イ ル の SOURCE行 で 表 示 す る 生 物 種 名 にgenbank common nameを追加した
4)DDBJリリースデータをDB格納データから再作成
・ DDBJリリース80において、全公開データをDB格納データから再作成し、リフ レッシュした
5)作業中フラグの導入
・ データベースに格納されているデータに作業中フラグを導入し、アノテータの公 開忘れによってフラットファイルの不整合が発生することを防止
3.DDBJ/EMBL/Genbank協調対応 1) DBLINK行対応
PROJECT行からDBLINK行への変更により、他極からの取込処理の変更、DDBJ 定期リリース(リリース79)のレトロフィット対応を実施
2) GenBankからTPA:reassembly WGS project
3) 曖昧塩基/アミノ酸の基準変更
GenbankおよびEMBLの曖昧塩基/アミノ酸の定義がDDBJと異なっていた為、 他極と定義を統一
4.データ公開
1)DDBJリリースの作成と公開 以下のリリースを作成公開した。 Rel.77 2009/03
Rel.78 2009/06 Rel.79 2009/09 Rel.80 2009/12
2)DADリリースの作成と公開 以下のリリースを作成公開した。 Rel.47 2009/04
Rel.48 2009/07 Rel.49 2009/10 3)PRFリリースの公開
以下のリリースを公開した。 Rel.126 2009/04
Rel.127 2009/06 Rel.128 2009/08 4)UniProtリリースの公開
以下のリリースを作成公開した。 Rel.14.7-14.9 2009/01-2009/03 Rel.15.0-15.11 2009/04-2009/12
5.利用システム
1)各サービスデザインの統一
・ デザイン統一共通化コンポーネントについての仕様検討 2) getentry関連
・ 各種データ/プログラムの是正・品質向上 3)DDBJ定期リリース
・ リリース80にて、DDBJ由来のデータをTSUNAMIからデータ抽出し、公開 ・ SOURCE行を、organelle genus species (Genbank common name)の
記載に統一 4)H-InvDB関連
・ KIPOフラットファイルフォーマットについて、明確に規定されていなかった 為、
規定する為の調整をJPOと実施 ・ 生物情報の表記改善
6)DDBJ HP
・ デイリーデータのRSS配信を開始(2009/9/15~) 7)その他データ公開
・ DDBJ由来のアノテーションContigデータの公開 ・ Genbankリプレースリスト導入の検討
8)サービスの評価と廃止
WEBアクセスログ等の各種ログについて集計作業を実施した。集計結果を評価 した結果、以下のサービスについてサービスを終了した。
・ H-InvDBミラーサーバ(2009/12/31)
・ H-InvDB フラットファイルサーバ(2009/12/31)
※BIRC 版 フ ラ ッ ト フ ァ イ ル は DDBJ Anonymous-FTP に て 公 開 (2010/1/4~)
また、以下のサービスについてサービスの終了を予定している。 ・ 相同性検索サービスの各サービスの廃止(2010年3月末)
fasta, ssearch, psi-blast, hmmpfamのサービス廃止 ・ DDBJ-XMLの廃止
廃止対象となるサービスはgetentry, DDBJ定期リリース 廃止時期は、サービスの影響を見て、すみやかに廃止
<システム管理チーム>
1. タスク
DDBJスーパーコンピュータシステムの管理、及び遺伝研ネットワークシステムの管理 2.業務内容
定常業務
各種申請に対する作業
稼動状況の監視
DDBJスーパーコンピュータシステムの稼動状況の監視、及び遺伝研ネットワー クシステムの通信状態の監視
ユーザー支援
メーリングリストの新規作成、所内ユーザーからの技術的な質問に対する受付/回
答、等 情報局支援
情報局と連携し、新たに所内へ来られた方のlab用メールサーバへのアカウント 登録、及びall-nigメーリングリストへの登録、メール利用登録
セキュリティ管理
セキュリティに関する情報の定期的な入手、必要に応じた問題への対処 定期保守
PRIMEPOWER2500サ ー バ 、 大容 量バ ッ ク ア ッ プ装置 、IPCOM2400装置 、
PRIMERGYサーバの定期的な保守、システムバックアップ、自家用電気工作物の
定期点検に伴う所内停電への対応(11月頃)
講習会開催
所内ネットワーク利用講習会(毎年4月~6月頃) IPアドレス棚卸
所内へ割り振っているIPアドレスの棚卸を実施(5月末頃)
所外公開サービス申請棚卸
所外公開サービスを行っているサーバ申請の棚卸を実施(3月末頃)
スパムメール対応
スパムメール統計情報作成、傾向分析、対策の検討 障害対応
DDBJスーパーコンピュータシステム障害対応 ハード障害、システム障害への迅速な対処
遺伝研ネットワークシステム障害対応
ハード障害、通信障害への迅速な対処 新規要望への対応
新規サービス構築
新規サービスの導入提案/導入テスト/構築、新規タスクの導入提案、他部門からの 要望への対応等
ネットワーク環境構築
新規ネットワーク環境の構築提案、構築 システム改善
DDBJスーパーコンピュータシステム及び遺伝研ネットワークシステムの稼動状 況監視強化のためのツール開発及び改善
その他
統計情報作成
DDBJスーパーコンピュータシステムの統計情報作成 3.主な作業実績(2009/1~2009/12)
トラブル対応
ハードウェア障害、システム及びネットワーク障害等の対処 インシデント対応件数:325件
(CPU、メモリ、ディスク等のインフラ関連障害、OS、各種サービス(メール、
NIS/DNS、ウィルス感染、ウェブメール等)のトラブル等 ) Q/A対応
所内ユーザーからの技術的な質問に対する受付/回答、等 インシデント対応件数:26件
Request対応
所内ユーザーからの要望受付/回答、対処等 インシデント対応件数:100件
定常業務
定常業務に関する作業
(特別申請、監視ツールメンテナンス、業務効率化、新規ツール作成、ホームページ 更新作業、新サービス公開作業、等)
インシデント件数:47件 各種申請件数:1023件
講習会開催
所内ネットワーク利用講習会(2009年5月実施)
4.その他
オープンシステムプロジェクトについて
次世代シーケンサの出現に伴う計算機需要の急激な高まりに対応するため、DDBJ で所有する解析サーバを所内外の研究者に利用いただくプロジェクトとして、オープ ンシステムプロジェクトを実施した。
概要
オープンシステムプロジェクトでは、研究者自身にDDBJで保有する大規模計
算機環境を提供し、様々なデータ解析、シミュレーションや、バイオ関連のプロ グラム開発、高速化に関する研究を実施いただく。
申請内容をDDBJで審査し、ふさわしい案件を採択後、申請者に利用可否の連絡 を行う。
採択された研究については、DDBJより申請者に対して利用期間等の情報を提
示後、利用いただく。 実施スケジュール
申請期間 2009年9月24日~2009年10月16日 審査期間 2009年10月19日~2009年10月23日 利用期間 2009年11月5日~2010年3月31日 対象研究および対象申込者について
オープンシステムプロジェクトの対象研究は「最大32ノード(256コア)」を
使用する大規模計算を大量に行う研究とした。
申込者は「国内の大学に所属する研究者,公共機関に所属する研究者」とした。
研究グループのメンバーは、DDBJ塩基配列データベース等利用規約に順ずる
有資格者,すなわち:
・ 国内の大学に所属する学生・研究者 ・ 公共機関に所属する研究者
・ 企業に所属する研究者,技術者 とした。
利用可能な計算機について
以下のスペックの計算機を最大32ノードを利用できるように環境を構築した。 CPU Xeon(4Core) 3.16GHz × 2
メモリ 16Gbyte ネットワーク 1000Base-T
内蔵ディスク 147Gbyte
OS RedHat Enterprise Linux 4.6 ES (EM64T)
HPC開発/実行環境 富士通Parallelnavi
採択された研究について
申請は全部で7件あったが、審査の結果7件全てを採択した。
ただし、そのうち1件については、他の研究のスケジュールの都合上、申請い ただいた利用期間を変更いただいた。
採択された研究一覧を以下に示す。
表 オープンシステムプロジェクトで採択された研究(順番は申込順)
(*1)
1 立命館大学
河合様
タンパク質の折り畳み過程進化 の解析
①8日間 / 32 ノード
2 国立遺伝学研究
所 小原様
次世代型シーケンサを用いたゲ ノム多型解析
①16日間 / 12 ノード
②33日間 / 8 ノード
3 大阪大学
安永様
次世代シーケンサーを用いた感 染症診断システムの開発
①6 日 間 / 32 ノード
4 長浜バイオ大学
阿部様
一括学習型自己組織化マップ法 を用いた環境由来DNA配列を 対象とした環境生物群集構造の 解明
①15 日 間 / 16 ノード
②15 日 間 / 16 ノード
③15 日 間 / 16 ノード
5 国立遺伝学研究
所 藤山様
次世代シークエンサーを用いた ゲノム解析
①33 日 間 / 8 ノード
6 前橋工科大学
坂田様
高速並列化計算によるゲノムワ イドなヒト転写制御ネットワー ク推定
①15 日 間 / 32 ノード
7 明治大学
坂田様
環境やゲノムによって異なる発 現パターンを示す遺伝子群の探 索とそれら遺伝子群の機能解析
①12 日 間 / 32 ノード
② 8 日 間 / 32 ノード
③ 5 日 間 / 32 ノード
(*1) 複数期間の利用がある申請については、利用日数を複数記載している。
今後について
次年度以降も同様にオープンシステムプロジェクトを継続予定である。
ネットワークシステム増強について
概要
今年度、遺伝研の基幹ネットワーク機器のうち、特に老朽化している以下の ネットワーク機器の更新を行い、安定稼動を確保する。
・インターネットルータ(レイヤ3スイッチ) 1式 ・建物スイッチ(レイヤ3スイッチ) 2式 ・ファイアウォール 1式
スケジュール
入札説明会 2009年10月21日 書類提出締切 2009年12月5日 開札 2009年12月25日 納入日 2010年3月31日
スパムメール対策について
遺伝研メールシステムのスパムメール対策として、スパムメールの検出率を向上さ せるために、外部データベースによるスパムメールチェックを取り入れた。
概要
遺伝研メールシステムのスパムメール対策として、利用者に送信されるスパム メールをさらに軽減するため、外部データベースを用いたスパムメール対策を 2009年8月4日より実施した。
状況
2009年1月~7月のスパムメール検出率(受信したメールのうち、スパムとし て検出したメールの割合)は、約30~40%であったが、スパムメール対策に外部 データベースを採用した2009年8月以降は約60%となっており、効果を得られ たため継続して実施する。
セキュリティ監査について
インターネットを利用するシステムに関して、外部からの不正侵入やWebページ の改ざん等のセキュリティインシデントを防止するために、一部のサーバについてセ キュリティ監査を実施した。
概要
スパコン機器において、新規にインターネットに接続する計算機をシステム管 理チームで構築する際に、利用される方に引き渡す前にセキュリティのチェック を実施した。
・ポートのオープンチェック。
・Webアプリケーションのセキュリティチェック。(クロスサイトスクリプ ティング等)
状況
2009年10月より、現時点で合計5台のLinuxサーバのセキュリティ監査を 実施した。