Summary for INSDC Advisory 2009
2009年7月1日(水)20:00
場所:国立情報学研究所 Room 1213(大学院講義室2 内線:2607)
DDBJ Advisors
Haruki Nakamura, Institute for Protein Research, Osaka University (欠席) Sumio Sugano, Institute of Medical Science, The University of Tokyo
Satoru Miyano, Institute of Medical Science, The University of Tokyo EMBL Advisors
Antoine Danchin, CNRS, Institut Pasteur, Paris
Babis Savakis, University of Crete and IMBB-FORTH, Heraklion Jean Weissenbach, Genoscope, Evry
GenBank Advisors
Zhiping Weng, Boston University, US
Steven Salzberg, University of Maryland, US
Agenda
1.Summary of INSDC and SRA collaborative meetings (NIHで開催)報告 5月12-13日 INSDC 実務者会議
5月14-15日 Trace/Short Read Archive 会議
実務者会議とRead Archive会議の報告を諮問委員に対して行った(以下トピックス)
Follow-up items
• Structured vouchers ‒ Collections Database
Instituteの表記揺れなどの問題を回避するため、institute codesをNCBIが公開する。 • Transcriptome Shotgun Assemblies
TSAの品質をコントロールする詳細について議論。ambiguous bases が5%以上の場合に は警告。
• Project data exchange
project dataをflat-fileの形で三極で交換する議論。XMLのフォーマットを検討する。 • Change qualifier /pseudo to /non_functional
pseudo と名付けられている遺伝子がかならずしもpseudogeneではない。 /non_functional を導入する。
• Initiated discussion about which qualifiers can have single or multiple values
qualifierのなかに本来single valueしか持てないものが定義上あるが、運用面でゆらいで きている。再検討する。
Annotation of Genomic Sequences
iBOL - Barcode of Life配列の受け入れ
Strain level taxonomy nodes
微生物ゲノムの配列が完成した場合、独立のtaxonomy idをつけていたが、廃止したい。
WGS Master records
Whole Genome Shotgunデータに新たなreferenceが加わった場合、これまで数十万配列 単位で全データを交換していた。master recordを作りこれを回避する方針とする。
Blurring the distinction between traditional sequence database and sequence read archives
ESTやCAGEのデータをおさめるdivisionは、新型シーケンサ由来データと区別できなく なってきている。legacyなEST divisionは今後不要になる可能性がある。
2. Treatment of synthetic sequences in patent entries
3. Sequence Read Archives part of INSDC
新型シーケンサからのリードアーカイブは三極の国際協力の枠組みの中で行う。SRA meeting では主に技術的な内容が議論された。
4. Support for minimum/maximum measurement of quality for new sequencing technologies.
5. Role of mandatory submission for SRA and project - requirement from journals