• 検索結果がありません。

SAX上のlazy XML tree の構成によるXSLTの最適化

N/A
N/A
Protected

Academic year: 2021

シェア "SAX上のlazy XML tree の構成によるXSLTの最適化"

Copied!
1
0
0

読み込み中.... (全文を見る)

全文

(1)Vol. 46. No. SIG 11(PRO 26). Aug. 2005. 情報処理学会論文誌:プログラミング. 発表概要. SAX 上の lazy XML tree の構成による XSLT の最適化 真. 中. 賢. 二†. 佐. 藤. 周. 行†,††. XSLT は XML を HTML,あるいは別のデータ構造を持つ XML に変換するトランスフォーマー であり,現在広く使われている.しかし,現在の XSLT ではそのための十分なパフォーマンスを持っ ていない.XSLT はデータベース上の莫大なデータを取り扱う際,オーバヘッドや処理時間の長さが 問題になっている.今回の発表では,lazy XML parsing による XSLT の最適化の方法を提案する. Lazy XML parsing は,実際に参照されると判断した時点で初めて node を構成する手法である.提 案する手法の特徴は interface に SAX を使用できる点にある.大規模なデータの処理を得意とする SAX を interface に使うことにより,大規模なデータに対して有利に処理ができるようになる.多く の場合,XSLT による変換に,XML で与えられたすべての node を必要とするわけではない.特に データベースなど大規模なデータに対しては,数パーセントの node しか参照されない場合が多い. それゆえ,lazy XML parsing はオーバヘッドを抑えるためと,処理時間を早くするために有効的な 手段となる.また,この最適化の手法を代表的な XSLT である saxon に実装することにより,性能 評価をした.. Optimization of XSLT Based on lazy XML Parsing Using SAX Kenji Manaka† and Hiroyuki Sato†,†† XSLT is a widely used tool for transforming an XML document into other forms including HTML, XML, PDF, etc. Unfortunately there are pointed out still many performance problems in XSLT when working with large datasets. In this presentation we propose our optimization technique based on lazy XML parsing. Lazy XML parsing is technique with which nodes are constructed just when they are proved to be really accessed. Our lazy XML parser is built on SAX, which means that we must determine on-line which nodes are needed. This adds a complexity, compared with conventional lazy XML processor on DOM. Using SAX improves XSLT performance when processing large documents. Because many transformations do not require full access to XML, in particular, accesses in large database are sparse, a lazy XML parsing decreases overhead and improves performance. Furthermore, we show our implementation and evaluation.. (平成 17 年 1 月 20 日発表). † 東京大学新領域創成科学研究科基盤情報学専攻 Department of Frontier Informatics, The University of Tokyo †† 東京大学情報基盤センター Information Technology Center, The University of Tokyo. 69.

(2)

参照

関連したドキュメント

 この地球上で最も速く走る人たちは、陸上競技の 100m の選手だと いっても間違いはないでしょう。その中でも、現在の世界記録である 9

節の構造を取ると主張している。 ( 14b )は T-ing 構文、 ( 14e )は TP 構文である が、 T-en 構文の例はあがっていない。 ( 14a

「文字詞」の定義というわけにはゆかないとこ ろがあるわけである。いま,仮りに上記の如く

本章では,現在の中国における障害のある人び

うのも、それは現物を直接に示すことによってしか説明できないタイプの概念である上に、その現物というのが、

ƒ ƒ (2) (2) 内在的性質< 内在的性質< KCN KCN である>は、他の である>は、他の

テキストマイニング は,大量の構 造化されていないテキスト情報を様々な観点から

テューリングは、数学者が紙と鉛筆を用いて計算を行う過程を極限まで抽象化することに よりテューリング機械の定義に到達した。