• 検索結果がありません。

サーバ運用上の問題点

ドキュメント内 センターレポート 第14号 (ページ 92-95)

( OHP 9 )  その大学には迷惑をかけないと表明しました

4  サーバ運用上の問題点

結果コードには次のような意味がある.

内容

200 

3 0 2   R e d i r e c

.t

e d  R e q u e s t s   400  Bad R e q u e s t s  

4 0 1   U n a u t h o r i z e d  R e q u e s t s   403 

アクセス権により拒否

404 

要求されたデータ無し

500 

サーノ

f

側の異常

5 0 1  

要求自体(内容)の異常

貯蔵したログは活用するべきであるが,サーバソフトウエアには保存したログの分析 機能が無い.そこで,分析のためのツールを用いることになる.センターのサーバ運用に おいては,幸いなことに電子ニュースに投稿されていた,

p e r l

で書かれた

2

14のツール

WebReport

wwwstat

15を用いることで統計資料を作成することが容易に可能となった.

3 .

1.

データ提供機能の追加部分について

3 .

1.

1

の項で述べた追加機能は,

c g i

というプログラム機能を用いることで提供可能となる.

c g i

CommonGateway I n t e r f a c e

の略である.実体は

C

言語で書かれたプログラムで あったり,

UNIX

のシェルや

p e r l

などの言語を用いて作成できる実行可能なコマンド,ま たはコマンド群である.そのいくつかは

CERN

NCSA

W W W

サーバから入手可能で ある.もちろん自作も可能である.

ただし,同じ

c g i

であってもサーバの種類が異なると動作しないものもあるので,十分 な注意が必要である.

もし

c g i

を自作する場合は,その実行権と

C g l

を置くディレクトリについて注意しなけれ ばならない.間違った場合は,

c g i

の内容が正しくても実行できない.

そこで,サーバ自体の公開範囲とデータ毎の公開範囲について検討の上,サーバ自 体については登録するか否かを決定し,またデータ(ページ)単位ではデータを置く ディレクトリを分けた上で個々のディレクトリについてアクセス権の設定を行わなく てはならない.

2 .

データディレクトリとデータ形態,内容

データのアクセス権との関係でデータディレクトリを分割する必要があることは上 に述べたが,それ以外にも次のような問題もある.

‑データをどのファイルシステムにあるディレクトリに置くか

・ユーザディレクトリに各ユーザが自分のデータを自由に置くことができるように するか

・データディレクトリ自体の(マシン上の)ユーザアクセス権の設定

これらについては,予め設計を行ってからデータ配置しないと,公開後のデータ再 編成は非常にむづかしい.

また,データ形態ではとくに画像ヌァイルに関してその形式によって同じ画像でも 占有データ量が異なるので注意が必要である.静止画像では

TIFF

形式が非常に大き なデータ量を要し,現状ではJPEG形式が最も小さくて済むようである.

さらにデータの内容の面では 既に述べた機密の問題以外に

・情報は正しいか

・不必要なデータを含んでいないか

・引用データ等が著作権を侵害していないか

・画像情報が著作権や肖像権を侵害していなし、か

・個人のプライパシー情報に関わっていないか

・公務員や公的機関が運営する場合特定の企業等を利する情報を含んでいないか

・情報が変化した場合に修正(メンテナンス)する要員を確保できているか 等の様々な問題が有る.

これらを考えた場合,安易な(特に個人的な)サーバ立ち上げは慎むべきかもしれ ない.

3 .

標準設定

ネットワーク上の問題として,ブラウザが指定するサーパの名前とポートの問題,そ して標準の入口ページ(

I

ホームページ

J

)の設定が必要となる.これらは概ね

3 .

1.

2

で 述べた

c o n f i g r a t i o n

ファイルで設定する.

まず,サーバを運用するマレンのホスト名を設定しなくてはならない.ホスト名は 固有の名前でもよいが,マシンが変更となる可能性も考えると固有の名前とは異なる

ものをつけた方がよいと考えられる.

9 0  

通常,サーバを起動するマシンがサブドメイン(例えば

x x x . y y . a c . j p

というサブドメ インを例にする)の中に

1

台しかない場合は,

www.xxx.yy.ac.JP 

と言ったようにホスト固有名の部分を

w w w

と置き換えた名前をつけ,ネームサーノ¥,

1 7

で 管理する場合が多いようである.

次に,ポートは試験的運用の場合等マシンの

r o o t

権限を用いずに起動するためには その番号が

1 0 2 4

以上でなければならないが,

r o o

t.権限を用いた運用では

8 0

を用いる ことが多いようである

1 8

なおこの点については,サーバソフトウエアの起動方法に よって設定を行うファイルが変るので,設定時に十分注意する必要がある.

最後に,ホームペ}ジ名は通常

i n d e x . h t m l

とすることが多いが,このファイルを どのディレクトリにおくかを設定する必要がある.ホームページをおくディレクト リはデータディレクトリの中でも最も上位にある必要があるが,このディレクトリを

S e r v e r R o o t

と呼んでいる.いずれも

c o n f i g r a t i o n

ファイルで指定する.

4 .

漢字コード

日本語を用いたページやデータを置く場合は,予め漢字コードについて検討する必 要がある.

これまでは,

UNIX

X

ウインドウ上で動作する

M o s a i c1 9

を用いて参照する場合が 多く ,

M o s a i c

が余分な操作無く表示できる

j i s

コードを選択する場合が多かった.

しかし,近年

M a c i n t o s h

Windows

マシンがネットワークに

I P

接続される数が急 激に増えており,かっその場合に利用できるブラウザは,現状

2 0

では,

M a c i l l t o s h

では

S J I S

もしくは

EUC

Windows

では

S J I S

NeXT

では

EUC

で書かれた日本語データ を表示できるブラウザがあることが確認されているのみで,いずれも

j i s

コードで書か れた文字を表示することができない.そこで,データ提供側で対処する必要がある.

1

つの方法として,作成した文字データの漢字コード変換を行って

3

種類用意する ことも可能である.しかし,当然のことながらメンテナンス量が増えるためあまり現 実的ではない.

そこで,漢字コードを変換するツールを聞にかませる方法を検討しなければならな いが,現在のところ

d e l e g a t e

というツールがある.

d e l e g a t e

は電子技術総合研究所(電総研)の佐藤氏が開発し,現在もパージョンアッ プが続いている.入手は

anonymousf t p

を用いて可能であり,フリーウエアである.

よく用いられる機能としては

p r o x y

機能

2 1 c a e h e

機能

2 2

漢字コード変換機能がある.

そこで,このうち漢字コード変換機能を活かしてユーザからの接続先を

d e l e g a t e

に してもらうことで漢字コードの面の問題を解消することができる.

1 7

コンピュ}タネットワーク上のホスト名と

I P

アドレスの対応表と考えてください.

1 8r o ot

権限以外で

www

サーバを起動する場合は8001や8080といったポートがよく用いられている.

1 9

ほとんどの場合, NCSA XMosaIcの多言語パッチ版

2 0

フリーウエアのものに限って調べた.

2 1 p r o x y

とは代理のことで,参照者を代行する機能と考えればよい.会社などで組織外とのデータ流通に 制限がある場合に役立つ.

2 2

一旦参照したデータを保存しておく機能.ネットワーク上のデータ流量を押えることができる.

91 

ところが,この方法には

l

つ問題点がある.

3 .

1.

3

の項で述べたように,特にセン ターと言った共用的な幸脱哉でサーバを運用する場合は 参照記録を保存し,解析する 必要があると考えられるが,

d e l e g a t e

を通してサーバにアクセスした場合は,サーパ 側に残る記録は

c l e l e g a t e

が動作しているマシンからのアクセスとして残ってしまうの である.

d e l e g a t e

自身にもアクセス記録をとる機能はあるが,

d e l e g a

.t

e

は漢字コード 毎に起動しなければならないねので,接続先毎に記録を集計したうえで統計にかける などの操作が必要である.記録ファイルの変更などのタイミングの上でかなりの検討 が必要であり,また

d e l e g a t e

を経由せずに直接サーバへ接続する場合を許すと,サー バの記録との兼ね合いがあるためなかなか難しい.

5 .   Y

クセス記録(ログ)の処理

アクセスの記録が残ることは既に述べたが,一定の周期でこれを処理し,また一定 期間の後に過去の記録を破棄しないとディスク容量の点で限界がきてしまう.そこで,

一定周期(週/月)単位で記録を集計し,また記録ファイルから過去の記録を消去しな ければならない.

集計については

3 .

1.

3

で述べたようなツールを利用すればよいが,過去の記録を順次 選択して消去してゆくのは煩わしく, .かっ記録ファイルを見るのは通常管理者だけな ので,記録ファイルをまるごと消去もしくは取り替えてしまうのが簡単である.ただ し,過去の記録を直ちに消去するのではなく,一定期間過去の分も世代管理しつつ残 す必要があると考えられる.

ドキュメント内 センターレポート 第14号 (ページ 92-95)