• 検索結果がありません。

薬用資源学実習 ~bioinformatics入門; webを使っての

N/A
N/A
Protected

Academic year: 2021

シェア "薬用資源学実習 ~bioinformatics入門; webを使っての"

Copied!
10
0
0

読み込み中.... (全文を見る)

全文

(1)

薬用資源学実習

~bioinformatics 入門; web を使ってのデータベースアクセス~

課題 今回の実習で用いている ・遺伝子; -グルクロニダーゼ ・プロモーター; 35S ・プロモーター; TR2 について、配列・系統樹・立体構造・論文・遺伝子発現量等を調べる。

beta-glucuronidase について (全般、配列、系統樹)

-グルクロニダーゼ (beta-glucuronidase) について、京大にあるゲノムネットというデータベー スで調べてみよう。 1. [Google] Google を開いて「ゲノムネット」と検索し、ゲノムネットのページを開く。 2. [GenomeNet]

ゲノムネットの Top page にある検索フォームに「glucuronidase」と打ち込んで、検索する。 3. [DBGET Search Result]

ゲノムネットには、glucuronidase に関係のあるエントリーが複数あることが分かる。ページ中頃 の KEGG ORTHOLOGY を見ると、beta と alpha がある。実験で用いたのは beta の方。 beta-glucuronidase のリンク "K01195" をクリックすると、beta-glucuronidase についてま とめてあるページが開く。 4. [ KEGG ORTHOLOGY:K01195] このページで beta-glucuronidase について分かることは、 ・Entry:ゲノムネットでは K01195 という ID が振られている ・Name:遺伝子名は uidA という ・Definition:このグループの名前。 EC 番号は 3.2.1.31 である。 ・Pathway:どの代謝系に関与しているかということ。この酵素は、複数の代謝に関与しているこ とがわかる リンクをクリックすると、画像で確認できる。 ・Others DBs:他の分類データベース ・Genes:KEGG に収録されている、ゲノムが解読された生物の beta-glucuronidase 細菌では、しばしば同じ種で別の株 (例えば、大腸菌の実験室株 K12 と病原性株の O157 のよ うな関係) が登録されている。

(2)

以下の表は Genes に出てきた生物の一部をまとめたものである。

ここでの略記 種名 補足

HSA Homo sapiens ヒト

PTR Pan troglodytes チンパンジー MCC Macaca mulatta アカゲザル CFA Canis familiaris イヌ BTA Bos taurus ウシ SSC Sus scrofa ブタ

MDO Monodelphis domestica フクロネズミ OAA Ornithorhynchus anatinus カモノハシ GGA Gallus gallus ニワトリ

DRE Danio rerio ゼブラフィッシュ SPU Strongylocentrotus purpuratus ムラサキウニ

DME Drosophila melanogaster キイロショウジョウバエ DPO Drosophila pseudoobscura ウスグロショウジョウバエ TCA Tribolium castaneum コクヌストモドキ

CEL Caenorhabditis elegans 線虫

NVE Nematostella vectensis イソギンチャク FGR Fusarium graminearum 赤カビ病菌 ANI Aspergillus nidulans 偽巣性コウジ菌 AOR Aspergillus oryzae ニホンコウジカビ ANG Aspergillus niger クロコウジカビ ECO Escherichia coli 大腸菌

ECJ Escherichia coli 大腸菌

ECE Escherichia coli O157 腸管出血性大腸菌 O157 ECC Escherichia coli 尿路病原性大腸菌

ECP Escherichia coli 尿路病原性大腸菌 ECI Escherichia coli 尿路病原性大腸菌 ECV Escherichia coli 鳥病原性大腸菌 ECL Escherichia coli 大腸菌

SFL Shigella flexneri フレクスナー赤痢菌 SFV Shigella flexneri フレクスナー赤痢菌 SSN Shigella sonnei ソンネ菌 (赤痢菌の一種) SBC Shigella boydii 赤痢菌の一種

HSO Haemophilus somnus ウシ病原菌 SDE Saccharophagus degradans 海洋細菌

SIT Ruegeria sp. 細菌プランクトン SHA Staphylococcus haemolyticus B 群レンサ球菌 SPH Streptococcus pyogenes B 群レンサ球菌

(3)

SAG Streptococcus agalactiae B 群レンサ球菌 SAN Streptococcus agalactiae B 群レンサ球菌 SAK Streptococcus agalactiae B 群レンサ球菌 SSU Streptococcus suis 05ZYH33 豚レンサ球菌 SSV Streptococcus suis 98HAH33 豚レンサ球菌 LBR Lactobacillus brevis ラブレ菌 (乳酸菌) CPE Clostridium perfringens ウェルシュ菌

CEF Corynebacterium efficiens コリネ菌 (アミノ酸産生菌) AAU Arthrobacter aurescens アースロバクター

PAC Propionibacterium acnes アクネ菌 (プロピオン酸菌) ABA Acidobacteria bacterium アシドバクテリア

SUS Solibacter usitatus アシドバクテリア

FJO Flavobacterium johnsoniae フラボバクテリウム (滑走性細菌) TMA Thermotoga maritima 好熱菌

TPT Thermotoga petrophila 好熱菌 SSO Sulfolobus solfataricus 好熱古細菌 etc・・・ beta-glucuronidase はヒトを含めた高等動物や真性細菌、古細菌にもあり、かなり普遍的に存 在するが、植物には無いことがわかる。 今回の実験では、タバコにおいて 2 種類のプロモーター (35S ,TR2) がどのように発現するか を調べるのに大腸菌の beta-glucuronidase を用いた。これはタバコに beta-glucuronidase が無いからで、例えばヒトにおいて同じ実験を行うなら、調べたいプロモーターをヒトが持って いない酵素と繋いで実験する必要がある。

5. 大腸菌 (E. coli) は ECO と略されている。Genes の show all をクリックし、中ほどにある b1617 をクリックする。

6. [KEGG E.coli:b1617]

アミノ酸配列 (AA seq) や核酸配列 (NT seq) が掲載されている。これは薬用資源学実習書 p. 52 に書いてある配列と同じなので、実験で使った beta-glucuronidase は、大腸菌由来のものである ことが確認できる。 7. このE. coliの配列を基にして beta-glucuronidase の系統樹を書いてみよう。系統樹とは遺伝 子がどのくらい似ているかをツリー構造で示したもので、分子生物学ではよく使う。 8. 遺伝子が近いか遠いかを調べるには、通常、アミノ酸配列を用いる。核酸配列は ACGT の 4 種 類しかないので偶然同じになることがあるが、アミノ酸は 20 種類あるので偶然では同じになりに くく、さらに、例えばアラニンとバリンが似ているといったように、機能に類縁性があるので、遺 伝子の似ている、似ていないを評価しやすいからである。

(4)

BLAST とは配列の似ている遺伝子を探すソフトで、核酸配列にも適用することができる。 10. [Sequence Similarity Search - BLAST]

どの配列データベースに当てるか選ぶ。今回はそのまま、KEGG のデータベースに対して検索する ことにして、そのまま「Compute」をクリックする。

11. [BLASTP Search Result]

BLAST result の画面になり、問い合わせ配列、つまりE. coliの beta-glucuronidase に似てい る配列が、似ている順にリストになって出てくる。

12. リストの中身を見てみると、大半は beta-glucuronidase と説明されているが、いくつかの遺 伝子は beta-galactosidase となっている。データベースの情報には間違いがあることもあり、注 意 が 必 要 だ が 、 こ の 場 合 は beta-glucuronidase (EC:3.2.1.31) が beta-galactosidase (EC:3.2.1.23) と遠く似ていることを反映している。

13. GenomeNet の BLAST は工夫されていて、これらの似ている遺伝子群からアラインメントと 系統樹を作成することができる。

画面一番上の「select operation」と書いてあるプルダウンメニューから CLUSTALW を選び、 「Exec」をクリックする。ClustalW はアラインメント作成ソフトである。 14. [CLUSTALW Result] 画面の最初の方はログが書かれているだけなので、下の方へスクロールする。 15. 中頃からアラインメントが出てくる。アラインメントとは同じアミノ酸を同じ位置になるよう に並べた図のことで、遺伝子の中で保存されている領域と保存されていない領域を判断するのに使 う。

16. 系統樹を書くには、画面一番下の「select tree menu」から書かせたい系統樹の方法を選ぶ。 ここでは、「rooted phylogenetic tree (UPGMA)」を選び、「Exec」をクリックする。

17. [rooted phylogenetic tree (UPGMA)]

結果の図を見ることができる。元の配列 (eco; E. coli) に最も近い配列は rir の配列だということが 分かる。rir はアグロバクテリウムの一種であるが、アグロバクテリウムは大腸菌と同じ原核生物で あり、配列が似ていることにも納得が行く。次に近い配列の ssj は赤痢菌であるが、こちらもやは り原核生物。他に近いものとして、ecy や ecw の配列がみられるが、これらは E. coli の一種で ある。E. coli 同士なので、配列が似ているのはやはり自然であると言える。このように、通常は種 の系統樹と遺伝子の系統樹は一致する。この系統樹は、画像を右クリックして保存することができ る。

18. 少し戻って、beta-glucuronidase の分類について見てみよう。 19. [KEGG E.coli:b1617]

(5)

EC による分類へ移動してみよう。Orthology にある、EC 番号 (EC:3.2.1.31) をクリックしよう。 20. [KEGG ENZYME 3.2.1.31]

先程のまとめ画面と重複もあるが、ここでは、beta-glucuronidase の酵素としての性質が中心に まとめられている。例えば、Reaction (反応式) 、Substrate (基質) 、Product (生成物) 等が書 かれている。

21. (余裕のある人用その1)

植 物 に 本 当 に beta-glucuronidase が 無 い の か 確 か め て み よ う 。 こ の 大 腸 菌 の beta-glucuronidase の配列を、植物でゲノムが詳細に解読されている Arabidopsis (和名: シロ イヌナズナ) に対して BLAST で検索してみる。Arabidopsis の BLAST を掛けるホームページは Google で "Arabidopsis BLAST" と検索する。

22. (余裕のある人用その2)

beta-glucuronidase の配列を基に、細胞内局在を予測してみよう。細胞内局在を予測するソフト の一つに Wolf PSORT がある。Google で " Wolf PSORT " と検索し、Wolf PSORT のホーム ページに行き、配列を検索してみよう。

beta-glucuronidase について (立体構造)

次は立体構造について調べてみよう。立体構造のデータベースにはどんなものがあるだろうか? 1. [Google] Google を開いて、「立体構造 データベース」と検索。 2. [PDBj]

日本蛋白質構造データバンク Protein Data Bank Japan (PDBj) というホームページが Hit した。 ここで、サービス一覧から検索をクリックした後、PDB 検索 (PDBj Mine) をクリックする。 3. [PDBj Mine トップページ] 簡易検索のフォームに "beta-glucuronidase" と入力し、検索をクリックする。 4. 何件かの登録がある。一番上の 1BHG をクリックしてみよう。 5. [PDBj Mine 概要ページ : 1BHG] このページでこの登録について分かること は、 ・PDB では、1BHG という ID が振られている ・4 量体になっている

・ヒト (Homo sapiens) の beta-glucuronidase である

・論文は 1997 年に Nat. Struct. Biol という雑誌で報告されている

(6)

beta-glucuronidase について (遺伝子発現)

ヒトに beta-glucuronidase があることが分かったので、次は、どの細胞で発現しているのか調べ てみよう。 1. [Google] Google で検索して、「ゲノムネット」のページを開く。 2. [GenomeNet] Search を「統合データベース」から「遺伝子」に変更して、 "glucuronidase" を検索する。 3. [Search Result]

KEGG ORTHOLOGY の beta-glucuronidase (ko:K01195) をクリックする。 4. [ko:K01195]

ヒトでの遺伝子発現が知りたいので、Genes 欄のヒト (HSA: 2990) をクリックする。 5. [H.sapiens 2990]

Other DBs の中ほど、NCBI-GeneID:2990 をクリックする。UniGene は NCBI が行っているデ ータベースである。

6. [Gene]

一番上には遺伝子の基本情報とエキソン・イントロン構造の図がある。 一番下の Additional Links に UniGene へのリンクがあるので、見てみよう (Hs.255230) 。

7. [UniGene]

中ごろの GENE EXPRESSION の中に EST Profile というリンクがあるのでとんでみよう。 8. [EST Profile Hs.255230]

NCBI が作成している UniGene というデータベースの中で EST の取得された組織が分かるように なっている。この EST の (つまり遺伝子発現の) 組織特異性を見ると、殆どの組織で満遍なく発現 していることが分かる。

beta-glucuronidase について (論文)

論文はアメリカの NCBI という団体が作成している Pub Med というデータベースを用いて検索す るとよい。

(7)

Google で「NCBI」を検索して開く。 2. [NCBI]

検索対象を「All Databases」から「Pub Med」に変更する。

検索フォームに「beta-glucuronidase」と入力し、「Search」をクリックする。 3.beta-glucuronidase に関する論文が約 18,000 件も出てくる。ここでは最新のものから順に並 べられている。 今度は論文のタイトルに beta-glucuronidase が含まれている論文だけを検索してみよう。 フォームに「beta-glucuronidase[Title]」という風に「[Title]」という単語を加える。「Search」 をクリックして検索する。 4. 2,000 件以上もあり beta-glucuronidase に関して多くの研究がなされていることが分かる。 ヒトの遺伝子がいつ単離されたのか調べてみよう。

検索キーワードに「human」と「cloning」を加え、「beta-glucuronidase[Title] AND human AND cloning」と入力する。 5. 10 数件の論文があるが、その中からヒトの beta-glucuronidase の単離についての論文を 探す。 今回は、1990 年Miller RDらによる論文および、1987 年Oshima A らによる論文が該当する。 6. リスト中のタイトルをクリックすると、要約 (Abstract) を読むことができる。

35S promoter について (論文)

PubMed で論文を検索するのは非常に重要なことなので、もう少し慣れておこう。 実習では 35S promoter は全ての組織で発現していた。このことについて書いてある論文を検索 してみよう。 1. [NCBI]

検索対象を Pub Med にして、検索フォームに「35S promoter」と入力して検索する。

2. 2,000 件以上の論文が Hit した。多すぎてよく分からないので、「35S promoter[Title] AND “tissue specificity”」と検索してみよう。

3. カリフラワーモザイクウイルス 35S プロモーターの活性に必要な DNA 配列の identification という論文だけが残った。要約を見てみよう。

4. 要約の最後に、"The 35S promoter showed no tissue-specificity of expression" つまり 「この 35S プロモーターは発現の組織特異性を示さなかった」とある。図書館に行って、この論 文を読めばさらに詳しいことが分かる。またこの要約の中ほどには、転写開始点から上流 105bp

(8)

の領域が遺伝子発現に必要であることが記載されている。

35S promoter について (配列)

35S promoter はカリフラワーモザイクウイルスの 35S rRNA のプロモーターで、配列が短い、 組織特異性が無い、強い遺伝子発現を導く、などの理由で、植物系の研究では多用される。今度は NCBI から、配列を調べてみよう。 1. [Google] Google で NCBI を検索して開く。 2. [NCBI] 検索対象を Nucleotide に変更。検索フォームに「35S promoter」と入力し検索する。

3. 約 1200 個もの遺伝子が Hit した。これではよく分からない。そこで、右の「Top Organisms」 で More…をクリックし Cauliflower mosaic virusを選択する。

4. 以上のように候補を絞り込んだうえで、目的とする配列を探す。

TR2 promoter について (配列)

TR2 promoter は、土壌細菌のAgrobacterium tumefaciensの持つ Ti plasmid 上の TR-DNA 領域にある 2 'gene (mannopine synthase) の promoter である。

1. [NCBI]

まず単純に、NCBI で検索対象を Nucleotide にして、「TR2 promoter」と検索してみよう。 2. Hit 件数が多くないので全てのタイトルを見てみるが、残念ながらこの検索語では目的の情報が 出てこない。 3. [NCBI] そこで、今度は、「TR2' promoter」と検索してみよう。 4. この検索語でもうまくいかなかった。 5. [Google]

そこで新たなキーワードを探すため、Google で、「TR2-promoter lens」と検索してみよう。 6. [Search result]

(9)

Lens というページを見てみると、Claims 1.の最後の方に、“TR2' promoter of the mannopine synthase gene”という表現がある。TR2 promoter が mannopine synthase の promoter で あることを思い出して、"mannopine synthase" と promoter でさっきの NCBI から検索してみ よう。

7. [NCBI]

NCBI で検索対象を Nucleotide にして、「"mannopine synthase" promoter」を検索する。 8. 1 番目が知りたかった TR2' promoter の配列のようである。ID をクリックして中を確かめるこ と。 ここまで上手くできただろうか。次は腕試し。今行ったことを利用して、自分の興味のあるものに ついて調べてみよう。ゲノムネットや NCBI を基点にするのが分かりやすいだろう。 (例) 「狂牛病の原因となっているプリオン (prion) 」 ・遺伝子名 ・機能 ・発現する組織 ・正常なものと異常なものの立体構造

「肝臓の健常度の指標となっている、gamma-GTP (EC: 2.3.2.2) 、GOT (EC: 2. 6.1.1) 」 ・遺伝子機能

・発現特異性

「ヒトの ABO 血液型 (ABO blood) を決める遺伝子」 ・遺伝子名

・酵素反応

・ABO の遺伝子はどこが異なるか (アラインメント) ・他の哺乳類の血液型との関連 (系統樹)

「重症急性呼吸器症候群 (SARS; Severe Acute Respiratory Syndrome) コロナウイルス (corona virus) 」 ・何株のゲノムが決まっているか ・ゲノムの長さ ・遺伝子数 (ポリプロテインというのを聞いた事が無い人は Google で調べてみよう) 「古い論文の本文」 ・ワトソンとクリックが 1953 年に発表した DNA 二重らせんについての論文 (本物は A4 用紙1枚に簡単な英語で書かれている論文なので、読んだことが無い人は是非、読んで みよう。web で取れなかった人も取れた人も図書館で本物を見てみるといいかもしれない。)

(10)

「クリスマスツリーで知られる、モミノキ (Abies firma) について」 ・論文は存在するか ・配列は? 他にもデータベースは沢山存在する。有名なものはリンク集のようなもの (Google で「生物 ツー ル集」などと検索するとリンク集が出てくる) からいけるだろうし、特定のユーザーが用いるよう なちょっとしたものは、個々の論文に記載されている。 またデータベースの紹介だけの特集号を設けている論文誌もある (参考: NAR のデータベース特 集号 (2005 年)) 。 研究と平行して、これらのデータベースより、自分の研究に関係のある情報を収集するということ は研究を進める上で大切なことである。 参考書 「改訂第二版バイオデータベースとウェブツールの手とり足とり活用法」 今回の web 実習のようなことが、色々なデータベースについて非常に分かりやすく記述されている。 「東大、生命系 3 年生のコンピュータ実習資料」 Web サイトの資料なのでアクセスしやすい。一度参照してみよう。

参照

関連したドキュメント

 その後、徐々に「均等範囲 (range of equivalents) 」という表現をクレーム解釈の 基準として使用する判例が現れるようになり

テューリングは、数学者が紙と鉛筆を用いて計算を行う過程を極限まで抽象化することに よりテューリング機械の定義に到達した。

これはつまり十進法ではなく、一進法を用いて自然数を表記するということである。とは いえ数が大きくなると見にくくなるので、.. 0, 1,

このように、このWの姿を捉えることを通して、「子どもが生き、自ら願いを形成し実現しよう

ヒュームがこのような表現をとるのは当然の ことながら、「人間は理性によって感情を支配

と判示している︒更に︑最後に︑﹁本件が同法の範囲内にないとすれば︑

遮音壁の色については工夫する余地 があると思うが、一般的な工業製品

自然言語というのは、生得 な文法 があるということです。 生まれつき に、人 に わっている 力を って乳幼児が獲得できる言語だという え です。 語の それ自 も、 から