情報処理装置「生命」の
設計図を読み解く
大林武
(東北大・情報)自己紹介(大林武)
生物学
情報科学
11
年
4
年
7
年
東工大・生命
(千葉大・薬)東大・医科研
東北大・情報
バイオ
インフォ
マティクス
Bioinformatics / Computational Biology
Biology
Informatics
Bio
informatics
Computational
Biology
Biology
Chemistry
Bio
chemistry
Chemical
Biology
もくじ
細胞システムの解明へ
遺伝子ネットワーク
情報処理システム
111010001001 000000111101 変換器
利用者のニーズ
情報処理システム
入力 出力 目的 様々な トランジスタ NANDゲート, NORゲートCPU / GPU / FPGA
制御装置 / 演算装置 / レジスタ
半導体 原子
細胞システム
グルコース濃度が上昇 タンブリングの抑制 変換器子孫繁栄
入力 出力 目的 変動環境での タンパク質(遺伝子) Pathway タンパク質複合体 アミノ酸 タンパク質ドメイン 原子 Genome遺伝子型と表現型の関係性
ゲノム配列
複合体
機能
Protein Protein Protein Protein Protein Protein Protein
複合体
複合体
複合体
Pathway
Pathway
増殖速度
表現型捕食者対応力
遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子
システムの複製
複合体
機能
Protein Protein Protein Protein
複合体
複合体
Pathway
Pathway
捕食者対応力
増殖速度
表現型ゲノム配列
複合体
Protein Protein Protein Protein
複合体
複合体
Pathway
Pathway
捕食者対応力
増殖速度
ゲノム配列
遺伝子 遺伝子 遺伝子 遺伝子
遺伝子 遺伝子 遺伝子 遺伝子
ゲノムのコピー
変化するゲノム
複合体
機能
Protein Protein Protein Protein
複合体
複合体
Pathway
Pathway
捕食者対応力
増殖速度
表現型ゲノム配列
ゲノムの変化
複合体
Protein Protein Protein Protein
複合体
複合体
Pathway
Pathway
捕食者対応力
増殖速度
ゲノム配列
遺伝子 遺伝子 遺伝子 遺伝子
遺伝子 遺伝子 遺伝子 遺伝子
もくじ
細胞システムの解明へ
遺伝子ネットワーク
情報処理システム
細胞システムの研究アプローチ
ゲノム配列
複合体
機能
Protein Protein Protein Protein Protein Protein Protein
複合体
複合体
複合体
Pathway
Pathway
増殖速度
表現型捕食者対応力
遺 伝 学 逆 遺 伝 学遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子
要素は決定できる
ゲノム配列
複合体
機能
Protein Protein Protein Protein Protein Protein Protein
複合体
複合体
複合体
Pathway
Pathway
増殖速度
表現型捕食者対応力
遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子
次々と決定されている ゲノム配列からほぼ決定できる 遺 伝 学 逆 遺 伝 学ヒトゲノムの一部
CCCTGTGGAGCCACACCCTAGGGTTGGCCAATCTAC
TCCCAGGAGCAGGGAGGGCAGGAGCCATCTATTGCT
TACATTTGCTTCTGACACAACTGTGTTCACTAGCAAC
TCAAACAGACACC
ATGGTGCACCTGACACCTGAGGA
GAAGTCTGCCGTTACTGCCCTGTGGGGCAAGGTGAA
CGTGGATGAAGTTGGTGGTGAGGCCCTGGGCAG
GT
TGGTATCAAGGTTACAAGACAGGTTTAAGGAGACCAA
TAGAAACTGGGCATGTGGAGACAGAGAAGACTCTTG
GGTTTCAGATAGGCACTGACTCTCTCTGCCTATTGGT
CTATTTTCCCACCCTTAG
GCTGCTGGTGGTCTACCCT
TGGACCCAGAGGTTCTTTGAGTCCTTTGGGGATCTG
TCCACTCCTGATGCTGTTATGGGCAACCCTAAGGTGA
AGGCTCATGGCAAGAAAGTGCTCGGTGCCTTTAGTG
ATGGCCTG
11番染色体: ヘモグロビンβサブユニットゲノムプロジェクト
# Gene: Protein-coding genes in Ensembl release 53 Icon: LSDB icon
Yeast
1996年
6,698
1998年
Nematode
20,176
2000年
Fly
2001年
Human
21,416
2002年
Mouse
23,117
2004年
Rat
22,593
14,141
# Genes # Genes20000~30000
の遺伝子で生物が作られている
2000年
Arabidopsis
30,535
27,025
Rice
2004年
Popula
45,555
2006年
Tomato
2012年
35,000
35,434
Grape
2007
年 2008年
29,035
Lotus
Vertebrate Genomes in Ensembl DB
DNA配列解読速度の爆発的上昇
機能モジュールをどう推定するか?
ゲノム配列
複合体
機能
Protein Protein Protein Protein Protein Protein Protein
複合体
複合体
複合体
Pathway
Pathway
増殖速度
表現型捕食者対応力
遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子
?もくじ
細胞システムの解明へ
遺伝子ネットワーク
情報処理システム
代謝ネットワーク
H
H
エタノール アセトアルデヒド ADH 酢酸 ALDH細胞情報を担う3タイプの分子
出典: Molecular Biology of THE CELL 5th
設計図
伝令
機能の実体
DNA
RNA
タンパク質
アルコール代謝遺伝子の発現パターン
ADH1B
ALDH2
NCBI GEO: GSE2361
活動量データから友人関係を推定できる
http://ics.t.u-tokyo.ac.jp/ja/スマート活動量計データからの人間関係可視化/
東京大学
情報理工学研究科
下坂研究室
一次代謝系,二次代謝系とも共発現する
グルコシノレート メチオニン CYP79F1 REF2 SUR1 UGT74B1 SOT17 MAM1 BCAT4 PGI PFK FBA TIM GAPC PGK iPGAM ENO PK ピルビン酸 グルコース6P MR < 30長い生合成経路
クロロフィル a グルタミン酸 全般的に共発現しているが 調節の鍵遺伝子がある CRD1 GUN5 PORC CHLD CHLM CHLI CHLG PPOX HEMCHEMB HEME LIN2
HEMA HEML Protoporphyrin IX
基質の供給経路が複数ある場合
スクアレン HDR HDS ISPF CDPMEK ISPD DXR DXPS1 HMG MVD MK MVA1 ACAT2 SQS1 FPS1 共発現はパスウェイ間の繋がりを表す メバロン酸経路 非メバロン酸経路 アセチルCoA ピルビン酸 IPP IPP MR < 100複数の代謝系の関係性
ADT MEE17 CM PAL C4H 4CL コリスミ酸 TS IGPS TRP1 AS トリプトファン PSP PSAT PGDH 3PG PAI EMB1144 EPSPSSK MEE32 DHS E4P PEP DQS クマロイルCoA MR < 30 共通経路はどちらのパスウェイとも共発現している遺伝子間関係の評価
本当に関係しているのか? 再現性 既知機能と無矛盾 ゲノム配列と無矛盾 比較する共発現の質 システムノイズの問題 生物種特異的 既知機能の限界 ゲノム情報の複雑さもくじ
細胞システムの解明へ
遺伝子ネットワーク
情報処理システム
システム進化の研究に向けて
システム構造
ゲノム理解
システム動態
ACGTACGATC GTACAGCTAG CTAGCTCAGCゲノム配列
ACGTACGATC GTACAGCTAG CTAGCTCAGC ACGTACGATC GTACAGCTAG CTAGCTCAGC階層構造の推定
ゲノム配列
複合体
機能
Protein Protein Protein Protein Protein Protein Protein
複合体
複合体
複合体
Pathway
Pathway
増殖速度
表現型捕食者対応力
遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子
?Lineage-Specific Coexpression
Xylan
Arabinan Glucan Cellulose
Monocot Dicot Osa-m Zma-m Ath-m Gma-m Osa-r Zma-r Ath-r Gma-r
Cellulose Synthase 6 Unknown Protein Glycoside Hydrolase 9 Monocot Dicot 1980 3509 201 320 8529 14523 7 1179 Monocot Dicot 9 16 11407 9476 15 300 5565 3459 Monocot Dicot 5578 4854 9 306 1176 1776 107 75 Monocot Dicot 16 12 97 305 101 42 30 28 Monocot Dicot 127 106 3595 3957 23 69 5487 3049 Coex Platforms Glycoside Hydrolase 3
Monocot plants Dicot plants
Substrate Substrate
Gene co-expression is evolving to acquire lineage-specific
cellular functions.
Gene Coexpression Databases
http://coxpresdb.jp http://atted.jp http://alcodb.jp
Animals Plants
Algae
Users of ATTED-II, COXPRESdb
Based on Google Analytics
Country
Yearly citation
0 25 50 75 100 125 Y2007 Y2014 (Session)