バイオ情報解析演習
非線形回帰分析
Environmental Purification Green Chemicals Biogenic Compounds (Primary Metabolites) Fermentation Foods Amino Acids Nucleic Acids Biologically Active Compounds Sugars Fat Organic Acids Alcohols Brewing Alcohols Miso Soy Sauce Yogurt Bakery Short chain Peptides
Rare Amino Acids
Proteins Poly-Amino Acids Pharmaceuticals Agriculture Applications Oligo-saccharides Sugars Fatty Acids Fat and Oils
Polymers Chemical Compounds Vinegar BioFuels Fermentation Enzyme Reactions Microbial Conversion (Secondary Metabolites) Vitamin Rare Sugars Non-Natural Compounds Alcohols Nytril Organic Acids β-lactam macrolide aminoglycoside alkaloid Oligo-Peptides Isomelized sugars
Fat and Oils
Lactone Epoxi compounds Olefin Amide Ketone
清水研の目指すもの:微生物細胞工場を作ろう!
Dr. Yagasaki by Kyowa
Chemicals Co
JST (2006)
1 Pharmaceuticals Biologically Active Compounds酵素:代謝工学の最重要部品
設計
試作
ベンチ
テスト
完成
プラスミド効率的な代謝経路
を設計する。
文献調査
代謝パスウェイの探索
代謝シミュレーション
実際に微生物に
組み込む。
データベースから有用
酵素
遺伝子を探索する
遺伝子組換え技術
培養をして問題点
を突き止める。
培養
代謝物量、フラックス
のデータを解析し、問
題点を突き止める。
代謝改変
ミカエリスメンテン式
]
[
]
[
max
S
K
S
V
v
m
S
E
P
http://ja.wikipedia.org/wiki/%E3%83%9F%E3%82%AB%E3%82%A8%E3%83%AA%E3%82%B9%
E3%83%BB%E3%83%A1%E3%83%B3%E3%83%86%E3%83%B3%E5%BC%8F
酵素の性質を理解するには
酵素を精製する
酵素の至適温度, pHなどを決定する。
K
m
値を決定する。
実験的にK
m
値を決める:Phenylalanine ammonia lyase (PAL)
x M Phenylalanine
Cinnamic acid
PAL
http://ja.wikipedia.org/wiki/%E3%83%9F%E3%82%AB%E3%82%A8%E3%83%AA%E3%82%B9%
E3%83%BB%E3%83%A1%E3%83%B3%E3%83%86%E3%83%B3%E5%BC%8F
緩衝液中に
基質+酵素を加え
反応速度を調べる。
酵素液
リン酸緩衝液pH7.5
30℃5分
1Nの塩酸反応停止
生成した
Cinnamic acidを
測定
Phe濃度 (mM) 反応速度 (mmol/mg protein) 0 0 2 7 4 13 5 17 10 22.5 20 28 30 35 40 35 50 39 75 41 100 41 0 5 10 15 20 25 30 35 40 45 0 20 40 60 80 100Phe 濃度 (mM)
反応速度
(mmol
/mg
pr
ot
ein)
]
[
]
[
max
S
K
S
V
v
m
0 0.02 0.04 0.06 0.08 0.1 0.12 0.14 0.16 0.18 -0.2 0 0.2 0.4 0.6
Lineweaver-Burk plot
Phe濃度 [S](mM) 反応速度 v (mmol/mg protein) 0 0 2 6 4 13 5 17 10 22.5 20 28 30 35 40 35 50 39 75 41 100 41max
max
1
]
[
1
1
V
S
V
K
v
m
1/[S] 1/v 0.500 0.167 0.250 0.077 0.200 0.059 0.100 0.044 0.050 0.036 0.033 0.029 0.025 0.029 0.020 0.026 0.013 0.024 0.010 0.0241/[S]
1/
v
1/Km
Lineweaver-Burk plot
1/Vmax
]
[
]
[
max
S
K
S
V
v
m
回帰分析 (regression analysis)
62つの変数xとyの間に
y
i
= f (x
i
; a, b, c, d, …..)
の関係があることがわかっているとき
に、係数a、b、c、d、・・・を求めたい。
このような問題を、
回帰モデル
y = f (x; a, b, c, d, …..)
への回帰分析 (またはパラメータの
フィッティング)と呼ぶ。
y = f (x)
x
y
線形回帰分析
7b
ax
y
ある量xとyに
の
関係があることが解っているときに、
傾きa
切片b
を求めたい。
こういった問題を
回帰モデル
への回帰分析(またはパラメータ
のフィッティング)と呼ぶ。
b
ax
y
i
i
b
ax
y
x
y
線形最小二乗法
8x
y
y = ax + b
フィットした直線
と実測値の差
y
i
– (ax
i
+ b)
フィットした直線y = ax + bと実
測値 (x
i
, y
i
)との差の二乗J
J = {y
i
– (ax
i
+ b)}
2
の和を最小にするようなa, b
の組を求める方法
線形最小二乗法
(x
i, y
i)
x
iy
iax
i+ b
非線形回帰分析
9ある量xとyに、y = f (x)の関係があることが解っているときに、そ
の関数にあるパラメータ(上の例ではaとb)を求めたい。
こういった問題を
非線形モデル
への回帰分析(またはパラメー
タのフィッティング)と呼ぶ。
y = f (x; a, b, c, ...); たとえば y = ae
bx
x
y
非線形最小二乗法
10実測値(x
i, y
i)とフィットした関数f(x)
との残差二乗和Jを最小にするよう
にパラメータを決める。
残差二乗和
x
i
y
i
f (x
i
)
(x
i, y
i)
y = f (x; a, b, c, …...); たとえば y = ae
bx
x
y
2
)
,
;
(
i
i
i
f
x
a
b
y
J
非線形最小二乗法
11と実測値(x
i,y
i)との差の二乗和をJとすると
となる。このとき、二乗和Jを最小にするa,bは、
以下の極値条件を満たす。
しかしながら、f(x)が非線形の場合はその条件を満たすa,bを探すのは簡単な問題
ではない。
パラメータa,bを持つ関数f(x)
x
a
b
f
y
;
,
2)
,
;
(
i i if
x
a
b
y
J
0
a
J
0
b
J
J
a
ニュートン法
12例:
を満たすaを求める。当然
初期条件として、
とおく。
a
a
g
2
a
a
2
2
0
g
5
.
1
2
2
0 2 0 0 0 0 0 1
a
a
a
a
g
a
g
a
a
2
0
a
416667
.
1
2
2
1 2 1 1 2
a
a
a
a
414216
.
1
3
a
:
0a
a
a
g
1a
2a
00 0 0 0 00
a
g
a
g
a
a
y
a
a
a
g
a
g
y
a
0g
の直線上の式には根が2つ(±√2)ある。どち
らに解が収束するのは初期条件による
が、どちらに収束するかを正確に決め
ることは非常に難しい。興味がある人は、
「ニュートン法 フラクタル」で検索
a
a
2
2
g
nn na
g
a
g
a
a
のとき求めることが難しい非線形関数の根を繰り返し計算によって
求める方法として、ニュートン法が広く用いられている。
非線形最小二乗法
13を最小とするa、bを求めるためには、
最小二乗法の残差二乗和
2)
,
;
(
i i if
x
a
b
y
J
,
0
1
b
a
g
a
J
0
,
2
b
a
g
b
J
J
a
*本当はbもあるので 2次元の図になる。を満たすa、bをニュートン法のような
繰り返し計算によって求めればよい。
(実際に使われる方法は、もうすこし手
が込んでいる)
aとbの初期値は、最適値に近いほうが
よい。
Rで非線形最小二乗法をやってみる
14test8.xlsをダウンロード後、CSV形式2変換し、read.csv()を用いてRに読み込んでみる。
> data <- read.csv("test8.csv")
> data
x
y
1 0.3849762 -0.1796237
2 1.5912074 -2.6203331
3 2.9198931 -4.2187897
4 3.0011874 -4.4551598
5 3.3204495 -5.7535737
このデータが、二次式
に従うとしたとき、
そのパラメータa,b,cを求めてみる。
c
bx
ax
y
2
Rで非線形最小二乗法をやってみる
15> data
x y
1 0.3849762 -0.1796237
2 1.5912074 -2.6203331
3 2.9198931 -4.2187897
: :
> result <- nls(y ~ a*x^2+b*x+c, data, start=c(a=1, b=1, c=1))
目的変数y
c
bx
ax
2
データx、yを含む
データフレーム
a,b,cの初期条件
nonlinear least square
(非線形最小二乗の略)
J
a
*本当はb, cもあるの で3次元の図になる。
Rで非線形最小二乗法をやってみる
16
> result <- nls(y ~ a*x**2+b*x+c, data, start=c(a=1, b=1, c=1))
> summary(result)
Formula: y ~ a * x^2 + b * x + c
Parameters:
Estimate Std. Error t value Pr(>|t|)
a 0.28489 0.02067 13.785 1.17e-10 ***
b -2.85399 0.24362 -11.715 1.45e-09 ***
c 1.14773 0.62121 1.848 0.0821 .
---Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.7165 on 17 degrees of freedom
Number of iterations to convergence: 1
Achieved convergence tolerance: 2.764e-07
求められたパラメータ。
つまり最小二乗法の結果として求められた関係は、
14773
.
1
85399
.
2
28489
.
0
2
x
x
y
Rで非線形最小二乗法をやってみる
17