• 検索結果がありません。

Vol J. Weed Sci. Tech. 3. :,,, Keywords : seed bank, sampling, accuracy of estimation, sample size, はじめに, Leck et al , 2010

N/A
N/A
Protected

Academic year: 2021

シェア "Vol J. Weed Sci. Tech. 3. :,,, Keywords : seed bank, sampling, accuracy of estimation, sample size, はじめに, Leck et al , 2010"

Copied!
9
0
0

読み込み中.... (全文を見る)

全文

(1)

総  説

特集

3. 難防除雑草の埋土種子調査

埋土種子調査のためのサンプリング計画

中山壮一*・柴田泰宙**・浅井元朗キーワード: 埋土種子,サンプリング,推定精度,サンプル 数

Keywords : seed bank, sampling, accuracy of estimation, sample size,

は じ め に

 雑草の埋土種子調査の,研究・農業生産上の目的ならびに 具体的な手法については古くから論じられてきた(Leck et al. 1989)。また本特集においても小林・渡邊(2010),澁谷ら(2010), 浅井ら(2010),住吉ら(2011)で論じてきた。  埋土種子調査の特性として,1. 調査の結果得られるデータ が計数値である,2. 種子は土中にあり,かつ微小であるため 時間と労力を要する分離同定プロセスを経た後でないとデー タが(そのおおざっぱな目算すら)得られない,および少な くとも国内においては,3. 現地圃場での埋土種子の量および その圃場内での空間的変動に関するデータの蓄積が乏しい, の3 つが上げられる。  これらのうち,1 については,正規分布を仮定できないデー タを扱わねばならないことを意味し,しばしば得られる “0” 値データは,種子量の推定に直接的には有効なデータとなら ない。また特性の2 により,現地でのデータの取得が困難な ため,データを見ながらのサンプル数の加減ができない。し たがって,埋土種子調査においては,データが連続変量とし て得られる場合(例えば土壌の化学分析など)や,現地でデー タが得られる場合(例えば個体数調査など雑草の地上部に関 する様々な調査)よりも,サンプリング計画,特に調査サン プル数の検討は慎重に行わねばならない。後段で述べるよう に調査で要求される精度を満足するための必要サンプル数は 埋土種子の量自体とその標準偏差によって決まる。このため, 必要サンプル数を事前に求めるためには当該圃場における埋 土種子の量とその変動についての予備知識が必要となるが, 特性の3 により適切なサンプル数の目処をつけることさえ困 難という制約がある。  埋土種子調査において,「いくつサンプルを取ったらよい か?」という必要サンプル数の問題については,古くからヨー ロッパ圏の諸国において多くの検討が成されてきた(Barralis et al. 1986 ; Zanin et al. 1989 ; Simpson et al.1989 ; Dessaint et al. 1996 ; Ambrosio et al. 1997 ; Jones 1998)。それらの研究は,1 筆 当たり100 前後,場合によっては 100 を大きく越えるサンプ ル数が,要求される推定精度を満足するために必要と結論づ けている。しかし,現状で埋土種子調査に必要な労力と時間 を考慮すると,このような膨大なサンプル数は,あるいは研 究場面では実現可能な場合があるかも知れないが,複数の圃 場を対象とするような生産現場においては実現可能なサンプ ル数とは考えにくい。  小林・渡邊(2010)は埋土種子調査の目的として,1. 作物 の作付け前に潜在的な雑草発生量を知ること,2. 雑草防除の 効果を正当に評価するための指標とすること,3. 雑草量の長 期的な増減を把握すること,および 4. 長期的な雑草個体群の 動態を予測するモデルの開発・実用化のためのパラメータを 取得すること,の 4 つを上げている。これらの目的の中で数 字が大きいものほど高い精度を要求すると考えられる。  本稿は,サンプリング計画,とくにサンプル数の設計につ いて論ずるものであるが,初めにサンプル数と推定精度の関 係について述べ,ついで欧米諸国を中心に行われたサンプリ ング計画に関する研究を概観する。最後に,前段で述べた制 約を打開する一助とするためのサンプリング法の提案を行っ た。そこでは調査の目的を,前述の小林・渡邊(2010)が掲 げた埋土種子調査の目的の1 に絞り,精度は少々劣ってもか まわないから,多数の現地圃場の埋土種子量の推定値を,実 現可能なサンプル数で得ることができないか,あるいはそれ が実現可能な条件,すなわち種子量とそのばらつきは,どの ようなレベルかについて検討した。なお,以下の記述は全て 対象圃場がサンプリング総面積に対して十分大きい場合,す なわち無限母集団とみなせる場合についてのものである。

サンプル数と推定精度

1.推定精度  ここまで推定精度の語を特に定義せずに用いてきた。本稿 でサンプル数と推定精度の関係を論ずるにあたり,過去に推 定精度の指標として用いられてきた2 つの概念,標本誤差率 および相対標準誤差の関係を整理する。 一般的に統計の教科書(例えば西沢(1978))では,推定精度, * 農業・食品産業技術総合研究機構東北農業研究センター 〒 020-0198 盛岡市下厨川字赤平 4 ididit@affrc.go.jp ** 横浜国立大学大学院環境情報研究院

Soichi Nakayama, Yasutoki Shibata and Motoaki Asai : Sampling designs for seed bank surveys.

(2)

すなわち推定値の信頼性は,標本誤差率Pを指標としている :       P=( ⋅t s q) m ・・・・・・・(1)  ここで,q はサンプル数,t は自由度 q−1 の t-分布の両側 α×100%(危険率)点,sは標準偏差の標本推定値,m は平均値 の標本推定値である。(1)式の分子t ⋅s qは,平均値 m の 1−α% 信頼区間である。したがって P は,平均値 m に対す る信頼区間t ⋅s qの比率になっていることがわかる。  さて(1)式では信頼区間を求めるのに t-分布のパーセン ト点を用いている。t-分布のパーセント点は,母集団標準偏 差σ が未知な正規変量の信頼区間を求める際に用いられる。 したがって(1)式を適用するには,平均値 m の分布が正規 分布に近いものでなければならない。平均値を求めるのに用 いた個々のデータが正規分布に由来するデータであれば,こ の点で問題は生じない。しかし,埋土種子量のように離散分 布で0 値も出現するデータでは,サンプル数が十分大きくな いと(1)式自体が成立しない。海外での埋土種子調査の必 要サンプル数に関する多くの研究(Barralis et al. 1986 ; Zanin et al. 1989 ; Ambrosio et al. 1997 ; Jones 1998)では,多数のサンプ ルを取ることを前提に,この標本誤差率 P が精度の指標とし て採用されてきた。  これに対し,Dessaint et al. (1996)や高柳(2004)は,相対 標準誤差D(久野 1986):        D=(s q) m ・・・・・・・(2) を精度の指標として採用している。D は,P と異なり,平均m の分布に関する仮定がない。したがって,少数のサンプ ルに対しても,また m の分布が正規分布からかけ離れている ケースでも定義が可能である。  本稿では埋土種子調査の実状を踏まえて,少数のサンプル による埋土種子量の推定について論じる。そのため,精度の 指標として平均値の正規性を仮定しないD を採用する。なお (1)式と(2)式を比べるとわかるように,形式上の P と D の違いはt の有無だけである。したがって q が大きい場合, α = 0.05 では,おおざっぱに P ≈ D×2 (∵ t(0.05, ∞)=1.96)と見 ることもできる。しかし推定精度としてP を採用する場合は, データの正規化のため変数変換が必要となることが多い。こ の場合,元のデータが与えられない限り 2 種類の精度の換算 はできない。  (2)式から,[精度]=[標準誤差]/[平均値]の関係になっ ていること,また精度 D は,サンプル数 q が一定の場合,s/m, すなわち変動係数に比例することがわかる。精度D は相対標 準誤差として定義されているので,値が大きいほど精度が低 く,値が小さいほど精度が高い。だいたいの目安として,一 般的な動態研究で0.2-0.3,詳細な生命表解析を主眼とする集 約的な研究で0.1-0.2,やや大まかな鳥瞰的研究で 0.3-0.4 とさ れている(久野1986)。ここではこれ以上詳しくは述べないが, 後段で精度D と検出力の関係について論じた。 2.必要サンプル数  (2)式を変形すると目標精度 D に対する必要サンプル数 q が,       q =s2

(

D2m2

)

・・・・・・・(3)  で得られる。(3)式から,精度 D を一定に保つとすると, 必要サンプル数q は(s/m)2に比例することがわかる。つまり m すなわち種子量が少ないほど,また s すなわち種子量のば らつきが大きいほど必要サンプル数は増大する。またこのこ とは,必要サンプル数は推定しようとする種子量の平均値 m 自身とその標準偏差s で決まることを意味する。このため, サンプリングを始める前に必要サンプル数を計算するために は,調査対象について平均値 m および標準偏差 s の事前情報 が必要となる。  埋土種子調査の場合,事前に平均値と標準偏差について信 頼できる推定値が得られていることはまれであり,現実には サンプル自身から計算された平均値および標準偏差を基に必 要サンプル数を算出することとなる。このため,必要サンプ ル数は調査を始めてみないと目処をつけることができない。 この点は,あらゆる標本調査に共通の問題であるが,埋土種 子調査の場合,サンプリングからデータの取得までに時間を 要する場合が多いことから問題はより深刻である。この問題 の解決策については後段で提案する。  ここで,単純化のため,対象とする雑草種(または種群) の種子が空間的に完全なランダム分布をしている1 枚の圃場 を考える。このとき土壌コアサンプルに含まれる種子数の頻 度分布はポアソン分布に従うと想定される。ポアソン分布で は平均値mと分散s2が等しい,m=s2という性質があるので(2) 式は,     D=(s q) m=( m q) m=1 qm ・・・・・・・(2)′ となる。例えば16 個のサンプルに平均 9 個の種子が含まれ ていたとする。この場合,精度 D=1/ 16×9=0.08 で,前述の 久野(1986)に従えば,かなり高精度の推定ができているこ とになる。 (2)′式から必要サンプル数 q は,        q=1

( )

D2m ・・・・・・・(3)′ で与えられる。第1 図に D = 0.1,0.2,0.4 の場合の平均種子 数と必要サンプル数との関係を示した。(3)′式からも明らか なように,必要サンプル数 q は平均値 m に反比例し,サンプ ル中の種子数が少ないほど一定精度の推定に多くのサンプル が必要である。

(3)

 ところで,サンプル中の種子数の合計 N をで表すと, N=q・m より(2)′式は,          D=1 qm=1 N ・・・・・・・(2)′′ と書け,精度 D は合計種子数 N だけで決まることがわかる。 さらに,(2)′′式を変形すると,         N =1 D2 ・・・・・・・(4) であり,(4)式からは目標精度から必要調査種子数が計算で きる。例えば,目標精度を 0.4 とするなら,1/0.42<7 で,7 粒 の種子が出てくるまで調査を行えば良いことになる。同様に D = 0.2 では 25 粒,D = 0.1 では 100 粒となる。  くどいようだが,以上はあくまでも種子がランダムに分布 するという理想的状況での必要サンプル数である。実際の圃 場では,前年の不均一な雑草発生などが原因で,m<s2とな る集中分布をしているのが普通である。したがって,第 1 図 を含むここでの試算は,これより増えることはあっても減る ことはない最低限のサンプル数の目安である。しかし無作為 に取られた多数の小サンプルを十分混合することや層別抽出 を的確に行うことで,分析サンプル中の種子数の分布をラン ダムな分布に近づけることができる。この点については,後 段で詳しく述べる。

サンプリング計画に関する既存の研究

 サンプリング計画と埋土種子量の推定精度に関する研究 は,1950 年代から見られるようになり,1980 年代までにサン プル数やサンプリングユニット(コアサンプラなど)の容量 などとの関係について検討が行われた(Simpson et al. 1989)。 それらの研究は,1) 一定の推定精度を得るために,土中の種 子量が少ない場合,また種子の空間分布が不均一で強い集中 分布をする場合により多くのサンプルを要すること,また 2) 同じ容量の土壌を分析するのであれば,大きなサンプリング ユニットで1 つのサンプルを得るよりも,小さなサンプリン グユニットで多数のサンプルを得た後に,それらを合わせて 分析サンプルとする方が高精度となることを明らかにした。 1) については,それぞれ平均値 m が小さい場合,標準偏差 s が大きい場合に相当し,前述の(3)式からも容易に理解さ れよう。2) については,一般に土中の雑草種子はランダム分 布するよりも集中分布する場合が多く,空間的に近くのサン プル同士は,遠くのサンプルよりも似た値になりがちなこと による。すなわち大きなサンプリングユニットによる少数の サンプリングは推定値に偏りを生じやすいのである。ちなみ に種子分布が完全にランダムな場合には,同じ量の土壌を分 析するのであればサンプリングユニットの容量は推定精度に 影響しない。この他にSimpson et al.(1989)の総説に引用さ れた1980 年代前半までの研究の中では,Goyeau and Fablet (1982)が,分析サンプル中の種子数の頻度分布は,種子量 が少ない場合にはポアソン分布に,種子量が非常に多い場合 には正規分布に従う傾向があるが,それ以外の多くの場合は 集中分布すること,またその分布型は雑草の種の違いよりも 種子量の多寡自体に大きく依存することを示した点が特筆さ れる。

 1980 年代から 90 年代にかけては,Goyeau and Fablet(1982) が注目した埋土種子の空間分布に関する知見を必要サンプル 数の決定や推定精度の向上に応用しようとする研究が行われ た(Barralis et al. 1986 ; Lopez et al. 1988 ; Chauvel et al. 1989 ; Zanin et al. 1989 ; Dessaint et al. 1990, 1996 ; Ambrosio et al. 1997)。その代表的なものとして平均値と分散の関係式を求 め,それをサンプリング計画に活用しようとする試み(Barralis et al. 1986 ; Lopez et al. 1988 ; Zanin et al. 1989 ; Dessaint et al. 1990, 1996) がある。以下に,その概要を紹介する。  前段で述べたように,必要サンプル数は推定しようとする 種子量の平均値そのものとその標準偏差によって決まる。こ のうち,データのバラツキを表す,標準偏差については,事 前には目処をつけることも容易ではないだろう。一方,平均 値については前年の雑草発生状況などから,おおざっぱにで も想定できる場合があるかも知れない。そうした状況におい て平均値と分散の関係式が事前に得られていれば,効率的な サンプリングを行うことができるはずである。  生物分布の平均値−分散関係を記述する一般式としては, Taylor’s power law(Taylor 1961),

         log s2=log a+b・log m ・・・・・・・(5)

がよく知られている。もともと(5)式は主に動物の空間的 分布様式を表す経験則として見いだされたもので,分散 s2

第 1 図 ランダム分布する埋土種子の種子量推定における目標推定精度 D = 0.1, 0.2 および 0.4 の場合の平均種子数と必要サンプル数との関係

(4)

対数値と平均値m の対数値が直線関係にあることを示してい る。この式が成立する理由については長年「現代生態学にお けるミステリーの一つ」と言われていたが,現在では生物の コロニーのサイズが可変的で個体群が増殖する際に各コロ ニーの空間的な広がりが相対生長的に一定倍大きくなるとい うモデル(Colony expansion model)により説明されている (Yamamura 2000 ; 山村 2002)。

 (5)式は書き換えると,

      s2=a・mb ・・・・・・・(5)′

となり,これを(3)式に代入すると,

        q=a・mbD2m2)=a・mb−2/D2 ・・・・・・・(6)

となる。Taylor’s power law を使うことにより,(6)式では, 分散s2が消えて,必要サンプル数 q が平均値 m だけで規定 できるようになる。  実際に(6)式をサンプリング計画に使うためには,パラメー タa および b を求める必要がある。ここでは,そうした検討 の一例としてDessaint et al.(1996)を紹介する。ヨーロッパ の5 ヶ国に設置された調査圃場において,3 ないし 4 ヶ年に わたり埋土雑草種子量が圃場当たり約100 個のコアサンプル で調べられた。その結果を年次,地域(国),雑草種を込み にして回帰分析を行い,平均値と分散の関係について         log s2=log 2.82+1.41・log m ・・・・・・・(5)′

という関係式を得た(r2=0.887)。(6)式に a=2.82,b=1.41 を代入すると,サンプル数と平均値,精度との関係は,       q=2.82・m−0.59/D2 ・・・・・・(6)′ となる。(6)′式を用いると,調査しようとする圃場の埋土種 子量の平均値m の見当がつけば必要サンプル数 q が求められ る。例えば,コアサンプル当たり平均で 1 粒以上の種子があ ると想定できるとする。目標精度D=0.2 の場合,q=2.82× 1/0.22=70.5 で必要サンプル数は 71 と計算される。  この方法は,一見有用なものに思える。しかし Dessaint et al.(1996)も認めているように,(5)式のパラメータ a およb は地域や年次により変動し,平均値と分散の関係は変動 が大きい。彼らが(6)′式を導く基となった分散 s2の対数値 と平均値m の対数値の散布図(Dessaint et al. 1996)を見ると, 同じ平均値m=1 の場合でも,分散 s2の範囲はおよそ1∼40 の範囲にあることがわかる。m=1 に対する s2の平均は確か に(5)′′式から2.82 と計算される。しかし,(5)′′式が分散s2 の対数変換値を目的変数とする回帰分析により求められてい るため,分散の大きい側の外れ値には鈍感な性質がある。ち なみに分散s2=40 の場合には,(3)式により必要サンプル数 q=40/0.22=1000 となってしまう。これは極端な数値例を用い て計算したものではあるが,こうした手法の限界として理解 しておく必要がある。  近年も欧米では埋土種子調査の必要サンプル数に関する研 究(Wiles and Schweizer 2002 ; Ambrosio et al. 2004 ; Wiles and Brodahl 2004 など)が行われているが,それらは空間統計学 の手法を取り入れ,圃場内の埋土種子の空間分布をより精密 に捉えようとする方向に向かっている。それらについては, 本稿の目的から外れるため,ここではこれ以上は触れないが, 後段の層別サンプリング法を適用する際にも,こうした空間 統計学の手法が有効な情報を与えてくれるはずである。

サンプリング計画の実例

1.事前情報の無い場合のサンプリング計画−逐次法とサ ンプルの混合  (3)式から明らかなように,必要サンプル数は調査対象圃 場における対象草種の種子量の平均値m とその標準偏差 s に よって,また要求される推定精度 D によって決まる。もちろ ん,どのような場合でもサンプル数が多いほど推定精度は向 上するが,埋土種子の分析には多くの時間と労力を要するた め,調査可能なサンプル数はそうした要因によって決まるこ とが多い。  サンプリング計画の前提として,1. 圃場 1 筆の平均種子量 を推定の目的とする(圃場内の空間的分布は興味の対象とし ない),2. 当該圃場の埋土種子量についての事前情報が一切 無い,3. 精度が低いのは許容せざるをえないが,事後のサン プリング計画のため精度についても情報を得たい,4. 土壌サ ンプリングのため現場に出掛けるのは1 回のみとする,の 4 つをおくことにする。  以上の前提のうち,1∼3 は特に説明を要しないだろう。前 提4 については,データが得られてみたら,圃場から取って きたサンプル数が目標精度にはるか及ばないことが明らかに なる場合もあると想定される。しかし実際には,サンプルか らの種子の回収,検鏡はサンプリングから時間をおくことが 多い。そこであらためて追加サンプルを取りに現地に出向い ても,すでに初回サンプル時の埋土種子相と同じではありえ ない。したがって,追加サンプリングは,特に多数の現地圃 場を対象とする場合には事実上不可能と考えられる。  このような状況で,現地圃場の埋土種子量についてより “ま し” な推定値を得る方法として,以下の様なサンプル数の決 定法が考えられる。  1. 労力などの制限要因から調査可能上限数 Q と下限調査 数q0(>1)を決める。  2. 対象圃場から,Q 個の土壌コアサンプルを無作為に採 取する注)

(5)

 3. Q 個の土壌サンプルから予め決めておいた下限調査数 q0個のサンプルを無作為に選び埋土種子を分析する。  4.  得られた q 個(最初は q0)のデータをもとに,平均値 m と標準偏差 s を推定し,(3)式で必要サンプル数 qDを求め る。  5. qDq の場合 : 調査終了。qDq の場合 : 1 個の追加サンプルを残ったサンプルから 無作為に選び埋土種子を分析する。4 へ戻る。 注)ここでは,サンプリング場所を圃場内で空間的にどう配 置するかについては扱わなかったが,推定精度を高めるため には,一般的に系統サンプリング(等間隔サンプリング)が 単純無作為サンプリングより優れるとされる(例えば久野 1986)。  このように,データを見ながら調査のサンプル数を加減す る調査法は,逐次(サンプリング)法と呼ばれており,古く から実用上の要求から研究が行われ,さまざまな調査打ち切 り基準が提案されている。一般に,逐次法では現場での利便 性を考え,グラフィカルなインターフェースが提案されてい る。例えば,グラフ上に調査サンプル数に対して累積カウン ト数を順次プロットし,プロットをつなぐ折れ線が予め決め られた調査打ち切り域に入った段階で調査を打ち切るなどで ある(例えば久野 1986 ; Berti et al. 1992)。  埋土種子調査の場合,分析自体は室内作業であること,ま た種子の分布に関する事前の情報が無いとする前提から,こ こではサンプルから計算される平均値m と標準偏差 s を元に 必要サンプル数qDを,その都度計算して調査の打ち切り点 を決める。この方法は,特定の種子分布を仮定せず,また計 算が容易である。ただし,サンプルから得られた平均値 m と 分散s2の除算によって必要サンプル数を得ている((3)式) ことから,m と s2の推定精度が低いと必要サンプル数q Dの 推定精度も低くなる点は注意が必要である。  このように逐次法は,平均値と分散の推定精度が低いと, 精度の悪い推定値であるにも関わらず,調査の打ち切りを判 断してしまう可能性もあるが,全く事前情報のない現地の埋 土種子調査にはおいては,省力性とともによりましな推定値 が得られる可能性のあるサンプリング法と考える。特に多数 の現地圃場を対象とした初動的な調査には有効性を発揮する と期待される。  逐次法を採用しても,当然のことながら,必要サンプル数 が調査可能上限数を上回る(qD>Q)場合は目標精度を達成 できない。サンプル数q を増やすことなく推定精度 D を上げ る(D の値を小さくする)ためには,(2)式から明らかなよ うに,平均値 m を大きくするか,標準偏差 s を小さくするこ とが必要となる。  平均値m を大きくする方法は,分析するサンプルの土の量 を増やすか,何らかの方法で種子を濃縮することが考えられ るが,後者は現実的ではない。土の量を増やすと,例えば, n 個の土壌コアを取り,それらを合わせて 1 サンプルとした 場合には,平均値は n 倍,標準偏差は n 倍になり,一定の q に対する精度D は 1/ n 倍に向上することが期待される。  しかしこの方法では,分析すべき土の量も n 倍となり,労 力的には,サンプル数を n 倍に増やしたのと大差がなく,メ リットは小さいかも知れない。  一方,分析すべき土の量を増やさずに標準偏差を小さくす る方法としては,1 個のコアサンプルをそのまま分析に供す るのではなく,n 個の土壌コアを取り,それらを十分に混合 してその一部を分析するという方法が考えられる。  今,1 つの圃場から Q・n 個のコアサンプルを無作為に採 取し,これを 1 次サンプルとする。それぞれの 1 次サンプル に含まれる種子数の分散をs2とする。次に,n 個の 1 次サン プルを1 組とする Q 組のサンプル群を得たとすると,s2Q 個のサンプル群内におけるn 個の 1 次サンプル間の分散 sn2と Q 個のサンプル群間の分散 st2に分割できる(より正確を期す なら,全体の平方和 S は,Q 個のサンプル群内における n 個1 次サンプル間の平方和 SnQ 個のサンプル群間の平方Stに分割できる,となる)。ここで,各サンプル群内の n 個の1 次サンプルを十分に混合・撹拌し,2 次サンプルを得 たとすると,2 次サンプル内部の種子の分布はランダムに近 くなることが期待される。i 番目のサンプル群内の n 個の元々1 次サンプル内の種子数の平均値を mi,その分散を sni2と すると,2 次サンプルから 1/n 量(1 次サンプル相当)のサブ サンプルを取ると,そこに含まれる種子数の頻度分布は平均 miのポアソン分布に従うことが期待される。したがって,サ ブサンプル中に含まれる種子数の平均値はmi,分散もまた mi となる。土中の埋土種子は集中分布することを前提とするな ら,misni2であるので,混合操作により 2 次サンプル内の 分散は,sni2−miだけ減少したことになる。もちろんサブサン プルの量は1/n より多いほど良い。また,労力が許すのであ れば,2 次サンプルから複数のサブサンプルを取ることも 2 次サンプルの撹拌が十分であったかをチェックする意味から も勧められる。  この方法はmiに比べてsni2が大きいほど有効性が増す。し たがって圃場全体の平均値にのみに興味がある場合は,圃場 全体の種子量のばらつきを,2 次サンプル内における 1 次サ ンプル間の分散sn2に,できる限り取り込むことが有効である。 具体的には,圃場に全体に渡って n 個のコアサンプルを系統 的に採取し,それを Q 回繰り返す方法が相対的に sn2を大き くできることからメリットが大きいと考えられる。  サンプルの混合操作を行う際に注意しなければならないの は,この方法はいわば疑似的な生データを作り出していると

(6)

いうことである。この方法を用いて推定された平均値は,従 来と同じく直接生データから推定された平均値と等しくなる が,分散はその限りではない。したがって,先行研究や前年 の結果と比較をする際に,先行研究や前年の結果で使われて いる分散が生データから直接推定されていた場合には注意が 必要である。あくまで精度のよい平均値を求める,つまり, 推定された平均値の信頼区間の幅を狭めたいときに,この方 法を使うようにすると良い。 2.事前情報がある場合のサンプリング計画―層別無作為 サンプリング 実際のところ,埋土種子が圃場内でランダムに分布している ほうがまれである。このような圃場から,単純無作為サンプ リングによって埋土種子量を推定すると,どうしても誤差が 大きくなってしまう。前年の発生状況や圃場周縁部の影響な ど,埋土種子が多く分布する部分と少ない部分が予想できる 場合は,圃場を種子量によっていくつかに分け,種子量の多 い部分と少ない部分ごとに平均値や分散を推定して,それら を後でまとめれば,精度が良くなることが期待できる。この とき,分けられたそれぞれのグループを層と呼び,層別した それぞれの層から無作為に標本を抽出する方法を層別(また は層化)無作為サンプリングという(山田・北田2004)。  層別無作為サンプリングの理論は単純である。層ごとに平 均値と分散を計算し,それらに各層の面積に応じた重みづけ を行って足し合わせるだけである。たったこれだけのことで, 精度が飛躍的に上昇する様子を以下に示す。まず,サンプリ ングユニットのN 倍の面積の圃場を L 個の層に分ける。分割 された各層はサンプリングユニットのN1, N2, …, Ni …NL倍の 面積を持つものとし,それぞれの層から q1, q2, …, qi, … qL(た だしqi, << Ni)個のサンプルを得るとする。また,第 i 層の 標本平均値をmi,分散を si2とし,圃場内全体の平均値を m, 分散をs2とする。このとき圃場全体の平均値は以下の式で推 定される。        

= = L i i i m W m 1 ここで,Wi=Ni/ N である。これは各層の平均値に重みをつけ た加重平均であることを示す。(2)式の分子,すなわち標準 誤差をSE で表すと,Niが十分に大きいものとすれば,    

SE = V m

( )

=

W

i 2

V m

i

( )

i=1 L

å

=

W

i2 i=1 L

å

s

i2

q

i である。  それでは実際にどのくらい精度が向上するのか計算してみ る。今,簡単のためサンプリングユニットの 500 倍の面積を 持つ圃場を考える。この圃場を埋土種子の多そうな層と少な そうな層の2 つに 2 対 3 の面積比で層別したものとする(つ まり,それぞれはサンプリングユニットの 200 倍および 300 倍の面積を持つ)。多そうな層から7, 8, 10, 11 の 4 つのデータ を,少なそうな層から 0, 0, 0, 1, 2, 3 の 6 つのデータを取った とする。まずは,これらのデータが単純無作為サンプリング によって得られたものして,埋土種子量とその標準誤差を推 定してみると,平均値 m は,m=(7+8+…+2+3)/10=4.2 となる。ここで,分散は,s2={(7−4.2)2+…+(3−4.2)2/(10 −1)=19.07 なので,推定精度 D は,  D=(s/ q )/m= 19.07/10/4.2=0.33 となる。  次に層別サンプリングの理論に従って埋土種子量とその標 準誤差を計算してみる。種子量が多そうな層の平均値をm1, 少 なそうな層の平均値をm2とすると,m1=(7+8+10+11)/4=9, m2=(0+0+0+1+2+3)/6=1 となる。先ほどの式だと,L=2, W1=200/500=0.4, W2=300/500=0.6 となるため,圃場全体の平均 値m は,m=0.4×9+0.6×1.67 = 4.2 と推定され,層別化しない 場合と全く同じ結果が得られる。しかし,その標準誤差を計 算してみると,層別無作為サンプリングの力がわかる。多そ うな層と少なそうな層の分散をそれぞれ,s12, s22として,s12={(7 −9)2+…(11−9)2/(4−1)=3.33,同様に s 22=1.6 である。このと き標準誤差は,SE= (200/500)2×3.33/4+(300/500)2×1.6/6=0.49 となり,推定精度 D は,D=SE/m=0.49/4.2=0.11 となる。層別化する前の精度は0.33 であったので,同じ努力 量にも関わらず,推定精度が 3 倍も向上できた。  この例では,各層の面積に比例したサンプル数を割り当て たが,分割した各層にどのように q1, q2, …, qi, qLを割り当てる かも,層別無作為サンプリングの推定精度に影響する。詳細 は成書(例えば山田・北田2004)を参照いただきたい。

精度と検出力

 ここまで精度D の値については,久野(1986)を引用する のみで,たとえば精度 D=0.4 の調査により,どの程度の情報 が得られるかについては論じないままであった。異なる圃場 間の埋土種子量の違い,あるいは同一圃場で作物の作付け前 後での埋土種子量の変化など,埋土種子量の違いを把握する ためにはどの程度の精度が要求されるのだろうか? あるいは 反対に埋土種子量の差がどの位あれば,実現可能な精度で検 出可能であろうか? ここでは,統計検定の検出力を指標と

= = L i i i m W m 1

= = L i i i m W m 1

(7)

して,精度 D の意味を具体的に検討したい。  第1 図は種子がランダムに分布する場合の平均値 m と必要 サンプル数q の関係((3)′式)を示すものである。ここでは, 圃場の種子分布の如何によらず,前段で述べた 2 次サンプルの 混合または層別サンプリングにおける層別が理想的に行われ, 分析サンプル間の種子数の頻度分布がランダム分布,すなわち ポアソン分布にきわめて近い状況を仮定して話を進める。  検出力の算出は,統計解析ソフト R(R Development Core Team 2010)上で,第 2 図に示すスクリプトにより行った。具 体的には,精度 D がほぼ一定になるようにさまざまな平均値 とサンプル数を組み合わせ,2 系統のポアソン乱数を発生さ せ,その平均値間の差をポアソン回帰により有意差検定を 行った。これを100,000 回試行し,有意となった回数を全試 行回数100,000 で割った値を検出力とした。  一例として,D=0.4の場合の結果を第1表に示した。例えば, 「平均1」が 4,「平均 2」が 0.5 と 2 つの平均値間に 8 倍の差 がある場合,目標精度 D=0.4 に対するそれぞれの必要サンプ ル数は2 と 13,検出力は 0.93 となる(第 1 表のグレー塗り の部分)。これから,D=0.4 では,8 倍の平均値の差があると ほぼ確実に平均値の差を有意差として検出しうるが,4 倍の 差であると7 割程度の検出力となることがわかる。言い換え れば,この精度では,4 倍の差を統計的に検出できない場合 が3 割程度存在するということである。  同様にD=0.2および0.1についても計算すると,D=0.2では, 4 倍の差はほぼ確実に検出できるが,2 倍の差であると 7 割 程度の検出力となった。D=0.1 では,2 倍の差をほぼ確実に, 1.41 倍の差で 7 割程度の検出力となった。この関係は精度が 一定であれば,平均値の絶対値によらずほぼ維持されている 第 2 図 平均値の検出力をR で計算するためのスクリプト: 任意の有意水 準p,目標精度 D,平均 1 ml および平均値間の差 tを指定することで,目標 精度を満足するための必要サンプル数を平均1 および平均 2 に対して計算 する。次いで平均1 および平均 2 それぞれについて必要サンプル数のポアソ ン乱数を発生させ,それらの間の有意差検定をポアソン回帰により行った。こ れを100,000 回試行し有意となった回数を全試行回数で割った値を検出力と した。サンプル数一定の場合の検出力の計算には,q1およびq2に定数を代 入する(例えば,“q1<−3”) 第 1 表 目標精度D = 0.4 の場合の必要サンプル数と平均値の差の検出力(p = 0.05) 平均11) (/ サンプル) 必要サンプル数D = 0.4 に対する2) 実精度 平均21)(/ サンプル) 0.0625 0.125 0.25 0.5 1 2 4 8 16 (2) 0.177 >0.99 >0.99 >0.99 >0.99 >0.99 >0.99 0.98 0.65 8 (2) 0.250 >0.99 >0.99 >0.99 >0.99 >0.99 0.90 0.39 4 2 0.354 >0.99 >0.99 0.98 0.93 0.71 0.28 2 4 0.354 >0.99 0.98 0.93 0.71 0.26 1 7 0.378 0.97 0.90 0.65 0.25 0.5 13 0.392 0.88 0.65 0.26 0.25 25 0.400 0.62 0.24 0.125 50 0.400 0.24 0.0625 100 0.400 1) 比較しようとしている2 つの平均値の内,大きい方を「平均 1」,小さい方を「平均 2」で表した(以下同様)。 2) ( )付きの数字は,必要サンプル数が 1 以下と計算されたことを示し,それらに対する検出力はサンプル数を2として計算し た参考値である。

(8)

ので,サンプル数を決める際の目安として覚えておくと有用 である。  ところで,第 2 図のスクリプトを用いると,サンプル数一 定の場合の平均値の差の大きさによる検出力の違いも計算で きる。これは埋土種子量に関わる実験を計画する際に有効な 情報となる。  実験の場合,基本的にはプロット内の分散に関する情報は 不要なので,1 プロットから 1 つの代表値を得れば事足りる。 したがって,労力が許す限り多数の 1 次サンプルをプロット 内から採取し,1 つにまとめて十分混合した 2 次サンプルか らサブサンプルを得る方法が現実的と思われる。プロットを 実験圃場内にブロック化して配置することで,プロットの代 表値の分布がポアソン分布に従うと仮定し,同様にシミュ レーションを行った。一例として,反復数 3 の場合の結果を 第2 表に示した。2 つの平均値のうち,小さい方が 0.25 程度 であると,9 割以上の検出力には 16 倍程度の差が必要なこと がわかる。同様に,小さい方が 0.5 ないしは 1 程度であれば 8 倍,2 ないし 8 程度であれば 4 倍,16 程度であれば 2 倍の 差が必要となる。  以上,2 つの平均値の比較の場合について検出力を考えた。 実験の場合,2 つ以上の平均値の比較を行うケースもあると 思われる。その場合,1 対 1 の比較よりも検出力は当然劣る ため,検出力を維持するためにはさらに多くの反復数が必要 となる。これを避けるには,実験計画の段階で標準区と各処 理区の比較など1 対 1 の比較を繰り返せる設計を考えること も有効である。

お わ り に

 以上,埋土種子調査のためのサンプリング計画,特に必要 サンプル数の問題を論じた。ここで述べた方法を効率的に組 み合わせれば,いくらかの必要サンプル数の低減,または調 査結果の精度向上が可能なはずである。また,得られたデー タの精度から推論できる範囲がより明確になるだろう。埋土 種子調査におけるさまざまな制約や手法的困難さを理解した うえで,データを蓄積することが雑草の発生予測や管理対策 の提案,動態の追跡に対して多くの示唆をもたらすことを忘 れてはならない。

 本稿で紹介した,Taylor’s power law による平均値−分散関 係のサンプリング計画への活用は,現状では必ずしも十分な 成果をもたらしているとは言い難い。しかし,こうした関係 性に対する,圃場の土質土性,耕耘作業を初めとした耕種管 理,雑草種子の大きさや寿命,散布器官型といった要因との 関係が整理されれば,より有効性を高めうる可能性も考えら れる。埋土種子調査の効率化のためには,国内においてもこ うしたデータの蓄積が必要となろう。  埋土種子調査の精度を上げるためには,何よりもサンプル 数を増やすことが直接的で効果が大きい。そのためには調査 に要する時間と労力といった総体のコストの低減が必要であ る。しかし,土壌サンプルから種子量データを得る分析過程 の急速な簡便化,自動化は困難と思われる。他方,圃場での 土壌サンプリングの過程(あるいはこれに加えて,混合−サ ブサンプリングの過程)については,現在の技術でもニーズ さえあれば自動化によるコスト,特に作業時間の削減は可能 かも知れない。埋土種子調査に対するニーズは,埋土種子調 査によって得られるデータの生産現場における有用性が決定 すると考える。埋土種子調査データの有用性を高める上では, 埋土種子量と発生量,雑草害,防除手段に対する反応など体 系的な情報が,不可欠と思われる。本稿が,こうした研究の 一助となればと期待する。

謝   辞

 本研究は,農業・食品産業技術総合研究機構交付金プロジェ 第 2 表 反復数3 の場合の平均値の差の検出力(p = 0.05) 平均1 (/ サンプル) 反復数 精度 平均2(/ サンプル) 0.25 0.5 1 2 4 8 16 32 64 3 0.072 >0.99 >0.99 >0.99 >0.99 >0.99 >0.99 >0.99 >0.99 32 3 0.102 >0.99 >0.99 >0.99 >0.99 >0.99 >0.99 0.98 16 3 0.144 >0.99 >0.99 >0.99 >0.99 >0.99 0.82 8 3 0.204 >0.99 >0.99 >0.99 0.93 0.53 4 3 0.289 0.97 0.90 0.71 0.31 2 3 0.408 0.68 0.47 0.21 1 3 0.577 0.31 0.17 0.5 3 0.816 0.10 0.25 3 1.155

(9)

クト研究「難防除雑草の埋土種子診断と個体群動態−経済性 評価統合モデルに基づく総合的雑草管理(IWM)の検証」の 研究課題として実施された。

引用文献

Ambrosio, L., J. Dorado and J.P. Del Monte 1997. Assessment of the sample size to estimate the weed seed bank in soil. Weed Res. 37, 129-137.

Ambrosio, L., L. Iglesias, C. Marin and J.P. Del Monte 2004. Evaluation of sam- Evaluation of sam-Evaluation of sam-pling methods and assessment of the sample size to estimate the weed seedbank in soil, taking into account spatial variability. Weed Res. 44, 224-236.

浅井元朗・大段秀記・市原実・石田義樹2010.麦作における難防除

雑草の埋土種子調査法.雑草研究 55, 218-227.

Barralis, G., R. Chadoeuf and J-P. Gouet 1986. Study of the size of the sampling

for the study of the buried weed seed bank. Weed Res. 26, 291- 297(in

French with English summary).

Berti, A., G. Zanin, G. Baldoni, C. Grignani, M. Mazzoncini, P. Montemurro, F. Tei, C. Vazzana and P. Viggiani 1992. Frequency distribution of weed counts and applicability of a sequential sampling method to integrated weed management.  Weed Res. 32, 39-44.

Chauvel, B., J. Basquez and H. Darmency 1989. Changes of weed seed bank parameters according to species, time and environment. Weed Res. 29, 213

-219.

Dessaint, F., G. Barralis, E. Beuret, M.L. Caixinhas, B.J. Post and G. Zainin 1990.  EWRS collaborative study of seed bank estimation : Studies of the relation between the mean and the variance with sampling procedure. Weed Res. 30, 421-429(in French with English summary).

Dessaint, F., G. Barralis, M.L. Caixinhas, J-P, Mayor, J. Recasens and G. Zanin

1996. Precision of soil seed bank sampling : how many soil cores ? Weed Res. 36, 143-151.

Goyeau, H. and G. Fablet 1982. Study of the buried weed seed bank : the sam- Study of the buried weed seed bank : the sam-Study of the buried weed seed bank : the sam-pling problem. Agronomie 2, 545-552(in French with English summary).

Jones, N.E. 1998. The number of soil cores required to accurately estimate the seed bank on arable land. Asp.App.Biol. 51, 1-8.

小林浩幸・渡邊寛明2010.雑草研究における埋土種子調査の目的と

手法.雑草研究 55, 194-207.

久野英二1986.「生態学研究法講座 17 動物の個体群動態研究法 I −

個体数推定法−」.共立出版,東京,pp. 55-57.

Leck, M.A., V.T. Parker and R.L. Simpson 1989. Ecology of Soil Seed Banks.  Academic Press, San Diego, pp. 461.

Lopez, C., P. Abramovsky, J. L.Verdier and J.Mamarot 1988. Estimation of seed stock during a trial study of the influence of cultural systems on the development of the weed flora. Weed Res. 28, 215-221 (in French with English summary).

西沢正久1978.標本調査法 . 応用統計ハンドブック編集委員会編「応

用統計ハンドブック」,養賢堂,東京,pp. 706-722.

R Development Core Team 2010. R : A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0, URL http://www.R-project.org.

澁谷知子・中谷敬子・中山壮一・小林浩幸2010.ダイズ作における

重要雑草の埋土種子調査法.雑草研究 55, 208-217.

Simpson, R.L., M.A. Leck and V.T. Parker 1989. Seed Banks : General Con- Seed Banks : General Con-Seed Banks : General Con-cepts and Methodological Issues. In “Ecology of Soil Seed Banks” ed. by M.A. Leck, V.T. Parker and R.L. Simpson, Academic Press, San Diego, pp. 3-8.

住吉正・小荒井晃・川名義明・牛木純・赤坂舞子・渡邊寛明2011. 水

稲作における難防除雑草の埋土種子調査法.雑草研究 56, 43-52.

高柳繁2004.関東黒ぼく土地帯における主要一年生畑夏雑草の定量

的発生予測.中央農業総合研究センター研究報告5, 23-58.

Taylor, L.R. 1961. Aggregation, variance and the mean. Nature 189, 732-735.

Wiles, L. and M. Brodahl 2004. Exploratory data analysis to identify factors influencing spatial distributions of weed seed banks. Weed Sci. 52, 936-947.

Wiles, L. and E. Schweizer 2002. Spatial dependence of weed seed banks and strategies for sampling. Weed Sci. 50, 595-606.

山田作太郎・北田修一 2004.「生物統計学入門」,成山堂,東京,pp. 165-169.

Yamamura, K. 2000. Colony expansion model for describing the spatial distribu- Colony expansion model for describing the spatial distribu-Colony expansion model for describing the spatial distribu-tion of populadistribu-tions. Popul. Ecol. 42, 161-169.

山村光司2002.正しい分散分析結果を導くための変数変換法.植物

防疫56, 436-441.

Zanin, G., A. Berti and M.C. Zuin 1989. Estimation of the seedbank in cultivated and direct drilled systems. Weed Res. 29, 407-417(in French with English

参照

関連したドキュメント

interaction abstract machine token passing on fixed graph. call

“top cited” papers of an author and to take their number as a measure of his/her publications impact which is confirmed a posteriori by the results in [59]. 11 From this point of

This article is organized as follows: In section 2, the model coupling 3D Richards equation with the Dupuit horizontal approximation is introduced; consequences taking

Theorem 2 If F is a compact oriented surface with boundary then the Yang- Mills measure of a skein corresponding to a blackboard framed colored link can be computed using formula

We extend some of the results of Pfaffelhuber and Wakolbinger on the process of the most recent common ancestors in evolving coalescent by taking into account the size of one of the

We show some symmetry relations among the correlation functions of the in- tegrable higher-spin XXX and XXZ spin chains, where we explicitly evaluate the multiple integrals

Then it follows immediately from a suitable version of “Hensel’s Lemma” [cf., e.g., the argument of [4], Lemma 2.1] that S may be obtained, as the notation suggests, as the m A

Shi, “The essential norm of a composition operator on the Bloch space in polydiscs,” Chinese Journal of Contemporary Mathematics, vol. Chen, “Weighted composition operators from Fp,