• 検索結果がありません。

中央農研ニュース No.70

N/A
N/A
Protected

Academic year: 2021

シェア "中央農研ニュース No.70"

Copied!
2
0
0

読み込み中.... (全文を見る)

全文

(1)

研究情報

耳より情報

商品の改良・新商品開発につながるヒントを発見 するために、最近、商品に関する感想や質問などの 「言葉」に関するデータ(テキストデータとよびま す)が活用されるようになってきました。しかし、 大量のテキストデータを人力で解析すると膨大な時 間が必要になるだけでなく、その作業を複数の人で 分担すると解析方針に一貫性が無くなります。そこ で、コンピューターによって大量のテキストデータ から効率的に知見を見つけ出すテキストマイニング と呼ばれる技術の導入が進んできています。 テキストマイニングは、1)テキストデータの内 容を抜き出し(言語処理)、2)統計的手法により 必要な知見を見つけ出す(マイニング)ものであ り、新聞記事等の推敲されたテキストデータの高速 な解析を可能にしてきました。これまでに多くの言 語処理ツールが公開され広く利用されていますが、 農産物に関するテキストデータへ利用した事例はま だ少ない状況にあります。 インターネット通販の野菜商品レビュー(購入者 の感想)は農産物に関するテキストデータの一つで あり、それらを解析することで利用者の嗜好など販 売促進に関する多くのヒントを得られると期待でき ます。そのため私たちは、まず、既存の言語処理 ツールで農産物に関するテキストデータの内容が高 精度で抜き出せるかを、ネット通販の野菜商品レ ビュー(購入者の感想)に用いて確認してみまし た。 商品を購入した人が実際にどのような感想を持っ たかは、この「購入者の感想」を言語処理して抽出 したキーワード(名詞・動詞・形容詞に限定)で表 現できると仮定しました。例えば、「安納芋は美味 しくない」という文章の場合は「安納芋、美味しく ない」が記述内容を表現するキーワードと判断でき ます。しかし、既存の言語処理ツールをそのまま使 う と、“安 納 芋”は“安”・“納”・“芋”と、 “美味しくない”は“美味しい”・“ない”と分割 されてしまうため、キーワードは「安、納、芋、美 味しい」となり、書いてある内容を正確に表現でき ません(例1)。したがって、このような問題を解 決するためには、「安納芋」のような一つの言葉を 抜き出したり、「美味しくない」の「ない」のよう な否定の意味を落とさない処理が必要となります。 また、このような処理をした場合でも、例えば、 「安納芋は美味しくない」と同じ意味である、「安 納芋は旨くない」はキーワードが「安納芋、旨くな い」となるため、2つの文章の内容が同じと判定さ れません(例2)。このため、“美味しい”と“旨 い”を同じ意味として抜き出す処理が必要となりま す。 農産物に関するテキストデータには、品種名など 新聞記事にあまり出てこない単語が多く出てきたり (サツマイモの品種の一つである“安納芋”もその 一 例 で す)、品 種 名 な ど の 表 記 が 複 数 あ る こ と (例 ;“安 納 芋”は“安 の う 芋”や“あ ん の う い も”と表されます)がありました。 以上のように、農産物に関するテキストデータは 独特であることから、既存の言語処理ツールだけで は「購入者の感想」の内容を正しく抜き出すことが できませんでした。したがって既存の言語処理ツー ルを利用する際には、少なくとも農産物の用語や用 語間の関係の情報(例;“安納芋”がサツマイモの 品種を示す一つの用語であるということ、“安納 芋”と“あんのういも”が同じ意味であること)が 必要と判断しました。 今後は、これらの結果をもとに農産物に関するテ キストデータの解析精度を向上させ、必要な情報を 抜き出す方法を確立する予定です。

研究情報

「言葉の山」から価値ある情報を探し出す

情報利用研究領域

竹崎あかね

NARC NEWS No.70 2015.7

1

No.

70

2015.7

例1 安・納・芋・は 美味しい・ない 安納芋・は 美味しくない 安納芋は美味しくない 例2 安納芋は旨くない 安納芋・は 旨くない 安納芋・は 美味しくない <既存のツールを 用いた言語処理のみ> <追加処理_1> 語の抜き出し 否定の意味追加 <追加処理_2> “旨い”と”美味しい” を同じ意味で抜き出し <追加処理_1> 語の抜き出し,否定の意味追加

(2)

ウシの乳量などを高めるための形質改良にはこれ まで長い年月がかかってきました。たとえば、乳量 の多い雌牛をつくるための優良な種牛(雄親)を選 ぶ場合、種牛候補の雄牛は乳を出さないので、雌牛 と交配して産まれた多数の娘牛の乳量を調べないと どの雄牛が優良なのかわかりません。そのため、こ れまでの方法では、新たに優秀な種牛ができるまで に5年以上の時間を要していました。また、この方 法ではその間種牛になれなかった雄牛についても飼 育しておく必要があり、餌代等の多大な経費がかか るという問題がありました。 一方、最近では家畜の遺伝子情報が容易に得られ る状況になっています。それにより候補の雄牛から DNA検査によって優良な雄牛を選ぶことができるよ うになったことから、時間もコストも大幅に削減で きるようになりました。実際この方法はすでに米国 やカナダなどの乳牛の形質改良において利用されて おり、新しい種牛の育成期間が2年程度と大幅に短 縮され、種牛の候補個体の飼育コストも不要とな り、効率的な方法であることが実証されています。 このような遺伝子情報を用いた効率的な形質改良法 は、イネ、野菜、果樹等の作物への展開も期待され ています。 (情報利用研究領域 林 武司)

耳より情報

NARC NEWS No.70 2015.7

2

図.DNA情報の活用による育種年限の短縮. 上側:DNA情報を用いた場合の種牛育成期間、下側:従来の育種法を用いた場合の種牛育成期間

遺伝子情報を活用した効率的な品種改良

編集・発行 国立研究開発法人 農業・食品産業技術総合研究機構(農研機構) 中央農業総合研究センター(中央農研) 〒305-8666 茨城県つくば市観音台3-1-1 Tel. 029-838-8421・8981(情報広報課) Web http://www.naro.affrc.go.jp/narc/

中央農研ニュース

No.70 (2015.7)

遺伝子情報を 用いた場合 従来の 育種法の場合

参照

関連したドキュメント

であり、 今日 までの日 本の 民族精神 の形 成におい て大

・また、熱波や干ばつ、降雨量の増加といった地球規模の気候変動の影響が極めて深刻なものであること を明確にし、今後 20 年から

北区で「子育てメッセ」を企画運営することが初めてで、誰も「完成

   遠くに住んでいる、家に入られることに抵抗感があるなどの 療養中の子どもへの直接支援の難しさを、 IT という手段を使えば

自然言語というのは、生得 な文法 があるということです。 生まれつき に、人 に わっている 力を って乳幼児が獲得できる言語だという え です。 語の それ自 も、 から

良かった まぁ良かった あまり良くない 良くない 知らない 計※. 良かった まぁ良かった あまり良くない

下山にはいり、ABさんの名案でロープでつ ながれた子供たちには笑ってしまいました。つ

えんがわ市は、これまで一度も休 まず実施 してきたが、令和元年 11月 は台風 19号 の影響で初 めて中止 となつた。また、令和 2年