役に立つデータは身近なところに
お客様の声 #001 農林水産省様
メディアチャンネル末吉の新刊『テキストマイニング入門 ExcelとKH Coderでわかるデータ分析』のエッセンスをお伝えする勉強会「テキストマイニングで実現する文章データの分析&データ活用術」が農林水産省で開催されました。
当日は、農林水産省 政策統括官付総務・経営安定対策参事官付 参事官補佐の原田様の呼びかけにより省内の様々な部局から42名の方々にお集まりいただき、文章を分析することの意義から手法にいたるまで、テキストマイニングツールを用いた実習を交えながら体感していただきました。
省内には、報告書や議事録、白書、法案など、ボリュームのある文章を扱う業務が多く存在するとのこと。
今回、本勉強会を企画・運営してくださった原田様から、農林水産省におけるデータ活用の現状や展望についてお話を伺いました。
組織全体で知識と技術のボトムアップを図りたい
株式会社メディアチャンネル 末吉美喜(以降 S)本日はどうもありがとうございました。早速ですが、今回のテキストマイニング勉強会を企画された理由や経緯についてお話いただいてもよいですか?
農林水産省 原田達様(以降 H)私は元々、数学が好きだったこともあって、定量的なデータ分析を業務で活用できないものだろうかと考えていました。
その延長で、テキストマイニングも自分でやってみようと考え、まずはプログラミングで形態素解析のコードを書こうとしたのですが、そこに労力を割くことができないままでした。
そのような折に、書店でテキストマイニングの本(「テキストマイニング入門 ExcelとKH Coderでわかるデータ分析」)を見つけ、すぐに購入して自宅でKH Coder(テキストマイニングツール)をインストールして使ってみたのが始まりです。
S: お買い上げありがとうございます(笑)。 拙著を読まれて、すぐにテキストの分析はできましたか?
H: 簡単にできてしまい、KH Coderの敷居の低さに大変驚きました。
書籍で紹介されている具体例(満足度調査のテキスト分析)が、我々の業務でもすぐに活用できそうだと感じ、私以上にテキストデータを活用する可能性が高い省内の多くの職員にも情報を共有したいという思いから、勉強会を企画しました。
S: ご自身が良いと思ったものを組織全体で共有しようとされる姿勢が素晴らしいですね。
H: 私が現在所属している組織だけでなく、このような有用な知識や技術を、もっと活用してもらえる場所があるはずだと考えたからです。
農林水産省には多くの部局があります。農地や作物のデータを扱う統計部もありますが、例えば、消費トレンドも踏まえた企画を考える食料産業局のような組織もあります。
そのような立場の職員にこそ、テキストデータを有効に活用してもらいたいと思いました。
議論のプロセスと内容がテキストマイニングで視覚化されて明快に
S: 原田様ご自身は実際の業務でテキストマイニングをされましたか?
H: 末吉さんの本を参考にしながら、議事録をテキストマイニングで分析し、アウトプットとなる対応分析の図を関係者に共有しました。
米政策に関する会議の議事録でしたが、分析結果と自分たちが経験した思考プロセスとが合致した内容だったことに感動しました。
最後の会議で議論にまとまりが見えて収束したという経緯が、数値とグラフで明らかになったのは実に爽快でした。
S: 分析結果を共有することにより、何か反応はありましたか?
H: その分析アウトプットを見た上司や同僚から、「こういう分析をもっとやって欲しい」と、関心を持ってもらえたので、会議や文章の内容を他の人に理解してもらうときの判断材料としても有効なのだと実感しました。
このような経緯もあり、今回の勉強会の開催によってテキストマイニングが省内で広がるきっかけになればと考えています。
S: 農林水産省のホームページを拝見すると、統計情報が提供されています。それらの統計データはテキストマイニングの対象になりそうでしょうか?
H: 統計情報として公開されているのは、作付け面積や収穫量、家畜の頭数などの定量データになりますので、残念ながら単独ではテキストマイニングには適用できないかもしれませんね。
例えば、「坪狩り(調査)」と言って、一坪あたりに作物が何把植えられていて、一本の稲から何粒の米が収穫できるか、どれくらいの収量が見込めるか、といったデータです。
それらは伝統的に収集されているデータであり重要だと思う一方、現在のIT技術を見据えた活用という点が分断されているようにも感じます。
最近は、EBPM(Evidence-based Policy Making、エビデンスに基づく政策立案)が求められているので、時代に合わせてデータの内容と収集の仕方を進化させる必要があるかもしれませんね。
データという根拠にもとづく施策設計を
S: 原田様の普段のお仕事では、どのようなデータを扱っていますか?
H: 私は、農林水産省のなかでも、主に米・麦・砂糖といった土地利用型農業を担当している組織で、国会・予算・人事をはじめとする組織内の取りまとめをしています。
施策の企画や立案、法令案の作成など、省内には多岐にわたる業務がありますので、具体的にどのようなデータを扱っているかよりも、 「どのように」データを扱うかを考えていると言ったほうが分かりやすいかもしれませんね。
S: データ分析の指針となる大切な部分ですね。具体的な事例があれば、教えていただいてもよいでしょうか?
H: 最近ですと、ある作物の需要に関する将来予測をする案件がありました。
普段は直線の近似値による予測をしていたのですが、時系列分析(ARIMAモデル)による予測結果を示したところ、関係者から喜ばれたことがあります。
S: 予測精度の向上に貢献されたのですね。
H: また別件ですが、イベント開催時のアンケート分析の事例もあります。
農林水産物をPRするイベントなどで参加者の満足度をアンケートで調べることがあるのですが、ただ満足度を確認して終わるのではなく、「どれくらいの人に波及効果があったのか」つまり、どれだけの人が良いと言い、どれだけの人がその後に具体的なアクションを起こしたかを常に念頭に置きながら事業を進めるべきだと考えています。 そのためにも、過程をデータとして客観的に認識できるよう、企画段階からきちんと設計しておくことの重要性を発信しながら業務に取り組んできました。
政府全体でも、ビッグデータやAIという言葉が頻繁に話題に挙がると共に、省内でデータに基づく施策の設計が徐々に広がってきたことを実感しています。
データを有効活用して再生回数が過去最高数に
S: 定量的な効果測定をもとにした施策につなげるために、データの活用を積極的に推進していらっしゃるのですね。
H: はい。デジタルマーケティングの流れの中で、農林水産省もYouTubeで動画を配信しているのですが、 より多くの人に視聴してもらわなければ意味がないと考え、広告配信の仕組みを先駆けて取り入れました。
ただ動画を流すだけではなく、適切な方策を採用し、どのような属性の方々に向けて配信するのかを指定したり、 どのようなキーワードで検索したのかを調べたりしてデータを積極的に利用することにより、事業の効果を定量的に説明することができました。
ちなみに、動画の再生回数も省内で過去最高を記録しました。
S: 過去最高数!差し支えなければ数字をお伺いしたいです。
H: 約88万PVです。全国の生産現場の想いを伝える内容だったので、その結果、生産者と購買者の懸け橋として貢献できたなら本望です。
残念ながら、現在は著作権の関係により動画そのものは別のバージョンになってしまっているのですが、プロジェクトのホームページから各動画への動線は残っています。
http://shirutteoishii.com/
S: 素晴らしい取り組みですね。
H: 本件は既存のサービスを活用してデータを利用した一例にすぎません。実際の施策についても、統計というツールを用いることによって客観的に現状を再認識できると同時に、 自分たちの考えや想いとは異なる気づきが得られる可能性があるということを職員全体の共通認識にできればと願っています。
統計的視点による客観的な評価軸をもつことが農林水産省全体の能力アップにつながり、より良い施策の提案・実施を通して国民の皆様にも貢献できるはずだと信じています。
身近にあるデータでも、視点を変えれば新たな気づきが得られるもの
S: 職員の方々がデータ分析に関するスキル向上の意欲と高い意識をお持ちだということが今回の勉強会を通して伝わってきました。
最後になりますが、今回の勉強会の感想をお聞かせいただけるでしょうか?
H: テキストマイニングという手法の概念と、ツールを使ってどのようなことができそうかを知ることができたのは参加者にとって大きな収穫でした。
文章の評価や分析は情緒的になりがちですが、文章データを定量的な指標によって説得材料・エビデンスにできるというのは目から鱗だったという声もありました。
実習を通してテキストマイニングの分析結果を実際の仕事に活かしていくイメージを持つことができましたので、ぜひ実践につなげてほしいですね。
S:どのような業務に活かしていただくことができそうでしょうか?。
H: 一例になりますが、最もイメージしやすいのはアンケートの分析ですね。
農林水産省関連のイベント参加者向けアンケートや研修アンケート、そして白書の内容にもテキストマイニングが利用できるのではないかと考えています。
これまでは、自由記述欄を十分に分析できないことにもどかしさを感じていましたが、どのような層が、どのような内容に関心があるのか、ポジティブ・ネガティブな反応を示すのか、 といった一歩踏み込んだ分析が「自分たちの手でもできる」と体感することができて良かったと思います。
また、法律の特徴や傾向の分析、国会の議事録や、生産現場からの情報をまとめる際にも役立てられそうです。
英語の文書でテキストマイニングを実施する予定だという参加者もいました。
S: 様々な業務・場面で利用機会がありそうですね。分析の結果をぜひ拝見させていただけると嬉しいです。
今回、テキストマイニングの勉強会を開催していただき、また勉強会を企画・運営してくださった原田様にインタビューさせていただいた中で最も印象に残っているのは、身近なデータを大切に扱い、役立てようとする意識の高さでした。
情報洪水の時代において、どんどん流れ込んでくるビッグデータとAIの力を駆使して効率化を目指す動きがあり、もちろん農林水産省にも多種多様なデータが存在しています。その状況を踏まえた上で、「ビックデータではなくても、AIに至らなくても、役に立つデータは身近なところにあるものです」と原田様。
たとえ少数であっても、生産者や消費者、あるいは議員や省内職員など、農林水産に関わるあらゆる現場の声を拾って政策に活かそうとする姿勢が伝わってきました。
テキストマイニング勉強会には、統計や研究開発に携わる職員の方々だけではなく、政策、広報、国際経済、農村計画、森林利用、食品流通・食品安全など、私たちの日々の生活に関わる様々な部局からご参加いただきました。
日本の「食」を支える農林水産省に届けられる国民の声や文章データが、テキストマイニングの実践によって日本の食文化・食生活の更なる向上にむけて有効活用されることを期待しています。