根拠に基づく将来予測
オープンデータ活用講座

はじめに

講座第2弾では「より公共性の高い話題」を採用

 昨年、ビッグデータ分析に関する一連の記事をまとめ、マイナビ出版から「Excelからはじめるビッグデータ分析」を上梓いたしました。この本の中で、流通関連のデータを使用した分析手法を紹介しましたが、特定分野に限定した内容であると受け取った方も多かったと聞き、分析のことを理解するための一助と本当になり得たのか、不安になりました。さまざまなことを考えた結果、もっと幅広い層の方々にデータ分析に関する興味を持ってもらうための題材を採用し、新たに第2弾のデータ活用講座を開くこととしました。
 興味を持っていただくためには、より身近にある話題を採り上げることが重要です。例えば、幼いお子様のいる家庭では、教育機関や公園などの公共施設の有無といった居住地域の環境、感染症などの子どもが罹りやすい病気という話題に敏感でしょう。高齢者の方にとっては、自身の余命や年金のことが気がかりです。このように、多くの方に興味を持っていただくために、公共性の高い話題を率先して採り上げようと考えています。

本講座の主役「オープンデータ」とは

 では、そうした公共性の高い話題に関連するデータは、どのようなもので、どこに存在するのでしょうか。先ほどの例で言えば、居住地域の環境についてのデータは、自治体が把握しています。病気に関しても、自治体あるいは国にデータが蓄積されています。余命や年金についても、同様です。このように、公共性の高いデータは、自治体や国が収集し・管理している場合がほとんどです。そして、そうしたデータの中にはオープンデータとして開示されているものもあります。
 このオープンデータには多くの種類がありますが、2つに大別されます。一つは、大気環境や気象などの測定データや施設などの位置情報に代表される、特別な処理を行っていないデータ(RAWデータ)です。もう一つは、調査などの集計結果に代表されるデータ(集計データ)です。オープンデータの場合、これらのデータには、情報保護の観点から個人情報や企業情報は含まれていません。
 ただし、集計データを作成する前の調査データはRAWデータですから、個人情報や企業情報が含まれていることがあります。また、国が実施しているような調査ともなると、データが膨大になり、RAWデータですがビッグデータの領域に入ってきます。

Excelで実現!オープンデータの活用

 オープンデータを利用したデータ分析の場合、分析の精度を上げるためには、いろいろなデータを組み合わせることが不可欠になります。目的とするデータがない場合は、RAWデータ(調査データ)などを使うなどの工夫が必要です。
 今回の「オープンデータ活用講座」では、より多くの方にデータ分析への興味を持っていただくために、公共性の高い話題に関連したオープンデータを活用いたします。目的に適合するデータがない場合は、どのようなRAWデータを使い、どのようにデータを揃えると良いのかを提示します。また、分析に関しては、現状分析だけでなく、対策の考察まで含めた将来推計を行い、幅広い層の方々に有益となるような記事をめざします。さらに、今回の講座でもExcelを使用します。目指すのは、「Excelで実現!オープンデータの活用」です。

どうぞよろしくお願いいたします。
< オープンデータ活用講座 トップ
1.オープンデータの活用(1) >
未来を作る意思決定に。新世代統計集計システム【Z-Adam】