コラム  著者:麻生川 静男

はじめに  


【第28回】データマイニング・夜話
(その十:子供の頃わくわくした事)


コラムTOPへ戻る

世間では、データ活用といえば、つい数年前までは、統計解析が主流でありましたが、現在では、データマイニングという単語が流行しています。
しかし、そのデータマイニング、なんだか分かりにくく登場そうそう、どうもとても怪しげな雰囲気を感じている人が多いように感じます。

私は、十数年前にニューラルネットワークのツールビジネスを契機としてこのデータマイニングのビジネスにかかわりをもちました。
当初(1992年)、日経インテリジェントシステムという雑誌に、データマイニングに使えるツールを紹介する記事を投稿したところ、編集長からは、次のような小言を言われました。
データはさておき、『マイニング』という単語自体が日本語として馴染みない、このマイニングの説明をしてくれ、と。

そこで私は次のような説明をつけました。

『...このData Base Mining(当時販売していたデータマイニングソフトの名称)は、その名の通り数値データを主体とするデータベースから有用な情報を“発掘”することを目的としている。
それはちょうど、地中に埋もれている金や銀、ダイヤモンド、チタンなどの貴重な鉱物資源も、発掘しなければいつまでたっても人間には役立たないのと同じことである。
近年、情報化といわれているが、その実体はなんでもかんでもとにかくデータを収集して、ディスクあるいはテープに情報をただ大量に蓄積している傾向が強い。
しかし、これらのうち果たしていくらが本当に有益な情報をもたらしてくれるであろうか?』

正式に調べた訳ではありませんが、日本でデータマイニングに関わる『マイニング』という定義を初めて与えたのがこの文章であろうと私はひそかに確信しています。

それから、私は、大量データを保有するクレジットカード会社や通信販売会社などのデータマイニングのプロジェクトを幾つもこなしました。
当初は手探り状態でしたが、その内自分なりの実践的な『データマイニング道』を会得するに至りました。

さて、それから十年以上の歳月が過ぎ、データマイニングという言葉自体は世間では、周知の単語となりましたが、どうも必要以上の期待感を抱いている人やら、よく理解できていないが単語だけを景
気良く連発している人などに数多く出会いました。

一方、ツールを購入したり、コンサルタントを頼んだりしてデータマイニングのプロジェクトを遂行してみたが、期待はずれに終わり、データマイニングに逆に不信感を抱いている人もいることでしょう。

このような状況に対して、私としてはデータマイニングの正しい姿、適用限界、実際のデータマイニングでのヒントなど私の経験の範囲内で、お伝えしたいと思いました。
従いまして、本項は必ずしもデータマイニングを網羅的、学術的に説明するものではないことをあらかじめご了解ください。

麻生川 静男
TOPへ


Copyright © 2004 Zetta Technology Inc. All rights reserved.