コラム「どこかおかしいよ、データマイニング!」麻生川 静男


【第7回】ニューラルネットワークについて(その一)  


【第28回】データマイニング・夜話
(その十:子供の頃わくわくした事)


コラムTOPへ戻る

データマイニングでは様々なデータ分析手法が使われます。その中でも特によく使われる技法がニューラルネットワークです。これから暫くこのニューラルネットワークに関する話をしましょう。

ニューラルネットワークは別名ニューロといわれていて、十年ほど前はニューロ・ファジイと併称され、家電製品、とりわけ、洗濯機やクーラー、掃除機などに搭載されました。それで、家庭の主婦も『家電はニューロでなくっちゃ』と呪文の如くニューロを唱えた時代がありました。

当時からニューロは魔法の杖の如く、不可思議なものと思われ、あるいはまやかしだ、などと疑う人もいました。しかし、ニューロは私たちの脳が行っている情報処理、つまり目で見たものを認識したり、耳で聞いた音から意味を理解したり、記憶したり、全く新しいことを考えたり、という知的活動を工学的見地からモデル化したものだったのです。

現在私たちが使っているニューロの性能は正直なところ、私たちの脳に比べるとはるかにレベルが低いことしかできませんが、それは脳の情報処理自体がまだ完全には解明されていないからです。自然界の他の現象、例えば力学の場合、作用する力の法則は完全に数式で記述できます。つまり、物の運動の様子が紙と鉛筆(もちろんコンピュータ上でも)で完全に解き明かすことができるのです。それに反し、脳の場合は、こういった完全な数式がわかっていません。それに加えて、脳は150億個もの脳細胞を持っており、各々の脳細胞(ニューロン)が互いに複数のシナプス(synapse)という神経線維で連結されています。人工的に作ったニューロはこのような巨大な構造を持てません。従って、現在使われているニューロは本物の脳に比べると、まだまだおもちゃのレベルなのです。しかし、このようなレベルのニューロでも用途によっては結構『いい仕事』をしてくれるのです。

さて、このように人工的に考えられたニューロは数学的な観点からいうと、非線形の最適化技法であります。非線形や最適化技法などという聞きなれない単語が急に出てきて戸惑われた方も多いでしょう。こういった概念は、数学が分かると難しくも何ともない、至って平明な事柄なのですが、そのためには数学、とりわけ解析学の基本となっている微分や積分を理解する必要があります。

微分、積分と聞いただけで、高校で悩まされた経験がよみがえり頭が痛くなる人もいるでしょう。しかし最近はそういった人たちを対象として、『誰でも分かる、微分、積分』のようなタイトルの社会人向けの本が出ています。このような本をのぞいて見ますと、多色刷りで、また図がふんだんに盛り込まれていて、分かり易く書かれています。しかし、それでもまだ数式がごちゃごちゃと出てきて、見かけほどには易しくはなっていません。でもご安心ください。このコーナーでは、式を一切使わずに言葉だけで説明します。

でも、本音を言うと、数式を使うほうが数学の概念を正しく伝達できるのです。数式というのは、音楽における楽譜に相当します。楽譜の読める人にとっては、下手な人に弾いてもらったり、歌ってもらうより楽譜をもらう方がはるかに楽曲を正しく知ることができます。でも、私のようにまともに楽譜が読めない人間にとっては、いくら楽譜に素敵なメロディーが書かれていても、さっぱり感情が沸きません。それよりも、少々テンポや音程が外れていても、楽譜の読める人に口ずさんで(ハミングして)もらった方がよほど価値があります。このコーナーで数式を使わないというのは、この喩えでいうハミングなのです。

早速、このハミングで微分と積分のキモとなる所を説明してみましょうか。まず、微分とは、読んで字のごとく、こまかい(微細な)ものを対象とします。微細とは、時間的、あるいは空間的にある点から次の点に遷移する僅かの時間・場所が対象となります。具体的イメージが湧かない人は、1ミリ秒、1ミリメーターと考えて見てください。

積分とは、読んで字の如く、積み上げる、というものです。つまり、微細な状態を次々と積み上げると、山となる、つまり現象の全体像がわかるということです。

この微分、積分というのは、私たちが自然現象を理解する上で必須の道具なのです。例えば、空中に放り投げたボールのがどこまで届くか、計算したいとしましょう。その時、もし微分や積分の概念を知らないとすると、理論的に割り出すことはできないので、実験データをたくさん集める必要があります。つまり、たくさんのデータを手元に持っていてこれから投げるボールの大きさや、投げる人の筋力、そして投げる方向、風の方向・強さから、以前のデータの中から一番近い状況のデータから、飛ぶ距離を推定するやり方です。この方法には限界があります。その昔天動説が支配していた頃、惑星の運行が(見かけ上)不規則で、法則性が見付からなかったのがその良い例です。

一方、微分方程式を使って、理論的にボールの飛行距離を求めるときには、次のようにします。

空中に放り投げられたボールの、ある瞬間の状態をイメージして下さい。ボールは刻一刻と動いている(飛んでいる)のですが、あたかもビデオの静止画モードで見ているように、動きが止まったと考えて下さい。

ボールを飛ばすためには、力が要ります。そして、飛行距離というのは、その力によって決まる訳ですからボールにかかる力を正確に知る必要があります。

飛んでいるボールには、どのような力が働いているでしょうか?

図:飛んでいるボールに働く力


あっけない程簡単ですが、飛行中のボールに働く力は空気からの抵抗力と重力の二つだけなのです。その空気の抵抗力は、速度の二乗に比例する力だというのは、皆さんもご存知でしょう。

これで静止画モードで見た飛行中のボールに働く力が分かった訳です。つまり、数学的にいうと、これが微分を使った式、即ち微分方程式を立てる(得る)ことができたのです。

さて飛行距離を求めるには、この静止画モードから再生モードにしてみれば言い訳です。数学的にいうと、このプロセスが微分方程式を解く、即ち微分方程式を積分するということなのです。早速、テープを巻き戻し、最初のシーンから再生してみましょう。この再生モードで最初のシーンを見る、ということが、微分方程式を解くときに必要となる初期値を設定することなのです。

このように微分方程式を立て、それを解くというのは、ビデオで静止画モードである一場面だけを綿密に解析し、あとは最初のシーンをチェックするだけで、テープの全体のシーンが分かるというカラクリになっているのです。

微分方程式はこのように自然界の現象(物理現象、化学現象、生物現象、天体現象、など)を解析するには必須の道具なのですが、人為的な現象にも適用することができます。例えば、最近(1997年)ノーベル経済学賞は金融のデリバティブで使われているブラック・ ショールズという式を発見した米スタンフォード大学のマイロン・ ショールズ教授に授与されました。現在の経済活動、とりわけ金融業界には、このデリバティブと言うのはなくてはならない仕組みですが、その中核には微分方程式が使われているのです。

さて、前書きが長くなりましたが、ニューロにも微分方程式が使われています。それ故、さまざまな観点からのデータ解析ができるのだといえます。

冒頭でも述べましたように、脳の情報処理を真似したニューロですが、脳の仕組みが解明されていないため、結果的には本物の脳とはかなり異なった方法で情報処理をしていることになります。しかし、それでもニューロという脳のニューロン(神経回路)を連想させる単語を使っているのは意味のあることなのです。自然界の現象と人工の仕組みとは必ずしも細部まで一致する必要はないからです。このことを理解するために飛行機を考えてみて下さい。太古から人は鳥のように空を自由に飛びたいという願望を持っていました。レオナルド・ダ・ヴィンチのデッサンに見られるように当初は鳥が飛ぶのとそっくりの方法、つまり、巨大な羽をつけて上下に羽ばたかせて飛ぼうとしていました。しかし、それらはいずれも失敗に終わりました。

ライト兄弟は1903年に初めて飛ぶことに成功しましたが、その時に彼らの作った飛行機は形こそ鳥に似ているものの、飛んだ方法は全く鳥と似ていません。それでも鳥の様に空を飛ぶことができた訳です。つまり鳥が飛ぶために利用している飛行原理だけを拝借し、それを工業的に実現可能な仕組みに置き換えて利用したのです。ニューロと脳の情報処理はちょうどこういう関係にあるといえるでしょ う。

脳は、たとえ現在の進んだコンピュータ技術(ハードウェア、ソフ トウェア)を用いても人為的に作るには、あまりにも複雑過ぎます。しかし、その情報処理の原理の一部だけを拝借したニューロは現段階に於いてもデータマイニングの中核の技術として大活躍していますし、これからも技術的にますます発展していくものと私は予想しています。

続く...
TOPへ


Copyright © 2005 Zetta Technology Inc. All rights reserved.