コラム「どこかおかしいよ、データマイニング!」麻生川 静男


【第16回】セキュリティとデータマイニングについて(その一)  


【第28回】データマイニング・夜話
(その十:子供の頃わくわくした事)


コラムTOPへ戻る

最近、セキュリティという言葉を新聞、テレビなどのメディアを通してよく耳にします。セキュリティ、なんとも日本語になり難い言葉ですのでね。何となく、知ったふりをして使っている人も多いのではないでしょうか。本当は一体どういう意味でしょうか?

長島監督が某セXX社のコマーシャルでセキュリティを宣伝していましたが、それは物理的なセキュリティ、つまり、防犯対策のことです。しかし、現在話題となっているのは、情報セキュリティのことの方が多いと思われます。

さてこのセキュリティの意味を語源から考えて見ましょう。英語のsecurity はラテン語の securus から来ています。漢字が偏と旁に分解されるように、ラテン語の単語もたいていは分解できます。 security を分解すると se + cura となります。ここで se とは英語でいうと without であり、cura とは英語の care の同じ意味で『心配』という意味です。つまり、日本語でいう『備えあれば憂え無し』という諺の『憂え無し』というのがセキュリティ元来の意味なのです。驚いたことにこの単語は最近になって作られたのではなく、ずっとローマ時代(紀元前)から存在していたのです。

紀元前2世紀のローマにカトー(加藤)という政治家がいました。彼は軍人であると同時に雄弁家でもありました。当時ローマはカルタゴと地中海の覇権を争っていました。ローマは第一次、第二次ポエ
ニ戦争でカルタゴに勝利を収めたため、カトーの時代にはローマの覇権が確定していました。

その昔学生運動が盛んなりしころ、赤ヘルメットをかぶった学生が口癖のように『日帝打倒』と叫んでいました。 また数年前には某国の大統領が『フセイン政権打倒』と叫んでいましたが、カトーも議会では必ず『Carthago delenda est』(カルタゴを滅ぼすべし)と言って発言を締めくくったと言われています。

ローマの歴史家、Livius(リビウス)によりますと二度の敗戦にも拘わらず不死鳥のごとく再興したカルタゴの威力に、カトーは子孫の security に不安をもっていたと(nepotumque securitatis anxius)言われています。

一方 security には、『憂えなし』の他に『頑丈な』という意味もあったようです。ローマの博物学者の Plinius の『博物誌( Natural History)』によりますと、『柳は他のどんな木より頑丈で( securior )、繁殖しやすい木である』と書いてあります。つまり、柳は自然環境の変化にも対応して成長する、非常に逞しい木であるというのです。

このように、security は単に『憂え無し』という状態を示す意味だけでなく、荒れ狂う自然の暴力に対しても耐性が高い・頑丈である、という意味を持っていたことが分かります。

セキュリティの語源から判断すると現在の情報セキュリティにおいて不正侵入に対して耐性が高く、安心していられることが必要だと言えます。

結局セキュリティは『安全』とも訳せますし、その結果の『安心』とも訳してもいい事がわかります。

次にこれらの漢字について考えてみましょう。この安全、安心という漢字は、だいたい前漢時代に作られた単語のようです。逆に言うと、中国の古典中の古典である四書五経や春秋左史伝には存在しません。例外的にわずか一箇所、礼記・問喪にしか見当たりません。もっとも文脈から判断すると私たちが現在使っている意味とほぼ同じだと考えられます。しかし、意外なことに中国の文書には安心・安全という単語はあまり出てきません。二十四史といわれる中国の史書全部(注釈の部分も含め)合わせても、安心は13箇所しか表れてきません。二十四史とは史記から明史までの中国歴代の正史の総称で、全部合わせた文字総数は約3000万文字にもなります。その中に安心が13箇所というのはいかにも少ない気がしませんか。また安全も(注釈の部分も含め)66箇所しか表れてきません。

当時の歴史が戦争や騒乱など毎年のようにあった割には安心・安全が一般的な単語とならなかったはちょっと意外な気がします。

ところで10年前に阪神淡路大震災で多大な被害を蒙った兵庫県は、『防災、防犯』や『安心、安全』をモットーにして、住みやすい町づくりを目指しています。地震直後には、物質的な安全を目指していたのですが、最近になって顧客名簿などの情報漏洩が問題となってきたせいもあり、情報セキュリティを一つの観点とした活動を初めました。

その一環として2005年6月7日、神戸に情報セキュリティ専門の大学院を開校しました。詳しくは同校のホームページhttp://www.cmuj.jp をご覧下さい。

これは、情報セキュリティでは世界のトップクラスのカリキュラム(講座)を誇るカーネギーメロン大学の授業を日本で行うものです。従って授業は全て英語で行われます。それだけでなく、学生達の
日常会話も英語です。よく日本人同士だと、互いに照れて日本語でしか話さないものですが、ここでは、一度校舎に入るとそこからはアメリカだという認識で進んで英語で話しをします。

授業を開始して(2005年8月末)から1ヶ月も経たない内に学生同士が英語で話すことがごく自然に行われるようになりました。英会話と言うとついアメリカのような本場に行かないと上手になれないよ
うな偏見を持っている人がいるようです。しかし、私もアメリカでよく見かけましたが現地でも(それも10年近く住んでいても)片言、あるいはブロークンな英語を操っている人は多いものです。つまり英語は意識的に正しく使おうと心がけてこそ上達するのです。

また、日本人は英語の読み書きはできても会話ができない、という思い込みが強くあるように思います。しかし、これも正しい認識ではありません。ビジネスの現場や授業で必要とされる読む能力とい
うのは、文意を正しく理解するのはもちろんとして、速く読めるという点が要求されます。このためにはやはり大量の文書を読む経験が不可欠です。また作文(和文英訳)にしても、日本語をそのまま英語に置き直したような文はビジネス的には通用しないと認識する必要があります。このように考えてみると、日本の英語教育は基礎部分を作っただけの未完成なシロモノであるのを日々学生達を見ていると感じます。

さて情報セキュリティのカリキュラムですが、技術的観点から分類すると次の五点に絞られるでしょう。

『通信、OS、暗号化理論、侵入検知、統計・確率論』

現在のインターネット環境における情報セキュリティは内部犯行やパソコンの盗難などによる情報漏洩を除いては大抵は通信経路からの犯行です。それ故、通信に関する知識は非常に重要です。これには、インターネットも当然含まれますし、インターネットに係わるさまざまな設定(ファイアーウォール、セキュリティポリシイ)も含まれます。

統計・確率論は、通信の技術的観点を理解する時にも必要となりますが、また実際にセキュリティ対策を行うにあたって投資対効果を判断するのにも必要となります。つまり、限られた予算の中からセ
キュリティ対策を施すときにやはり起こりやすい被害、一旦発生すると多大な金銭的損失をもたらす被害について考えるでしょう。この時、被害が発生しやすい、と言うのはどういった判断に基づくのでしょうか?これらの判断には確率論は欠かせません。

次に侵入検知ですが、これは、主としてネットワークを介してコンピュータに不正な手段で忍び込みいろいろと被害を与える操作を発見し、それを防止することにあります。

現在、インターネットを介してのアクセスは天文学的数字になっていますので、人手で、アクセスログをいちいち検査し、防止するのは実質的に不可能です。となると結局プログラムを組み自動的に不
正侵入を検知しなければなりません。

さてこの時、どのような仕組みで不正か正当なアクセスかを判断するのでしょうか?いろいろと手法が提案されていますが、現在のところ、データマイニングによる方法が最も広く採用されていると言ってもいいでしょう。

データマイニング以外の方法としては、フィルタリングやルールベースによる検出があります。しかし、これらはいずれも限定的にしか作用しないため特定のパターン検出には威力がありますが、日々変化している不正アクセスパターンに対しては効果が発揮できないことも多々あります。ただし現実問題として、データマイニング技法で不正な侵入検知が完全に捕捉できるわけではありません。

次回はデータマイニングの技法をセキュリティにどのように適用するかについて述べます。

続く...

TOPへ


Copyright © 2006 Zetta Technology Inc. All rights reserved.