|
2.1 データマイニングとは
データマイニング(data mining)とは、データウェアハウス(データの倉庫) に入っているデータをマイニング(採掘)し、宝物である情報・仮説・知見・ 課題などを見つけ出す方法・プロセスのことである。また、データマイニング はそれ自体をそのまま用いることは少なく、KDD(Knowledge Discovery in Databases)の中のプロセスの一つ(パターンの発見)として用いられる。( KDDとは、大規模データをもとにして、その中から特定のルールを抽出する プロセスのことである。)
図1:KDDの概要
図2:KDDの詳細
2.2 データマイニングの目的
- 目的:
- データの要素の間の複雑な関係から特定のパターンを発見する。
2.3 データマイニングの例
POS(point of sales,販売時点情報管理システム)などの膨大なデータから、 購買客の購入傾向を見つけ出す。
- 刺身とわさびは併せ買いされる。
- そばとわさびは併せ買いされる。
- カナダのドラッグストアでは、金曜日の夕方、男性がビールと 紙おむつを併せ買いしている。
2.4 実際の応用例
- アメリカンエキスプレスやAT&Tなどは顧客のファイル情報 を分析するために用いている。
- BBCは画像分析にデータマイニング技術を応用している。
- ヨーロッパの銀行と保険会社の一部では顧客属性分析を応用している。
2.5 手法
主な手法として知識工学、ニューラルネットワーク、パターン認識、 フラクタル、ファジー理論、遺伝的アルゴリズム、統計手法などがある。
[Prev] [Next] [Contents]