Data Warehouse & Data Mining eの紹介
このアプリケーションでは、Data WaherouseとData Miningに関する詳細なコース+演習+修正を見つけます
最初に「データウェアハウス」とは何ですか? :
これは、組織内での意思決定に役立つ大量のデータを含むデータベースの一種です。このタイプのデータベースは、その内部構造が、いわゆるスタースターモデルのインジケーターと分析の軸からユーザーが必要とするものと、そのアプリケーション:システムとの適合性を特徴としています。意思決定支援とデータマイニング。
データウェアハウスには通常、多くの入力および更新操作が行われるアプリケーションで使用される通常のデータベースのデータから派生および抽出された履歴データが含まれます。また、データウェアハウスには、テキストファイルや他のドキュメントなど、他のソースからのデータ。
「データマイニング」とは何ですか? :
これは、データの知識をコンピュータで手動で検索するものであり、この知識が何であるかについての仮説はありません。データマイニングは、データの所有者にとって理解可能で有用な新しい方法でデータを要約する論理関係を見つけるために、大量のデータ(通常は大量)を分析するプロセスとしても定義されます。 。 「モデル」は、関係と呼ばれ、データマイニングから取得されたサマリーデータです。データマイニングは通常、データマイニング以外の目的で取得されたデータを扱います(たとえば、銀行内のトランザクションのデータベース)。これは、データは、データ自体の収集方法には影響しません。これは、データマイニングが統計とは異なる領域の1つであり、このため、データマイニングプロセスは二次統計プロセスと呼ばれます。この定義は、データ量が一般に多いことも示していますが、データ量が少ない場合は、定期的な統計的手法を使用して分析するのが最善です。
大量のデータを処理する場合、データ内の異なるポイントを識別する方法、妥当な時間内にデータを分析する方法、見かけ上の関係がデータの性質の事実を反映しているかどうかを判断する方法など、新しい問題が発生します。 。通常、データセットの一部であるデータが抽出されます。その目的は通常、結果をすべてのデータに一般化することです(たとえば、将来の需要を予測するために製品の消費者の現在のデータを分析すること)消費者)。データマイニングの目標の1つは、大量のデータを削減または圧縮して、一般化せずに単純なデータを表現することでもあります。
最初に「データウェアハウス」とは何ですか? :
これは、組織内での意思決定に役立つ大量のデータを含むデータベースの一種です。このタイプのデータベースは、その内部構造が、いわゆるスタースターモデルのインジケーターと分析の軸からユーザーが必要とするものと、そのアプリケーション:システムとの適合性を特徴としています。意思決定支援とデータマイニング。
データウェアハウスには通常、多くの入力および更新操作が行われるアプリケーションで使用される通常のデータベースのデータから派生および抽出された履歴データが含まれます。また、データウェアハウスには、テキストファイルや他のドキュメントなど、他のソースからのデータ。
「データマイニング」とは何ですか? :
これは、データの知識をコンピュータで手動で検索するものであり、この知識が何であるかについての仮説はありません。データマイニングは、データの所有者にとって理解可能で有用な新しい方法でデータを要約する論理関係を見つけるために、大量のデータ(通常は大量)を分析するプロセスとしても定義されます。 。 「モデル」は、関係と呼ばれ、データマイニングから取得されたサマリーデータです。データマイニングは通常、データマイニング以外の目的で取得されたデータを扱います(たとえば、銀行内のトランザクションのデータベース)。これは、データは、データ自体の収集方法には影響しません。これは、データマイニングが統計とは異なる領域の1つであり、このため、データマイニングプロセスは二次統計プロセスと呼ばれます。この定義は、データ量が一般に多いことも示していますが、データ量が少ない場合は、定期的な統計的手法を使用して分析するのが最善です。
大量のデータを処理する場合、データ内の異なるポイントを識別する方法、妥当な時間内にデータを分析する方法、見かけ上の関係がデータの性質の事実を反映しているかどうかを判断する方法など、新しい問題が発生します。 。通常、データセットの一部であるデータが抽出されます。その目的は通常、結果をすべてのデータに一般化することです(たとえば、将来の需要を予測するために製品の消費者の現在のデータを分析すること)消費者)。データマイニングの目標の1つは、大量のデータを削減または圧縮して、一般化せずに単純なデータを表現することでもあります。
表示