2020年3月27日 星期五

資料探勘與資料倉儲


資訊科技越來越發達,

而相關的知識也隨著越來越龐大,

在如何管理這些龐大的資料,

就得透過各式不同的方法來管理與分析。

在提到這些龐大資料的時候,

往往都會提到今天的主題:

資料探勘與資料倉儲

何謂資料探勘

簡單的講就是從大量的資料中,

從中擷取出有用的資訊,

通常用於資料分析。

何謂資料倉儲

最早由 Bill Inmon 所提出,

在闡述資料可以由一個或多個資料集經過有系統的分析整理的集中管理,

透過分析後的資料幫助決策處理。



資料倉儲有幾個主要的特性:


  • 主題導向(Subject Oriented)

著重將資料按其意義歸類至相同的主題區(subject area),在組織中,這些主題的資料通常用以回答該領域的問題

  • 整合性(Integrated)

資料來自組織內的各個系統或者不同的資料來源,這些資料來源可以是資料庫也可以是應用程式,而且在資料倉儲中這些資料是整合過且一致的。

  • 時間差異性(Time Variant)

資料在資料倉儲中是可被紀錄且可追蹤變化,反映出資料隨著時間變化的資料差異。

  • 不變動性(Nonvolatile)

資料一旦寫入是不會被取代或刪除的。


資料倉儲可以是OLAP( online analytical processing ,即時線上分析處理)

與資料探勘的資料來源,

由於資料倉儲的資料都經過有系統的分析整理後才存下,

對於決策處理支援方面,

較不易發生因為資料錯誤導致決策失敗。




沒有留言: