Arbutus資料分析技術

Arbutus Data Analysis – 演算欄位 (Computed Field)

在資料分析上,經常需要進行模擬數據或者是將要比較資料表間關鍵欄位(KEY)規格化,或是依照特定各組邏輯條件給予不同標識或標籤或公式進行數值計算,如同在Excel工作表中架構演算公式一樣,只是在Arbutus的資料分析作業中,效能可以獲得大大的提升,而且具有相當大的彈性,可隨 …

繼續閱讀 »

Arbutus Data Integrity Verification – 重複性測試 Duplicate Command

當資料要進行分析之前,在確認資料完整性的其中之一是驗證關鍵值KEY的有效性,尤其是它代表主檔的唯一值,被當做參考檔,來比對它的完整性,因此,Arbutus Duplicate可以協助User判斷資料中的關鍵欄位是否有重複?或者是近似與相似值存在,這些都有可能是因為資料品質或 …

繼續閱讀 »

Arbutus Data Access – 資料擷取文字型檔案(Text File)

文字型資料檔案格式是一般資訊部門媒體交換檔案的標準格式,同時,它也是所有資料格式中,最可靠的一種格式,因為,它檔案結構簡單,每個字元位置清楚,對系統軟體工具匯入資料方式,是最簡單而可靠,所有要使用電腦稽核軟體進行稽核分析工作的人員來說,就是從這個檔案格式開始進行學習定義資料 …

繼續閱讀 »

Arbutus Data Analysis – 交叉分析資料 (Crosstabulate)

資料分析經常是多維度的,如同Excel中的樞紐分析一樣,透過交叉比對分析,才能夠真正看清楚,每個數據背後是由哪些要素組成,瞭解影響範圍,以及它們之間的相關性,請參考以下影片為你做詳細說明! 【 影片內容所使用檔案資料為非真實性虛構測試資料,若有雷同,純屬巧合!】

繼續閱讀 »

Arbutus Data Analysis – 資料關聯 (Relation)

當我們面對管理系統背後的資料庫,他們是採用關聯式資料庫的觀念去建構,因此,Arbutus的Relation 指令,可以協助使用者重建系統資料的連結關係,可以很方便地進行資料串聯與彙整,一次可以從數個有關聯的資料表中,找出主要資料態樣,而整體使用的關鍵在使用者本身對系統流程與 …

繼續閱讀 »