資料分析結果經常需要匯出成各種不同報告格式,或是轉至其他應用系統工具進行第二階段處理作業,因此,像Arbutus這樣的資料分析軟體是必須提供匯出各資訊系統普遍採用的檔案格式,方便進行資料交換或轉換,以下影片即為你介紹操作方式,即可知步驟相當簡單,而且Arbutus還提供直接 …
繼續閱讀 »Tag Archives: Arbutus 資料分析技術
Arbutus Data Analysis – 資料分期(Age)
資料分析技術中,還有關於期間的彙總,通常是針對交易資料內某一個日期與指定的截止日期進行比較,依相距天數劃分不同期間進行資料彙總,這不但是財務會計科目評價的參考依據,同時,也是管理決策所仰賴的指標,通常會用帳齡或庫齡來說明,關於資料分期Age指令的操作,請參考下列影片介紹! …
繼續閱讀 »Arbutus Data Analysis – 資料分層(Stratify)
在剖析資料的方法中,除了採用分類彙總的方式,另外,還有以數值金額範圍來分成級距進行彙總,以金額來訂定資料彙集範圍,是企業營運決策參考數據中不可或缺的一種,要分析數值欄位其毋體數據的分佈情形,以方便後續採行分析深度及廣度的有效步驟,這不僅被廣泛運用在抽樣上,同時,可做為產品行 …
繼續閱讀 »Arbutus Data Integrity Verification – 缺漏測試 GAP Command
和Duplicate 指令剛好是一體兩面,GAP 指令是驗證資料表中的序號欄位值是否有缺漏,用此來判別系統產生或使用的序號的有效性! 【 影片內容所使用檔案資料為非真實性虛構測試資料,若有雷同,純屬巧合!】
繼續閱讀 »Arbutus Data Integrity Verification – 資料有效性驗證 Verify Command
每當取得測試資料使用資料分析工具進行資料定義,一旦完成之後,先不要急著做分析工作,你必須先測試所定義資料的完整性與有效性,利用Arbutus 的Verify指令,主要在驗證所定義資料檔案結構的有效性,例如:不適當非可列印字元的存在,及數值欄位存在文字內容,還有無效日期,這些 …
繼續閱讀 »Arbutus Fuzzy Duplicate – 模糊重複測試
Damerau-Levenshtein 距離演算法是數學上模糊理論之一,它目前被廣泛運用在DNA及Fraud Detection(舞弊查核)範籌,當然,我覺得不侷限於此,舉凡系統資料庫的資料清理工作,就是一件讓IT人員相當苦腦的工作,若是可以藉由此架構,利用Fuzzy Du …
繼續閱讀 »Arbutus Compare – 比較
Arbutus Compare 指令是專門用來針對不同時點的檔案版本, 它可以是Master File(主檔),也可以是異動檔,比較它們之間異動的差異,例如任何新增、修改及刪除的比對記錄,這個若是要利用低階程式語言撰寫程式或是透過其他資料分析和稽核軟體,也是需要花費不少時間 …
繼續閱讀 »Arbutus Smart Search – 智慧搜尋
Arbutus Smart Search 是專門針對資料分析人員及內部稽核在探索資料工作時所設計的快速搜尋功能, 讓初學者對篩選資料條件定義不太熟悉者, 也可以輕鬆上手, 對定義好的資料表進行檢查, 找出特定事項與記錄, 提升工作效能, 對於身為主管也可以透過這個簡單的功能 …
繼續閱讀 »