和Duplicate 指令剛好是一體兩面,GAP 指令是驗證資料表中的序號欄位值是否有缺漏,用此來判別系統產生或使用的序號的有效性! 【 影片內容所使用檔案資料為非真實性虛構測試資料,若有雷同,純屬巧合!】
繼續閱讀 »ARBUTUS
Arbutus Data Integrity Verification – 資料有效性驗證 Verify Command
每當取得測試資料使用資料分析工具進行資料定義,一旦完成之後,先不要急著做分析工作,你必須先測試所定義資料的完整性與有效性,利用Arbutus 的Verify指令,主要在驗證所定義資料檔案結構的有效性,例如:不適當非可列印字元的存在,及數值欄位存在文字內容,還有無效日期,這些 …
繼續閱讀 »Arbutus Fuzzy Duplicate – 模糊重複測試
Damerau-Levenshtein 距離演算法是數學上模糊理論之一,它目前被廣泛運用在DNA及Fraud Detection(舞弊查核)範籌,當然,我覺得不侷限於此,舉凡系統資料庫的資料清理工作,就是一件讓IT人員相當苦腦的工作,若是可以藉由此架構,利用Fuzzy Du …
繼續閱讀 »Arbutus Compare – 比較
Arbutus Compare 指令是專門用來針對不同時點的檔案版本, 它可以是Master File(主檔),也可以是異動檔,比較它們之間異動的差異,例如任何新增、修改及刪除的比對記錄,這個若是要利用低階程式語言撰寫程式或是透過其他資料分析和稽核軟體,也是需要花費不少時間 …
繼續閱讀 »Arbutus Smart Search – 智慧搜尋
Arbutus Smart Search 是專門針對資料分析人員及內部稽核在探索資料工作時所設計的快速搜尋功能, 讓初學者對篩選資料條件定義不太熟悉者, 也可以輕鬆上手, 對定義好的資料表進行檢查, 找出特定事項與記錄, 提升工作效能, 對於身為主管也可以透過這個簡單的功能 …
繼續閱讀 »