HFBH 評估Arbutus 搜尋資料表欄位特定資料的效能

  1. 首先比較選擇特定欄位中的特定字串, 在Arbutus Analyzer系統中, 使用Smart Search功能, 進行關鍵字搜尋, 輸入後約45秒,順利找出兩筆符合關鍵字的記錄。
  2. 接著轉換至ACL, 使用Fiter(篩選器)功能, 設定篩選條件, Enter後, 執行資料篩選動作, 約二十秒後, 畫面出現timeout停頓的情況, 這個時候, 必須到Tool\Option選項l裡, 變更Buffer Size 調大一點, 然後為了要增快它的搜尋符合資料的速度, 因此, 先利用Index 指令, 針對篩選欄位做索引檔, 約執行37秒, 接下來再重新執行一次Filter 篩選資料的作業, 經過20秒, 又出現Timeout中斷。
  3. 改用Find()函數去篩選資料, 遇到一樣的問題, 最後, 採用Extract 萃取指令, 加上篩選條件, 直接將符合條件資料的記錄, 萃取出到另外一個輸出檔, 結果似乎執行非常久的時間, 1分17秒, 才開始一點點。
  4. 接著轉回Arbutus Analyzer軟體, 使用相同的Extract 萃取指令, 以相同的篩選條件篩選記錄出來, 結果只花了38秒就完成, 另外, 利用Count指令, 計算原始母檔案的總筆數, 約使用7秒鐘, 就得出總共是5,042,518筆, 而回到ACL利用Count的指令, 去計算原始母檔, 卻要花40秒, 而且結果有點奇怪, 好像跑不出來答案。最後操作者只有放棄了。

Arbutus Analyzer vs ACL searching for a field from HFBH Global Consulting on Vimeo.

關於 David Chuang

David Chuang
CFE舞弊稽核師、資料分析與電腦稽核專家 現 任: 台北商業技術學院會計資訊系兼任講師 - 電腦審計 兆益數位股份有限公司 總經理 中華民國電腦稽核協會理事專業發展委員會主任委員 台灣舞弊防治與鑑識協會理事暨會員發展與服務委員會主任委員