網友對8/14大衛營活動主題【海量數據環境下持續有效的營運確保工作】熱烈反應的醒思!

我們於八月十四日星期四下午在電腦稽核協會再度舉辦一場【大衛營研討會】,主題是「海量數據環境下持續有效的營運確保工作」,首次由營運管理的角度來和大家探討,面對巨量資料環境下,我們該如何面對資料收集與營運分析及確保的挑戰,這又會回到我們日常作業的習慣,是否只是仰賴資訊單位提供報表資料逕行決策,還是你們會被要求收集大量交易資料,做不同角度的分析與比對,確保交易的完整性與正確性,因此,不論你是不是稽核人員,你都必須要會使用資料分析工具進行營運交易資料的檢查,確認是否符合原先預估期望的目標,此次,在臉書、Line、Google +和電子報上所進行的活動通知,反應極為熱烈,可見海量數據環境下經營管理的新思維,我們必須要有所因應和調整,不然,我們會失去市場的競爭力。

IMAG0484

什麼是「巨量數據資料(big data)」?

「Big data」依據維基百科的定義,「大資料」或稱為「巨量資料」、「海量資料」、「大數據」等,指的是所包括的資料量規模巨大到無法經由人工擷取、管理、處理,並整理成為人類所能解讀、利用的資訊。大資料還應具備了「資料量大(Volume)」、「輸入和處理速度快(Velocity)」、「資料多樣性(Variety)」及「真實性(Veracity)」這4個特點。換句話說,大資料是由數量巨大、結構複雜、類型多樣的資料所構成的資料集合。

過去人們為了取得一些相關研究或調查的資料,但礙於經費、人力、時間、設備等因素,故而在資料的蒐集及分析上,無法全面顧及,只能以具代表性或隨機性的「抽樣」或「統計學」的方式來完成。此舉相對的造成了研究或調查上的不精確,雖其準確度在誤差百分之三以內是可接受的,但若在蒐集或分析時,有人為或其它因素而造成更大的誤差值或錯誤時,即無法以其他方式補救。所以,相對的在現今在大量資料的加持下,也許資料本身不一定要大到非常的巨大如TB(TeraByte,兆位元組)、PB(PetaByte,千兆位元組)或EB(ExaByte,百萬兆位元組)的等級,但絕對是要「完整的」、「相對的」資料集,也就是必須在加以整理、分析後,能成為有用的資訊,以便能看出各個資訊片段間的相互關係。

從上述簡單對巨量數據資料(BIG Data)的定義,一般人從這裡就開始感受到工作上的阻礙和威脅,擔心因為知識與技能的不足,會影響營運決策的品質,及風險控管程度!

瞭解公司營運目標

企業經營管理不可能漫無目標地隨各單位的喜好自行訂定,就如同面對巨量數據資料環境,也不可能在沒有企業整體目標的情形,各自尋找解決方案,重點在於,你該如何達成公司整體目標,這裡有三點提供大家參考:

  • 及時減少浪費和快速完成專案
  • 確認營運需求的正確性與必要性
  • 改善專案執行效率

所有公司最重要的營業目標就是增加營收、減少成本及費用,提升獲利率,因此,配合公司行銷活動與方案,快速達成,提早實現收益,立即減少不需花費的成本及費用,是公司訂定營業目標的基本原則,而為達到這項原則,各項配合營運需求及內部控制作業就必須被確認其正確性與必要性,改善專案的執行效率,是所有公司為達成營運目標的不二法門。

營運分析(Business analysis 是一種辨別營運需求與決定營運問題解決方式的研究過程,它經常包含系統發展要件,也涵蓋作業流程的改善、組織變更或是策略規劃和政策擬定。

  • 策略規劃 — 決定企業組織營運需求
  • 營運模式分析 — 決定企業組織政策和行銷方式
  • 流程設計 — 將企業組織流程標準化
  • 系統分析 — 配合資訊作業將營運規則與需求系統化

 

分析、監控、報告和及時回應

資料分析(Data Analysis) 

  • 資料分析(Analysis of data)是以發現有用資訊、建議具體結論及支持決策的目標所進行檢視、清理、格式轉換、和模組化資料的作業流程,數據資料分析具有多重面向和方法,在不同商業、科技和社會科學領域裡,各種名目之下涵蓋不同的技術。
    • 資料採礦(Data Mining)是一種特定的資料分析技術,專注於模組化及知識發現上,做為預測而不是純粹描述性的目的。
    • 商業智慧(Business Intelligent)含蓋很大程度上依賴彙集、重心放在業務訊息上的資料分析。
    • 在統計應用中,有些人劃分的資料分析為描述性統計(Descriptive Statistics)探索性資料分析(EDA, Exploratory data analysis)證實性資料分析(CDA, Confirmatory data analysis), EDA專注於發現資料中新的特性(New Features),而CDA則是在進行證實或否定已知的假設
    • 預測分析(Predictive Analyics)側重於統計或結構模型的應用以進行預測或分類。
    • 文字分析(Text Analytics)應用統計、語言和結構技術,從文字敘述來源或非結構化資料中擷取及分類資訊。
  • 資料整合(Data Integration)是資料分析的先行步驟和資料分析是緊密地與資料數據可視化與資料傳遞相連,因此資料分析一詞有時候被當作資料建模的同義詞。

資料來源(Data Source)資料(Data Set)

DataSet  資料結構與關連式資料庫極為相似,DataSet 資料集內可以包含資料表、資料行、資料列、關聯性和條件約束,以下列出關連式資料庫的一些概念:

  • 關連式資料庫是由許多資料表所組成。
  • 關連式資料庫的資料表(Table)是由欄位(columns)及列(rows)所組成。
  • 資料表與資料表間會有關聯性(Relation)來建立彼此的關連。
  • 而資料表上會有條件約束(constrain)來維持資料的一致性及正確性。

資料來源(Data Source) - 資料集(Data Set)
將以上關連式資料庫的概念轉換成DataSet 資料集的概念就是:

  •  DataSet 資料集是由許多的DataTable(資料表)所組成。
  •  DataTable 是由DataColumn(資料欄)及DataRow(資料列)所組成。
  •  DataTable 與DataTable 間會有DataRelation 來建立彼此的關連。
  •  DataTable 上會有條件約束來維持資料的一致性及正確性。

建立資料集

尋找資料的態樣(Data Pattern)或發生錯誤的地方

  • 辨別問題傾向、精確地確認差異、突顯潛在風險區域
  • 依照使用者作業準則,藉由比較分析檔案資料的方式,找尋錯誤及可能舞弊的地方
  • 重新計算及確認餘額
  • 確認各流程控制點及確保各作業準則之遵循
  • 可對應收、應付帳款及任何時間敏感性交易進行帳齡分析
  • 藉由對重複付款、帳單號碼缺漏或未發帳單的測試,回復其多支出或所損失的金額
  • 可測試出未授權員工與廠商間的關係

要想掌握公司營運生存的命脈,就必須立即著手建立即時性資料倉儲(Instant Data Warehouse),隨時連結線上資料庫進行即時性分析,立即改善內控缺失,避免重大損失擴大的風險,是每一位營運主管工作的目標!

關於 David Chuang

David Chuang
CFE舞弊稽核師、資料分析與電腦稽核專家 現 任: 台北商業技術學院會計資訊系兼任講師 - 電腦審計 兆益數位股份有限公司 總經理 中華民國電腦稽核協會理事專業發展委員會主任委員 台灣舞弊防治與鑑識協會理事暨會員發展與服務委員會主任委員