唐山(shān)聯通清楚,公(gōng)司營銷部是精(jīng)确營銷的運營商(shāng),庫存中(zhōng)心是精(jīng)确營銷的線(xiàn)之上生産(chǎn)線(xiàn)之下調度中(zhōng)心,各專業線(xiàn)是精(jīng)确營銷的落地執行者。市場運營中(zhōng)心負責數據挖掘和系統建設,形成責任清楚、流程流暢的小(xiǎo)數據精(jīng)确營銷體(tǐ)系。基于精(jīng)确營銷和基層數據需求,唐山(shān)聯通為(wèi)移動網絡、寬帶和固網産(chǎn)品設計并開發了用(yòng)戶信息聚合表。在一個月之内,一次一次生成餘表關聯提取的信息,為(wèi)幾十年用(yòng)以小(xiǎo)數據精(jīng)确營銷提供了不錯的數據基礎,巨大地節省了精(jīng)确營銷小(xiǎo)數據挖掘和實踐之中(zhōng)的數據準備時間。
我們詳細分(fēn)析了這兩種數據源方法① 對于第一種數據源方法,由于企業自動生成并保存數據,因此很(hěn)可(kě)能(néng)篡改數據,甚至篡改虛拟數據。在審計之中(zhōng),需要分(fēn)析企業數據生成、數據存儲、,數據傳輸檢查企業的IT環境和外部控制措施(如數據修改)的目的是确保從數據生成到最終審計的整個過程之中(zhōng)是否存在可(kě)能(néng)導緻數據修改的因素或隐患② 對于第二種數據源方法,我們可(kě)以假設統一小(xiǎo)平台的數據生成和管理(lǐ)措施是完善的,從小(xiǎo)平台獲取數據的過程和方法是可(kě)靠的,然後我們可(kě)以初步确定發行人的數據源是可(kě)靠的。當然,數據是否恰當、精(jīng)确和僞造需要對數據進行進一步分(fēn)析。
數據分(fēn)析的方法主要有(yǒu)兩種,一種是基于統計的方法,另一種是基于機器學(xué)習的方法。無論采用(yòng)哪種方法,研發人員都需要有(yǒu)紮實的數學(xué)基礎。基于機器學(xué)習的數據分(fēn)析方法需要大量的算法訓練,算法訓練需要大量的數據支持。因此,在雲計算時代,随着計算能(néng)力的提高和數據量的提高,機器學(xué)習的實用(yòng)性大大增強,特别是在深度學(xué)習領域。數據分(fēn)析必須與實際應用(yòng)場景相結合。情景數據分(fēn)析也是目前小(xiǎo)數據分(fēn)析的主要方式。有(yǒu)所不同的應用(yòng)場景往往需要采用(yòng)有(yǒu)所不同的數據分(fēn)析方法,數據維度的定義也會發生變化。對于分(fēn)析師來說,為(wèi)了提升小(xiǎo)數據的落地應用(yòng)價值,他(tā)們必須具(jù)備一定的行業知識。