#大數據分析筆記
數據流程說明
1. 定義問題
2. 搜集數據
>第一點決定要搜集的數據有哪些,那麼搜集就得有搜集方法,包含來源、規則、儲存。
3. 處理數據
>包含清洗數據和優化數據,是目前數據科學的核心,也是有商業化的部份。
4. 分析數據
>分析數據的方法可以歸納為測定、建模、模擬、驗證、預測。這和目前網路公開的大數據分析內容不同,其中各種演算法是將上述的方法類別落實。
此處還要注意「數據特質」!例如分析數據的數據是常見可做四則運算的數字,就能適用實數系發展出來的數學和變數變換。
數字可能是排序用,不能做四則運算,那就要用另一種分析方法。
數據不是數字,就會落在「計數」,產生「頻率」的分析方法上。
5. 解讀數據