課程內容細節
介紹數據科學, 學習使用數據科學工具R及RStudio, 掌握探索式數據分析(EDA)七部曲
- 數據科學項目的流程
- 學習R基本編程
- 利用R導入及整理原始數據
透過EDA七部曲分析學校管理系統數據,找出影響學生學習表現的因素
- 使用RStudio創建及管理數據項目
- 透過Feature Engineering技巧加深對原始數據的了解
- 利用Exploratory Data Analysis計劃最合適的進階分析
學習使用R套件, 掌握關聯規則學習 Association Rule Mining (ARM), 建立一個推薦系統
- 利用Association Rule Mining (ARM) 技術在大量數據中發掘關聯性
- 建立一個預測用戶對物品偏好及評價的推薦系統
- 使用R修改推薦系統,擴大系統的應用性
建立Linear Regression模型, 嘗試預測波士頓不同區域的樓價
- 使用Caret Package建立預測模型
- 如何識別商業問題種類,並選擇最有效的模型
- Regression的使用流程及實際應用
掌握Machine Learning工作流程, 學習建立Decision Tree(決策樹)預測模型
- 使用K-Means Clustering進行數據分割 (如根據顧客特性建立數個顧客群組)
- 如何根據實際問題需要修改Cluster Analysis的設定
- 利用A/B Testing的配合協助商業運作 (如客戶研究、個人化服務、成本控制)
透過建立Decision Tree預測模型, 嘗試預測不同條件下的賽馬結果及銀行客戶違約風險。
- 建立用於數據挖掘的Decision Trees
- 如何將Decision Trees的分析結果應用於決策支持
- 利用Random Forests技術進一步改良Decision Trees
把編程工作轉化為一般人可使用的模式,及如何持續學習數據科學
- 機器學習 (Machine Learning) 的應用實況與效果
- 人工智能 (AI) 的商業應用機會
- 如何根據個人興趣與需要,利用網上資源作低成本高效率的持續進修
學習使用R Notebook、R Markdown及Shiny App為不同類型的分析製作報告範本
- 製作自動化報告 (Automated Reporting) 節省重複分析數據的時間
- 如何尋找合適的數據項目範本,套用於你的個人項目
- 利用Shiny App提高你的分析報告質素,或製作數據應用產品原型