數據科學速成班

 
 
 

以專業 R coding 和 實用案例 為材料,助你在 30 天內掌握 Big Data (大數據) 和 A.I. (人工智能) 等複雜概念,並開始應用到你的個人及商業項目上。

課程三大特色

 

即學即用 R 基本數據科學技術

數據發展及運用成為主導未來的動力,令市埸上出現很多要求「需要懂得 R 或 Python」的招聘廣告。這兩個編程語言在數據分析上各有強大的實用性。R 語言 特別受數據分析師及學術界人士歡迎。

作為針對非編程人員而設的入門課程,我們選擇以R作為教學語言,並配合幾個相關工具來降低 R 的上手難度,務求令學員以最快的速度開始應用各種進階的數據分析法。

除了教授基礎技術,本課程另一個重點是幫助學員掌握持續自我進修數據科學的方法。數據科技日新月異,每推出流行科技就花費大量金錢參加課程,並非最有效益的學習方法。學會如何利用 R 豐富的網上資源及穩固的開發者社群支持,便可以快人一步為自己的項目帶來技術優勢。

 

以實戰案例作為教學單元

學員都期望能盡快把數據科學應用於工作或個人項目上,因此本課程以真實案例為單元。每一個單元都是一個數據科學家現實中經常面對的數據項目或商業問題,讓學員從實戰中學會實用的數據分析思維及技術。由獲得原始數據後的探索工作,到套用R的分析技術,一直到最後的結果檢視與應用。整個數據工作流程將會以案例加實戰的形式在課堂中呈現出來。

 

小班研習

本課程以小班教學模式設計。我們將每班人數限制在8人以下,為學員與導師、以及學員與學員之間提供更多交流機會。對於初學者,小班教學的好處是能讓導師更容易照顧到學員的學習需要,令學習過程事半功倍。學員也可向資深數據科學家 (你的導師) 直接提問,以吸收其解決問題的思維、經驗和心得。

 

所有完成本課程的學員將獲邀請加入 Sky Catcher 畢業生的網上群組。你的導師會透過此社群發佈最新消息 (活動推薦、業界消息等)。

完成課程你將學會

R 編程語言 (R Coding) 和相關支援工具包的應用

數據科學 (Data Science) 入門級理論和運作

建立入門級機器學習 (Machine Learning / AI) 項目作海量數據的預測和分析

大數據 (Big Data) 前期處理理論及數據庫資料挖掘技術應用

數據可視化 (Data Visualization) 和 報告自動化 (Automation) 技巧,提升商業分析報告質素

過往學員來自

客戶好評

課程重點

– 由Warrington親身指導

– 為沒有編程背景的學員而設

– 著重於實戰案例的小班教學

– 全程廣東話授課

– 完成課程的學員將會獲得證書一張

– 完成課程的學員將會獲邀加入畢業生的交流社群

課程資訊 (2022年)

因疫情關係暫停舉辦 (有線上版本喔 -> 傳送門)

課程全長: 10小時

教授語言: 廣東話

* 實體線下課程地點: 灣仔杜老誌道6號群策大廈15樓1504室

學費: HKD 6400

每個單元長1小時15分鐘,每課上兩個單元

按下方「立刻報名」後,將會跳轉到 信用卡/PayPal 支付頁面,如想用銀行轉帳請按下方 WhatsApp 查詢

課程內容細節

介紹數據科學, 學習使用數據科學工具R及RStudio, 掌握探索式數據分析(EDA)七部曲

  • 數據科學項目的流程
  • 學習R基本編程
  • 利用R導入及整理原始數據

透過EDA七部曲分析學校管理系統數據,找出影響學生學習表現的因素

  • 使用RStudio創建及管理數據項目
  • 透過Feature Engineering技巧加深對原始數據的了解
  • 利用Exploratory Data Analysis計劃最合適的進階分析

學習使用R套件, 掌握關聯規則學習 Association Rule Mining (ARM), 建立一個推薦系統

  • 利用Association Rule Mining (ARM) 技術在大量數據中發掘關聯性
  • 建立一個預測用戶對物品偏好及評價的推薦系統
  • 使用R修改推薦系統,擴大系統的應用性

建立Linear Regression模型, 嘗試預測波士頓不同區域的樓價

  • 使用Caret Package建立預測模型
  • 如何識別商業問題種類,並選擇最有效的模型
  • Regression的使用流程及實際應用

掌握Machine Learning工作流程, 學習建立Decision Tree(決策樹)預測模型

  • 使用K-Means Clustering進行數據分割 (如根據顧客特性建立數個顧客群組)
  • 如何根據實際問題需要修改Cluster Analysis的設定
  • 利用A/B Testing的配合協助商業運作 (如客戶研究、個人化服務、成本控制)

透過建立Decision Tree預測模型, 嘗試預測不同條件下的賽馬結果及銀行客戶違約風險。

  • 建立用於數據挖掘的Decision Trees
  • 如何將Decision Trees的分析結果應用於決策支持
  • 利用Random Forests技術進一步改良Decision Trees

把編程工作轉化為一般人可使用的模式,及如何持續學習數據科學

  • 機器學習 (Machine Learning) 的應用實況與效果
  • 人工智能 (AI) 的商業應用機會
  • 如何根據個人興趣與需要,利用網上資源作低成本高效率的持續進修

學習使用R Notebook、R Markdown及Shiny App為不同類型的分析製作報告範本

  • 製作自動化報告 (Automated Reporting) 節省重複分析數據的時間
  • 如何尋找合適的數據項目範本,套用於你的個人項目
  • 利用Shiny App提高你的分析報告質素,或製作數據應用產品原型

時間不合 / 想先了解 ?

請在下方留下你的疑問

課程登記

發送申請電郵後,會轉到課程頁面,按免費報名即可獲取課程。