救人除了捐血,還可以捐數據?|RTHK 太陽底下新鮮事訪問節錄

感謝 香港電台第一台 節目 太陽底下新鮮事 的訪問邀請,Sky Catcher 創辦人及數據科學家許文強 Warrington Hsu 與主持人張鳳萍和何立彥在節目內談什麼是大數據和數據科技的發展。


RTHK 香港電台第一台 「太陽底下新鮮事」01/08/2021 – 達人教路:數據科學家 許文強 節錄

你想不想知道大數據是怎樣收集的呢?人們喜歡上網購物,很多時只是看過相關網站,就會有大量的廣告在社交媒體出現,令到人「心郁郁」想下單購買。

該集節目邀請了一位大數據達人 Sky Cather 創辦人及數據科學家:許文強 Warrington Hsu 來說說怎樣收集數據,幫你節省金錢,又會關心大數據收集和人工智能可能帶來的問題,例如在道德、法律、社會的爭議。

Q1: 我們看到很多大學把數據科學變成一門學科,那麼大數據真的是收集很多不同的數據?我們這個概念正確嗎?事實又是這樣呢?

許文強: 可以說部份正確。大數據的「大」是形容什麼呢?可以是指所有規模都是很「大」,數據量是一部份,還數據產生的速度和數據的多樣性來源都是大數據所說的「大」的部份。

用零售業作例子。大約十幾二十年前做生意都是租個地方開門市,在一間店舖內可以收集到的數據很單一。通常都是客人購物完後在收銀機系統內的資料。

但現在商舖會開網店,數據變得多樣性,儘管客人沒有買東西,但你也可以在他遊覽產品時收集到很多資訊,同時網店年終無休,所以數據的數量和產生速度也會快了很多。

Q2: 收集數據主要是用什麼方法?和主要是什麼行業/科技比較多應用這些大數據?

許文強: 在各平台的後台,會編寫一些程式在不同的地區去收集數據,例如客人在瀏覽網頁時,在每一頁停留多久、滑鼠按過什麼位置,又或者在一個頁面上的哪一個位置較吸引遊覽者等,這都是可以透過一些工具去收集的。

Q3:數據數量的多寡、多元性的程度,怎樣影響到人工智能學習的情況?

許文強: 人工智能就是我們一般說的演算法,其中一個最主要的用途是用來做預測。而人工智能(演算法),是需要利用大量的數據去訓練的,可以說大數據像是這些演算法的燃料。

除了數量外,數據的質素也很影響到人工智能最後出來的預測是否準確。所以我們數據科學家的工作,可能有七至八成的時間都是在整理數據,確認這些數據是準確的,沒有任何雜質!這樣才能讓演算法做到它的工作。

Q4:現在全球大數據發展的趨勢是怎樣的呢?而香港的角色是怎樣呢?香港在發展大數據中有甚麼潛力?

許文強: 現在全球大數據發展的趨勢是開始看能否將傳統上,不能拿來訓練演算法的數據轉化為可以使用,如圖像數據、聲音數據或者是一些手寫文字 (free text ) 的數據,嘗試使用 AI (人工智能),看能否閱讀我們一般人使用的語言等。

目前香港的階段,是在不同來源的數據去進行整理、整合。例如我所做的研究,主要是來自醫管局的數據。醫管局的病歷數據雖然很有價值,但很單一的。最突出的數據就是某病人患上某種病,或者他吃過什麼藥等,但其實影響健康的因素,除了病歷之外,還有很多不同因素可以影響到。例如遺傳的DNA,甚至是一些生活和工作相關的數據,都可以豐富到這些醫療研究。

Q5:在香港要取得不同來源的數據難不難呢?其他地方又是怎樣做的?

許文強: 其實都困難的。說到數據運用會有很多考慮,例如私隱和道德上的考慮,當你想開始一個項目,希望 NGO (非政府組織)可以提供數據給你,也可能要向政府申請一些數據等,中間需要很多考慮和協商。而向一些私營機構申請調用數據,這些數據都是他們的財產,這就更加難!

但我看到外國有些例子做得不錯。美國衛生局兩三年前開始一個叫做All Of Us (AOU) 的項目,是一個全民醫療大數據的研究項目。他的做法是希望市民能捐贈醫療數據出來,再跟不同機構合作做研究。由於是用捐贈出來的數據去做研究,減少了一些關於私隱上的爭議和一些用途上的爭議。

Q6:香港有沒有這個能力可以做到數據共享平台?

張鳳萍:我覺得是社會上的共識及認知程度的問題。以前說捐血就理解,但現在原來可以捐數據。

許文強:是的。這個想法挺新穎的,而我認為有這個機會存在。尤其是經歷過疫情,人們比較注重公共健康問題,這製造一個機會讓人意識到除了捐血、捐器官等方法可以幫到別人,原來捐數據也能做到同樣效果。

現在捐了數據,將來我老了,身體出現了什麼毛病,可能就是我十幾二十年前捐出來的數據,推進到一些研究,然後幫到自己。

Q7:個人資料是否做到一個足夠保安的程度呢?我們有沒有足夠的方法來收集這些數據?

許文強: 在保安方面,很多時要尋求一些私營機構的合作。而你說到怎樣取得數據,其實都有一些技術阻礙存在。取得數據都需要人力物力,要找一些相關的機構或者數據庫裏面把數據拿回來。這樣的做法,一個研究項目所需時間一定很長,也要用到很多資源。

一個比較好的例子可以參考英國衛生局。他們設立了一個平台,只要你拿到數據的權限,你就可以透過這個平台很安全地,遙距的在你辦公室下載數據。

Q8:現在建立大的數據庫是可以幫助到很多未來的發展,那收集到數據後最能幫到什麼?

許文強: 用醫療數據作例子,現在演算法的發展挺成熟的,即是有很多很準確的演算法,只要數據質素是好的,它就可以很精準地預測到一些結果出來。這些結果是什麼呢?可能是一些疾病的風險,或者可能是早期的一些篩查的結果。

例如我最近研究的自閉症項目,其實自閉症越早診斷,你可以做到的應對方法越多。但是這個事情非常困難,例如說是在兩歲之前,探測到一些訊號就是最理想。

張鳳萍: 嘗試在早期就做一個篩查,找一找有沒有一些徵兆,嘗試用一些演算法去估計是嗎?

許文強: 沒錯

張鳳萍: 如果大家願意交出自己的一些數據出來,是有機會做到的事情。今天我們很多謝許文強跟我們的分享。

訪問原篇來源:RTHK 香港電台第一台 「太陽底下新鮮事」

數據科學速成班

以專業 R coding 和 實用案例 為材料,助你在 30 天內掌握 Big Data (大數據) 和 A.I.(人工智能) 等複雜概念,並開始應用到你的個人及商業項目上。

導師:香港數據科學家 Warrington Hsu

學員:適合任何對數據科學有興趣的初學者 (沒有 coding 底子要求)

了解課程:https://bit.ly/scvidclass

Data Science入行:懂數據分析比AI重要

Data Science入行:懂數據分析比AI重要

到求職網站上看看,你會發現市場上越來越多給數據科學家 (Data Scientist) 的工作機會。這份工作的待遇和前景吸引了很多不同背景的人嘗試入行。但與律師、會計師等專業不同,數據科學家並沒有「考牌」這回事。有機會問問職位為 Data Scientist 的人,你會發現他們之間的背景、入行經歷可以很不一樣。要是你現在有興趣從事數據科學工作,在準備求職時或會好奇怎樣可以突圍而出。

我的數據科學顧問和教學工作,讓我經常接觸到很多現職數據科學家和想聘請數據人才的公司。尤其和一些公司管理層交流時,我可以直接聆聽他們的企業需要,了解他們期望找到怎樣的數據人才。在這一系列的文章我會提供一些和數據科學求職相關的資訊。並會分享我在這行業的觀察和經驗,希望能增加有興趣入行的朋友成功找到心儀工作的機會。

                                           


企業聘請數據科學家時在想什麼?

近年人工智能(AI)和大數據等概念很流行。但我觀察到至少在香港,真正投放資源、建立團隊來應用AI技術的企業其實並不多。一個常見情況是公司管理層被一些成功的AI商業應用案例吸引,便以「利用AI和大數據改善業務」這個目標為基礎,在招聘廣告中塞入一堆如 “random forest”, “neural network”等的技術關聯詞。成功被聘請的第一批數據科學家一般會先做一些研究性質工作,但當管理層發現成效不似如期(原因可以是發現公司並沒有足夠和有用的數據,或改善業務的成效不如預期來得即時,有機會日後再談),這些數據科學家的主要角色就變成了更像傳統數據分析師的數據整理、整合、分析及報告工作

根據我以上的觀察,如果你沒有任何數據科學相關經驗(例如統計及編程),我建議你在學習和為求職準備時,以這個心態作為基礎:

「首先掌握數據分析技術,人工智能理解基本概念就可以了」

今天先說掌握數據分析技術這部份。我指的是公司給你一些數據,你要有能力整理並找出一些對公司有價值的情報。「現在給你這堆數據,你去看看有沒有值得做的事情或對業務有用的資訊」這是我經常聽到企業對數據科學家的含糊指示。人工智能和機器學習演算法只是我們Data Science工具箱裡用來解決某類問題的方法(例如顧客習慣預測)。但實際操作上,你會花更多日常工作時間去整理數據、分析、找出結論並寫報告。除非你在一間研發數據產品的創新科技公司工作,否則我認為懂得利用數據說故事的能力,在商業上遠比能建立人工智能模型更有價值。

                                 


你的第一個數據科學項目

如果你有興趣入行,我會建議你先嘗試自行做一個小項目:拿一些原始數據然後加以整合和分析,最後報告你找到的有趣之處。留意我的指示也是很含糊,這是我們工作需要習慣的情境。原始數據可以在網上找,甚至你有心的話自行用Google Form等工具製作一份簡單問卷,在你朋友之間收集一些你有興趣知道的數據(例如問問疫情怎樣影響他們約會或交友習慣)。最後數據整合和分析部份不需要局限自己用什麼工具,不會Python或R,就用Excel (有空的話我會製作教學)。

就算覺得自己使用的分析方法、最後的結果不是很新奇特別也不要緊。更重要的是你要製作一份文件去記錄整個項目的過程,我稱它為數據日誌。這個日誌包括了你從收集數據到產生最後結果的詳細流程、及項目中遇到的所有問題和你選擇的解決方法。現在很多求職者只忙著在履歷表上塞滿一堆大數據/AI關聯詞,或是在網上找一些做貓、狗圖像辨識之類的編程碼範本來炫耀AI深度學習(deep learning)技術。在這情況下,你更為貼地的數據日誌能成為吸引招聘企業注意的重點。相比起你的分析結果和報告,這個日誌在你的作品集擔當了一個更重要的角色:它讓招聘者可以看到你解決數據問題的思路和創意,並顯示了你在項目裡的組織能力。這樣站在企業角度,就算最後用不著AI等進階技術,我也知道這個人至少有能力在沒有清晰指示下,能為我推行在數據中找價值的項目。你或會聽過一些科技公司面試會有像「需要多少顆網球才可以塞滿一輛巴士?」之類的奇怪問題。這些問題的重點並不是要尋求一個標準答案,而是要看求職者解決問題的思路和邏輯。數據日誌的意義正正是一樣。


總結:先學分析 後學AI

數據科技日新月異,我認為單純的統計或編程技能長遠並不能提供足夠的職業穩定性。相反數據分析專注的是如何把企業關注的問題與數據及科技連結,並透過有效的溝通將結果轉化為改善問題的方案。數據科學中講求的「軟技能」及面對問題的邏輯、彈性和創意 (例如如何把一個用來作網購產品推薦的數據分析系統,套用在尋找藥物副作用的醫學用途上),我認為是不能被自動化輕易取代的。

有讀者或會想:「但人工智能現在就是人人在談,我要找數據科學家的工作總不能不會啊!那我究竟要懂多少?」我下一篇文章就會談如何以最少努力來迎合數據工作市場中對AI背景的要求。


數據科學速成班

以專業 R coding 和 實用案例 為材料,助你在 30 天內掌握 Big Data (大數據) 和 A.I. (人工智能) 等複雜概念,並開始應用到你的個人及商業項目上。

導師:香港數據科學家 Warrington Hsu

學員:適合任何對數據科學有興趣的初學者 (沒有 coding 底子要求)

[button id=”001daa0a95f601f99398bf946c4117d7″ text=”了解課程” url=”http://skycatcheredu.com/%e6%95%b8%e6%93%9a%e7%a7%91%e5%ad%b8%e7%b6%b2%e4%b8%8a%e8%aa%b2%e7%a8%8b-r-%e9%80%9f%e6%88%90%e5%85%a5%e9%96%80/” target=”_self” alignment=”left” alignment_mobile=”default” image=”” icon=”” icon_alignment=”left” style=”1″ size=”medium” font_size=”20″ radius=”0″ border_size=”2″ shadow=”none” full=”false” tale=”none” margin=”0px 0px 15px 0px” text_color=”#ffffff” text_hover_color=”” background_color=”#1ea1b2″ background_hover_color=”” border_color=”” border_hover_color=”” animation=”none” animation_speed=”2″ animation_delay=”0″ __fw_editor_shortcodes_id=”8eaa8ff59c8a5e2f01006cb6a47fd086″ _fw_coder=”aggressive”][/button] 

柬埔寨 UBB 大學數據科學和 R-programming 義務培訓

中心的創始人及專業導師 許文強 Warrington Hsu 在農曆新年期間飛往柬埔寨,為 University Of Battambang – UBB 的大學生們做數據科學和 R-programming 的義務培訓,希望柬埔寨的大學生們能更接觸最先進的 Data Science 技巧,為他們帶來更廣大的國際視野。


感謝 University Of Battambang – UBB 大學在 Facebook 的感謝帖子。

數據科學速成班

以專業 R coding 和 實用案例 為材料,助你在 30 天內掌握 Big Data (大數據) 和 A.I.(人工智能) 等複雜概念,並開始應用到你的個人及商業項目上。

導師:香港數據科學家 Warrington Hsu

學員:適合任何對數據科學有興趣的初學者 (沒有 coding 底子要求)

三條問題測試出你的工作會否被人工智能取代 – AI與事業

如何思考 AI 崛起對你工作的影響

在網上閱讀有關人工智能 (AI) 的文章,你會發現其中一個近年最常見的主題是「某職業將被AI取代」。當我們看到自己的職業出現在文章標題裡,或多或少會為自己的工作前景感到擔憂:「我的工作真的會被AI取代嗎? 」今天我想分享一下如何開始思考人工智能對事業的影響。我會以自己的職業作為例子,把整個評估過程展示出來。

我是一名數據科學家,主要工作是透過整理和分析數據,為公司制定改善業務的決策。有讀者看到這裡或會想:「那你擔心什麼呢? AI 崛起數據科學家不是最吃香的嗎?」我今天想帶出的是訊息就是,其實無論你從事什麼行業,在新科技下也必需要保持警覺。

3 個思考 AI 與工作的關係的問題

以下的表格是我用來幫助自己有系統地思考 AI 與工作的關係。要完成這張表格有三個步驟,而每個步驟都是一條我們需要問自己的問題:

1. 我的工作是什麼?

第一步,把你的主要工作逐項在表格中列出來,並在每項工作上想一想:

  • 它佔了我多少工作時間?
  • 我的機構/上司/客戶對它有多重視?
  • 我對這項工作有多自豪?

職業只是一個標籤。對你的僱主來說,你每天上班完成的任務才是你能持續獲得收入的原因。一項佔了大量時間、你的服務對象重視及令你感自豪的工作,是一份高價值的工作。完成此步後我們可以更了解自己的價值主要來至哪些工作。

2. 我的工作何時會被取替?

第二步,預測每項工作何時會被AI取代。我在表格中設定了自己事業中的五個時間點 (1, 5, 10, 15, 20年後),並以填色的方式來顯示我認為每項工作我還能做多久。以上的五個時間點只是例子,你可以設定更多的時間點或更長的時間線。

要建立一個對工作壽命的概念,我們需要了解現時有什麼 AI 應用例子 是針對你的工作。在網上搜尋相關資料時,可以嘗試以「行業 + 工作描述 + AI」作為關聯詞。有機會的話甚至可以與熟悉你行業發展的專家談談。有讀者可能會想:「我不是神算,怎可能預測得準?」沒錯,科技發展充滿變數,就算是最頂尖的AI專家也不能說得準一份工作何時會被機器取替。所以在這裡預測時間的準確度並不是重點,更重要是你能否建立一個概念去比較每項工作的壽命

在思考哪些工作會先被人工智能取替時,嘗試用以下兩點作評估:

(A) 相關AI應用例子的技術成熟程度:
當AI在某項工作上做得比你有效率和精準,市場就有很大誘因以機器取代人力。

(B) 人類接受程度:
新科技要成為普及的應用,還需要先獲得人類信任。想像一下,有一天我們可能終於會擁有成熟數據,去支持無人駕駛技術是比人類司機安全和有效率。但要成功令這項技術普及化,還需要先通過一堆法規和在市場上獲取乘客的信心。這裡涉及的就不再是技術,而是人類的心理

3. 我的工作會如何被取替?

第三步,把剛才找到與你工作相關的 AI 應用例子記錄下來。此時「AI 取代工作」就不再是一份模糊的恐懼。現在我們擁有較清晰的概念,了解自己職業的每一部份或會以什麼形式 (AI技術/產品/應用方案等) 被機器取替。同時我們能夠估計哪些現時自我定義為高價值的工作會被自動化。

以我的職業為例,在數據科學家現時的分析工作中,探索式資料分析 (Exploratory Data Analysis)是一個很重要的步驟。此項工作的目標是透過製作數據圖表等技巧來描述數據,以便我們在進行進階分析 (例如建立預測模型) 前對數據建立基礎了解。一組數據集可以包含大量的數據項目。製作分析報告時應該選擇哪些數據作重點描述,當中應該使用什麼類型的圖表,這些選擇現時是透過我的思考、直覺、經驗、創意來決定。此過程佔據了我大量工作時間之餘,亦是公司由聘請我那一刻開始就已經十分重視的部份。正因如此,對我來說這是屬於一份高價值的工作。

但在剛才搜尋此部份工作的相關AI應用時發現,原來像 Microsoft Excel 與 Google Sheets 之類的試算表程式,近年推出了一種新的數據探索功能。這些應用了機器學習 (Machine Learning) 的功能,目標是讓演算法自行選擇在數據中抽出哪些項目作分析。演算法甚至還會自行製作合適的圖表來描述數據。雖然這些功能現階段還談不上成熟,但它們已經以試驗性質的形式推出市面讓一般用戶使用。這些功能針對的數據分析和報告製作工作,正是現時最令我自豪的高價值工作之一。因此我必須有一份危機感:在專業生涯中,很可能會看到自己現時這方面的技能嚴重貶值。

結總:把 AI 帶來的影響加入到對工作的思考中

我們要問的並不是一份工作會不會被AI取替,而是它何時會被取替,會怎樣被取替。綜合以上三步,要是你認為某些與你工作相關的AI應用例子可行性高 (技術成熟+人類接受程度高),你需要預期在更短的時間內看到這些應用被普及化。要是它們針對的剛好是你現時評估為高價值的工作 (花時間+社會重視+令你自豪),你便更加需要提高警覺性。在短期事業規劃上,例如決定該進修哪些技能或嘗試什麼新崗位時,你必需把人工智能帶來的衝擊作為實際考慮因素。

讀後思考
  • 我沒有技術背景,怎樣評估一項AI應用技術的可行性?
  • 我的工作性質單一,但在可見的將來我認為機器會做得比我好,我是注定要失業了嗎?
  • 我現在感到切身的危機感,我應該如何去準備?

往後的文章會繼續談「AI與事業」這個題目,例如怎樣為自己的職業重新定位,及如何選擇學習哪些新技能。如果在人工智能應用上你希望我特別去談某個行業/範疇,歡迎在下面表格留下電郵和感想。


    數據科學速成班

    以專業 R coding 和 實用案例 為材料,助你在 30 天內掌握 Big Data (大數據) 和 A.I. (人工智能) 等複雜概念,並開始應用到你的個人及商業項目上。

    導師:香港數據科學家 Warrington Hsu

    學員:適合任何對數據科學有興趣的初學者 (沒有 coding 底子要求)

    [button id=”001daa0a95f601f99398bf946c4117d7″ text=”了解課程” url=”http://skycatcheredu.com/%e6%95%b8%e6%93%9a%e7%a7%91%e5%ad%b8%e7%b6%b2%e4%b8%8a%e8%aa%b2%e7%a8%8b-r-%e9%80%9f%e6%88%90%e5%85%a5%e9%96%80/” target=”_self” alignment=”left” alignment_mobile=”default” image=”” icon=”” icon_alignment=”left” style=”1″ size=”medium” font_size=”20″ radius=”0″ border_size=”2″ shadow=”none” full=”false” tale=”none” margin=”0px 0px 15px 0px” text_color=”#ffffff” text_hover_color=”” background_color=”#1ea1b2″ background_hover_color=”” border_color=”” border_hover_color=”” animation=”none” animation_speed=”2″ animation_delay=”0″ __fw_editor_shortcodes_id=”8eaa8ff59c8a5e2f01006cb6a47fd086″ _fw_coder=”aggressive”][/button] 

    什麼是數據科學 (Data Science)?

    什麼是數據科學 (Data Science)?

    當我告訴你我是一個數據科學家 (Data Scientist),你很難立即可以想像到我的專長和技能是什麼。數據科學這詞語這麼難理解,在於它並沒有一個精確的定義。特別在商業/媒體以及技術/招聘這兩個角度上,數據科學可以在指非常不同的東西。我希望可以透過比較這兩個範疇,讓大家更容易理解當我們在某地方看到「數據科學」這四個字時,發言者背後的意思究竟是什麼。


    1) 商業及媒體角度講 Data Science : 把數據分析這品牌重新包裝

    近年人工智能等技術的發展,大大提升了企業以至公眾對數據應用的興趣。當一個概念擁有商業潛力,傳媒以及相關產品/服務供應者便有動機去創造一個新的用語,以方便解釋所有相關概念。這便造就了「數據科學」這個流行用語。從商業推廣及媒體傳播角度來看,「數據科學」這字其實和曾經流行的數據分析 (Data Analysis)、數據挖掘 (Data Mining)、商業智能 (Business Intelligence) 等術語是可以互相取替的。情況有點像數年前紅極一時的「大數據」和現在的「人工智能(AI)」。這些流行用語人人也在談在追捧,但人人對它們的意思也有各自的解讀。現在當我們在網上看到一篇標題為「AI創新改變XX行業」的文章,它可以是在談論最頂尖的無人駕駛技術,但它亦可以只是一篇在宣傳一個新推出點餐App的廣告文章。

    2) 技術及招聘角度講 Data Science : 應用工具及技術的變遷

    以一個科學、有系統的工作流程來從原始數據中獲取有用資訊,這種工作模式其實一直都存在。但實行這套工作流程的工具及技術卻在不斷改變。以下這張由數據科學家Drew Conway製作,用於定義數據科學的圖表,很多讀者可能都曾看過:

    此圖的重點是數據科學需要融合三個範疇的知識: 數學與統計 (Math & Statistics Knowledge)、編程與電腦科學 (Hacking Skills) 以及行業知識 (Substantive Expertise)。在「數據科學家」這個新興職位出現之前,當一間公司要招聘數據分析人員,一般都會用數據分析師(Data Analyst)、商業分析師(Business Analyst)、統計學家(Statistician)或者電腦科學家(Computer Scientist)等職稱。但傳統的數據分析人員一般只有數學統計或電腦科學知識,兩者兼備的人才是很罕有的。隨著近年機構企業可收集的數據變得越多越複雜,這就造成了一個新問題。我們有數學統計出身的分析師,他們很擅長利用各種分析技巧及統計學模型去解釋、演繹數據,但對如何有效整理大量多樣化數據卻毫無頭緒。另一方面,電腦科學出身的人員善於透過編程整合和整理不同來源的數據,提升分析海量數據的效率,但對於如何把原始數據轉化為有價值的資訊卻不是他們的專長。

    在數據分析這個行業裡,電腦科學和數學統計曾經是兩門較獨立的技術分支,直到近年R及Python等應用工具的興起改變了數據分析的遊戲規則。像Python和R這兩個用於數據分析的編程語言,設計非常適合一個電腦科學或數學統計背景出身的人去學習並填補自己缺乏的那一門範疇。現今可收集數據的多元化,加上分析工具的變遷,把電腦科學和數學統計拉在一起,提升了「從原始數據中獲取有用資訊」這個工作流程的效益。什麼是數據科學家? 這是我聽過最喜歡的定義:

    「數據科學家是一個比一般編程人員更會統計學,或比一般統計學家更會編程的人」

    剛剛說過數據科學除了數學統計和電腦科學,還需要行業知識第三塊拼圖。但我認為現今數據科學的發展,越來越則重前兩者的技術需求多於後者。例如你到招聘網站試找一個零售業數據科學家的招聘廣告,較常見的情況是會看到一行行強調對統計和編程等技術的首要要求,附上一句「擁有X年零售業經驗為佳」的次要要求。一間公司裡正正已經擁有著大量行業知識豐富的人,所以對於一個數據科學家,可以相對容易地透過入職後的交流及研究邊做邊獲取行業知識。相反數據科學的統計及編程技術部份是現時很多企業和機構最需要,但市場上兩者兼備的人才卻是供不應求的。在技術以及招聘角度,市場需要新類型的人才,就需要一個新的職稱去標籤一套新的技能組合,這就造就了數據科學家這個當今熱門的職業出現。

    總結 – Data Science 就是 統計學 + 編程 的強化版

    如果你在媒體或者商業交流上聽到數據科學這字,非常需要細讀前文後理才可以理解發言者真正意思,因為他們可以在指任何東西 (從用Excel試算表整理數據到Tesla 的無人車技術)。但如果你是在一個專業數據分析團隊或招聘廣告中聽到數據科學,定義一般會相對較為精準。意指透過利用數學統計和編程工具,並配合行業/領域知識,從原始數據中獲取有用資訊。


    數據科學速成班

    以專業 R coding 和 實用案例 為材料,助你在 30 天內掌握 Big Data (大數據) 和 A.I. (人工智能) 等複雜概念,並開始應用到你的個人及商業項目上。

    導師:香港數據科學家 Warrington Hsu

    學員:適合任何對數據科學有興趣的初學者 (沒有 coding 底子要求)

    [button id=”001daa0a95f601f99398bf946c4117d7″ text=”了解課程” url=”http://skycatcheredu.com/%e6%95%b8%e6%93%9a%e7%a7%91%e5%ad%b8%e7%b6%b2%e4%b8%8a%e8%aa%b2%e7%a8%8b-r-%e9%80%9f%e6%88%90%e5%85%a5%e9%96%80/” target=”_self” alignment=”left” alignment_mobile=”default” image=”” icon=”” icon_alignment=”left” style=”1″ size=”medium” font_size=”20″ radius=”0″ border_size=”2″ shadow=”none” full=”false” tale=”none” margin=”0px 0px 15px 0px” text_color=”#ffffff” text_hover_color=”” background_color=”#1ea1b2″ background_hover_color=”” border_color=”” border_hover_color=”” animation=”none” animation_speed=”2″ animation_delay=”0″ __fw_editor_shortcodes_id=”8eaa8ff59c8a5e2f01006cb6a47fd086″ _fw_coder=”aggressive”][/button] 

    課程登記

    發送申請電郵後,會轉到課程頁面,按免費報名即可獲取課程。