學習資源 HiSKIO  

Google 機器學習開發專家 (GDE) 來了!完整解惑機器學習八大問題

Google 機器學習開發專家 (GDE) Jerry 老師來了!
本篇文章整理自 2020/08/27 【Jerry 老師的免費諮詢直播時間】,特別整理了八個在直播中老師有回答到的問題,完整解決你對機器學習和強化學習的疑惑!

Google 機器學習開發專家來了!

Jerry 老師是現任 Google 機器學習開發專家 (GDE) 、歐奔頭殼共同創辦人兼CEO,超過十年數據科學相關經驗。專注於機器智能 (Machine Intelligence) 的研發。曾任亞太智能機器技術長、智庫驅動技術長、國立台灣科技大學講師、外商數據科學顧問、汽車產業資深數據科學家。

作為 GDE 專門針對 Google 新的機器學習技術推廣,喜歡做資料分析、數據分析和預測分析等有挑戰性的題目,覺得和一般開發系統的感覺很不一樣。

機器學習,首先必須先了解客戶需求並拆解成機器學習的問題,找出可以用哪些方法來去解決企業問題,最後再去做預測模型來達到目的並解決問題。

完整直播精華 免費看

你錯過 2020/08/27 Jerry 老師的直播嗎?
沒關係!我們把它放到 YouTube 讓你隨時都能複習在複習
完整滿滿一小時的超精華直播內容就在 HiSKIO YouTube 頻道!

完整解惑機器學習八大問題 Q&A

Q1:機器學習需要什麼基礎知識?

A1:其實機器學習要學的東西還蠻多的,但是一下子你要學完也學不完,包含你需要看過機器學習的書,可能包含線性代數的書,因為線性代數還蠻多提到這方面的東西,我甚至有看過什麼黎曼積分等等的一些很複雜的數學方程式在裡面。

但我想跟大家分享在產業上應用的部分大概分兩派,一派就是『我對演算法很熟悉』,那演算法熟悉有分不同的階段,譬如說你可能真的寫過演算法,這種OK,如果能做到這樣是最棒的。但是如果我一下子要踏進來這個領域,要你先去看迴歸分析然後再把迴歸寫出來,你可能先睡著比較快,如果是這樣的場景就先 STOP,你就先進入另一個派系。

另一派叫做『我知道這個方法是幹嘛用的』,你可以用在哪個場景所以你拿程式來用,現在程式設計跟套件都很發達,比較重要的是剛剛前面講的你知道這個方法在幹嘛。
如果你是應用端的工程師,你要做的事情是把老闆給的題目轉成機器學習可以運作的題目,然後用成你知道的方法去解,那我就會推薦你可以來上我開的這門機器學習線上課程,因為我在這堂課上面跟大家分享很多以問題為導向的機器學習的一些解法,因為這個解法會讓我們知道說在各種不同的機器學習的過程當中,場景中要怎麼去做應用。 所以其實就分兩派系,你喜歡是應用型你就做應用的,你喜歡研發的就要掌握演算法所有的邏輯。

這堂課我一直想跟大家分享,其實用機器學習是很簡單的,如果你搞清楚問題的面向是什麼,你可以快速的幫客戶或老闆導入機器學習,但是反過來如果你想要專研演算法,這也沒有問題,但我自己認為機器學習要學完理論要花蠻多時間的!

Q2:什麼時候要用機器學習?

A2:個人覺得這在實際的產業場景上是非常重要的議題,我們常會發現說很多使用者在很多題目上都想用機器學習的方式解,但實際了解過後,發現他可能做個簡單的數據化的統計報表或是描述性統計就可以完成他的工作了,不需要用到機器學習,這就有點殺雞用牛刀的感覺。

如果你今天需要機器學習的方式,最簡單的方法就是用分類。就是我今天有一堆東西,告訴電腦 A 是蘋果 B 是飛機 C 就是橘子,很明確的告訴他 ABC 是不同東西,然後丟給他大量數據讓他去做學習,學習完後你丟新的蘋果給他,他就會幫你進行自動化的判斷。因為在機器學習裡會把比較高像似性的東西,把它聚集在一起在做分類,所以在做判斷時會比較有效率,如果是用機器學習的程式去寫,可能寫個幾百行就完工了,如果用傳統的方法可能洗個幾千幾萬行都還是沒有辦法完整去判斷不同圖片的樣態。

跟大家分享這個網站,給大家玩玩看
https://quickdraw.withgoogle.com/
這個例子我個人是非常喜歡的

Q3:機器學習跟強化學習有什麼差別?適合用在哪?

A3:機器學習和強化學習兩者為互補的技術,沒有誰大誰小,兩個都可以獨立運用。

強化學習,是告訴機器它工作的範疇,它會在這個範疇裡找出最好、最能提升準確例、最拿到最高分的方法 (如:AlphaGo),而強化學習有個致命傷就是可能有犯錯空間,但強化學習不需前置資料。

而我的建議是一開始在做商業題目時候,先可以考慮用機器學習,雖然實務上通常是混用的。

如果是做電商推進系統,有可能用機器學習已經做的不錯了,那如果想挑戰更好更創新的方法,那強化學習就是你一個選擇,因為他可能在過程幫助你在機器學習中調一些參數或是做一些變化的方法,所以有點像是輔助機器學習強化他更創新的作法。

金融場景也有人在用強化學習來處理股票的預測,因為股票的投資其實是一個策略的一個過程,今天去做下單買股票,那在買股票過程中會有自己去判斷的一些因素,那這些盼端因素裡面他是有策略的,他是有一個策略性過程在裡面

Q4:公司要如何導入機器學習?

A4:在機器學習要導入前,一定要先確定機器學習的具體題目,這個題目通常很大 (如:提升公司營收),他們通常會舉一個比較龐大的題目,我們很重要的工作就是把這個題目收斂下來,我們要能夠把目標縮小,可能就會花很多時間

導入步驟:
明確的題目 → 定義目標 → 收集資料 → 訓練與測試模型 → 預測與驗證
例:改善產品品質問題 → A零件的損壞預測 → A零件的出場年限/供應來源/零件使用次數/運轉時間 → 分類/迴歸/集群/關聯/特徵工程 → 將新資料倒入預測是否損壞以進行模型驗證

分類 – 讓機器按照你的邏輯分類
迴歸 – 用於數值型的預測(存貨管理
集群 – 用在客戶分群、產品分群
關聯 – 產品的推薦、銷售的組合
特徵工程 – 對原始數據進行一系列的工程處理,將其提煉為特徵,作為輸入供算法和模型使用

👇️ 影片詳細講解在這裡 👇️
https://hiskio.com/courses/413/lectures?preview=20093

Q5:我是公司的管理階層,如何能順利導入機器學習並時刻讓組織與方案歷久常新跟上時代?

A5:我覺得導入機器學習的工作蠻重要,除了同袍的支持之外,上司的支持也很重要。

我們今天在做機器學習的導入時,一定要確認一件事,就是有沒有具體的題目可以做,那具體的題目就會有兩個面向。
第一個面向就是我今天做這個機器學習題目是可以幫公司省錢的。
第二個面向就是我今天做這個機器學習題目是可以幫公司賺錢的。

我們先定義好這兩個東西可不可以在公司導入上發生,如果這兩個面向都有機會發生一個的話,那你就會比較好去說服公司去做機器學習的題目。

第二個問題,機器學習不是萬靈丹,只能說它是驅動組織去發展的方法,只要你的組織開始碰機器學習後,你會發現一件事就是新的東西學不完,因為課堂上跟大家分享的都是一些常見的方法論,但新的方法很多,基本上機器學習的一個新的理論方向的改版基本上半年一年就有新的方法出現了,甚至現在三個月就有。

所以機器學習是一個隨著時代演進的技術,所以如果整個組織的文化願意接受機器學習這樣的方式跟實務上的實作,我相信整個組織就會時刻讓組織與方案歷久常新跟上時代,因為在追尋機器學習的過程當中不斷地改變自己跟整個團隊上的知識上的更新。

Q6:如何組成銷售曲線最高的產品組合?

A6:我們這個方法論其實是用非常間單的方法 – 先驗演算法(Apriori Alogorithm)
透過一些信心水準的計算,可以知道 A 產品和 B 產品的組合是否是好的,並透過客戶的交易資料來分析。

在機器學習分析場景比較談到的是非監督式學習,把客戶的交易資料放在資料庫裡,透過這個資料庫再來進行銷售組合的分析。
機器學習很適合在大量的數據裡面去分析所謂的商品組合,這個方法被定義為購物籃分析,因為購物籃分析想要知道說在這個商品組合裡在一個購物籃地下怎麼做一次性的帶走。
那方法論就會去需要計算支持度與信心水準

📌小整理:
1. 非監督式學習的一種
2. 分析交易資料中的商品組合
3. 適合用於購物籃分析(market basket analysis)
4. 計算前須設定最小支持度與最小信心水準

Q7:客戶有一堆資料但描述不清自己的需求,該怎麼引導客戶的需求導入到機器學習,然後可以幫助客戶?

A7:在我過去的導入生涯裡,起初我其實遭遇蠻大的困難,因為一開始我們基本上都會跟客戶講一些機器學習的方程式或是一些演算法,可是其實客戶聽不懂這些東西,聽不懂就算了,他可能會覺得這太撲朔迷離了,可能就慢慢的對這個東西失去信心。

實際上,隨著導入上的經驗慢慢增加,後來想了一套方法,這個方法在課堂上會做介紹。

機器學習的商用流程其實很重要,其實我們大部分的時間在幫客戶釐清他是在哪一個階段,他今天要導入機器學習沒有錯,但我在台灣看到的現狀是有非常多的企業,其實可能連收集數據或是數位化都還沒做到,簡單來說就是我要做機器學習但我沒有data。

基本上我會去評估幾個階段,今天做機器學習的題目裡,是否有直接的工作者,第二個步驟,是否有收集數據。

強化學習可以在沒有資料的情況下去做一些學習,但他的致命傷就是他必須做允許在那個情境下是可以犯錯的,有些場景是不能犯錯的如醫院,在適合的場景用對的方法去做是蠻大的挑戰。

Q8:市場有無分析及收集Chatbot用戶的意圖,然後串接機器學習的API工具?

A8:這個問題非常得不好回答,我必須說明在 Chatbot 裡面意圖判斷是蠻重要的事情,現在有一個做法就是結合知識圖譜來做,我們可能先不要想著如何去把意圖這個東西把他做得很精準。但是你反過來,有一個正確得知識圖譜來去做串連的動作可能比較能解決你的問題,因為大部分做的好的場景他不會願意分享這個API出來坦白說,因為他可能累積大量的數據在裡面去做意圖的判斷,可能很難直接實現 。

🔥 超強 AI 組合包|機器學習 X 強化學習

【Hi 找我嗎?追蹤訂閱HiSKIO】HiSKIO 嗨 程式技能」科技資訊文章、實用工具分享、新課程優惠領取
「Codefree」喝一杯咖啡,輕鬆學程式!
LINE!「HiSKIO 跨領域學程式」叮咚!有你的新訊息
「HiSKIO youtube頻道」免費實用課程、工程師經驗分享
「F5學程式」最懂初學者
不想一個人孤單寫 code ? 來活力滿點的「程式丼起來」加入話圈吧 !
Facebook Comments