深度學習

深度學習是什麼?

在愈來愈多領域中,我們會遇到像是機器學習、深度學習或人工智慧之類的名詞;這些名詞到底是什麼意思?實際應用在哪些地方?

深度學習,最成功的機器學習方法之一

在《機器如何學習?》影片中,我們說明機器學習的基礎原理,並揭曉機器如何借助神經網路變聰明。在這篇文章中,我們深入探討個別的子領域,說明在相關主題中不斷重覆出現的術語:深度學習是機器學習的一個子領域,而機器學習視為人工智慧的一個子領域。

人工智慧方案

1.人工智慧 (AI)

AI 通常被描述為由機器模仿或再現人類的行為結構,通常是個程式語言。一般泛稱的 AI 包括數個子領域,像是專家系統、型樣分析系統、或機器人。基於 AI 的系統使用多種方法來模仿或模型化人類行為與決策結構,例如統計演算法、啟發式程序、人造神經網路 (ANN),或其他機器學習變體。

2.機器學習

機器學習是 AI 的一個子領域,包括透過自動化程序從一組樣本資料導出通則,亦即從樣本資料「學習而來」的規則。可以使用預先定義且可理解的演算法和規則來完成,或以深度學習而言,使用人工神經網路來進行。機器學習又分成監督式和非監督式學習。在監督式學習,用來學習的樣本資料同時包括輸入和對應的預期結果‍(如分類),而在非監督式學習,系統理當從輸入本身識別可能的結果。

3.深度學習

深度學習是一種機器學習的方法,在此人造神經網路在會學習過程中獨自建構 (訓練) 中通則。特別是在機器視覺領域,神經網路通常以監督式學習訓練,亦即樣本資料以及其預先定義的結果來進行。

深度學習如何運作?

人造神經網路

1.人造神經網路

深度學習是一種運用特定形式人工神經網路 (ANN) 的方法,而 ANN 須先以樣本資料進行訓練。經過訓練的 ANN 即可執行其任務。使用經過訓練的 ANN 稱為「推理」。在推理期間,ANN 根據學得的規則,評估供給的資料並回報。舉例來說,可以用來推估輸入的影像是代表不良品或沒問題的良品。

2.神經元、層次與連結

ANN 含有多層相互連結的「神經元」。以最簡單的案例而言,會有一個輸入層和一個輸出層。神經元和連結可以視為矩陣。連結矩陣包含連結,讓輸入矩陣的各值連結到結果矩陣的值。連結矩陣的值包括對應連結的權重。輸入值與邏輯矩陣的值進行權重,產生結果矩陣中的對應值。

深度神經網路方案

3.深度人造神經網路

深度學習一詞描述所謂「深度」ANN 的訓練。除了輸入層和輸出層,在可見的輸入層與輸出層之間還有數百個「隱藏」層。隱藏層的結果矩陣作為下一層的輸入矩陣。在此情況下,只有最後一層的輸出矩陣包含結果。

深度學習訓練

4.訓練

訓練 ANN 時,最初是隨機設定焦點,之後逐步加入樣本資料。根據輸入資料與預期結果,使用學習規則來調整關係權重。ANN 最後的工作結果優劣,表示結果中評估的準確性,和訓練時的樣本資料有很深的關係。在訓練內容中使用大量樣本資料,且內容高度變異,通常推理的結果也更精確。如果使用許多相似且重複性高的資料,ANN 在遇到不同於樣本資料的情形時,就無法推估該領域的資料。這種情形,我們會稱對 ANN「過適」。

深度學習可以幫我做什麼?

不論餅乾是大是小,大家都愛吃。以餅乾當例子,可以解釋深度學習的運作方式。深度學習的應用領域非常多樣化。特別在機器視覺領域,深度學習廣泛用於各種類型工作。深度學習最常見的工作,大概就是影像分析,用於分類與影像資料分割。

1.影像分類

在影像分類中,影像會分配到不同的類別,例如,將有缺陷的組件和無缺陷的組件相互區分開來,並根據缺陷的不同類型來進行排序,或者將空出的影像 (vacation images) 分為不同類別。以餅乾生產過程為例,可以用來檢查所有餅乾是否都完好無缺,還是已經破損。

‍物體辨識與分隔

2.影像分割與物體辨識

影像分割會將影像的每一畫素都指定一個類別。這樣即可在同一張影像中辨識出多個不同物體,例如在購物籃中辨識出不同水果,或是在路上辨識交通號誌、道路和行人。舉例來說,影像分割也能讓我們看見同一條生產線上跑過的不同形狀餅乾:圓的、方的、六角型的。

3.影像處理

深度學習也可以用於處理並最佳化影像資料,例如,自影像中去除干擾雜訊,或補償光學鏡頭引起的干擾。

‍您需要什麼支援?

我們樂意提供產品選擇方面的建議,協助您為應用找到合適的方案。