機器學習入門:從玻爾茲曼機器學習到深度學習 | 生病了怎麼辦 - 2024年11月
機器學習入門:從玻爾茲曼機器學習到深度學習
用最親切的方式,告訴你機器學習到底是在學什麼
.日本IT技術書部門大賞2018年得獎作品
.以輕鬆有趣的對話方式進行,沒有艱澀難懂的文字
.用生活化的譬喻解說機器學習的原理
.簡單易懂的插圖解說,非專業人士也能藉由本書理解機器學習
機器學習正處於不斷演化的階段,本書將介紹玻爾茲曼機器學習與深度學習。什麼是「玻爾茲曼機器學習」呢?舉個例子來說,即使是有點模糊或部分被遮住的圖片,人類也能立刻了解圖片的內容,這是因為人類能斟酌過去的經驗與現在的狀況,了解圖片的內容。所謂的「玻爾茲曼機器學習」,就是讓電腦也能得到這種能力的方法。也就是為電腦打造眼睛與腦部記憶的構造。深度學習則是在這項技術加上腦部判斷能力,讓電腦根據周遭的情況做出「這個是這樣,那個是之前看過的那個」的判斷技術。即使您從未接觸過「機器學習」的知識,也能藉由本書建立基本的概念。
作者簡介
大関真之
現任教於日本東北大學。專長是統計力學、量子力學、機器學習。曾經榮獲得手島精一紀念研究賞博士論文賞、第6回日本物理學會若手獎勵賞、文部科學大臣表彰若手科學者賞。
第1章|什麼都不懂的鏡子
1.1 魔鏡與皇后
1.2 試著機械學習
Column 機械學習是什麼?
1.3 根據資料學習
Column 機械的自主學習
第2章|美麗的祕訣
2.1 魔鏡的答案
Column 數學的必要性
2.2 挑戰迴歸問題
Column 機械也跟人類一樣?
2.3 代表美麗的函數
Column 機械也有老師
第3章|挑戰最佳化問題
3.1 皇后全力衝刺!
Column 從演算法多學一點
3.2 模型的極限
Column 訓練資料與測試資料
3.3 建立新的特徵值
Column 如何建立困難的函數?
3.4 神經網路
Column 大腦的資訊處理機構
第4章|挑戰深度學習
4.1 推桿推不動了?
Column 深度學習的風潮
4.2 注意過擬合
Column 機械學習就是與過擬合戰鬥
4.3 批次學習與在線學習
Column 隨機梯度下降法的復活
第5章|預測未來
5.1 識別的鏡子
5.2 尋找分界線
Column 支持向量機的泛化能力
5.3 原本就能分離嗎?
Column 扭曲空間的核心函數
5.4 填補資料的缺漏
Column 資料的本質
5.5 掌握資料的本質
Column 稀疏性與人類的直覺
第6章|映出美麗的鏡子
6.1 珍貴的圖片資料
Column 利用磁鐵進行機械學習?
6.2 玻爾茲曼機械學習的影像處理
Column 機械學習與統計力學
6.3 能辨識更複雜的特徵嗎?
Column 變分原理
6.4 使用隱藏變數,打造多元世界
Column 採樣專用機器登場
6.5 複雜資料的真面目
Column 辛頓先生的意志力
第7章|只找出臉部的美麗度
7.1 知道世上所有事情的魔鏡
7.2 魔鏡啊魔鏡、魔鏡先生
序
看到孩子的成長後,總是不禁問自己:「他們到底是怎麼理解事物的呢?」雖然可一言以蔽之地以「就是從反覆的失敗與嘗試之中學習知識,再理解事物」的答案來回答這個問題,但是若能了解「那麼這些知識又是什麼知識?」,那麼說不定就能讓電腦獲得與人類相同的智能吧?實現這個夢想的技術就是近年來蔚為流行的機器學習。這是一種透過反覆嘗試與失敗,學習社會規則的技術。到底是何種方式學習這世上的事情呢?
機器學習正處於不斷演化的階段,而本書則打算介紹其中的玻爾茲曼機械學習與深度學習(Deep Learning)。所謂的玻爾茲曼機械學習是欣賞各種圖片,記憶世上風景的技術。即使是有點模糊或部分被遮住的圖片,人類也能立刻了解圖片的內容。這是因為人類能斟酌過去的經驗與現在的狀況,了解圖片的內容,現在已經能讓電腦搭載這種技術了。應用這種基本技術的就是玻爾茲曼機械學習,也就是在電腦打造睛與腦部記憶的構造。深度學習則是在這項技術加上腦部判斷能力,讓電腦根據周遭的情況做出這個是這樣,那個是之前看過的那個的判斷技術。大家是不是覺得,這個技術很厲害呢?
這些技術或許可實現超乎現在想像的「人工智慧」,而全世界也正籠罩著如此興奮的感覺。讓全世界驚豔的電腦技術之一,就是Deep Mind開發的Alpha Go吧。大家應該都知道這條透過最新的機器學習技術,讓電腦在圍棋的世界大勝人類的新聞吧。現在真的是很不得了的時代,但是這項技術的真面目到底是什麼?現在應該有很多人對此抱著興趣吧。
好吧,那就一起閱讀機器學習的書吧!抱著這個想法跑進書店,應該會看到不少的書。而且在這個時代,只要上網搜尋一下,大概就能得到不少知識。接觸這些資訊之後,一定會有不少人感到挫折,因為這些資訊充滿了一堆看起來很難的公式,這些公式到底是幹嘛用的?到底是怎麼讓電腦獲得智能的?對於只是想知道這些事情的人來說,要理解這些資訊的確難度很高。
因此本書將試著以「沒有公式」的「故事」從「機器學習為何」開始講解,也將介紹造成轟動的深度學習以及為深度學習的草創時期帶來進化曙光的玻爾茲曼機械學習。我希望把本書寫成誰都能輕鬆理解的內容,讓大家覺得這本書前所未有的簡單!
所以,本書適合對機器學習有興趣的上班族閱讀,也適合準備開始新興趣的人閱讀。即使是準備安排退休生活的高齡人士,應該也會覺得本書有趣才對。我試著把本書寫成適合與父母親一起進行自由研究的小學、國中題材,我也認為閱讀到故事的尾聲時,將可培育出開拓機器學習未來的人材。如果本書能成為敲開一億總機器學習時代的敲門,那將是筆者的榮幸。
機械的自主學習 機械學習可透過學習這個容易想像的字眼進一步了解。請想像成讓機械學習的樣子。這裡指的機械是電腦,所以在電腦裡輸入各種資料就等於讓電腦學習。 簡單來說,就是讓電腦看大量的計算練習題,不斷地連續計算,這世界上有這種問題,這麼做就是解開問題,這等於是叫電腦模仿人類的解題方式。 不過,聽到這裡,大家應該會有疑問吧?機械真的能了解這些計算方式嗎?其實它們並不了解。感覺上就只是讓電腦看大量的問題與解答的模式,然後再從中找出法則或規則,最後順利得出解答而已。人類的學習也差不多是這種模式。如果被別人問到「為什麼加法會是這樣的加法?」大部分的人應該只能回答加法就是加法。 我們常常都是憑藉著經驗與結果接受既定的事物,然後再繼續向前進。而機械學習就是讓機械以這種模式學習。 如果對象是人類,當然就能更有效率地教導規則,而教導規則的過程就稱為教育,但是當對象換成機械,又該怎麼教才有效率呢?由於我們是人類,所以有必要找出能更有效率地教導機械的方法,而這個方法就是數學的公式,這或許也是大部分機械學習初學者覺得困擾的部分。 機械的自主學習 加法、減法、乘法、除法,這是誰都學過的四則運算。 不過大家真的敢說完全理解這些運算嗎?或許大家能完成運算,但真的能說已經了解這些運算嗎?即使能正確運算,但其實不了解這些運算的真正意義,只是學會了這些運算的規則而已。 機械學習所做的事就是了解輸入與輸出之間的關係,換言之就是判讀輸出入的關聯性。 這世上已經有這樣的規則,所以教電腦依樣畫胡蘆地模仿這些規則,然後試著根據這些規則輸入資料,結果就得到同樣的輸出結果。如果稍微調整規則,輸出的結果也會跟著改變。重複這個過程,就能得到不同的輸出結果。這跟小孩鬧著玩,結果玩出很多花樣是一樣的道理。 此時的父母親會跟小孩說:「這樣做才對喲」。做計算練習題的時候也是一樣。只要稍微算錯,就會被打叉,老師也會幫忙修正。總之就是一邊訂正,一邊複習,再進行微調。 機械學習做的事情跟這些完全一樣。目標是要解出所有問題的正確答案,所以不斷不斷地解同一個問題。為了讓輸出的結果與資料相符,不斷地調整參數。為了提高解題率,所以重複細部的調整。大家都持續相同的努力。