首頁?行業  »   機器學習  »   正文

人工智能膠囊系統實現最先進的圖像分類結果

人工智能膠囊系統實現最先進的圖像分類結果

2017年,AI領域最重要的理論家、圖靈獎最新獲得者杰弗里·辛頓(geoffrey hinton)與學生薩拉·薩布爾(sara sabour)和尼古拉斯·弗羅斯特(Nicholas frost)一起提出了一種稱為capsnet的機器學習架構,這是一種經過培訓的多層方法,在目前流行的基準上實現了最先進的圖像分類性能。在他們工作的后續行動中,辛頓、薩博和牛津機器人研究所的研究人員詳細介紹了膠囊網絡的一個版本,該版本在無人監督的分類任務中優于當前領先的算法。

他們的工作內容在arxiv.org上發表的一篇論文(“堆疊膠囊自動編碼器”)中進行了描述。

膠囊系統通過幾何地解釋其相互關聯部分的有組織的集合來理解對象。針對各種對象屬性(如位置,大小和色調)單獨激活的數學函數(膠囊)的集合被添加到卷積神經網絡上,并且它們的幾個輸出內容化被重復使用以形成更高階膠囊的“穩定”表示

由于這些內容在整個過程中保持不變,所以膠囊系統可以利用它們來識別對象,即使在視點發生變化時,例如在交換或轉換零件位置。

關于膠囊系統的另一個獨特之處:它們注意過程。與所有深度神經網絡一樣,膠囊函數被安排在互連層中,從輸入數據傳輸“信號”并緩慢調整每個連接的突觸強度權重。但是在涉及膠囊的情況下,權重是根據前一層函數預測下一層輸出的能力動態計算的。

Hinton及其同事最近的研究工作是研究一種神經編碼器,它可以觀察圖像樣本,并試圖推斷出物體的存在和姿態。

它由一個解碼器訓練,該解碼器使用混合的姿態預測來預測已經發現的圖像部分(由自動編碼器分割)的姿態,并將每個圖像像素建模為轉換后的部分。然后在未標記的數據上學習膠囊系統,并將存在的向量(數學表示)聚在一起,以捕獲整個對象和部件之間的空間關系。

合著者注意到,物體膠囊的存在概率向量更有可能形成緊密的集群,并且為每個緊密的集群分配一個類會產生最先進的結果,在街景房號數據集(一個由60萬張真實世界圖像構成的數據集,來自G.Oogle街景圖片)。此外,這種實現導致了mnist(手寫數字的語料庫)的接近最先進的結果,并進一步提高了性能,參數小于300。

歡迎關注ATYUN官方公眾號,商務合作及內容投稿請聯系郵箱:[email protected]

發表評論