為了給機(jī)器賦予人類的理解和思考能力,科學(xué)家們創(chuàng)造了卷積神經(jīng)網(wǎng)絡(luò)(CNN)。雖然它們需要高度復(fù)雜的算法,能夠模擬人類思維的過程,但它們并不難理解,卷積并不意味著復(fù)雜。
幫助機(jī)器像人類一樣思考
卷積神經(jīng)網(wǎng)絡(luò)和嵌入式視覺領(lǐng)域的研發(fā)者不只是想讓機(jī)器變得更快。他們想讓機(jī)器變得更聰明。我們的目標(biāo)是幫助機(jī)器像人類一樣看待世界,以同樣的方式看待世界,然后應(yīng)用他們所擁有的知識(shí)。一些用途包括圖像識(shí)別、圖像分類和自然語(yǔ)言處理。
作為人類,我們不斷地分析我們的環(huán)境。我們還對(duì)我們所看到的進(jìn)行標(biāo)記和預(yù)測(cè)。例如,您可能知道較近的出口在哪里。每扇門都在你進(jìn)入大樓的路上。你的大腦在緊急情況下已經(jīng)準(zhǔn)備好了,但是你還記得今天早上你送進(jìn)辦公室的熒光燈的數(shù)量嗎?
你的大腦會(huì)自動(dòng)處理這個(gè)工作量。它被硬連接到你的DNA里。這看起來可能很簡(jiǎn)單,但是將這個(gè)過程編到CNN上是很有挑戰(zhàn)性的。CNN須接受輸入,確定什么是重要的,分類,預(yù)測(cè)下一步該做什么,然后采取行動(dòng)。但是這種人工智能與嵌入式視覺有什么關(guān)系呢?
卷積神經(jīng)網(wǎng)絡(luò)與嵌入式視覺
CNN可以被訓(xùn)練成以人類的方式看待世界。CNN不需要對(duì)它可能遇到的每一個(gè)物體的每一個(gè)特征進(jìn)行訓(xùn)練,而是可以使這個(gè)過程自動(dòng)化。利用嵌入式視覺,機(jī)器可以通過將對(duì)象與龐大的數(shù)據(jù)集進(jìn)行比較來識(shí)別對(duì)象。當(dāng)他們犯錯(cuò)誤時(shí),他們甚至可以調(diào)整他們的分類參數(shù)。
卷積神經(jīng)網(wǎng)絡(luò)甚至與視覺聯(lián)系在一起,因?yàn)樗鼈兪窃?D中組織的。它們有寬度、高度和深度。網(wǎng)絡(luò)中的人工神經(jīng)元連接到附近的其他神經(jīng)元。CNN使用一種稱為卷積的技術(shù),在輸入中添加一個(gè)濾波器,然后為CNN認(rèn)為它看到的對(duì)象繪制概率圖。
CNN是圖像分類的理想方法。這就是為什么它們與嵌入式視覺如此完好地結(jié)合在一起的原因。他們可以快速地從圖像中提取數(shù)據(jù),然后對(duì)數(shù)據(jù)進(jìn)行分類。嵌入式視覺系統(tǒng)通常具有大帶寬容量和低功耗,這正是CNN所需要的。