人工智能是怎樣運作的
收聽音頻課程
人工智能試圖了解智能的實質,并生產出一種新的能以人類智能相像的形式作出反應的智能機器,該領域的研究包括機器人、語言辨識、圖像辨識、自然語言處理和專家系統等。人工智能從誕生以來,理論和技術日漸成熟,應用領域也不斷擴大,可以預見未來幾年將會步入“人工智能時代”。
目前AI早已布滿我們的世界但是在日常生活中形成了巨大的變化。這種AI并不是懸疑連續劇中的這些有自我意識,計劃毀滅世界邪惡的機器人。而是像我們的智能手機、智能家裝、銀行信用卡管家和智能車輛這種圍繞我們每晚生活的產品和服務都在使用AI。
AI將通過促進手動駕駛車輛的發展、改善醫學圖象剖析、促進更好的醫療確診和個性化醫療,因而帶來社會的重大轉變。AI也將是支撐未來技術發展的基礎資源,如同電力和網路一樣。但對大部份人來說,AI還是很奇特并且飽含神秘感。
這么我們明天就來聊一聊AI最重要的功能——模式辨識的工作原理。希望通過簡明簡略的介紹幫助你們了解這個領域。
AI是一門嚴謹科學而不是無所不能神話故事,媒體過于夸大報導AI的功能,宣揚恐嚇論都是不負責任的。AI目標是設計具有智能的機器,其中的算法和技術部份借鑒了當下對人腦的研究成果。明天許多流行的AI系統使用人工神經網路來模擬由特別簡單的相互聯接單元組成的網路,有點像腦部中的神經元。這種網路可以通過調整單元之間的聯接來學習經驗,這個過程類似人類和鳥類的腦部通過更改神經元之間的聯接來進行學習。神經網路可以學習模式辨識、翻譯語言、學習簡單的邏輯推理,甚至創建圖象或則產生新設計。其中,模式辨識是一項非常重要的功能,由于AI非常擅于辨識海量數據中的隱藏的模式,而這對于依賴經驗和知識的人類來說就沒有這么容易。這種程序運行的神經網路具有數百萬單位和數十億的聯接。我們如今所能創造下來的“智能”就是由那些電子神經元網路組成的。
機器不像人類具有感知臟器和腦部,而且還能挺好地協調工作,例如當我們看見一只狗的時侯,都會很快的判定下來這是哪些植物,但是具體哪些種類。這個看似簡單的過程對于機器來說都是非常困難的。而人類獲得這樣的能力,也是源自于生物上億年的進化過程。而機器認識世界的方法是通過模型,須要通過復雜的算法和數據來建立模型,進而使機器獲得很簡單的感知和判定的能力。
下邊介紹一下深度學習系統中一個最重要算法——卷積神經網路。假如你之前對AI相關知識有所了解的話,那你一定據說這個概念。這些算法參考了生物學研究人類和其他植物腦部視覺皮層的結構。簡單介紹一下這些特定類型的人工神經網路,它使用感知器、機器學習單元算法,用于監督學習剖析數據。適用于圖象處理、自然語言處理和其他類型的認知任務。與其他類型的人工神經網路一樣,頻域神經網路具有輸入層、輸出層和各類隱藏層。其中一些層是頻域的,使用物理模型將結果傳遞給連續的層。這過程模擬了人類視覺皮層中的一些動作,所以稱為頻域神經網絡,也就是CNN。
舉例子來看,當我們人類看見一只貓和一只狗時,雖然它們的身材很類似,但我們還是馬上就能分辨它們分別是貓和狗。對計算機而言,圖象僅僅只是一串數據。在神經網路的第一層會通過特點測量物體的輪廓。神經網路的下一層將測量這種簡單紋樣的組合所產生的簡單形狀,例如昆蟲耳朵和鼻子。再下一層將測量這種形狀組合所構成的物體的個別部份,比如貓和狗的頭或則腿。神經網路的最后一層將測量剛剛這些部份的組合:一只完整的貓、一只完整的狗等等。每一層的神經網路就會目標進行圖象組合剖析和特點檢查,因而進行判別和組合,并將結果傳遞給下一層神經網路。實際使用的神經網路的層次深度會比這個事例多好多,所以神經網路才能以這些分層的方法進行復雜的模式辨識。
只要有大量被標記的樣本數據庫,就可以對神經網路進行特點訓練。它對于辨識圖象、視頻、語音、音樂甚至文本等信息非常有用。為了挺好地訓練AI的機器視覺,我們須要提供給那些神經網路被人標記的大量圖象數據。神經網路會學習將每位圖象與其相應的標簽并互相關聯上去。能夠將先前未曾見過的圖象及其相應的標簽配對。這樣的系統可以梳理各類各樣的圖象,而且辨識相片中的元素。同時神經網路在語音辨識和文本辨識中也十分有用,手動駕駛車輛和最新醫學圖象剖析系統中也是關鍵組成部份,所以你可以看見神經網路的運用是極其廣泛并且有效的。原先須要依賴人工標記大量有效數據來完成知識的輸入,現今通過運行海量數據,讓神經網路進行自我學習。大大提高的人工智能的應用范圍,增加了使用的門檻。
人類腦部與植物遠遠不同,在進化過程中高度特化而且具有顯著的適應性。而當前的AI系統遠遠不具有人類擁有的看似通常的智能。人工智能更中級的發展將會在旁邊進行討論,我們這兒還是關注如今實現的AI的基本原理。
AI最常見的三種學習方法
加強學習這是關于機器應當怎樣行動以獲得最大化獎勵的問題,它受行為心理學理論的啟發。在特定場景下,機器選購一個動作或一系列動作并獲得獎勵。機器行為每一步驟就會被標記,而且記錄結果和賦于權重。加強學習一般用于教機器玩游戲和博得賽事,例如國際圍棋、圍棋或簡單的視頻游戲。加強學習的問題是,單純地加強學習須要海量的試錯,就能學會簡單的任務。用處是只要你提出一個有價值的問題,提供足夠的數據輸入,理論上來說加強學習最終會找到哪個最優解。
監督學習就是須要我們告訴機器特定輸入的正確答案:這是一幅車輛的圖象,正確答案是“汽車”。它之所以被稱為監督學習,是由于算法是從帶標簽數據學習的。這個過程類似于向年幼的兒子展示圖畫書。成年人預先曉得正確的答案,兒子按照上面的事例作出猜測。這也是訓練神經網路和其他機器學習體系結構最常用的技術。
無監督學習人類和大多數其他植物的學習過程,非常是剛生出來的時侯,是以沒有人監督的方法來進行學習的:我們通過觀察和認知我們行動的結果來了解世界怎么運作。沒有人告訴我們剛開始所聽到的每一個物體的名稱和功能。但我們一直學會特別基本的概念,當前我們還不曉得怎樣在機器頭上實現這一點,起碼難以達到人類和其他植物的水平。缺少用于無監督學習的AI技術,也是當前AI發展問題之一。
概括來說當前AI技術原理是:將大量數據與強悍的運算處理能力和智能算法兩者相結合上去,構建一個解決特定問題的模型,使程序才能手動地從數據小學習潛在的模式或特點,進而實現接近人類的思索形式。下邊補充介紹三個AI研究領域重要的理論技巧和技術便于理解:
一、機器學習手動化剖析建模。
它使用來自神經網路、統計、數學和數學學的方式來發覺數據中的隱藏模型智能AI,而且無需明晰編程查找具體目標和范圍。理論基礎是這樣的:如果我們為了研究某個復雜的科學問題,須要創建海量的機器學習模型、使用大量的算法、使用不同的參數配置,在這些情況下,我們就可以使用手動化的形式進行建模。發展手動化機器學習是為了向科學家提供幫助,而不是替代她們。這種方式使數據科學家甩掉了令人厭惡和復雜歷時的任務(例如詳盡的參數優化和調試),機器可以更好地解決這種任務。而旁邊的數據剖析與推論的工作一直須要人類專家來完成。在未來,理解行業應用領域的數據科學家,也就是數據業務構架師,一直非常的重要。而這一項人工智能技術,將會輔助數據科學家構建模型而且加速驗證的速率,進而減少科學家的壓力,讓她們將精力放到這些機器難以完成的任務里面,通過愈發合理的分工協作,大大推動科學技術研制速率。
二、深度學習領域
這是應用十分廣的技術,它使用具有多層處理單元的巨大神經網路,借助強悍估算能力和改進的訓練技術來學習大量數據中的復雜模式。原理是計算機在學習特定問題時,須要大量輸入這個問題相關的學習材料也就是數據,之后在計算機通過算法和模型來建立對這個具體問題的認知,也就是總結出一個規律,這么在之后碰到相像問題時,計算機會把搜集的數據轉成特點值,假如這個特點值符合這上面規律上面的特點值,這么這個事物、行為或則模式,就可以被辨識下來。常見的應用太多了,這兒大約舉一些事例:
計算機視覺,這如同是機器的“眼睛”。依賴于模式辨識和深度學習來辨識圖片或視頻中的內容。當機器可以剖析和理解圖象時,她們可以實時捕捉圖象或視頻并剖析周圍環境。感知周圍環境、識別可行駛區域以及辨識行駛路徑,這也是無人駕駛的基礎技術。其中圖象辨識原理是通過辨識圖片中的對象,之后完善標簽,實現對海量圖片進行分類,也可以對圖象中的人臉或則其他目標進行辨識,運用在安防監控等領域;
自然語言處理中語音辨識技術如同是機器的“耳朵”:這是計算機剖析、理解和生成人類語言和語音的能力。運用語音采集的技術和技巧,對音頻中的語言內容進行提取和辨識,實現語音實時轉文字的功能;下一階段將會是自然語言交互,人們將可以使用普通的日常語言與計算機進行交流和執行任務。這也是AI語音助手和語音控制交互技術的基礎。
機器翻譯:模仿人腦理解語言的過程,產生愈加符合句型規則同時愈發容易被人理解的翻譯,微軟在線翻譯功能就是運用了深度學習技術,讓機器的翻譯水平大大提高;
情感辨識:通過辨識新聞、社交媒體、論壇等文本內容中所包含的情感誘因,及時了解網路輿論對新聞風波的反應情況;
醫療確診:例如通過對各個階段的癌癥確診這類醫療圖象數據進行學習,總結出惡性腦瘤形狀、紋理、結構等“特征”模型,進而使機器可以進行判定。
可以看見深度學習在神經元網路的基礎上,發展出了十分多的應用案例,但是當下各個行業的人工智能輔助工具和軟件都在大力開發中,各類數據都在被大量采集、清洗、輸入模型訓練,一旦訓練成功就可以大規模布署,帶來巨大的商業價值。具體有多大呢?參考一下人臉辨識領域的獨角企業市值和堪稱千億的市場規模就曉得了。假如這樣的市場再除以百倍、千倍呢,這兒面的蘊涵商業機會有多少呢?
三、認知估算
這也是人工智能的子領域,目標是與機器進行自然的、類似人類的交互。使用人工智能和認知估算,最終目標是讓機器獲得理解圖象和語音的能力,模擬人類交流過程,因而實現與人類的自然對話。也是依照神經網路和深度學習來建立的,應用來自認知科學的知識來建立模擬人類思維過程的系統。它囊括多個學科,包括機器學習、自然語言處理、視覺和人機交互。IBM就是認知估算的一個反例,在日本答題大賽節目上詮釋了它先進的問答交互能力智能AI,而且擊敗了人類。與此,同時這種服務應用插口也進行了開放,可提供其他組織用于視覺辨識、語音辨識、語言翻譯以及對話引擎等等。
如同AI的形成是多學科發展的綜合成果一樣,當下AI的快速發展也是多方面技術進步綜合上去取得的成果,總結上面重要的三個方面:
1.硬件方面:
直至本世紀初研究人員才意識到,為視頻游戲設計的GPU(圖形處理單元)可以被用作硬件加速器,以運行比先前更大的神經網路。這要歸功于這種芯片才能進行大量并行估算,而不是像傳統CPU那樣按次序處理它們。這對于同時估算構成深度學習神經網路的數百個神經元的權重非常有用。
2.通用算法:
AI那么快就流行上去,在很大程度上是由于開放的軟件工具(亦稱為框架),促使建立和訓練一個神經網路實現目標應用程序顯得容易上去,即便是使用各類不同的編程語言。對于已知的辨識目標,可以離線定義和訓練一個神經網路。一旦訓練完成,神經網路可以很容易地布署到嵌入式平臺上,也可以遷移到各類軟件程序和硬件平臺中。這是一個聰明的構架,允許利用PC或云的能力訓練神經網路,而低幀率的嵌入式處理器只需使用訓練好的數據來進行辨識。人體和物體的能力與流行的應用密切相關,例如工業機器人和手動駕駛車輛。
3.其他技術支持:
?圖形處理單元是AI的關鍵,由于它們提供了迭代處理所需的大量估算能力。訓練神經網路須要大數據和估算能力。而物聯網從聯接的設備生成大量數據,其中大部份未經剖析。使用AI手動化模型將容許我們使用更多的物聯網數據進行剖析,將貨運和信息流更好的結合上去。還有就是AI應用程序插口,可以將AI功能添加到現有產品和軟件中。例如它們可以為安防視頻系統中添加圖象辨識功能;也可以在我們觀看網路視頻時,手動創建翻譯和字幕;或則是在照相程序中手動識他人物性別和年紀甚至是表情和情緒等等,應用將會十分廣泛。
其實,這都是AI常常使用的方式,雖然我們創造了單個項目擁有趕超人類智慧的機器,這種機器一直能力有限。短期來看,人工智能將提供接近人類交互體驗,并為特定任務提供輔助支持,但它還不能成為人類的代替品,有自我意識的AI還不會很快出現。
本篇是老張創作的課程《人工智能進化論課程》基礎篇內容,轉載需授權。
免責聲明:部分文章信息來源于網絡以及網友投稿,本站只負責對文章進行整理、排版、編輯,出于傳遞更多信息之目的,并不意味著贊同其觀點或證實其內容的真實性,如本站文章和轉稿涉及版權等問題,請作者在及時聯系本站,我們會盡快為您處理。