僅一張草圖,能夠生成一個網站代碼;10秒鐘畫出一幅符合要求的插畫;它被拿來寫論文、做表格、甚至還可以寫小說……
近日,火熱網路,3月16日,百度文心一言發布會的舉辦,更是將生成式人工智能推向輿論高潮,網友們在聽到的強悍功能后,也引起了無限遐思,“自己未來會不會待業?”“是否會掀起第三次科技革命?”
科技部主任王志剛在不同的場合兩次提及了智能聊天工具,2月24日,國新辦召開“權威部門話開局”系列主題新聞發布會,科技部高新技術司局長陳家昌提出,下一步,科技部將把人工智能作為戰略性新興產業,作為新下降引擎,繼續給以大力支持。
(ChatPre-)是由德國人工智能研究實驗室推出的一款人工智能聊天機器人。作為一個小型語言模型,有效結合了大數據、大算力、強算法,擁有較強的語言理解和文本生成能力。
這么智能聊天工具的發展前景怎樣?它會帶來什么方面的改革?以及怎樣應對它可能帶來的風險?正觀新聞記者聯系到中國科技學院院長、中國人工智能學會人工智能倫理與整治地委會書記陳小平,針對生成式人工智能的眾多話題進行采訪。
陳小平博士歷任中國科學技術學院院長,國際頂尖刊物JAIR和KER編委,中國委員會主席,2008和機器人世界杯及學術會議主席,2015世界人工智能聯合會議機器人系列主席。創建并領導中國農大機器人實驗室,取得智能機器人和多Agent系統系列化創新成果,先后獲得10項世界亞軍。
陳小平受訪者供圖
談現況:5~10年完全有可能真正實現大面積應用
正觀新聞:當前,人工智能發展處在一個哪些樣的階段?
陳小平:2017年阿爾法狗第四代就早已通過實驗證明,它遠遠超過人類所有現役的象棋大神。但當時可能好多人都不太注重這件事,覺得只限于下象棋,現今事實證明這一判定是不符合事實。
前幾年我在好多場合都提出我的判定:預測在10~15年內才會實現人工智能的大面積應用,其中對我國最重要的應用領域是制造業和實體經濟。過去的5年,即使人工智能還沒有實現大面積應用,并且早已出現了具有大面積應用潛力的人工智能。事實上,這是一個很急迫的形勢。
并且就當前生成式人工智能的發展狀況來說,通過哪些方法、在什么行業實現大面積應用,會帶來哪些樣的后果,仍存在很大的不確定性。
目前人工智能發展很快,實際情況是學術界、產業界、社會各界都沒做好打算,沒做好打算的緣由在于你們沒預期發展那么快。當前在我們沒做好打算的情況下,我認為最重要是要防止兩個極端,我們既不能恐慌,也不能掉以輕心。
我的預測延續到如今這個時間點,最快就是5年內就可能大面積應用,生成式人工智能會帶來好多新的整治挑戰,我們如今一定要做好相關的工作,不僅研制以外,倫理治理一定要提上議事日程。倫理治理不只是學術界、產業界的事情,而是涉及社會各界,包括政府和行業管理機構,與大家息息相關。
談特點:GPT為什么這么智能?
正觀新聞:GPT-4有哪些特征?
陳小平:GPT-4是以大模型為核心的生成式人工智能的一個代表。簡單來說,目前生成式人工智能分成下層和底層兩個層次,而底層的核心是預訓練模型。就像大廈的地基加上大廈的基礎設施,預訓練模型在生成式人工智能中起類似的作用。
預訓練模型是用原始文本進行訓練的,原始文本指的就是直接從網路上下載的,沒有經過人工標明的內容。有人恐怕GPT-3的訓練文本的總數占互聯網文本總數的1/3~2/3。預訓練模型使用如此多的文本,做的最重要最基礎工作,就是從原始文本手動抽取文字之間的關聯度。例如“我”和“們”之間的關聯度很高,“我”和“門”之間的關聯度很低。除了抽取相鄰文字之間的關聯度,但是抽取遠距離文字之間的關聯度。
為何GPT給你們印象這么好,說它有理解能力,一個主要誘因就在于它能掌握遠距離的關聯。日常生活和文字工作中,如說話聊天、寫作文、撰寫督查報告、做廣告企劃……這些任務都涉及文字的關聯度。借助文字關聯度執行這種任務,可以在很大范圍內讓人覺得AI在說人話。
生成式人工智能還有一個下層,下層是對預訓練模型做進一步的加工訓練。要讓GPT說下來的話比較符合用戶的偏好,而不僅僅是聽上去像人話,這個時侯就須要人工標明,來反饋人對于AI的期望,所以這些反饋也是原始數據。諸如在的基礎上又做了專門訓練,這么它在聊天上就聊得更好。
另外在預訓模型里面又訓練了一個專門寫代碼的軟件,訓練代碼和訓練聊天不一樣,須要的訓練數據是不一樣的。經過各類后續訓練得到的還是大模型,通常稱之為微調大模型。
談缺點:兩個局限不可能徹底改掉
正觀新聞:GPT有沒有缺點?
陳小平:盡管GPT那么強,大模型不管是預訓練模型,還是微調模型,還是其他的類型的大模型,都有著相同的基本特點。并且它們對社會形成的作用常常就是由基本特點決定的。
我認為大模型有兩個基本特點最為重要。第一個特點,小型語言模型最核心的能力是文字的關聯度,這是一種語言功能,語言具有公用性而不具備通用性。
舉個事例,我們人工智能專業的主要的知識是用本專業的特殊的語言來抒發的,不是用自然語言,而物理學科的主要的知識是用物理語言、數學公式來描述的,數學、化學等各個學科都有自己的專業語言。
雖然我們觀察到一些現象,例如說很多人和GPT聊天,就發覺普通的話題它回答得挺好,但專業的話題回答上去常常不太令人滿意,緣由就在于語言不具有通用性。
第二個特點也是十分關鍵的。語言本身不能決定真偽,也不能決定優劣。語言是一個抒發工具,既可以抒發假話(符合事實的話)、好話(符合倫理的話),也可以抒發真話、壞話。為此我們不能要求生成式人工智能能決定真偽,判定優劣,這種要求都不現實。
隨著技術不斷地迭代,大模型說的謊話越來越少,假話越來越多,說風涼話越來越少,壞話越來越多,而且你不要指望到某三天,它就只說假話不說真話,只說好話不說好話,這三天永遠等不來,由于這是先天局限。從這個特點就看下來倫理治理的重要性了。
談國外:文心一言曝露的問題是正常的
正觀新聞:近日百度推出文心一言,目前我國預訓練語言模型發展狀況怎么?您是怎么看待文心一言的?
圖源文心一言發布會
陳小平:中國的學術界和產業界仍然是大模型技術的積極的參與者,但是做了大量工作。并且目前這個階段,生成式人工智能步入了大規模實測階段,從這個角度來看,愛爾蘭的產業界走到后面去了,所以在這個背景下,文心一言的發布,說明中國在該領域有很大的進步。
國外過去早已發布了多個大模型,而且并沒有面向全社會開放做測試。目前文心一言早已走出了這一步。人工智能發展不能只研究技術、模型,而是要去實際應用,那必將要去做大規模的實測,能夠了解其性能好不好,所以文心一言和一些其他的國外外企業往這個方向走,我認為都特別好,就應當有更多的企業去做大規模實測。
有人對文心一言進行了一些非專業測試,發覺了文心一言的表現有些不太令人滿意的情況,我也聽到了一些。但如今我沒有聽到對文心一言的系統性測試,我沒法給它下定論。
對于目前非專業測試發覺文心一言曝露出的一些問題,我認為其中好多問題都可以通過算法的優化得到解決,大部份問題在我看來都不是大問題,雖然文心一言打算時間比較短。大模型是個大系統,上面用了好多技術,所以它出了一些故障是很正常的。
這樣看中國在這個領域還是很有希望,依然有可能像你們期望的那樣,很快進入領頭羊的位置,非常是針對英文語言。我十分期盼我們中國的公司能把英文處理好。
談沖擊:須要做大社會財富面包
正觀新聞:生成式人工智能的使用有什么優劣,對哪一些行業形成影響?哪一類人群可能會待業呢?
陳小平:生成式人工智能以哪些方法在什么行業大規模應用,如今不是完全清楚。但能確定的是人工智能,因為兩個基本特點,它不能徹底替代人。現今有一些專家判定,比較大的可能性是生成式人工智能代替一部份中級職工,例如翻譯、編程、文案企劃……這些崗位的中級職工有可能會被替代一部份。
其實目前技術條件并沒有完全具備。但是潛在的問題早已值得注重了,若果短時間內代替了好多中級職工人工智能,這個對社會就業是一個很大的沖擊。
就業問題也會對行業的常年發展帶來影響,中級職工都是從中級職工逐漸鍛練成長上去的,假如中級職工沒有了,中級職工也就不復存在了。
據悉,中級職工可能由于人工智能的到來而獲益,擅于使用生成式人工智能的中級職工的工作效率可能會增強,收入可能會降低,同時中級職工之間的內卷可能會減緩,下游企業之間的競爭也有可能減緩。
教育行業也可能因而發生改變,假如某一個行業大規模縮減中級職工,這個行業的學院教育和職業教育都會遭到巨大沖擊。這是一個牽一發動四肢的問題。我們須要從更寬廣的視野去考察那些影響,還須要做更全面深入地剖析。
假如生成式人工智能大規模投入市場,并且整個市場規模、經濟體量沒有擴大,只不過生產方法變了,效率比原先高了,這么就帶來兩個可能的結果,一個后果就是一部份人待業。
另外還有一種可能的后果——較高收入崗位更迭為較低收入崗位,這是一些發達國家過去幾六年出現的情況,結果造成社會分化,矛盾激化。如今我國面臨的新情況是,在制造業好多崗位嚴重缺工的背景下,服務業又可能出現崗位降低,這就值得高度注重。
針對上述種種問題,一條重要出路在于我們能不能把社會財富的碟子做大。采用新的技術使生產效率提升的同時,假如碟子也做大了,這種問題才能解決,或則就沒有這么嚴重。
比如,原先我們用的電話都是固定電話,隨著產業的升級,出現了手機,用手機的人一下降低了特別多,結果碟子變大了,相關行業的職工并沒降低,反倒降低了。所以,生成式人工智投入大面積應用后,能夠把碟子做大,對中國尤其重要。
談倫理:新的整治模式要盡早跟得上
正觀新聞:GPT-4存在什么風險值得注意?您能夠提出些應對風險的建議?
陳小平:目前倫理治理面臨的一個關鍵問題是:生成式人工智能將提供一種新的服務,還是成為一種新的基礎設施?這兩種情況須要的整治模式是根本不同的。
我傾向于覺得,生成式人工智能有潛力成為新型的基礎設施,這促使傳統的整治模式顯得不再適用。例如,馬斯克面對生成式人工智能仍然指出做開源,而開源軟件和傳統的閉源軟件代表著不同的創新模式和社會整治模式。
人工智能倫理治理的根本宗旨是增進人類福祉,而不是單純地防范風險。在人工智能技術快速發展的當下,尤其須要思索一個重要課題:通過新的創新模式和社會整治模式,能夠讓新技術解決經濟回報不夠大的重大社會需求。例如,單純從技術角度,人工智能完全可以應用于涉及85%人口的普惠養老,但因為經濟回報太低,在現有創新模式下這些應用面臨重重困難。因此,完全有必要建立新型創新模式和整治模式。
生存式人工智能的大面積持續性應用取決于兩個條件,一是技術的迭代能不能讓技術真正大面積地實用化;另一方面是,我們能夠構建新的社會整治模式和創新模式,以保障新技術的大面積持續性應用能否增進人類福祉。在某種意義上,倫理治理具有更加重要的作用。
免責聲明:部分文章信息來源于網絡以及網友投稿,本站只負責對文章進行整理、排版、編輯,出于傳遞更多信息之目的,并不意味著贊同其觀點或證實其內容的真實性,如本站文章和轉稿涉及版權等問題,請作者在及時聯系本站,我們會盡快為您處理。