“隨著2017年AlphaGoZero的面世,人工智能技術發展開啟了第四次浪潮。這個階段,人工的基本特點發生了改變?!痹?023年5月18日召開的中國家用電器技術大會上,中國科學技術大學教授陳小平在介紹人工智能新發展時如是說。
此次大會上,陳小平不僅對人工智能的大模型進行了詳細介紹,還分享了從大模型到柔性機器人的新發展,以及這些變化帶來的新機遇和挑戰。
陳小平在演講中指出,現階段,人工智能呈現出四大特點,即大任務、大訓練、大模型、大系統。
(資料圖)
其中,大任務,指的是大規模的真實場景任務,如下棋、聊天、語言翻譯、命題、作文、命題繪畫等。陳小平以圍棋為例,大模型抓取了超過1億全球用戶的真實場景,這在以往是非常少見的。
大訓練,則是指人工智能訓練法已經從過去的大數據驅動,在2017年以后轉變為大訓練驅動。相比大數據驅動,大訓練驅動的具體表現為四項新要求。陳小平詳細介紹說:“第一,訓練數據的質。在大數據驅動的時候,人工智能對數據的質沒有要求,而現在強調的是原始數據。第二,訓練數據的量。現在對人工智能原始數據的量給出了新的標準,就是人類規模。比如ChatGPT,有人分析它抓取了互聯網1/3到2/3的文本數據訓練。第三,數據獲取方式。因為原始數據為人類規模的量,這就必須要用自動或者半自動的方式抓取數據。第四,訓練結果發生了變化。現在的訓練結果,是一種實例性的模型?!?
大模型,就是經過大訓練生成的大型實例性模型,例如,大型語言模型,也簡稱為大模型。大系統則是針對大任務、圍繞大模型、集成大量技術的集成智能系統?,F在的人工智能,是集成智能,它里面集成了非常多的、不同種類的智能技術。陳小平表示,中國想要抓住這一階段的發展機遇,非常關鍵的是要在概念上跟上時代,甚至是提前定義。
人工智能現階段的應用是生成式的,且已不再是狹義的生成語言、圖像等內容,而是從人到AI、從AI到人的交互?!拔艺J為,自然語言人機交互的重點是,會說話,能聽懂人話,能回答問題,但不能保證回答一定正確。對機器語言表達的基本要求,是說話要符合人的語言習慣?!标愋∑奖硎荆Z言習慣是什么,現在沒有科學標準,但是有經驗標準。所以關鍵是要掌握并利用這個經驗標準,這就要從人類規模語料中自動提取語言痕跡,并用于人機自然語言交互。
語言痕跡來源于原始語料。陳小平用兩個句子組成的語料進行簡單舉例:用于訓練的語料分別為“我要上網,請打開瀏覽器。”“我要聽歌,請打開音響?!边@兩句話反復說,且概率分別為0.6和0.4。如果基于相鄰語元之間關聯度的預測,也就是給定一個語元,預測下一個出現的語元,不確定情況下預測錯誤率過高。比如從“要”預測“上網”的錯誤率達到40%。如果基于語言痕跡遠程關聯度時(遠距離語元之間的關聯強度),“上網”與“瀏覽器”語元雖然不相鄰,但具有高關聯度,若已出現“打開”和“上網”,預測出“瀏覽器”的錯誤率為0。
對此,陳小平表示,基于語言痕跡遠程關聯時,預測錯誤率可以大大降低。這也是為什么大家覺得大模型好用?!半m然舉例的兩個句子只有六個語元,但在實際應用中,是從人類規模語料中提取語元關聯度,用于自然語言人機交互,數據的量很大。人工智能可以回看的語元至少超過4000個,甚至已經有可以回看10萬個語元的大模型發布?!标愋∑街赋?,如果將互聯網三分之一到三分之二的語言痕跡都抓取做成模型,大模型將非常強大。
上述所說的抓取語言痕跡,訓練語言痕跡,對語言痕跡做關聯,被稱為預訓練模型。這是大模型技術體系中的一部分。陳小平表示,實際上,預訓練以后的實際效果可能不夠理想,不夠精細,此時就可以引入一種方法——細調?!凹氄{類似于收音機的調臺旋鈕,一般收音機不清晰時,就需要細調旋鈕,直至內容變得清晰?!标愋∑奖硎荆氄{是專門訓練出的專用模型,通俗來說,不是大范圍的調整,而是有一個目標后,針對當前矛盾去細調。經過細調后的大模型應用效果會大幅提升。但是細調不是憑空實現的,需要大量的語言數據進行支撐,且用不同的數據進行不同的細調。例如聊天用聊天的細調,編程用編程的細調。
然而,細調后的大模型效果可能還是不夠,還可以運用“提示”?!斑@是小規模的訓練,為用戶引導模型的回答。也就是在提問題時,不僅要提問,還要給出一些提示。如果提示說得好,回答的質量也會大幅提升?!?
值得一提的是,大模型是實例性模型,是從訓練預料中提取的語元和語言關聯度的全體組成的模型,它沒有概括性規則,無法進行數學-邏輯推理?!按竽P褪且环N顛覆,我們需要用新的觀念、新的理念去看待?!标愋∑秸f。
一些科幻電影刻畫出的機器人具有自己的情緒、情感,會有自己的思想。陳小平直言,擬人化想象對大模型以及所有通過了大規模驗證的人工智能都不成立?!凹词乖诤腿斯ぶ悄芙换サ墓ぷ髦校瑫恼Z言中感受到情感、情緒,這也是因為語言的投射效應,即腦補?!标愋∑奖硎荆苏f話都帶涵義,所以習慣性地將自己理解的涵義投射到大模型上,認為大模型說話也帶涵義。“對大模型人工智能做擬人化想象,是不科學的?!?
大模型的應用,也將為人類帶來重大的機遇和挑戰。在機遇方面,陳小平表示,大模型可以應用于很多場景,例如聊天、智能家居的人機交互、文案撰寫、智能客服等。人工智能的加持下,能解決很多以往大家無法解決的問題。
同時,大模型還會帶來新的挑戰。首先是公共安全,其次是就業問題?!?017年開啟人工智能第四次浪潮的標志性實踐,就是AlphaGoZero圍棋程序面世,且該程序的圍棋水平已經超過職業選手。現在,人類積累了千年的圍棋知識很少再是人工教授或者看書,大家都開始通過這個程序進行訓練和學習,人與人的對練已經很少。”他表示,雖然圍棋是很小的領域,但未來大模型的應用可能會延伸到各領域,也有可能發生類似圍棋領域的情況,從而影響就業。
人工智能如何在物理世界中應用,也是很大的挑戰。比如現實世界中的家庭、醫院、工業、農業場景,現在的大模型是無法勝任的。陳小平表示,現在在工業上普遍應用的機械臂,基本上都是剛性的,這類機器人重復精度高,但靈巧性、安全性低,適合用于結構化環境。對于更復雜的非結構化環境,需要精確測量、建模和計算,這就需要軟體機器臂(柔性機器人手臂),也就是軟體機器人。這類產品采用蜂巢氣動網絡結構,為材料-機構-算法的一體化設計。據陳小平介紹,與傳統機械手臂相比,軟體機器人在制作成本、負載能力、后期維護等方面都具有較高的優勢。陳小平在現場通過幾個視頻,分享了軟體機器人在喂飯、開門、擰瓶蓋、拉抽屜等多個場景的應用。
對于人工智能在中國的應用,陳小平表示:“我認為,對于中國,大模型在智能制造、智慧農業、惠普養老三方面能得到很好的應用后,將迎來巨大的機遇。”
嚴正聲明:“電器微刊”所有原創文章,轉載均需獲授權。
標簽: