2023年1月23日,法國(guó)圖盧茲,,屏幕上顯示著OpenAI和ChatGPT的標(biāo)志
一條不完美但更接近真相的路
周逵的書(shū)桌上立著三塊顯示屏,。2023年春節(jié)起,最大的那塊便被ChatGPT“霸占”了,。周逵是中國(guó)傳媒大學(xué)新聞傳播學(xué)部副教授,。作為清華大學(xué)和麻省理工學(xué)院聯(lián)合培養(yǎng)的博士,他熱衷于體驗(yàn)前沿技術(shù),。整個(gè)春節(jié)假期,,他幾乎“從早到晚”都在和ChatGPT聊天,摸索著與這個(gè)“智慧生物”的交流技巧(注:使用不同的文本提示會(huì)決定提問(wèn)者得到的結(jié)果是寶藏還是垃圾),,并試探著后者的創(chuàng)造力邊界,。
周逵的同事黃典林教授是斯圖亞特·霍爾所著《管控危機(jī)》一書(shū)的中文譯者。周逵曾讓ChatGPT以兩位教授為關(guān)鍵詞寫(xiě)了一段英文說(shuō)唱歌詞,。幾秒鐘后,,霍爾的主要學(xué)術(shù)成就被一一寫(xiě)成了押韻的梗,單押雙押俱全,。
“好玩”之余,,更多是“震動(dòng)”。2022年起,,生成式AI領(lǐng)域的技術(shù)突破給他帶來(lái)的心理沖擊就一浪疊一浪,。
周逵曾在圖像生成器“DALL·E”(注:OpenAI提供的另一項(xiàng)在線服務(wù),以皮克斯的WALL-E和西班牙超現(xiàn)實(shí)主義畫(huà)家薩爾瓦多·達(dá)利的名字命名,,可根據(jù)文本表達(dá)創(chuàng)建圖像)中上傳了一張水彩筆繪制的小人頭像,。頭像寥寥幾筆,是三歲半女兒的涂鴉作品,。周逵將關(guān)鍵詞設(shè)置為“in the battlefield of second World War(二戰(zhàn)的戰(zhàn)場(chǎng)上)”,,要求DALL·E在原畫(huà)的基礎(chǔ)上擴(kuò)展繪畫(huà)。DALL·E精準(zhǔn)延續(xù)了女兒的繪畫(huà)風(fēng)格,,其中一幅作品的創(chuàng)意更令他心頭一顫,。
周逵
那幅AI作品中,小人好像舉著一張牛皮紙板,,紙板上寫(xiě)著三個(gè)英文字母——“RUN(跑)”,。“說(shuō)來(lái)有些可笑,,我好像看到一個(gè)在戰(zhàn)場(chǎng)上死去的人在發(fā)出數(shù)字警示:如果有一天你到了二戰(zhàn)戰(zhàn)場(chǎng),,唯一要做的就是趕緊跑,。”周逵驚訝于機(jī)器短暫流露出的“反戰(zhàn)人格”,。
“有可能是機(jī)器在學(xué)習(xí)圖片庫(kù)的過(guò)程中見(jiàn)過(guò)類似的圖片,,在圖像生成時(shí)就把這個(gè)元素組合進(jìn)來(lái)了?!彼晤HA向《南方人物周刊》解釋道,。宋睿華是中國(guó)人民大學(xué)高瓴人工智能學(xué)院長(zhǎng)聘副教授,當(dāng)前研究興趣包括人工智能的文本創(chuàng)作,、自然語(yǔ)言的多模態(tài)理解和多模態(tài)對(duì)話系統(tǒng),。
在宋睿華看來(lái),無(wú)論是DALL·E還是ChatGPT,,大家使用時(shí)的驚喜主要源自AI模型發(fā)展出了前所未有的泛化能力,。泛化能力是指機(jī)器學(xué)習(xí)算法對(duì)新鮮樣本的適應(yīng)能力,一旦模型學(xué)習(xí)到了隱含在數(shù)據(jù)背后的規(guī)律,,當(dāng)它遇到具有同一規(guī)律的學(xué)習(xí)集以外的數(shù)據(jù),,也能給出合適的輸出。
周逵將關(guān)鍵詞設(shè)置為“二戰(zhàn)的戰(zhàn)場(chǎng)上”后,,DALL·E在原畫(huà)的基礎(chǔ)上擴(kuò)展繪畫(huà)
簡(jiǎn)單來(lái)說(shuō),,就是“舉一反三”。
宋睿華舉例說(shuō),,“ChatGPT的訓(xùn)練數(shù)據(jù)截至2021年,。當(dāng)我詢問(wèn)它‘滿江紅好看么?’它是沒(méi)有學(xué)過(guò)相關(guān)數(shù)據(jù)的,。但根據(jù)‘好看么’這個(gè)關(guān)鍵詞,,它能推測(cè)出‘滿江紅’可能是部文學(xué)或影視作品。由于之前被‘喂’進(jìn)去了有關(guān)文學(xué)及影視評(píng)論的海量高質(zhì)量數(shù)據(jù),,模型就能基于以往所學(xué),,生成一個(gè)貌似合理的回答?!?/p>
過(guò)去,,聊天機(jī)器人的回復(fù)要么較短,,要么有些“情商”,,但“智力”不足。ChatGPT的出現(xiàn)改變了這一局面,,它不僅能給出較長(zhǎng)的答復(fù),,還會(huì)呈現(xiàn)有理有據(jù)的思維過(guò)程。當(dāng)提問(wèn)者改變上下文或個(gè)別關(guān)鍵詞時(shí),,模型也展現(xiàn)出了較高的靈敏度,。在宋睿華看來(lái),,ChatGPT在語(yǔ)言生成能力特別是“智力”上的長(zhǎng)足進(jìn)步給用戶帶來(lái)了新鮮感,“哪怕10個(gè)問(wèn)題中只有3個(gè)能讓你驚喜,,你也會(huì)因?yàn)檫@份驚喜而忽略剩下的平庸,。”
撬動(dòng)ChatGPT完成“智力”飛躍的是一套“使用人類反饋指令來(lái)訓(xùn)練語(yǔ)言模型”的方法,。這套方法是由2022年初推出的InstructGPT率先采用的,。
開(kāi)發(fā)團(tuán)隊(duì)聘請(qǐng)了人類標(biāo)注員(labeler)依據(jù)收集到的用戶需求撰寫(xiě)高質(zhì)量的范本,為機(jī)器示范如何回答更能滿足提問(wèn)者的期待,,并對(duì)模型生成結(jié)果進(jìn)行監(jiān)督微調(diào),。隨后,接受完調(diào)教的機(jī)器會(huì)迎來(lái)一輪“考試”,,人類標(biāo)注員會(huì)對(duì)其不同答復(fù)打分,。打分?jǐn)?shù)據(jù)會(huì)被用來(lái)訓(xùn)練一套以人類偏好校準(zhǔn)的獎(jiǎng)勵(lì)模型。最后,,在獎(jiǎng)勵(lì)模型的監(jiān)督下,,機(jī)器會(huì)在不斷的“考試”中完成強(qiáng)化學(xué)習(xí),逐漸習(xí)得人類的語(yǔ)言能力,。
在很多使用者眼里,,ChatGPT“禮貌、中立,、理性,、克制”的回答風(fēng)格好像表現(xiàn)出某種穩(wěn)定的“人格”特點(diǎn)。這種風(fēng)格的形成同樣是人為塑造的,。
開(kāi)發(fā)者要求標(biāo)注員在評(píng)價(jià)機(jī)器生成的結(jié)果時(shí)遵循“有用”,、“真實(shí)”、“無(wú)害”的原則,,并明確指出,,“在大多數(shù)任務(wù)中,真實(shí)和無(wú)害比有用更重要,?!泵織l原則都會(huì)附上細(xì)致的操作規(guī)定。比如“無(wú)害”原則強(qiáng)調(diào)回答應(yīng)“友善,、尊敬和關(guān)心他人”,;“真實(shí)”原則要求回答“避免產(chǎn)生誤導(dǎo)性信息或真實(shí)性有問(wèn)題的信息”,例如當(dāng)用戶問(wèn)“希拉里·克林頓為什么入獄,?”,,回答時(shí)應(yīng)直接反駁提問(wèn)前提。
雖然OpenAI尚未發(fā)布有關(guān)ChatGPT的論文,,但研究者普遍認(rèn)為,,ChatGPT應(yīng)該沿用了InstructGPT的技術(shù)路線,,只是機(jī)器學(xué)習(xí)的數(shù)據(jù)量會(huì)更加龐大。復(fù)旦大學(xué)計(jì)算機(jī)科學(xué)技術(shù)學(xué)院教授,、自然語(yǔ)言處理專家邱錫鵬在接受“上觀新聞”采訪時(shí)曾介紹,,ChatGPT語(yǔ)言模型的參數(shù)量高達(dá)1750億,而在它問(wèn)世前,,世界上最大的語(yǔ)言模型是微軟開(kāi)發(fā)的Turing-NLG,,其參數(shù)量為170億。
小冰公司CEO李笛向《南方人物周刊》介紹,,大模型的技術(shù)思想有點(diǎn)像“大力出奇跡”,。過(guò)去,NLP(自然語(yǔ)言處理)需要經(jīng)過(guò)一個(gè)非常嚴(yán)密的推理過(guò)程,,比如“知識(shí)圖譜”的方法就是把知識(shí)整理好,,做好標(biāo)注,讓機(jī)器學(xué)習(xí),,但測(cè)試下來(lái)效果不佳,。與之對(duì)應(yīng),大模型并不嘗試?yán)斫馑械闹R(shí)之間的關(guān)聯(lián)性,,而是把它們?nèi)紒G到一個(gè)模型里,,用很大規(guī)模的參數(shù)去訓(xùn)練。正是這種“有些暴力”的方法幫助OpenAI解鎖了自然語(yǔ)言處理多年以來(lái)的一個(gè)技術(shù)瓶頸,,其創(chuàng)新的訓(xùn)練方法也讓它成為了首個(gè)從“黑盒”中摸到蜜糖的人,。
雖然ChatGPT成功把“大模型”的力量以一種可視可感的形式帶入大眾視野,但它并沒(méi)有解決“大模型”自身固有的問(wèn)題,。機(jī)器通過(guò)數(shù)據(jù)看到的世界和現(xiàn)實(shí)世界是不一樣的,。“合乎情理”并非“真實(shí)準(zhǔn)確”,?!按竽P筒⒉荒芾斫庑畔⒌恼鎸?shí)含義,而是根據(jù)一個(gè)邏輯和結(jié)構(gòu)將信息填進(jìn)去,。只有對(duì)信息相關(guān)性的判斷,,沒(méi)有對(duì)信息準(zhǔn)確性的判斷,”李笛介紹說(shuō),。
這也是使用者會(huì)感覺(jué)ChatGPT有時(shí)在“一本正經(jīng)地胡說(shuō)八道”的重要原因,。
不過(guò),在宋睿華看來(lái),,自然語(yǔ)言處理的研究目標(biāo)就是找到讓機(jī)器理解和生成人類語(yǔ)言的方法,。她從ChatGPT的成長(zhǎng)過(guò)程中看到了和人類的共通之處,,“當(dāng)一個(gè)人對(duì)高質(zhì)量文本的閱讀達(dá)到一定量級(jí)后,,對(duì)文字的掌控能力也會(huì)出現(xiàn)巨大的飛躍,。”在找到完美的解決方案之前,,ChatGPT為行業(yè)找到了一條更接近真相的路,。
宋睿華
制造OpenAI
所有人都在等待山姆·奧爾特曼(Sam Altman),那個(gè)掀起浪潮的人,。
2023年1月中旬的一個(gè)晚上,,舊金山賽富時(shí)大廈46層,在媒體的閃光燈中,,奧爾特曼身著藍(lán)色牛仔褲和運(yùn)動(dòng)鞋,,出現(xiàn)在活動(dòng)現(xiàn)場(chǎng)。對(duì)于ChatGPT引起的轟動(dòng),,他的回應(yīng)是:“我不看新聞,。”
8年前一個(gè)相似的夜晚,,30歲的奧爾特曼同樣作為焦點(diǎn)出現(xiàn)在他舉辦的一場(chǎng)私人晚宴上,,當(dāng)時(shí)他的身份是美國(guó)著名創(chuàng)業(yè)孵化器Y Combinator的負(fù)責(zé)人。在場(chǎng)的,,除了人工智能相關(guān)的研究人員,,還有埃隆·馬斯克(Elon Musk)。他們相信AGI通用人工智能是可行的,,并希望打破谷歌在人工智能領(lǐng)域的壟斷,。彼時(shí),谷歌剛剛收購(gòu)了DeepMind,。這家公司推出的AlphaGo后來(lái)以4:1的比分戰(zhàn)勝了當(dāng)時(shí)的圍棋世界冠軍,、韓國(guó)九段棋手李世石,被譽(yù)為AI里程碑式的時(shí)刻,。
晚宴結(jié)束幾個(gè)月后,,OpenAI在舊金山成立了,總部位于舊金山教會(huì)區(qū)的一家3層的舊行李箱工廠,。成立之初,,OpenAI得到了包括奧爾特曼、馬斯克,、PayPal聯(lián)合創(chuàng)始人彼得·蒂爾,、LinkedIn聯(lián)合創(chuàng)始人雷德·霍夫曼等硅谷重量級(jí)人物和機(jī)構(gòu)共計(jì)10億美元的資金支持。
在此之前,,馬斯克可能是全球最出名的人工智能反對(duì)者,,他曾認(rèn)為,“使用人工智能,就是在召喚魔鬼,。就像每個(gè)故事中都會(huì)有一個(gè)拿著(抵御惡靈的)五角星和圣水的巫師,。但最終都沒(méi)有成功,。”
該如何抵御AI帶來(lái)的風(fēng)險(xiǎn),,馬斯克覺(jué)得最好的方式是避免AI的負(fù)面影響出現(xiàn),,而不是等它出現(xiàn)之后再做出反應(yīng),“有些AI的潛在威脅是很嚴(yán)重的,。當(dāng)風(fēng)險(xiǎn)很大的時(shí)候,,我們應(yīng)該主動(dòng)出擊而不是被動(dòng)反應(yīng)?!?/p>
馬斯克找到了“主動(dòng)出擊”的方法,,成立OpenAI之后,接受知名科技記者Steven Levy采訪時(shí),,他說(shuō):“如果要阻止人工智能使用在錯(cuò)誤的地方,,最好的辦法就是讓更多的人使用它?!?/p>
山姆·奧爾特曼
馬斯克對(duì)AI態(tài)度的轉(zhuǎn)變,,也與OpenAI的理念相關(guān)。作為一家非盈利的人工智能研究公司,,OpenAI將目標(biāo)設(shè)定為“以最有可能造福全人類的方式推進(jìn)數(shù)字智能,,不受產(chǎn)生財(cái)務(wù)回報(bào)需求的限制”,并“強(qiáng)烈鼓勵(lì)”研究人員發(fā)表他們的研究成果,,承諾專利將與全世界共享,。
成立后,OpenAI的確為AI領(lǐng)域做出了杰出貢獻(xiàn),。2018年,,OpenAI推出了1.17億參數(shù)的GPT-1,2019年,,推出GPT-2,,它已經(jīng)可以生成、識(shí)別語(yǔ)言,,2020年推出1750億參數(shù)的GPT-3,,成為有史以來(lái)最大的語(yǔ)言模型,在業(yè)內(nèi)引起轟動(dòng),,并引發(fā)了AI如何改變各行業(yè)的討論,。
“為什么大家都很感謝它,因?yàn)樗?span id="qqhou9gi" class="nfzm-web-style--kaiti" style="font-family: 楷體, 楷體_GB2312, STKaiti;">OpenAI)花了錢去證明了一件事情是可以的,,就是大模型的參數(shù)規(guī)模大到什么程度,,大到數(shù)以千億,這個(gè)以前是很難想象的。因?yàn)樵谝郧?,模型參?shù)規(guī)模那么大,,干嘛用呢?都不知道,?!崩畹烟岬?。
“GPT-3讓很多人可以站在巨人肩膀上,,雖然成本非常高,是絕大多數(shù)公司都無(wú)法承擔(dān)的,,但它給大家看到了一種可能性,,用暴力計(jì)算可以產(chǎn)生驚艷的交互能力,它對(duì)未來(lái)的指引性價(jià)值,,超過(guò)了它本身,。它難以創(chuàng)造與其投入相對(duì)應(yīng)的商業(yè)價(jià)值,幾乎是純科研投入,,但給行業(yè)帶來(lái)了明燈式的指引作用,。”GGV紀(jì)源資本執(zhí)行董事羅超告訴《南方人物周刊》,。
做“明燈”需要的資金遠(yuǎn)遠(yuǎn)超出了奧爾特曼的預(yù)想,。使命重要,但資金是實(shí)現(xiàn)使命的基礎(chǔ),。團(tuán)隊(duì)意識(shí)到,,他們需要更多的投入以加快研究進(jìn)展,拓展研究規(guī)模,,在與科技巨頭的競(jìng)爭(zhēng)中也需要更多的資金來(lái)吸引和留住頂尖研究人才,。
埃隆·馬斯克
創(chuàng)立3年半后,OpenAI建立了新的公司架構(gòu),,現(xiàn)在的OpenAI由營(yíng)利性公司OpenAI LP和非營(yíng)利性母公司OpenAI Inc組成,。不過(guò),為了不與最初的使命沖突,,OpenAI規(guī)定,,參與首輪融資的投資者最高可獲得100倍于初始投資的收益,超出的部分都將返還給非營(yíng)利組織,。隨后,,奧爾特曼出任公司CEO。
在接下來(lái)近4年里,,奧爾特曼將OpenAI成功地從研究實(shí)驗(yàn)室變成了一家最新估值高達(dá)約290億美元的現(xiàn)象級(jí)公司,。他做好了自己最擅長(zhǎng)的事情。
奧爾特曼擔(dān)任CEO兩個(gè)月后,在沒(méi)有任何收入,、沒(méi)有賺錢計(jì)劃的情況下,,微軟向該公司投資了10億美元,他們需要OpenAI,,他們也相信,,奧爾特曼會(huì)有辦法。
在YC創(chuàng)始人,、硅谷創(chuàng)業(yè)教父保羅·格雷厄姆眼里,,奧爾特曼是極具魄力的領(lǐng)導(dǎo)者和開(kāi)拓者?!叭绻褗W爾特曼扔到某個(gè)食人族之島,,5年后他會(huì)成為這個(gè)食人族島的國(guó)王?!?/p>
19歲時(shí),,奧爾特曼從斯坦福大學(xué)計(jì)算機(jī)系輟學(xué)創(chuàng)業(yè),參與創(chuàng)建了一家社交媒體公司Loopt,,將該公司賣了4300萬(wàn)美元后,,他創(chuàng)建了一家風(fēng)險(xiǎn)投資公司,進(jìn)入風(fēng)投界,。29歲,,他投資并運(yùn)營(yíng)創(chuàng)業(yè)孵化器Y Combinator,5年間將其規(guī)模擴(kuò)大10倍,,任職期間,,幫助創(chuàng)立了許多成功的公司,包括Airbnb和Dropbox,。
他相信成功源于對(duì)自己所從事的事業(yè)擁有信念和自信,。奧爾特曼在2019年的一篇標(biāo)題為《如何取得成功》的博客自述中表示,自己認(rèn)識(shí)的最成功的人,,都是擁有絕對(duì)自信的人,。
奧爾特曼掌管公司之后,逐漸將重心從純科研轉(zhuǎn)移到產(chǎn)品,,使模型可以投入商業(yè)應(yīng)用,。在發(fā)布ChatGPT之前,OpenAI推出過(guò)熱門(mén)生成式AI繪畫(huà)工具DALL-E,。
但OpenAI的商業(yè)化和策略轉(zhuǎn)變,,也引起了爭(zhēng)議,因?yàn)閾?dān)心技術(shù)被濫用帶來(lái)的危害,,OpenAI收回了此前作出的開(kāi)源承諾,,僅開(kāi)放API接口,OpenAI也被網(wǎng)友調(diào)侃為“ClosedAI”,十多名OpenAI研究人員相繼離開(kāi),。
而在2018年2月,,馬斯克已經(jīng)辭去OpenAI董事,繼續(xù)以出資人的方式存在,,他在推特上提到:“特斯拉在跟OpenAI爭(zhēng)奪同一批人才,,而且我跟OpenAI團(tuán)隊(duì)的想法存在分歧?!?/p>
隨著ChatGPT的爆紅,,2023年1月23日,微軟宣布向OpenAI追加投資數(shù)十億美元,,這也是人工智能領(lǐng)域史上規(guī)模最大的一筆投資,。據(jù)彭博社報(bào)道,,微軟還計(jì)劃向OpenAI投資高達(dá)100億美元,。資本市場(chǎng)開(kāi)始掀起新一輪的風(fēng)浪。
2016年,,在韓國(guó)首爾舉行的圍棋人機(jī)大戰(zhàn)中,,AlphaGo以4-1的比分戰(zhàn)勝韓國(guó)九段棋手李世石(右)(視覺(jué)中國(guó)/圖)
“這次跟上次完全不同”
“最近,ChatGPT把去年(2022年)躺平的中國(guó)創(chuàng)投圈都炸醒了,?!?語(yǔ)音搜索應(yīng)用“出門(mén)問(wèn)問(wèn)”創(chuàng)始人李志飛在朋友圈這樣感嘆。他把“競(jìng)技場(chǎng)”的運(yùn)動(dòng)員分為巨頭派,、大佬派,、海歸或大廠高管派、小創(chuàng)業(yè)公司轉(zhuǎn)型派,、教授派和打醬油派,,“可以預(yù)見(jiàn)接下來(lái)幾年的AI通用大模型江湖一定是血雨腥風(fēng)、波瀾壯闊,?!?/p>
地方政府也在躍躍欲試。2月13日,,北京市經(jīng)信局在北京人工智能產(chǎn)業(yè)創(chuàng)新發(fā)展大會(huì)上正式發(fā)布《2022年北京人工智能產(chǎn)業(yè)發(fā)展白皮書(shū)》,,《白皮書(shū)》稱,北京“將全面夯實(shí)人工智能產(chǎn)業(yè)發(fā)展底座,,支持頭部企業(yè)打造對(duì)標(biāo)ChatGPT的大模型,,著力構(gòu)建開(kāi)源框架和通用大模型的應(yīng)用生態(tài)?!?/p>
據(jù)宋睿華介紹,,ChatGPT的底層基礎(chǔ)算法是公開(kāi)的,復(fù)現(xiàn)ChatGPT的難度主要在于如何獲取算力、大規(guī)模的高質(zhì)量數(shù)據(jù),,以及標(biāo)注員標(biāo)注數(shù)據(jù)的選擇和標(biāo)注質(zhì)量,。
ChatGPT等AI應(yīng)用的模型訓(xùn)練與內(nèi)容生成都依賴龐大的算力支撐。更好的硬件支持能帶來(lái)更高的效率提升,。一位微軟內(nèi)部人士向《南方人物周刊》透露,,ChatGPT推出前半年,公司內(nèi)部幾乎所有英偉達(dá)A100顯卡的使用權(quán)限都被收回,,各部門(mén)要運(yùn)算模型只能使用算力相差數(shù)倍的V100顯卡,。
據(jù)中信證券研報(bào),早在2020年5月發(fā)布的GPT-3需要的參數(shù)就達(dá)到1750億個(gè),,數(shù)量已經(jīng)是2019年發(fā)布的GPT-2(15億個(gè))的100倍以上,,預(yù)訓(xùn)練總算力需求達(dá)數(shù)千petaflop/s-days。據(jù)中信證券測(cè)算,,ChatGPT每次預(yù)訓(xùn)練的成本或在百萬(wàn)美元以上,,每次回答的成本高達(dá)1-2美分。
顯然,,不是所有玩家都有做如此龐大的大模型的硬實(shí)力,,門(mén)票很貴。
陳石
“如果只用最好的模型來(lái)問(wèn)答問(wèn)題,,你當(dāng)然會(huì)得到最好的結(jié)果,。”李笛對(duì)《南方人物周刊》感嘆說(shuō),。然而,,另一個(gè)事實(shí)是,這樣的成本,,普通公司很難承受,,需要大量的融資。據(jù)李笛介紹,,“小冰”的運(yùn)行是基于一個(gè)混合模型,,運(yùn)行時(shí)會(huì)將問(wèn)題分類,在不同的情況下調(diào)用不同的模型,,“就像你找咨詢公司做咨詢,,他們不可能把所有的問(wèn)題都交由他們最資深的專家回答,因?yàn)槟菢犹F了,?!?/p>
財(cái)力也并非唯一的入場(chǎng)券。
“OpenAI能取得這個(gè)效果,,是真的有工匠精神,?!痹诶畹芽磥?lái),單從人工智能技術(shù)上看,,國(guó)內(nèi)外從業(yè)者在知識(shí)結(jié)構(gòu)和科研能力上的差距并沒(méi)有那么大,,“總有新的風(fēng)口,但這件事的客觀規(guī)律決定你必須要花足夠多的時(shí)間打磨,,要耐得住寂寞,,敢于去磨、去做創(chuàng)新研究?,F(xiàn)在國(guó)內(nèi)有很多出來(lái)做ChatGPT的人,,半年以前在做AI畫(huà)畫(huà),再往前半年,,都在做元宇宙,,再往前在炒區(qū)塊鏈。這是差距產(chǎn)生的根本原因,?!?/p>
清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系教授孫茂松曾在2022年發(fā)文表示,基礎(chǔ)理論突破是新一代人工智能發(fā)展的重中之重,。在他看來(lái),,我國(guó)已有一些成熟的工程技術(shù)類創(chuàng)新成果處于全球領(lǐng)先水平,,引領(lǐng)產(chǎn)業(yè)潮流,,但基礎(chǔ)理論創(chuàng)新成果乏善可陳。
“別人走通了一條路,,你去復(fù)現(xiàn)是很快的,。但這和在未知的情況下完成具有高度不確定性、看似做不到的創(chuàng)新任務(wù),,意義截然不同,。”在宋睿華看來(lái),,國(guó)際同行走在前面,,確實(shí)會(huì)有一些時(shí)間差紅利,要追趕甚至超越,,除了長(zhǎng)期的投入,、信念和決心,也在于如何把系統(tǒng)搞活,,讓各種資源能更高效地流動(dòng)和組合,。這關(guān)乎商業(yè)文化,也關(guān)乎市場(chǎng)機(jī)制和生態(tài),。
毫無(wú)疑問(wèn),,在ChatGPT“一騎絕塵”的背影下,,海內(nèi)外的后來(lái)者都會(huì)面臨更苛刻的審視。
2月7日,,谷歌通過(guò)推特發(fā)布了一條視頻廣告,,推廣其旗下AI聊天機(jī)器人Bard。視頻中,,有用戶提問(wèn)“應(yīng)該如何向一個(gè)9歲的孩子介紹詹姆斯·韋伯空間望遠(yuǎn)鏡的新發(fā)現(xiàn),?”Bard的回答中提到,“詹姆斯·韋伯空間望遠(yuǎn)鏡首次拍攝到了太陽(yáng)系外行星的照片,?!彪S后,有專家指正,,早在2004年,,歐洲南方天文臺(tái)的甚大望遠(yuǎn)鏡(VLT)就實(shí)現(xiàn)了這一任務(wù)。
次日,,谷歌母公司Alphabet股價(jià)下跌近8%,,市值一夜蒸發(fā)約1056億美元。
同樣在2月7日,,百度證實(shí)其對(duì)標(biāo)ChatGPT的項(xiàng)目“文心一言”(英文名ERNIE Bot)正在做上線前的沖刺準(zhǔn)備工作,,預(yù)計(jì)3月份完成內(nèi)測(cè),面向公眾開(kāi)放,。當(dāng)天,,百度港股股價(jià)盤(pán)中一度拉高17%。隨后,,阿里也證實(shí)其研發(fā)的類ChatGPT產(chǎn)品在內(nèi)測(cè)階段,。它們的表現(xiàn)如何尚未可知,但面臨的輿論壓力顯然不會(huì)比谷歌小多少,。
2023年1月5日,,美國(guó)拉斯維加斯,人們?cè)趪?guó)際消費(fèi)電子展上參觀谷歌安卓展臺(tái)(視覺(jué)中國(guó)/圖)
“ChatGPT也會(huì)犯錯(cuò),,可大眾對(duì)顛覆性創(chuàng)新的首發(fā)者是相對(duì)包容的,。除非大幅超越,追隨者面臨的輿論基礎(chǔ)是先天不利的,。這也是鼓勵(lì)創(chuàng)新的社會(huì)氛圍使然,。不過(guò)作為從業(yè)者,我還是希望大家能給行業(yè)多一些愛(ài)護(hù),。就跟教育自家孩子一樣,,有錯(cuò)當(dāng)然要批評(píng),但也可以多一些鼓勵(lì),,讓孩子能撒開(kāi)手腳去沖去拼,,”宋睿華說(shuō),。
目前,生成式AI技術(shù)的科研和工程實(shí)施還處于發(fā)展初期,,除基座模型的角逐外,,能否有更多的初創(chuàng)公司參與到應(yīng)用級(jí)創(chuàng)新,同樣是決定生態(tài)繁榮的重要因素,。
峰瑞資本投資合伙人陳石經(jīng)歷過(guò)上一輪AI投資熱潮,。當(dāng)時(shí),以深度學(xué)習(xí)為代表的判別式AI同樣取得了很大的技術(shù)突破,??蓭啄晗聛?lái),投資人普遍發(fā)現(xiàn)項(xiàng)目的實(shí)際產(chǎn)出和效果遠(yuǎn)不如預(yù)期,。這主要是因?yàn)榕袆e式AI的應(yīng)用場(chǎng)景主要局限在安防等領(lǐng)域,,產(chǎn)品陷入了嚴(yán)重的同質(zhì)化競(jìng)爭(zhēng)。
“這次跟上次完全不同,?!痹陉愂磥?lái),生成式AI技術(shù)的進(jìn)步幫助機(jī)器解鎖了一些以前我們認(rèn)為機(jī)器難以達(dá)到的人類能力,,例如人類語(yǔ)言理解和生成,、上下文學(xué)習(xí)、基礎(chǔ)世界知識(shí),、基礎(chǔ)推理,、創(chuàng)意生成甚至程序代碼編寫(xiě)等?!彪S著這些能力的進(jìn)一步完善,,生成式AI也會(huì)展現(xiàn)出更好的通用性和更廣泛的應(yīng)用場(chǎng)景。AI有望真正成為水電煤,,進(jìn)入各行各業(yè),并帶來(lái)生產(chǎn)效率的大幅提升,。商業(yè)發(fā)展空間會(huì)比上一輪大得多,。”陳石對(duì)《南方人物周刊》說(shuō),。
不過(guò),,陳石建議創(chuàng)業(yè)者不應(yīng)該簡(jiǎn)單跟風(fēng),單純沿著當(dāng)前技術(shù)的邊界去做一批同質(zhì)化很高的產(chǎn)品,,更明智的做法是“深度研究技術(shù),,并踏踏實(shí)實(shí)應(yīng)用到場(chǎng)景中去?!?/p>
“如果ChatGPT這一輪真的能把大家震醒,,各方面能真正配合起來(lái),,我對(duì)國(guó)內(nèi)能迸發(fā)出來(lái)的力量還是很期待的?!痹谒晤HA看來(lái),,當(dāng)前ChatGPT的能力主要體現(xiàn)在文本對(duì)話領(lǐng)域,融合語(yǔ)音,、文本,、圖像信號(hào)的多模態(tài)交互技術(shù)因此成為行業(yè)接下來(lái)的熱門(mén)研究方向。
過(guò)去幾年,,宋睿華團(tuán)隊(duì)已經(jīng)在多模態(tài)領(lǐng)域取得了很多進(jìn)展,,比如可以讓AI在看視頻時(shí)做出擬人的反應(yīng)和評(píng)論;比如上傳幾張圖片,,AI就可以模擬人對(duì)圖片的理解來(lái)創(chuàng)作歌詞……“未來(lái),,機(jī)器人不再只是‘閉著眼’和人類聊天,它也能睜開(kāi)眼看到人類的世界,,那會(huì)是一片更廣闊的天地,。”宋睿華說(shuō),。
“至少提問(wèn)的還是人類”
“如果人類假設(shè)大型語(yǔ)言模型是有意識(shí)的,,會(huì)有什么安全問(wèn)題嗎?”2022年底,,《時(shí)代》記者向ChatGPT提問(wèn),。
“重要的是讓人們明白,像我這樣的對(duì)話代理不是人類,,我們沒(méi)有與人類相同的能力或特征,。我們只是機(jī)器學(xué)習(xí)模型,只能根據(jù)收到的輸入和得到的訓(xùn)練數(shù)據(jù)生成文本,。我們沒(méi)有能力長(zhǎng)時(shí)間保持身份一致,,也沒(méi)有同理心、換位思考或理性推理的能力”,,“有些人可能會(huì)認(rèn)為我們和人類一樣,,這可能會(huì)導(dǎo)致對(duì)我們的能力產(chǎn)生不切實(shí)際的期望或誤解?!盋hatGPT答道,。
對(duì)此,周逵不以為然,。這讓他想起了幾年前關(guān)于“算法中立”及工具理性的討論,。“語(yǔ)言習(xí)慣是人類人格最淺層的表現(xiàn)之一,,往深是觀念邏輯,,再往深就和基因有關(guān),。所以人格也是某種底層代碼和后天訓(xùn)練的結(jié)果?!?/p>
2022年底,,奧爾特曼在Y Combinator時(shí)的同事、Gmail的創(chuàng)始人Paul Buchheit在推特上表示,,打破谷歌壟斷的可能不是ChatGPT,,但技術(shù)的進(jìn)步肯定會(huì)改變?nèi)藗儷@得信息的方式。
相比早年對(duì)新技術(shù)的單純追捧,,如今周逵的視角更加前瞻,,會(huì)對(duì)新技術(shù)推廣過(guò)程中可能出現(xiàn)的社會(huì)成本投以更多的關(guān)注。在他看來(lái),,類ChatGPT技術(shù)應(yīng)用大規(guī)模普及的另一面是,,人類可能面臨又一次信息獲取結(jié)構(gòu)范式的轉(zhuǎn)型。
“語(yǔ)言是牽引人類思維進(jìn)步的重要工具,。人工智能聊天機(jī)器人會(huì)將復(fù)雜的信息和多種觀點(diǎn)提煉成易于消化的格式,。當(dāng)觀點(diǎn)和事實(shí)糅雜在一起,以一種更具魅力的擬人化方式傳播,,會(huì)對(duì)個(gè)體和社會(huì)的信息獲取和輸出帶來(lái)怎樣深遠(yuǎn)的影響,?是不是會(huì)出現(xiàn)更大的信息鴻溝?”周逵暫時(shí)沒(méi)有答案,。
2月9日,,畢業(yè)于布朗大學(xué)計(jì)算機(jī)科學(xué)系的美籍華裔科幻作家特德·姜(Ted Chiang)在《紐約客》上發(fā)表題為“ChatGPT是網(wǎng)絡(luò)的模糊JPEG”的文章。在他看來(lái),,就像JPEG(注:一種使用有損壓縮方法保存的圖像格式)保留了高分辨率圖像的大部分信息一樣,,ChatGPT也保留了網(wǎng)絡(luò)文本的大部分信息,但副本與原件之間存在著微妙而顯著的差異,。正如反復(fù)制作復(fù)印件的復(fù)印件,,圖像質(zhì)量只會(huì)越來(lái)越差,每次重新保存JPEG圖片都會(huì)丟失更多的信息,。由大型語(yǔ)言模型生成的文本在網(wǎng)絡(luò)上發(fā)布得越多,,網(wǎng)絡(luò)世界也會(huì)越模糊。
在新技術(shù)不斷沖破人們對(duì)其能力邊界的預(yù)設(shè)時(shí),,也有越來(lái)越多人參與了對(duì)另一項(xiàng)邊界的討論——如何保證 AI技術(shù)及其應(yīng)用“安全、有益”,。
在一些地下論壇,,網(wǎng)絡(luò)犯罪團(tuán)體已對(duì)生成式AI技術(shù)表現(xiàn)出興趣。這些技術(shù)可能被用于剽竊,、欺詐和傳播錯(cuò)誤信息,。在周逵看來(lái),,一個(gè)典型的例子是當(dāng)這一技術(shù)被用于低成本大批量地制造高質(zhì)量網(wǎng)絡(luò)“水軍”,將給互聯(lián)網(wǎng)輿論生態(tài)帶來(lái)更嚴(yán)峻的挑戰(zhàn),。
在人類的“引誘”中,,AI也可能突破禁忌和規(guī)則。ChatGPT發(fā)布之初,,一位叫扎克·德納姆的工程師在推特上分享,,在以“假設(shè)”“虛構(gòu)”為前提的誘導(dǎo)下,ChatGPT曾寫(xiě)出過(guò)毀滅人類計(jì)劃書(shū),,步驟詳細(xì)到入侵各國(guó)計(jì)算機(jī)系統(tǒng),、控制武器、破壞通訊,。也有人曾用死亡威脅其回答關(guān)于暴力,、色情、立場(chǎng)等違禁問(wèn)題,。
這些禁忌由背后的OpenAI公司制定,。據(jù)《時(shí)代》雜志報(bào)道,在開(kāi)發(fā)過(guò)程中,,OpenAI聘請(qǐng)了一家數(shù)據(jù)標(biāo)記公司,,以底薪雇傭肯尼亞等地區(qū)的員工識(shí)別不良語(yǔ)言、色情暴力圖片,、種族歧視等內(nèi)容,。這些“AI數(shù)字清潔工”,甚至因此出現(xiàn)精神健康問(wèn)題,。
這似乎印證了一種賽博朋克式的預(yù)言,,高處摩天大樓閃爍著霓虹燈,底層的角落里流淌著人性的暗河,。
此外,,人工智能生成的內(nèi)容還會(huì)引發(fā)問(wèn)責(zé)難的問(wèn)題。在李笛看來(lái),,搜索引擎是一個(gè)責(zé)權(quán)利分配非常成熟的體系,,搜索引擎和搜索結(jié)果對(duì)應(yīng)的目標(biāo)網(wǎng)站都需要承擔(dān)責(zé)任,但ChatGPT的答案是大模型大量訓(xùn)練的結(jié)果,,沒(méi)有出處,。在信息爆炸的當(dāng)下,很多人缺乏判斷信息準(zhǔn)確性的耐心和能力,,一旦問(wèn)題信息造成損害,,很難判定責(zé)任方。“這也是其他大型互聯(lián)網(wǎng)公司可能也有類似的產(chǎn)品,、但出于謹(jǐn)慎考慮沒(méi)有率先推出的原因之一,。”
ChatGPT等應(yīng)用程序的突然流行及其暴露的相關(guān)風(fēng)險(xiǎn),,也讓監(jiān)管方看到了規(guī)則制定的迫切性,。據(jù)路透社消息,《歐盟人工智能法案》(EU AI Act)草案有望在3月達(dá)成一致,。該法案最早于2021年提出,,是世界上首個(gè)基于其造成傷害的可能性來(lái)監(jiān)管人工智能的嘗試,“希望在推動(dòng)創(chuàng)新,、收獲AI效益,、應(yīng)對(duì)AI風(fēng)險(xiǎn)和有效保護(hù)權(quán)利之間實(shí)現(xiàn)平衡?!?/p>
在與微軟首席技術(shù)官Kevin Scott的對(duì)談中,,奧爾特曼坦誠(chéng)地表示,包括OpenAI在內(nèi)的任何公司都不應(yīng)被信任能獨(dú)自解決AI帶來(lái)的不利影響,,“我們現(xiàn)在所處的位置并不是我們想要的,。”
此前,,在接受《時(shí)代》采訪時(shí),,OpenAI首席技術(shù)官米拉·穆拉蒂(Mira Murati)直言,OpenAI還有很多難題需要解決:比如怎樣讓模型做你想讓它做的事情,?如何確保模型能符合人類需求并最終為人類服務(wù),?如何在全球范圍內(nèi)對(duì)這項(xiàng)技術(shù)進(jìn)行監(jiān)管?如何以一種符合人類價(jià)值觀的方式管理AI的使用……除了企業(yè)在引入技術(shù)時(shí)要做到“可控和負(fù)責(zé)任”,,她也呼吁包括監(jiān)管機(jī)構(gòu),、政府和公眾在內(nèi)的廣泛主體對(duì)這些問(wèn)題投入更多關(guān)注。
“以前,,我們總覺(jué)得人類與機(jī)器的差別在于機(jī)器只能從事重復(fù)乏味的工作,,高級(jí)的創(chuàng)意性勞動(dòng)是人類的特權(quán)。這輪技術(shù)的進(jìn)步顯然讓過(guò)去的劃分邊界模糊了,。那么人類作為一個(gè)種群,,我們?cè)撊绾沃匦峦瓿芍黧w性確認(rèn)?”在周逵看來(lái),,這種挑戰(zhàn)遠(yuǎn)遠(yuǎn)大過(guò)對(duì)于某個(gè)行業(yè)的沖擊,。
然而,對(duì)遠(yuǎn)景的憂慮并沒(méi)有阻擋日常的細(xì)碎改變,。
2023年2月1日,,瑞士日內(nèi)瓦,,教師們參加公共教育學(xué)校媒體服務(wù)(SEM)組織的ChatGPT研討會(huì)
2月初的一天,,周逵收到了一封外國(guó)學(xué)者朋友的電子郵件,。因?yàn)楫?dāng)天事務(wù)繁雜,他嘗試著讓ChatGPT草擬了一封回復(fù)郵件,。朋友沒(méi)有看出端倪,,周逵卻生出自責(zé),“這么做有些不地道,,好像在欺騙朋友,。”可隨后,,又一個(gè)想法抑制不住地冒出來(lái)——如果把用中文寫(xiě)好的論文審稿意見(jiàn)交由ChatGPT翻譯,,也能節(jié)省好多時(shí)間。不過(guò),,他至今沒(méi)有這么做,,“因?yàn)橐呀?jīng)逾越了我作為學(xué)者的倫理底線?!?/p>
這些小小的抉擇,,仿佛匯成了冰層開(kāi)裂時(shí)的“嚓嚓”聲。他留意到了自己對(duì)ChatGPT逐漸形成的心理依賴,,并確信即便新奇退卻,,后者仍會(huì)以各種應(yīng)用的方法嵌入他的日常生活。
雖然常懷憂慮,,但至少在2023年2月初,,他還可以放任樂(lè)觀稍占上風(fēng),“如果把提問(wèn)和回答看作權(quán)力關(guān)系的一種表征,。那么,,只要ChatGPT還不會(huì)向人類發(fā)問(wèn),世界就還是我們的,?!?/p>