飞象网 - 通信人每天必上的网站

首頁(yè)|必讀|視頻|專訪|運(yùn)營(yíng)|制造|監(jiān)管|大數(shù)據(jù)|物聯(lián)網(wǎng)|量子|元宇宙|博客|特約記者
手機(jī)|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計(jì)算|芯片|報(bào)告|智慧城市|移動(dòng)互聯(lián)網(wǎng)|會(huì)展
首頁(yè) >> 頭條資訊 >> 正文

大模型,何時(shí)迎來(lái)大轉(zhuǎn)折?

2024年9月5日 08:33  第一財(cái)經(jīng)  

“真正的變革是,什么時(shí)間點(diǎn)有一個(gè)模型可以把錯(cuò)誤率降低到個(gè)位數(shù)。”

在經(jīng)歷了上半年密集的技術(shù)和產(chǎn)品發(fā)布后,下半年的AI圈顯得有些平靜,不再有如Sora這樣引發(fā)轟動(dòng)的產(chǎn)品,在GPT-4o之后,行業(yè)引領(lǐng)者OpenAI也遲遲沒有大動(dòng)作。不少行業(yè)人士認(rèn)為,技術(shù)的迭代放緩了。

在亞布力企業(yè)家夏季年會(huì)上,獵豹移動(dòng)董事長(zhǎng)傅盛提出一個(gè)觀點(diǎn),AI浪潮已出現(xiàn)泡沫跡象,從大模型出現(xiàn)在大眾視野以來(lái),已過去近一年的時(shí)間,但最頂級(jí)大模型的模型沒有明顯提升。“客觀來(lái)說(shuō),誰(shuí)家大模型有什么優(yōu)勢(shì),基本尚屬‘一家之言’,用戶用起來(lái)沒有感覺到太大差別。”他認(rèn)為,當(dāng)前大模型同質(zhì)化嚴(yán)重。

在與MiniMax創(chuàng)始人閆俊杰的交流中,關(guān)于瓶頸與轉(zhuǎn)折點(diǎn)他提到,現(xiàn)在所有模型錯(cuò)誤率都是20%的量級(jí),“真正的變革是,什么時(shí)間點(diǎn)有一個(gè)模型可以把錯(cuò)誤率降低到個(gè)位數(shù),這會(huì)是一個(gè)非常本質(zhì)的變化。”未來(lái)大模型能否成功,傅盛也認(rèn)為,大模型的天花板能否再上一個(gè)臺(tái)階很重要。

“至暗時(shí)刻覺得技術(shù)很重要”

這一輪的生成式AI是一場(chǎng)掀起巨大浪潮的社會(huì)生產(chǎn)力革命,傅盛認(rèn)為,這波浪潮今天已經(jīng)呈現(xiàn)出明顯的泡沫跡象。

何為“泡沫”,傅盛認(rèn)為,一方面是模型能力沒有明顯提升。“在一個(gè)以科技為核心的技術(shù)浪潮中,這是不太正常的。”每次寫不同的東西,傅盛都會(huì)用好幾個(gè)大模型互相比較,“有時(shí)候這個(gè)大模型更好用,有時(shí)那個(gè)更好用,當(dāng)前大模型的同質(zhì)化很嚴(yán)重。”

其次,說(shuō)了這么久人工智能,“但真正的Killer APP(殺手級(jí)應(yīng)用)并沒有出現(xiàn),不僅在C端沒有出現(xiàn),B端也未能出現(xiàn)。很多行業(yè)大模型都說(shuō)自己有不少應(yīng)用,但真正提效的并不多。”傅盛說(shuō),想要將大模型真正變成一個(gè)明顯能提效的應(yīng)用,還很有難度。

潑了盆冷水的同時(shí),傅盛補(bǔ)充表示,泡沫不見得會(huì)使大模型發(fā)展崩塌,因?yàn)橛悬c(diǎn)泡沫很正常,互聯(lián)網(wǎng)早期也曾出現(xiàn)泡沫。

在今年6月演講時(shí),金沙江創(chuàng)投主管合伙人朱嘯虎曾談及GPT-5一直“跳票”時(shí)表示,“硅谷也高度懷疑GPT-5還有沒有,即使出來(lái)在核心推理能力上還有沒有顯著的提高,這是很不確定的東西,今年年底是一個(gè)驗(yàn)金石。”他判斷,大模型演化速度有放緩趨勢(shì),而迭代曲線放緩以后,應(yīng)用層的機(jī)會(huì)就會(huì)更多。

不過,在波形智能創(chuàng)始人姜昱辰看來(lái),大模型技術(shù)迭代其實(shí)并沒有放緩,而是保持著2018年以來(lái)的增速,那一年基于Transformer架構(gòu)的大規(guī)模語(yǔ)言模型預(yù)訓(xùn)練開始流行。從博士的自然語(yǔ)言處理研究到大模型創(chuàng)業(yè),姜昱辰更早開始經(jīng)歷這輪大模型技術(shù)演化的進(jìn)程。

“大家之所以有這樣的感覺(技術(shù)迭代放緩)是因?yàn)榇蟊娛窃?022年底、2023年初第一次看到這個(gè)技術(shù),做了很多短時(shí)間的learning和追趕,追趕當(dāng)然比較快。”姜昱辰對(duì)第一財(cái)經(jīng)表示,把OpenAI做出來(lái)的技術(shù)學(xué)一遍,不叫“技術(shù)迭代”。

雖然行業(yè)此前有一句“沒有應(yīng)用的大模型一文不值”廣為傳播,但在很多從業(yè)者看來(lái),大模型的技術(shù)同樣重要,因?yàn)楦玫膽?yīng)用一定建立在更好的技術(shù)之上,技術(shù)和應(yīng)用是一個(gè)相互轉(zhuǎn)化的串聯(lián)關(guān)系。

在MiniMax剛剛過去的伙伴日活動(dòng)上,閆俊杰在討論中提到,“至暗時(shí)刻會(huì)覺得技術(shù)很重要。”

很多時(shí)候做技術(shù)時(shí),并沒有真正意識(shí)到技術(shù)為什么重要。閆俊杰舉例表示,用戶感受到的東西可能來(lái)自于一些產(chǎn)品細(xì)節(jié),或者一些品牌,技術(shù)本身是好多個(gè)環(huán)節(jié)在一起,尤其在繁榮時(shí)期,可能分不清什么是主,什么是次,“當(dāng)在某些時(shí)間點(diǎn)遇到瓶頸的時(shí)候,拋開所有的表象東西,會(huì)意識(shí)到技術(shù)才是最終提升的來(lái)源。”

“技術(shù)做不好的時(shí)候,發(fā)現(xiàn)所有東西都是問題,當(dāng)技術(shù)做好了,似乎所有問題都被掩蓋了,”閆俊杰表示,技術(shù)是一家科技公司最核心的要素這件事,盡管已深刻意識(shí)到,偶爾還是在繼續(xù)犯錯(cuò)誤,“這個(gè)是我在多次至暗時(shí)刻里最有共性的一件事。”

做技術(shù)也是一件非常奢侈的事,“如果看一眼我們每個(gè)月的賬單還是會(huì)非常心疼的。”在采訪中,說(shuō)到這話時(shí),閆俊杰幾次看向了MiniMax技術(shù)總監(jiān)韓景濤,也就是“賬單的制造者”。

因?yàn)樽黾夹g(shù)可能會(huì)失敗,研發(fā)投入很大,閆俊杰此前很多時(shí)候會(huì)想要不要走點(diǎn)捷徑,但實(shí)踐經(jīng)驗(yàn)會(huì)證明,走捷徑就會(huì)被“打臉”,“這個(gè)事在我這發(fā)生可能超過十次了。”

“一個(gè)東西要實(shí)驗(yàn)三次才能成功,第三次實(shí)驗(yàn)成功的時(shí)候,會(huì)想前面兩次是不是可以不用做,就像吃包子吃三個(gè)會(huì)吃飽,就會(huì)想是不是前兩個(gè)不用吃是一樣的。”閆俊杰表示,這是做技術(shù)時(shí)一個(gè)比較容易犯的錯(cuò)誤。

在各種關(guān)于模型技術(shù)細(xì)節(jié)的排行榜上,或許GPT-4o的跑分不常出現(xiàn)在第一,甚至?xí)谥虚g,但在MiniMax基于真實(shí)客戶的測(cè)試集中,OpenAI的GPT-4o是遙遙領(lǐng)先的。

在大模型時(shí)代,如何判斷技術(shù)的好壞,大眾很迷惑,企業(yè)同樣覺得很難,但這個(gè)點(diǎn)很重要,因?yàn)榧夹g(shù)的評(píng)價(jià)標(biāo)準(zhǔn)會(huì)決定模型的迭代方向,如果指標(biāo)本身不對(duì)迭代方向可能就錯(cuò)了。

閆俊杰提到,MiniMax目前的一個(gè)辦法是,基于MiniMax開發(fā)平臺(tái)的3萬(wàn)多個(gè)開發(fā)者和付費(fèi)客戶,在他們的場(chǎng)景上構(gòu)建一個(gè)真實(shí)使用的測(cè)試集,有些客戶對(duì)他們的場(chǎng)景非常看重,要求保證產(chǎn)品的效果,基于這些客戶真實(shí)使用的評(píng)測(cè)是較為客觀的。

“這個(gè)測(cè)試集上所有國(guó)產(chǎn)化模型相比GPT-4o都相差較多,其他排行榜基本上GPT-4o都要排到中間去了,但是在我們的排行榜上確實(shí)GPT-4o排在最靠前。”閆俊杰提到,國(guó)內(nèi)所有模型都與GPT-4o有本質(zhì)的差距,且越難的問題差距越大。按照這個(gè)評(píng)估方式,國(guó)產(chǎn)模型的提升空間還很大。

靜待下一轉(zhuǎn)折點(diǎn)

大模型的下一個(gè)轉(zhuǎn)折點(diǎn)在哪里?眾多創(chuàng)業(yè)者有不同的答案,有人認(rèn)為是錯(cuò)誤率的降低,有人覺得是個(gè)性化的模型,有人認(rèn)為關(guān)鍵在于小算力訓(xùn)練出大模型,背后或許意味著架構(gòu)的改進(jìn)。

朱嘯虎曾提到,今年的大模型本身還是有很多錯(cuò)誤,且出來(lái)的結(jié)果不可控,今天落地最困難的是,場(chǎng)景下怎么解決錯(cuò)誤問題、可控問題。

現(xiàn)在所有的模型錯(cuò)誤率都在20%左右,即兩位數(shù)的錯(cuò)誤率,有時(shí)驚艷,有時(shí)不靠譜,閆俊杰認(rèn)為,這也是制約模型處理復(fù)雜任務(wù)的原因,“真正的變革是,什么時(shí)間點(diǎn)有一個(gè)模型可以將錯(cuò)誤率降低到個(gè)位數(shù)。”這是能增加用戶使用深度的核心手段。

復(fù)雜任務(wù)往往需要多個(gè)步驟“相乘”,較高的錯(cuò)誤率導(dǎo)致失敗率的指數(shù)增加。閆俊杰表示,即便是GPT-4這樣的模型也無(wú)法支持非常靈活的Agent(智能體),這并不是因?yàn)锳gent框架寫得不夠好,產(chǎn)品做得不好,最根本的原因是模型本身不夠好。

但現(xiàn)在可以看到的是,每家公司有了算力,無(wú)論是OpenAI、谷歌還是Meta,都在加碼算力。Meta CEO扎克伯格曾在社交媒體上表示,要建立一個(gè)大規(guī)模的計(jì)算基礎(chǔ)設(shè)施,到2024年底,這一設(shè)施將包括35萬(wàn)張英偉達(dá)H100顯卡,業(yè)界預(yù)估這或許將耗費(fèi)近百億美元。

算法也在進(jìn)步,OpenAI在2023年只能做出來(lái)GPT-4,但2024年能做GPT-4o,雖然性能差不多,速度快了近10倍。

“計(jì)算量多了不止10倍,算法也快了10倍時(shí),沒有道理說(shuō)訓(xùn)練不出來(lái)一個(gè)更好的模型。”閆俊杰提到,“如果Scaling law(尺度定律)是對(duì)的,未來(lái)這個(gè)模型一定會(huì)出現(xiàn),標(biāo)志就是個(gè)位數(shù)的錯(cuò)誤率。”

在傅盛看來(lái),降低錯(cuò)誤率同樣重要。“今天的大模型有20%-30%的知識(shí)幻覺,而且‘它不知道自己不知道’,這是在企業(yè)應(yīng)用上非常重要的一大卡點(diǎn)。”想要真正落地一個(gè)應(yīng)用,得用大量工程化的手段去解決以前通用人工智能認(rèn)為它能干的活,這中間是有差距的。

問及大模型技術(shù)的下一個(gè)轉(zhuǎn)折點(diǎn),姜昱辰給了一個(gè)不一樣的答案,她認(rèn)為是“個(gè)性化”的技術(shù)。

“ToB的創(chuàng)業(yè)者會(huì)覺得錯(cuò)誤率降低很重要,因?yàn)槠髽I(yè)級(jí)、工業(yè)級(jí)場(chǎng)景中要的是極高準(zhǔn)確率,而在消費(fèi)場(chǎng)景中,要的是‘懂你’的個(gè)人助手。因此,對(duì)ToC創(chuàng)業(yè)者來(lái)說(shuō),個(gè)性化技術(shù)更重要。”對(duì)于不同的答案,姜昱辰解釋,ToB和ToC不同的場(chǎng)景下會(huì)有不同的感知。

從難度上來(lái)說(shuō),大模型幻覺是概率模型固有的,不容易解決,但個(gè)性化大模型確實(shí)是技術(shù)層面可行的。姜昱辰提到,波形智能目前在做的是這個(gè)方向,主要的難點(diǎn)是算法,中間需要知道的是,這樣的個(gè)性化生成式模型需要什么用戶信息,如何用于模型自進(jìn)化。

深思考創(chuàng)始人楊志明則認(rèn)為,下一個(gè)轉(zhuǎn)折點(diǎn)是,如何利用小算力訓(xùn)練出大模型、做好大模型的推理,在這背后,當(dāng)下主流的Transformer架構(gòu)需要堆積算力,“性價(jià)比太低”。架構(gòu)的改進(jìn)或許是重要的方向。

值得期待的是,近日有消息稱,OpenAI將在今年秋天推出代號(hào)為“草莓”(Strawberry)的新模型。作為核心技術(shù)突破,草莓可能集成在ChatGPT內(nèi),幫助解決當(dāng)前AI聊天機(jī)器人(9.250,-0.01,-0.11%)難以完成的復(fù)雜任務(wù),如數(shù)學(xué)和編程問題。此外,草莓更會(huì)“思考”,在解決強(qiáng)主觀性問題上更擅長(zhǎng)。

“草莓”是前菜,消息人士透露,OpenAI正在開發(fā)下一代大型語(yǔ)言模型Orion(獵戶座),草莓將為其生成高質(zhì)量訓(xùn)練數(shù)據(jù),以幫助減少大模型幻覺問題。能否突破瓶頸,帶領(lǐng)行業(yè)進(jìn)入下一轉(zhuǎn)折點(diǎn),最大的可能性還在OpenAI。

編 輯:魏德齡
飛象網(wǎng)版權(quán)及免責(zé)聲明:
1.本網(wǎng)刊載內(nèi)容,凡注明來(lái)源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對(duì)于經(jīng)過授權(quán)可以轉(zhuǎn)載,請(qǐng)必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和飛象網(wǎng)來(lái)源。
2.凡注明“來(lái)源:XXXX”的作品,均轉(zhuǎn)載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問題,請(qǐng)?jiān)谙嚓P(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時(shí)間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實(shí)”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對(duì)此聲明的最終解釋權(quán)。
相關(guān)新聞              
 
人物
中國(guó)電信邵廣祿:面向AI大模型的智算集群及網(wǎng)絡(luò)的實(shí)踐和展望
精彩專題
CES 2024國(guó)際消費(fèi)電子展
2023年信息通信產(chǎn)業(yè)盤點(diǎn)暨頒獎(jiǎng)禮
飛象網(wǎng)2023年手機(jī)評(píng)選
第24屆中國(guó)國(guó)際光電博覽會(huì)
CCTIME推薦
關(guān)于我們 | 廣告報(bào)價(jià) | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號(hào)-1  電信與信息服務(wù)業(yè)務(wù)經(jīng)營(yíng)許可證080234號(hào) 京公網(wǎng)安備110105000771號(hào)
公司名稱: 北京飛象互動(dòng)文化傳媒有限公司
未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像
主站蜘蛛池模板: 压接机|高精度压接机|手动压接机|昆明可耐特科技有限公司[官网] 胶泥瓷砖胶,轻质粉刷石膏,嵌缝石膏厂家,腻子粉批发,永康家德兴,永康市家德兴建材厂 | 硫酸钡厂家_高光沉淀硫酸钡价格-河南钡丰化工有限公司 | 蜗轮丝杆升降机-螺旋升降机-丝杠升降机厂家-润驰传动 | PCB厂|线路板厂|深圳线路板厂|软硬结合板厂|电路板生产厂家|线路板|深圳电路板厂家|铝基板厂家|深联电路-专业生产PCB研发制造 | 温州富欧金属封头-不锈钢封头厂家| 有机废气处理-rto焚烧炉-催化燃烧设备-VOC冷凝回收装置-三梯环境 | 胶水,胶粘剂,AB胶,环氧胶,UV胶水,高温胶,快干胶,密封胶,结构胶,电子胶,厌氧胶,高温胶水,电子胶水-东莞聚力-聚厉胶粘 | 不锈钢酒柜|恒温酒柜|酒柜定制|酒窖定制-上海啸瑞实业有限公司 | 伺服电机_直流伺服_交流伺服_DD马达_拓达官方网站 | 南京欧陆电气股份有限公司-风力发电机官网 | 无缝钢管-聊城无缝钢管-小口径无缝钢管-大口径无缝钢管 - 聊城宽达钢管有限公司 | 德国UST优斯特氢气检漏仪-德国舒赐乙烷检测仪-北京泽钏 | 煤机配件厂家_刮板机配件_链轮轴组_河南双志机械设备有限公司 | 冷藏车厂家|冷藏车价格|小型冷藏车|散装饲料车厂家|程力专用汽车股份有限公司销售十二分公司 | 蓝莓施肥机,智能施肥机,自动施肥机,水肥一体化项目,水肥一体机厂家,小型施肥机,圣大节水,滴灌施工方案,山东圣大节水科技有限公司官网17864474793 | 沙盘模型公司_沙盘模型制作公司_建筑模型公司_工业机械模型制作厂家 | 河南新乡德诚生产厂家主营震动筛,振动筛设备,筛机,塑料震动筛选机 | 可程式恒温恒湿试验箱|恒温恒湿箱|恒温恒湿试验箱|恒温恒湿老化试验箱|高低温试验箱价格报价-广东德瑞检测设备有限公司 | 国产液相色谱仪-超高效液相色谱仪厂家-上海伍丰科学仪器有限公司 | 动库网动库商城-体育用品专卖店:羽毛球,乒乓球拍,网球,户外装备,运动鞋,运动包,运动服饰专卖店-正品运动品网上商城动库商城网 - 动库商城 | 不锈钢发酵罐_水果酒发酵罐_谷物发酵罐_山东誉诚不锈钢制品有限公司 | 冷却塔改造厂家_不锈钢冷却塔_玻璃钢冷却塔改造维修-广东特菱节能空调设备有限公司 | 温州中研白癜风专科_温州治疗白癜风_温州治疗白癜风医院哪家好_温州哪里治疗白癜风 | 南京办公用品网-办公文具用品批发-打印机耗材采购 | 横河变送器-横河压力变送器-EJA变送器-EJA压力变送器-「泉蕴仪表」 | 动物麻醉机-数显脑立体定位仪-北京易则佳科技有限公司 | 垃圾压缩设备_垃圾处理设备_智能移动式垃圾压缩设备--山东明莱环保设备有限公司 | 微波萃取合成仪-电热消解器价格-北京安合美诚科学仪器有限公司 | 万烁建筑设计院-建筑设计公司加盟,设计院加盟分公司,市政设计加盟 | 雪花制冰机(实验室雪花制冰机)百科 | 防水接头-电缆防水接头-金属-电缆密封接头-不锈钢电缆接头 | 聚氨酯催化剂K15,延迟催化剂SA-1,叔胺延迟催化剂,DBU,二甲基哌嗪,催化剂TMR-2,-聚氨酯催化剂生产厂家 | 真丝围巾|真丝丝巾|羊绒围巾|围巾品牌|浙江越缇围巾厂家定制 | 登车桥动力单元-非标液压泵站-非标液压系统-深圳市三好科技有限公司 | 游泳池设计|设备|配件|药品|吸污机-东莞市太平洋康体设施有限公司 | 检验科改造施工_DSA手术室净化_导管室装修_成都特殊科室建设厂家_医疗净化工程公司_四川华锐 | 丹尼克尔拧紧枪_自动送钉机_智能电批_柔性振动盘_螺丝供料器品牌 | 闪蒸干燥机-喷雾干燥机-带式干燥机-桨叶干燥机-[常州佳一干燥设备] | 武汉高低温试验机-现货恒温恒湿试验箱-高低温湿热交变箱价格-湖北高天试验设备 | 粘弹体防腐胶带,聚丙烯防腐胶带-全民塑胶 | 厚壁钢管-厚壁无缝钢管-小口径厚壁钢管-大口径厚壁钢管 - 聊城宽达钢管有限公司 |