飞象网 - 通信人每天必上的网站

首頁|必讀|視頻|專訪|運營|制造|監管|大數據|物聯網|量子|元宇宙|博客|特約記者
手機|互聯網|IT|5G|光通信|人工智能|云計算|芯片報告|智慧城市|移動互聯網|會展
首頁 >> 頭條資訊 >> 正文

Meta繼續押寶開源大模型 Llama 3拿下“賽點”?

2024年4月23日 08:11  每日經濟新聞  

每經記者 可楊    每經編輯 董興生

開源與閉源之爭延續到大模型時代。在尋找“新大陸(16.880, 0.04, 0.24%)”的路上,開源與閉源的辯論,就像是一場關于AI未來的“航海策略”討論。

開源一派認為,開源能夠促進全球科研人員和開發者的協作,加速AI技術的迭代與創新。同時,開源讓更多人參與到模型的改進和優化中,通過集體智慧解決復雜的技術難題。

閉源的倡導者則看重其在商業化、技術保護和產品差異化方面的優勢。閉源模型使得企業能夠控制產品的開發節奏和市場策略,保護其商業利益。此外,閉源也有助于企業維護其技術優勢,避免競爭對手模仿或超越。

Llama 3的發布讓開源大模型在與閉源的競爭中再度“扳回一城”。從測試結果來看,Llama 3的成績大幅超越了Llama 2,也勝過了GPT-3.5。

在AI這場沒有硝煙的“航海競賽”中,大模型已然成為眼前的燈塔。未知的是,這座燈塔究竟是向所有航海者開放其光芒,還是僅為特定的船只照亮前行的航道。

開源在開發者和研究人員中極受歡迎

Meta正沿著開源路徑繼續前進。

近日,Meta推出開源大模型Llama 3系列,發布8B和70B兩個版本。Meta創始人兼首席執行官扎克伯格在同一天宣布,基于Llama 3,Meta的AI助手現在已經覆蓋Instagram、WhatsApp、Facebook等全系應用,并單獨開啟了網站。

與Llama 2相比,Llama 3進行了幾項關鍵的改進:使用具128K token(輸入數據的最小單元)詞匯表的tokenizer(編譯器),可以更有效地編碼語言,從而顯著提升模型性能;在8B和70B模型中都采用分組查詢注意力(GQA),以提高Llama 3模型的推理效率;在8192個token的序列上訓練模型,使用掩碼來確保自注意力(Self-Attention)不會跨越文檔邊界。

據Meta介紹,Llama 3已經在多種行業基準測試上展現了最先進的性能,提供了包括改進的推理能力在內的新功能,是目前市場上最好的開源大模型。

此外,Llama 3發布后,微軟Azure、谷歌云、百度智能云等陸續宣布其平臺上線Llama 3。百度方面此前對《每日經濟新聞》記者表示,百度智能云千帆大模型平臺在國內首家推出針對Llama 3全系列版本的訓練推理方案,便于開發者進行再訓練,搭建專屬大模型。

工業和信息化部工業文化發展中心AI應用工作組執行組長、行行AI董事長李明順在接受《每日經濟新聞》記者采訪時表示,Meta的Llama 3發布可能會帶來更多AI應用落地機會和場景,它通過提供更大詞匯量的Token詞典、更長的輸入上下文長度以及優化的模型結構,增強了模型的編碼效率和推理效率。“現在,比起Llama 2,Llama 3在代碼能力和邏輯推理能力上有顯著提升,這可能會促進相關AI應用的性能(提升),尤其是在需要復雜邏輯和代碼理解的場景中去落地!

OpenAI在GPT-2之后調轉船頭走向閉源,Meta則成為開源界的引領者之一。

從2020年發布GPT-3,到引發轟動的GPT-3.5,以及2023年3月發布的GPT-4,都是閉源模型。此前,馬斯克起訴OpenAI時曾直言:“如果OpenAI改名為ClosedAI,我就撤銷訴訟。”

李明順認為,OpenAI的轉變可能與其商業戰略和市場定位有關!俺跗陂_源有助于快速吸引關注和社區參與,但隨著公司的發展,我估計阿爾特(10.770, -0.15, -1.37%)曼(Sam Altman)的野心和商業夢想越來越膨脹了,閉源可以更好地讓它融資,包括和微軟合作,保護領先的技術優勢。”他表示,從OpenAI的轉變中可以看出,開源與閉源的選擇并非固定不變,而是需要根據公司戰略目標、市場環境和產品發展階段靈活調整。天下沒什么事情是絕對的,很多開源公司也是拿著次優代碼開源,獨家秘方閉源。

在追逐AGI(通用人工智能)這顆明珠的道路上,迄今為止,Meta依舊持續沿著開源的路徑前行。

2024年初,扎克伯格在Meta第四季度及2023全年財報電話會議上表示:“長期以來,我們的策略是構建并開放源代碼通用基礎設施,同時保留我們的具體產品實現為專有技術。”

他認為,開源帶來了幾個戰略好處。首先,開源軟件通常更加安全可靠,并且因為社區的持續反饋、審查和開發,更加高效。其次,開源軟件經常成為行業標準,“當企業開始基于我們的技術棧建立標準時,這使得將創新融入我們的產品變得更加容易。這種微妙的優勢,能夠迅速學習和改進,是巨大的競爭優勢,而成為行業標準正是這一能力的關鍵”。第三,開源在開發者和研究人員中極受歡迎。

開源與閉源并不矛盾

開源還是閉源,也許是全球人工智能信徒長久的辯題。在Llama 3誕生前幾天,國內同樣在進行一場“辯論”。

4月11日,百度董事長兼首席執行官李彥宏在其內部講話中直言,大模型開源的意義不大,閉源模型在能力上會持續領先,而不是一時領先,做模型的創業公司既做模型又做應用的“雙輪驅動”不是一個好的模式。在一周后的Create 2024百度AI開發者大會上,李彥宏再度提到,大家以前用開源覺得開源便宜,其實在大模型場景下,開源是最貴的,所以開源模型會越來越落后。

360公司創始人周鴻祎則持不同的觀點。他表示:“網上有些名人胡說八道,大家也別被他們忽悠,說開源不如閉源好。一句話,今天沒有開源就沒有Linux(操作系統內核),沒有Linux就沒有互聯網,就連說這話的公司自己都借助了開源的力量才成長到今天!

這段發言被解讀為對李彥宏觀點的回懟,周鴻祎隨后澄清道:“我一直是開源的信徒,但是我說開源好,是(4月)13日在哈佛講的,李廠長(指李彥宏)說閉源好,是(4月)16日在北京講的!

生數科技聯合創始人兼CEO唐家渝站在閉源的一邊。在4月18日舉行的“2024中國生成式AI大會”上,唐家渝表示:“在我們看來,開源、閉源都有各自可以做的商業生態,但是從模型能力的提升來說,或者持續走到前列來說,閉源還是會走到開源的前面!

昆侖萬維(37.520, 0.38, 1.02%)董事長方漢的觀點是,開源模型與閉源模型之間的差距正在不斷縮小。4月16日,方漢在接受《每日經濟新聞》記者在內的媒體采訪時表示,閉源模型的確是第一,但是開源大模型在2023年到今年這一年間,從落后兩年以上,已經進化到落后4~6個月以上。

此外,方漢認為,在應用側,閉源對于產品特性和長尾需求的滿足都落后于開源大模型,開源大模型是一種生態構建器,更利于滿足用戶的長尾需求。開源大模型和閉源大模型是一個生態的組成部分,不是誰壓倒誰,大家都有自己的生存空間,也都有更好的明天。

不過,從商業化上來講,閉源和開源也許并不矛盾。啟明創投合伙人周志峰就認為,開源閉源在過去幾個大浪潮當中沒有很大的沖突,不太理解為什么很多人把閉源、開源在AI時代看成對立的。

李明順的觀點則是,在當前強應用導向的背景下,開源模式具有顯著優勢,能夠吸引全球范圍內最廣泛的人參與,從而使其創新性保持在較高水平。

相較之下,盡管一些閉源大模型在技術上具有領先地位,但其成本太高。不過他也強調,開源與閉源在不同公司和應用場景中可以相互轉換。一些基于開源的產品在發掘到獨特優勢后,可能會通過閉源策略建立競爭壁壘。同時,一些閉源公司也會不斷將其部分產品開源。這兩個應該是共存的,未來開源可能用戶量級上更大,但是行業內,商業化做得比較好的公司,往往還是閉源的多一點。

在開源與閉源的辯論中,也許答案并非非此即彼。AI的未來可能既不是完全開放的“自由港”,也不是徹底封閉的“孤島”,而是一個既包含開放協作也包含封閉競爭的混合生態。在這個生態系統中,開放與封閉不是對立的兩極,而是一枚硬幣的兩面。

編 輯:魏德齡
聲明:刊載本文目的在于傳播更多行業信息,本站只提供參考并不構成任何投資及應用建議。如網站內容涉及作品版權和其它問題,請在30日內與本網聯系,我們將在第一時間刪除內容。本站聯系電話為86-010-87765777,郵件后綴為#cctime.com,冒充本站員工以任何其他聯系方式,進行的“內容核實”、“商務聯系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權。
相關新聞              
 
人物
聞庫:全球6G發展需要統一的思路、方向和目標
精彩專題
CES 2024國際消費電子展
2023年信息通信產業盤點暨頒獎禮
飛象網2023年手機評選
第24屆中國國際光電博覽會
CCTIME推薦
關于我們 | 廣告報價 | 聯系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網 CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號-1  電信與信息服務業務經營許可證080234號 京公網安備110105000771號
公司名稱: 北京飛象互動文化傳媒有限公司
未經書面許可,禁止轉載、摘編、復制、鏡像
主站蜘蛛池模板: 成人纸尿裤,成人尿不湿,成人护理垫-山东康舜日用品有限公司 | 爱佩恒温恒湿测试箱|高低温实验箱|高低温冲击试验箱|冷热冲击试验箱-您身边的模拟环境试验设备技术专家-合作热线:400-6727-800-广东爱佩试验设备有限公司 | 火锅加盟_四川成都火锅店加盟_中国火锅连锁品牌十强_朝天门火锅【官网】 | 不锈钢拉手厂家|浴室门拉手厂家|江门市蓬江区金志翔五金制品有限公司 | 国标白水泥,高标号白水泥,白水泥厂家-淄博华雪建材有限公司 | 示波器高压差分探头-国产电流探头厂家-南京桑润斯电子科技有限公司 | 潜水搅拌机-双曲面搅拌机-潜水推进器|奥伯尔环保 | 干式变压器厂_干式变压器厂家_scb11/scb13/scb10/scb14/scb18干式变压器生产厂家-山东科锐变压器有限公司 | 理化生实验室设备,吊装实验室设备,顶装实验室设备,实验室成套设备厂家,校园功能室设备,智慧书法教室方案 - 东莞市惠森教学设备有限公司 | 气力输送_输送机械_自动化配料系统_负压吸送_制造主力军江苏高达智能装备有限公司! | 北京公积金代办/租房发票/租房备案-北京金鼎源公积金提取服务中心 | 大立教育官网-一级建造师培训-二级建造师培训-造价工程师-安全工程师-监理工程师考试培训 | 温州中研白癜风专科_温州治疗白癜风_温州治疗白癜风医院哪家好_温州哪里治疗白癜风 | 谷梁科技| LED投光灯-工矿灯-led路灯头-工业灯具 - 山东普瑞斯照明科技有限公司 | 3D全息投影_地面互动投影_360度立体投影_水幕灯光秀 | 广东银虎 蜂窝块状沸石分子筛-吸附脱硫分子筛-萍乡市捷龙环保科技有限公司 | 江苏远邦专注皮带秤,高精度皮带秤,电子皮带秤研发生产 | 炒货机-炒菜机-炒酱机-炒米机@霍氏机械 | 四川成都干燥设备_回转筒干燥机_脉冲除尘器_输送设备_热风炉_成都川工星科机电设备有限公司 | 陕西安玻璃自动感应门-自动重叠门-磁悬浮平开门厂家【捷申达门业】 | 北京遮阳网-防尘盖土网-盖土草坪-迷彩网-防尘网生产厂家-京兴科技 | 耙式干燥机_真空耙式干燥机厂家-无锡鹏茂化工装备有限公司 | 二手回收公司_销毁处理公司_设备回收公司-找回收信息网 | 菲希尔X射线测厚仪-菲希尔库伦法测厚仪-无锡骏展仪器有限责任公司 | 广州监控安装公司_远程监控_安防弱电工程_无线wifi覆盖_泉威安防科技 | 上海冠顶工业设备有限公司-隧道炉,烘箱,UV固化机,涂装设备,高温炉,工业机器人生产厂家 | Copeland/谷轮压缩机,谷轮半封闭压缩机,谷轮涡旋压缩机,型号规格,技术参数,尺寸图片,价格经销商 CTP磁天平|小电容测量仪|阴阳极极化_双液系沸点测定仪|dsj电渗实验装置-南京桑力电子设备厂 | 算命免费_生辰八字_免费在线算命 - 卜算子算命网 | 西安文都考研官网_西安考研辅导班_考研培训机构_西安在职考研培训 | 成都装修公司-成都装修设计公司推荐-成都朗煜装饰公司 | 石膏基自流平砂浆厂家-高强石膏基保温隔声自流平-轻质抹灰石膏粉砂浆批发-永康市汇利建设有限公司 | 爆炸冲击传感器-无线遥测传感器-航天星百科 | 网站制作优化_网站SEO推广解决方案-无锡首宸信息科技公司 | 双段式高压鼓风机-雕刻机用真空泵-绍兴天晨机械有限公司 | 商用绞肉机-熟肉切片机-冻肉切丁机-猪肉开条机 - 广州市正盈机械设备有限公司 | 电机铸铝配件_汽车压铸铝合金件_发动机压铸件_青岛颖圣赫机械有限公司 | 【法利莱住人集装箱厂家】—活动集装箱房,集装箱租赁_大品牌,更放心 | 冷却塔减速机器_冷却塔皮带箱维修厂家_凉水塔风机电机更换-广东康明冷却塔厂家 | 上海单片机培训|重庆曙海培训分支机构—CortexM3+uC/OS培训班,北京linux培训,Windows驱动开发培训|上海IC版图设计,西安linux培训,北京汽车电子EMC培训,ARM培训,MTK培训,Android培训 | PCB设计,PCB抄板,电路板打样,PCBA加工-深圳市宏力捷电子有限公司 | 铝箔-铝板-花纹铝板-铝型材-铝棒管-上海百亚金属材料有限公司 |