飞象网 - 通信人每天必上的网站

首頁|必讀|視頻|專訪|運營|制造|監管|大數據|物聯網|量子|低空經濟|智能汽車|特約記者
手機|互聯網|IT|5G|光通信|人工智能|云計算|芯片|報告|智慧城市|移動互聯網|會展
首頁 >> 人工智能 >> 正文

中國新AI大模型為何火爆全網?人工智能領域專家解讀

2025年1月27日 08:50  環球網  

【環球時報記者 劉揚 環球時報特約記者 任重】近日,一個名為DeepSeek(深度求索)的中國AI初創公司成為國內外人工智能(AI)大模型領域熱議話題。在不到30天的時間里,DeepSeek先后發布了DeepSeek-V3和DeepSeek-R1兩款大模型,其成本與動輒數億甚至上百億美元的國外大模型項目相比堪稱低廉,而性能與國外頂尖大模型相當。同時,DeepSeek與外國大模型巨頭閉源的路徑不同,采用開源模式。中國這家公司的發展模式與成果讓硅谷高度關注,多家西方主流媒體紛紛發文感嘆“中國AI模型震驚硅谷”,甚至引發了國內外多家知名廠商與機構連夜嘗試復現DeepSeek成果的“熱潮”。DeepSeek的發展具有哪些特點?是否對國產大模型的發展路徑以及創新思路帶來一些啟示?《環球時報》記者26日采訪了多位人工智能領域的專家。

“OpenAI o1經濟實惠且開放的競爭對手”

DeepSeek公司本月20日發布大模型R1,并表示“在數學、代碼、自然語言推理等任務上,性能比肩OpenAI o1正式版”,引發外媒特別是美國媒體高度關注這家中國公司及其最新大模型成果。

“中國便宜、開放的人工智能模型 DeepSeek讓科學家興奮不已。”《自然》雜志24日以此為題稱,中國研制的大語言模型DeepSeek-R1令科學家們興奮不已,它被認為是OpenAI o1等“推理”模型的經濟實惠且開放的競爭對手。

《紐約時報》24日以“中國人工智能初創企業DeepSeek如何與硅谷巨頭競爭”為題報道稱,能做到上述成績本已是一個里程碑,但DeepSeek-V3大模型背后的團隊描述了一個更大的進步。他們在訓練該系統時只用了先進人工智能公司所用的高度專業化計算機芯片的一小部分。中國工程師稱,他們只花了約600萬美元以及約2000個英偉達專用芯片就完成了新模型的訓練,無論資金以及芯片使用規模都遠低于世界領先的人工智能公司。

“這不是中國追趕美國的問題,而是開源追趕閉源的問題”

DeepSeek備受關注,除了性價比超高,還有另一個原因:開源。連日來,網絡上已經出現了一波復現DeepSeek的熱潮。加州大學伯克利分校、香港科技大學、知名人工智能公司HuggingFace等紛紛成功復現,只用強化學習,沒有監督微調,甚至只用幾十美元的成本就能完成復現。

美國紅迪網25日稱,中國DeepSeek的模型是開源的,這是令人興奮的真正原因。基本上,他們將制造這些東西的知識免費提供給全世界,確保沒有人能夠真正壟斷它。中國公司基本上與美國公司的做法完全相反。你能看到OpenAI、Anthropic或谷歌開源任何強大的模型嗎?到目前為止,我們從他們那里得到的只是皮毛。Meta是唯一一家對開源大模型做出重大貢獻的西方大公司,但他們將來可能不會開源其最好的模型。被譽為“深度學習三巨頭”之一的Yann LeCun(楊立昆)在社交平臺X上表示,這不是中國追趕美國的問題,而是開源追趕閉源的問題。

北京郵電大學人機交互與認知工程實驗室主任劉偉在接受《環球時報》記者采訪時表示,大模型三大核心要素是數據、算法、算力,Deepseek使用較少的數據、較少的算力,通過算法的優化實現了與國外知名大模型等效甚至更優的效果,這是非常值得肯定的。同時還要看到它是開源的,可以供全球希望使用這一大模型的用戶來使用和復現。

清華大學新聞學院、人工智能學院教授沈陽26日對《環球時報》記者表示,DeepSeek的大模型是全球開源大模型當中相當優秀的一款,是混合使用多種先進技術實現超越傳統預訓練技術的創新突破。他結合自身使用的感受談了這款大模型的幾個優點。一是它把目前提升AI大模型能力的方法進行了工程上的微創新組合。二是DeepSeek公布了相關論文,整個過程可以讓大家去復現,這就是開源的力量。三是DeepSeek的推理過程,有自身的創新。沈陽作為AI領域的研究者,使用AI超過3萬次,他認為,DeepSeek跟美國的AI相比,還有很多中國元素在里面,如中國網絡當中的一些熱詞。

提升推理能力

對于Deepseek的發展模式為國內大模型發展以及創新提供了怎樣的重要啟示,劉偉認為,“創新不是規劃出來的,需要市場、專業機構通過長時間的研究來另辟蹊徑,尤其是一些長期關注垂直領域的商業公司可以通過對技術路徑的反思、對市場發展的嗅覺,來找到更好的創新點。OpenAI最初的發展過程也是這樣,并不是美國官方與科技巨頭砸重金規劃出來的。”

日前,OpenAI、軟銀等公司公布了“星際之門”計劃,要在4年中砸5000億美元來加速美國人工智能的發展。劉偉強調,這種集中人力、財力、物力,再給予政策傾斜的發展路徑,在未來研究方向與研究結果方面都存在一定的不確定性。“還是要鼓勵國內更多商業公司、科研院所聚焦自身的研究領域,找到適合自己的創新與發展路徑。”

沈陽表示,在AI發展歷史中,新的突破往往是由不顯眼的工程創新與科學探索共同驅動的。這種趨勢在DeepSeek的成果中得到了深刻體現,它不僅突破了傳統的訓練方式,也為推理能力的提升帶來了全新的視角。“盡管它的成就尚處于一個階段性水平,但其工程貢獻和理論創新已經為未來的AI發展奠定了重要基礎。”沈陽認為,DeepSeek團隊在基礎模型預訓練方面的貢獻,不僅是在技術層面上的突破,更在于其工程方法的精細與高效。DeepSeek的這種工程創新,標志著AI模型訓練的一個全新階段,這不僅降低了開發成本,也為其他公司提供了可借鑒的路徑。同時,DeepSeek的核心創新還體現在推理能力的提升上,尤其是通過相關算法創新來推動模型的自然推理能力,證明了AI領域的一種潛力——無須大量昂貴的思維鏈標注,模型依然能夠涌現出推理能力。

沈陽認為,DeepSeek的成功也讓我們看到了未來AI產業的發展方向:更多的開源創新、硬件與軟件的深度協同,以及對模型開發成本與推理能力的不斷優化。同時,我們也必須看到,DeepSeek雖然取得了顯著的階段性成果,要想在未來發展道路上實現進一步突破,仍然需要面對許多深層次的挑戰,例如需要更多的原創性訓練數據和算法創新。

編 輯:高靖宇
飛象網版權及免責聲明:
1.本網刊載內容,凡注明來源為“飛象網”和“飛象原創”皆屬飛象網版權所有,未經允許禁止轉載、摘編及鏡像,違者必究。對于經過授權可以轉載,請必須保持轉載文章、圖像、音視頻的完整性,并完整標注作者信息和飛象網來源。
2.凡注明“來源:XXXX”的作品,均轉載自其它媒體,在于傳播更多行業信息,并不代表本網贊同其觀點和對其真實性負責。
3.如因作品內容、版權和其它問題,請在相關作品刊發之日起30日內與本網聯系,我們將第一時間予以處理。
本站聯系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯系方式,進行的“內容核實”、“商務聯系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權。
相關新聞              
 
人物
vivo胡柏山:手機行業是最典型的新質生產力代表
精彩專題
2024通信業年終盤點
2024數字科技生態大會
2024年度中國光電纜優質供應商評選活動
2024全球6G發展大會
CCTIME推薦
關于我們 | 廣告報價 | 聯系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網 CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號-1  電信與信息服務業務經營許可證080234號 京公網安備110105000771號
公司名稱: 北京飛象互動文化傳媒有限公司
未經書面許可,禁止轉載、摘編、復制、鏡像
主站蜘蛛池模板: IP检测-检测您的IP质量 | 石磨面粉机|石磨面粉机械|石磨面粉机组|石磨面粉成套设备-河南成立粮油机械有限公司 | 耐力板-PC阳光板-PC板-PC耐力板 - 嘉兴赢创实业有限公司 | 大通天成企业资质代办_承装修试电力设施许可证_增值电信业务经营许可证_无人机运营合格证_广播电视节目制作许可证 | 聚合氯化铝-碱式氯化铝-聚合硫酸铁-聚氯化铝铁生产厂家多少钱一吨-聚丙烯酰胺价格_河南浩博净水材料有限公司 | 煤矿支护网片_矿用勾花菱形网_缝管式_管缝式锚杆-邯郸市永年区志涛工矿配件有限公司 | 北京工业设计公司-产品外观设计-产品设计公司-千策良品工业设计 北京翻译公司-专业合同翻译-医学标书翻译收费标准-慕迪灵 | 骨密度仪-骨密度测定仪-超声骨密度仪-骨龄测定仪-天津开发区圣鸿医疗器械有限公司 | 蓝米云-专注于高性价比香港/美国VPS云服务器及海外公益型免费虚拟主机 | 办公室家具公司_办公家具品牌厂家_森拉堡办公家具【官网】 | 上海APP开发-APP制作-APP定制开发-上海APP开发制作公司-咏熠科技 | 废气处理_废气处理设备_工业废气处理_江苏龙泰环保设备制造有限公司 | 塑料薄膜_PP薄膜_聚乙烯薄膜-常州市鑫美新材料包装厂 | 河南包装袋厂家_河南真空袋批发价格_河南服装袋定制-恒源达包装制品 | 土壤有机碳消解器-石油|表层油类分析采水器-青岛溯源环保设备有限公司 | 广州印刷厂_广州彩印厂-广州艺彩印务有限公司 | 喷播机厂家_二手喷播机租赁_水泥浆洒布机-河南青山绿水机电设备有限公司 | 管理会计网-PCMA初级管理会计,中级管理会计考试网站 | 武汉刮刮奖_刮刮卡印刷厂_为企业提供门票印刷_武汉合格证印刷_现金劵代金券印刷制作 - 武汉泽雅印刷有限公司 | 低粘度纤维素|混凝土灌浆料|有机硅憎水粉|聚羧酸减水剂-南京斯泰宝 | 精密光学实验平台-红外粉末压片机模具-天津博君 | 医养体检包_公卫随访箱_慢病随访包_家签随访包_随访一体机-济南易享医疗科技有限公司 | 大巴租车平台承接包车,通勤班车,巴士租赁业务 - 鸿鸣巴士 | 连栋温室大棚建造厂家-智能玻璃温室-薄膜温室_青州市亿诚农业科技 | 无尘烘箱_洁净烤箱_真空无氧烤箱_半导体烤箱_电子防潮柜-深圳市怡和兴机电 | 洛阳防爆合格证办理-洛阳防爆认证机构-洛阳申请国家防爆合格证-洛阳本安防爆认证代办-洛阳沪南抚防爆电气技术服务有限公司 | 一体化净水器_一体化净水设备_一体化水处理设备-江苏旭浩鑫环保科技有限公司 | 江苏大隆凯科技有限公司 | 微型实验室真空泵-无油干式真空泵-微型涡旋耐腐蚀压缩机-思科涡旋科技(杭州)有限公司 | 跨境物流_美国卡派_中大件运输_尾程派送_海外仓一件代发 - 广州环至美供应链平台 | 一体式钢筋扫描仪-楼板测厚仪-裂缝检测仪-泰仕特(北京) | YJLV22铝芯铠装电缆-MYPTJ矿用高压橡套电缆-天津市电缆总厂 | 科昊仪器超纯水机系统-可成气相液氮罐-美菱超低温冰箱-西安昊兴生物科技有限公司 | 深圳激光打标机_激光打标机_激光焊接机_激光切割机_同体激光打标机-深圳市创想激光科技有限公司 深圳快餐店设计-餐饮设计公司-餐饮空间品牌全案设计-深圳市勤蜂装饰工程 | 臭氧灭菌箱-油桶加热箱-原料桶加热融化烘箱-南京腾阳干燥设备厂 臭氧发生器_臭氧消毒机 - 【同林品牌 实力厂家】 | 储能预警-储能消防系统-电池舱自动灭火装置-四川千页科技股份有限公司官网 | 直流电能表-充电桩电能表-导轨式电能表-智能电能表-浙江科为电气有限公司 | 压砖机_电动螺旋压力机_粉末成型压力机_郑州华隆机械tel_0371-60121717 | 吉祥新世纪铝塑板_生产铝塑板厂家_铝塑板生产厂家_临沂市兴达铝塑装饰材料有限公司 | 家乐事净水器官网-净水器厂家「官方」 | 江苏齐宝进出口贸易有限公司 |