飞象网 - 通信人每天必上的网站

首頁|必讀|視頻|專訪|運營|制造|監管|大數據|物聯網|量子|低空經濟|智能汽車|特約記者
手機|互聯網|IT|5G|光通信|人工智能|云計算|芯片|報告|智慧城市|移動互聯網|會展
首頁 >> 頭條資訊 >> 正文

物理測試暴擊AI圈,DeepSeek R1穩超o1、Claude,我們已進入RL黃金時代

2025年1月26日 09:25  機器之心  

DeepSeek R1 真是太厲害了!

最近,‘神秘的東方力量’DeepSeek 正在‘硬控’硅谷。

我讓 R1 詳細解釋勾股定理。這一切都是 AI 在不到 30 秒時間里一次性完成的,沒出任何錯。簡單來說,its over.

在國內外 AI 圈,普通網友發現了神奇的強大新 AI(還開源),學界專家紛紛喊出‘要奮起直追’,還有小道消息稱海外的 AI 公司已經如臨大敵。

就說這個本周剛發布的 DeepSeek R1,它沒有任何監督訓練的純強化學習路線令人震撼,從去年 12 月 Deepseek-v3 基座發展到如今堪比 OpenAI o1 的思維鏈能力,似乎是很快達成的事。

但在 AI 社區熱火朝天的讀技術報告、對比實測之余,人們還是對 R1 有所懷疑:它除了能跑贏一堆 Benchmark 以外,真的能領先嗎?

能自建模擬‘物理規律’

你不信?來讓大模型玩玩彈球?

最近幾天,AI 社區的一些人開始沉迷一項測試 —— 測試不同的 AI 大模型(尤其是所謂的推理模型)來處理一類問題:‘編寫一個 Python 腳本,讓一個黃色球在某個形狀內彈跳。讓該形狀緩慢旋轉,并確保球停留在形狀內。’

一些模型在這項‘旋轉球形’基準測試中的表現優于其他模型。據 CoreView CTO Ivan Fioravanti 稱,國內人工智能實驗室 DeepSeek 的開源大模型 R1 完勝 OpenAI 的 o1 pro 模式,后者作為 OpenAI ChatGPT Pro 計劃的一部分,每月收費 200 美元。

左邊是 OpenAI o1,右邊是 DeepSeek R1。如上所述,這里的 Prompt 是:‘write a python script for a bouncing yellow ball within a square, make sure to handle collision detection properly. make the square slowly rotate. implement it in python. make sure ball stays within the square.’

根據另一位網友在 X 上的說法,Anthropic 的 Claude 3.5 Sonnet 和谷歌的 Gemini 1.5 Pro 模型對物理原理判斷錯誤,導致球偏離了形狀。也有用戶報告稱,谷歌最新的 Gemini 2.0 Flash Thinking Experimental,以及相對更舊的 OpenAI GPT-4o 都一次性通過了評估。

但這里面也是能分出高下的:

在這個推文底下的網友表示:o1 的能力原本很好,在 OpenAI 優化速度過后就變弱了,即使是每月 200 美元的會員版也一樣。

模擬彈跳球是一個經典的編程挑戰。精確的模擬結合了碰撞檢測算法,其算法需要去識別兩個物體(例如一個球和一個形狀的側面)何時發生碰撞。編寫不當的算法會影響模擬的性能或導致明顯的物理錯誤。

AI 初創公司 Nous Research 的研究員 N8 Programs 表示,他花了大約兩個小時從頭開始編寫一個旋轉七邊形中的彈跳球。‘必須跟蹤多個坐標系,了解每個系統中的碰撞是如何進行的,并從頭設計代碼以使其具有魯棒性。’

雖然彈跳球和旋轉形狀是對編程技能的合理測試,但對于大模型來說還是個新項目,即使是提示中的細微變化也可能產生出不同的結果。所以如果想讓它最終成為 AI 大模型基準測試的一部分的話,還需要改進。

無論如何,經過這一波實測之后,我們對大模型之間的能力不同有了觀感。

DeepSeek 是新的‘硅谷神話’

DeepSeek 正讓大洋彼岸陷入‘恐慌’。

Meta 員工發帖稱‘Meta 工程師們正在瘋狂地分析 DeepSeek,試圖從中復制任何可能的東西。’

而 AI 科技初創公司 Scale AI 創始人 Alexandr Wang 也公開表示,中國人工智能公司 DeepSeek 的 AI 大模型性能大致與美國最好的模型相當。

他還認為,過去十年來,美國可能一直在人工智能競賽中領先于中國,但 DeepSeek 的 AI 大模型發布可能會‘改變一切’。

X 博主 @8teAPi 則認為,DeepSeek 并不是一個‘副業項目’,而是像洛克希德・馬丁以前的‘臭鼬工廠’。

所謂‘臭鼬工廠’,就是當初洛克希德・馬丁公司(Lockheed Martin)為了研發諸多先進飛行器專門成立的一個高度機密、相對獨立的小團隊,從事尖端或非常規的技術研究與開發。從 U-2 偵察機、SR-71 黑鳥,到 F-22 猛禽、F-35 閃電 II 戰斗機都是從這里走出來的。

后來,這個詞逐漸演變成一個通用術語,用來形容在大公司或組織內部設立的‘小而精’、相對獨立且自由度更高的創新團隊。

他給出的理由有兩個:

一方面是 DeepSeek 擁有大量的 GPU,據稱有超過一萬塊,而 Scale AI 的 CEO Alexandr Wang 甚至表示可能達到 5 萬塊。

另一方面,DeepSeek 只從中國排名前三的大學招聘人才,這意味著 DeepSeek 與阿里巴巴和騰訊具有同等的競爭力。

僅憑這兩個事實,就可以看出,顯然 DeepSeek 在商業上取得了成功,并且已經足夠知名,能夠獲得這些資源。

至于 DeepSeek 的開發成本,該博主表示,中國科技公司可以獲得各種各樣的補貼,比如低用電成本和用地。

因此,DeepSeek 非常有可能大部分成本都被‘安置’在核心業務之外的某個賬目上,或者以某種數據中心建設補貼的形式存在。甚至除了創始人之外,沒人完全清楚所有財務安排。有些協議可能只是‘口頭協定’,只靠聲譽就能敲定。

不管怎樣,有幾點是明確的:

這個模型非常出色,與 OpenAI 兩個月前發布的版本相當,當然也有可能不如 OpenAI 和 Anthropic 尚未發布的新模型。

從目前來看,研究方向仍主要由美國公司主導,DeepSeek 模型屬于對 o1 版本的‘快速跟進’,但 DeepSeek 的研發進度非常迅猛,比預期更快地迎頭趕上,他們并沒有抄襲或作弊,最多只是逆向工程。

DeepSeek 主要是在培養自己的人才,而不是依賴美國培養的博士,這大大擴展了人才庫。

與美國公司相比,DeepSeek 在知識產權許可、隱私、安全、政治等方面受到的約束較少,圍繞錯誤地使用那些不想被訓練的數據的擔憂也較少。訴訟更少,律師更少,也更少顧慮。

毫無疑問,越來越多的人認為 2025 年將會是決定性的一年。與此同時各家公司都在摩拳擦掌,比如 Meta 就正在建立一個 2GW+ 的數據中心,預計在 2025 年投資 600-650 億美元,年底擁有超過 130 萬塊 GPU。

Meta 甚至用一張圖表展示了 2 千兆瓦數據中心與紐約曼哈頓的對比。

但現在 DeepSeek 用更低的成本,更少的 GPU 做到了更好,怎能不讓人焦慮?

Yann LeCun:要感謝開源

Hyperbolic 的 CTO、聯合創始人 Yuchen Jin 發帖表示,在僅 4 天時間里,DeepSeek-R1 向我們證明了 4 個事實:

開源 AI 僅落后于閉源 AI 不到 6 個月

中國正在主導開源 AI 競賽

我們正進入大語言模型強化學習的黃金時代

蒸餾模型非常強大,我們將在手機上運行高智能 AI

由 DeepSeek 引發的連鎖反應仍在繼續,比如 OpenAI o3-mini 免費可用、社區中希望能減少關于 AGI/ASI 的模糊討論以及傳聞 Meta 陷入恐慌等。

他認為,現在很難預測最終誰會獲勝,但不要忘記后發優勢的力量,畢竟我們都知道是 Google 發明了 Transformer,而 OpenAI 解鎖了其真正潛力。

此外,圖靈獎得主、Meta 首席人工智能科學家 Yann LeCun 也表達了自己的看法。

‘對于那些看到 DeepSeek 的性能就認為“中國正在超越美國的 AI”的人,你理解錯了。正確的理解是:開源模型正在超越專有模型。’

LeCun 表示,DeepSeek 之所以這次一鳴驚人,是因為他們從開放研究和開源(如 Meta 的 PyTorch 和 Llama)中獲益。DeepSeek 提出了新想法,并在他人工作的基礎上構建。因為他們的工作是公開發布和開源的,每個人都可以從中受益,這就是開放研究和開源的力量。

網友們的反思還在繼續,在對于新技術發展興奮的同時,也能感受到一點點憂慮的氣氛,畢竟 DeepSeek 們的出現,可能會帶來真金白銀的影響。

參考內容:

https://x.com/ivanfioravanti/status/1881969391547683031

https://x.com/Aadhithya_D2003/status/1882105009548222953

https://x.com/8teAPi/status/1882836551866204656

https://x.com/Yuchenj_UW/status/1882840436974428362

https://x.com/ylecun/status/1882943244679709130

https://venturebeat.com/ai/tech-leaders-respond-to-the-rapid-rise-of-deepseek/

編 輯:路金娣
飛象網版權及免責聲明:
1.本網刊載內容,凡注明來源為“飛象網”和“飛象原創”皆屬飛象網版權所有,未經允許禁止轉載、摘編及鏡像,違者必究。對于經過授權可以轉載,請必須保持轉載文章、圖像、音視頻的完整性,并完整標注作者信息和飛象網來源。
2.凡注明“來源:XXXX”的作品,均轉載自其它媒體,在于傳播更多行業信息,并不代表本網贊同其觀點和對其真實性負責。
3.如因作品內容、版權和其它問題,請在相關作品刊發之日起30日內與本網聯系,我們將第一時間予以處理。
本站聯系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯系方式,進行的“內容核實”、“商務聯系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權。
相關新聞              
 
人物
中國信通院湯立波:“5G+工業互聯網”已進入規模化發展新階段
精彩專題
2024通信業年終盤點
2024數字科技生態大會
2024年度中國光電纜優質供應商評選活動
2024全球6G發展大會
CCTIME推薦
關于我們 | 廣告報價 | 聯系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網 CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號-1  電信與信息服務業務經營許可證080234號 京公網安備110105000771號
公司名稱: 北京飛象互動文化傳媒有限公司
未經書面許可,禁止轉載、摘編、復制、鏡像
主站蜘蛛池模板: 煤棒机_增碳剂颗粒机_活性炭颗粒机_木炭粉成型机-巩义市老城振华机械厂 | 南京泽朗生物科技有限公司-液体饮料代加工_果汁饮料代加工_固体饮料代加工 | 欧美日韩国产一区二区三区不_久久久久国产精品无码不卡_亚洲欧洲美洲无码精品AV_精品一区美女视频_日韩黄色性爱一级视频_日本五十路人妻斩_国产99视频免费精品是看4_亚洲中文字幕无码一二三四区_国产小萍萍挤奶喷奶水_亚洲另类精品无码在线一区 | 光栅尺_Magnescale探规_磁栅尺_笔式位移传感器_苏州德美达 | KBX-220倾斜开关|KBW-220P/L跑偏开关|拉绳开关|DHJY-I隔爆打滑开关|溜槽堵塞开关|欠速开关|声光报警器-山东卓信有限公司 | 山东氧化铁红,山东铁红-淄博科瑞化工有限公司 | 粉末冶金-粉末冶金齿轮-粉末冶金零件厂家-东莞市正朗精密金属零件有限公司 | 安规电容|薄膜电容|陶瓷电容|智旭JEC安规电容厂家 | 棕刚玉_白刚玉_铝酸钙-锐石新材料 | 道达尔润滑油-食品级润滑油-道达尔导热油-合成导热油,深圳道达尔代理商合-深圳浩方正大官网 | 淄博不锈钢,淄博不锈钢管,淄博不锈钢板-山东振远合金科技有限公司 | 冲击式破碎机-冲击式制砂机-移动碎石机厂家_青州市富康机械有限公司 | 油冷式_微型_TDY电动滚筒_外装_外置式电动滚筒厂家-淄博秉泓机械有限公司 | 电主轴-高速精密电主轴-高速电机厂家-瑞德沃斯品牌有限公司 | 成都茶楼装修公司 - 会所设计/KTV装修 - 成都朗煜装饰公司 | 激光内雕_led玻璃_发光玻璃_内雕玻璃_导光玻璃-石家庄明晨三维科技有限公司 激光内雕-内雕玻璃-发光玻璃 | 广东青藤环境科技有限公司-水质检测 | 模温机-油温机-电加热导热油炉-工业冷水机「欧诺智能」 | 解放卡车|出口|济南重汽|报价大全|山东三维商贸有限公司 | 青岛侦探_青岛侦探事务所_青岛劝退小三_青岛婚外情取证-青岛王军侦探事务所 | 杭州翻译公司_驾照翻译_专业人工翻译-杭州以琳翻译有限公司官网 组织研磨机-高通量组织研磨仪-实验室多样品组织研磨机-东方天净 | 润滑脂-高温润滑脂-轴承润滑脂-食品级润滑油-索科润滑油脂厂家 | 浇注料-高铝砖耐火砖-郑州凯瑞得窑炉耐火材料有限公司 | 重庆LED显示屏_显示屏安装公司_重庆LED显示屏批发-彩光科技公司 重庆钣金加工厂家首页-专业定做监控电视墙_操作台 | 点焊机-缝焊机-闪光对焊机-电阻焊设备生产厂家-上海骏腾发智能设备有限公司 | 滚塑PE壳体-PE塑料浮球-警示PE浮筒-宁波君益塑业有限公司 | 冻干机(冷冻干燥机)_小型|实验型|食品真空冷冻干燥机-松源 | 南京兰江泵业有限公司-水解酸化池潜水搅拌机-絮凝反应池搅拌机-好氧区潜水推进器 | 热闷罐-高温罐-钢渣热闷罐-山东鑫泰鑫智能热闷罐厂家 | 防勒索软件_数据防泄密_Trellix(原McAfee)核心代理商_Trellix(原Fireeye)售后-广州文智信息科技有限公司 | 提升海外网站流量,增加国外网站访客UV,定制海外IP-访客王 | 物联网卡_物联网卡购买平台_移动物联网卡办理_移动联通电信流量卡通信模组采购平台? | 小型数控车床-数控车床厂家-双头数控车床| 水质传感器_水质监测站_雨量监测站_水文监测站-山东水境传感科技有限公司 | 棉柔巾代加工_洗脸巾oem_一次性毛巾_浴巾生产厂家-杭州禾壹卫品科技有限公司 | 手机游戏_热门软件app下载_好玩的安卓游戏下载基地-吾爱下载站 | 全自动贴标机-套标机-工业热风机-不干胶贴标机-上海厚冉机械 | 深圳美安可自动化设备有限公司,喷码机,定制喷码机,二维码喷码机,深圳喷码机,纸箱喷码机,东莞喷码机 UV喷码机,日期喷码机,鸡蛋喷码机,管芯喷码机,管内壁喷码机,喷码机厂家 | 蒸压釜_蒸养釜_蒸压釜厂家-山东鑫泰鑫智能装备有限公司 | 鑫铭东办公家具一站式定制采购-深圳办公家具厂家直销 | 品牌策划-品牌设计-济南之式传媒广告有限公司官网-提供品牌整合丨影视创意丨公关活动丨数字营销丨自媒体运营丨数字营销 |