飞象网 - 通信人每天必上的网站

首頁|必讀|視頻|專訪|運營|制造|監管|大數據|物聯網|量子|低空經濟|智能汽車|特約記者
手機|互聯網|IT|5G|光通信|人工智能|云計算|芯片|報告|智慧城市|移動互聯網|會展
首頁 >> 人工智能 >> 正文

從Deepseek看,模型推理的盈利思辨與產業賦能

2025年5月12日 08:01  天翼智庫  

Deepseek推動大模型平價化,降低開發成本,為下游端側和應用側打開市場空間,催生大量推理算力需求。IDC預測2026年中國智能算力規模年復合增長率達52.3%,增長源于推理端需求釋放,大模型應用中推理算力需求超訓練算力。國內各廠商已積極開展布局適配DeepSeek的多類型算力芯片的推理框架,實現推理算力效率最大化、提升DeepSeek推理速度、創新業務模式等,增強其在DeepSeek推理方向的市場競爭力。

模型推理簡介

模型推理是指利用已訓練模型對新輸入數據進行預測或決策的計算過程,其核心目標是通過高效、準確、實時的輸出解決實際問題。與模型訓練不同,模型推理是其后續流程的一環,具體來看:

訓練階段是計算密集型任務,旨在依托大量預處理數據,運用隨機梯度下降等方法歷經復雜迭代,持續調校模型參數來探尋數據規律,其特點在于需要處理大規模數據集和復雜的梯度計算,通常依賴于高性能GPU的并行計算能力,對顯存容量和帶寬要求高,需要高速互聯保證多卡協同運行,通常要求千卡及萬卡級以上。同時模型訓練伴隨多次梯度迭代,對于數據的精準度通常要求較高,通常計算精度要求FP16及以上。

推理階段,模型參數固定,更多屬于訪存密集型任務,更注重低延遲和高吞吐量的前向傳播,單次計算量較小,但高并發場景下整體算力需求仍會增加,依據應用場景對于數據精度要求差異,目前場景以FP16、FP8、int8計算精度為主,一些特殊場景如科學計算等需要FP32或FP64。

模型推理過程主要涉及推理算力、推理框架、推理應用。推理框架作為模型推理的“操作系統”,簡化推理部署及開發復雜性,屏蔽底層的算力資源差異,支撐上層應用開發。其優化部署技術主要包括KV Cache、服務調度優化技術、顯存優化、Offload技術、量化技術、解碼優化及其變體等。通過減少計算和內存需求加速推理,滿足實時性要求、降低部署成本,如專注于高性能推理和服務的開源框架vLLM、SALang、以及在CPU推理方面表現良好的llama.cpp等推理框架,企業根據實際芯片和模型需求的自研框架。

DeepSeek推理盈利引爭議,技術與商業博弈凸顯

3 月 1 日,DeepSeek 官方在《DeepSeek-V3 / R1 推理系統概覽》中首次披露成本利潤率,理論值高達 545%。然而,潞晨科技曾表示DeepSeek R1推理部署有虧損風險并宣布暫停 DeepSeek API 服務模式。一方面是DeepSeek推理的巨大成本利潤率545%,另一方面是企業賣DeepSeek API(MaaS)每月虧本4億元,出現兩種相反觀點的主要原因在于:在推動推理服務商業化進程中,保障用戶體驗需被置于首要位置,這要求企業需儲備大量冗余智算資源。據浪潮開展的相關調研測算,當前我國智算中心的平均算力使用率維持在 30%上下,為確保推理服務能為用戶帶來優質體驗,需維持近70% 的算力資源冗余,大量冗余需要大量的資金投入。反觀DeePSeek則通過算力資源統籌管理、生態合作實現了高盈利。一是“見縫插針”用顯卡,即白天高負荷全節點部署推理,夜間低負荷時釋放節點用于訓練/研究的模式,論測算僅考慮資源的效率。二是DeepSeek推理盈利模式多元,以ToB服務的API調用收費為主,與垂直行業合作,通過生態衍生業務如開發者工具、云服務、數據服務等來盈利,如DeepSeek 與教育、醫療、金融等領域展開合作,將技術轉化為針對性解決方案,推出智能教學助手、病例分析系統、客服機器人等產品,業務覆蓋超 20 個垂直行業。

DeepSeek推理算力、推理框架、推理應用三方面賦能 AI 產業新生態

DeepSeek 憑借自身在硬件優化、模型創新及自研推理框架等方面的優勢,為國內模型推理相關AI產業發展提供新機遇。

(一)推理算力方面,DeepSeek模型推理通過性價比優勢推動國產算力在推理側的滲透。DeepSeek推理通過混合專家模型(MoE)動態選擇合適的專家模塊處理,減少計算量,保證推理準確的前提下降低成本。如推理定價方面,DeepSeek R1($0.14/百萬輸入tokens)較OpenAI o3-mini($1.1/百萬輸入tokens)更便宜。目前華為昇騰、海光信息、摩爾線程、昆侖芯、燧原科技等AI芯片廠商,相繼宣布適配或上架 DeepSeek 模型服務,其中昇騰910C芯片針對MoE模型動態路由優化使推理效率提升50%。截至今年2月20日,已有超過30家軟硬件企業基于昇騰推出DeepSeek一體機方案2,并超過80家企業基于昇騰上線DeepSeek,服務全國超70%區域。

(二)推理框架方面,DeepSeek利用硬件親和的工程優化,充分發揮了受限顯卡(H800)的性能,為國產芯片廠商發展提供了新范式。DeepSeek用更接近底層硬件的匯編語言PTX,對計算過程進行更細粒度的控制,開發了通信和數據分配模塊進行優化,擺脫了部分cuda庫,充分發揮底層GPU的計算性能。因此,在硬件受限的情況下,通過算法創新和工程優化可部分彌補芯片性能差距。目前科技廠商已推出自研推理框架(與國產芯片適配)服務于DeepSeek,如澎峰科技已完成基于海光DCU的自研推理框架PerfXLM +,并深度適配、優化 DeepSeek 全系列模型。2月25日智源研究院聯合多個芯片廠商開發并開源了 DeepSeek-R1 多芯片版本,其異構并行訓推框架 FlagScale可適配多芯片,能夠一鍵部署 DeepSeek-R1 模型服務和自動分布式推理調優能力。

(三)推理應用方面,DeepSeek憑借開源、高效推理能力助推眾多行業實現智能化轉型,尤其在工業領域實現明顯的降本增效。富士康引入DeepSeek優化iPhone主板貼片生產線,節拍時間縮短12%,產能提升至120萬臺/日。燧原科技基于DeepSeek全量模型在慶陽、無錫、成都等智算中心實現“數萬卡”快速落地,硬件成本降低超30%。聯想通過DeepSeek多模態模型提升智能質檢的缺陷識別準確率至99%以上,并借助時序預測模型優化供應鏈管理,助力企業降本超20%。

國內AI相關企業模型推理發展建議

(一)建議以混合部署模式構建 DeepSeek 推理算力體系,如將 NVIDIA 硬件與昇騰硬件協同部署。著重強化對運維團隊的專業技術培訓,確保團隊成員能夠精通 NVIDIA 與昇騰兩種硬件的運維管理。在提升 DeepSeek 推理算力性能表現與運行可靠性的同時,有效規避因過度依賴單一技術路線而可能引發的潛在風險,為相關企業在AI領域的業務拓展筑牢堅實的技術根基。

(二)建議依托 vLLM 等現有的開源推理框架,全力開展自研DeepSeek 推理框架對混合異構算力的適配工作。在推理框架設計中,建議以國產芯片為主導、英偉達 GPU 為補充,充分利用國產芯片的性價比優勢和英偉達GPU的高性能特點。確保在充分滿足推理性能要求的同時,實現成本的最大化削減,僅在國產芯片難以勝任的復雜計算任務或對性能有極致要求的關鍵環節合理采用英偉達 GPU,實現性能與成本的最優平衡。

(三)建議積極探尋并挖掘工業領域推理應用場景。組建專業的行業調研團隊,深入各類工業企業內部,全面、細致地了解其生產流程、現存痛點問題以及對智能化和安全性的具體需求。基于調研結果,量身定制基于 DeepSeek 的工業解決方案,精準滿足工業企業的實際業務訴求,助力其實現智能化轉型升級。

編 輯:高靖宇
飛象網版權及免責聲明:
1.本網刊載內容,凡注明來源為“飛象網”和“飛象原創”皆屬飛象網版權所有,未經允許禁止轉載、摘編及鏡像,違者必究。對于經過授權可以轉載,請必須保持轉載文章、圖像、音視頻的完整性,并完整標注作者信息和飛象網來源。
2.凡注明“來源:XXXX”的作品,均轉載自其它媒體,在于傳播更多行業信息,并不代表本網贊同其觀點和對其真實性負責。
3.如因作品內容、版權和其它問題,請在相關作品刊發之日起30日內與本網聯系,我們將第一時間予以處理。
本站聯系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯系方式,進行的“內容核實”、“商務聯系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權。
推薦新聞              
 
人物
韋樂平詳解生成式人工智能的聯網技術
精彩視頻
北京聯通雙萬兆AI賦能行動正式發布
專家談 | 中國信通院曹薊光:大模型紅利加速釋放AI跨行業全場景賦能
飛象趣談第二十五期!全球人形機器人半馬首秀,中國黑科技如何讓機器人跑贏未來!
看見數智福建 2025數字中國建設峰會媒體探訪活動
精彩專題
第八屆數字中國建設峰會
通信產業2024年業績盤點
3·15權益日 | 共筑滿意消費 守護信息通信安全防線
聚焦2025全國兩會
關于我們 | 廣告報價 | 聯系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網 CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號-1  電信與信息服務業務經營許可證080234號 京公網安備110105000771號
公司名稱: 北京飛象互動文化傳媒有限公司
未經書面許可,禁止轉載、摘編、復制、鏡像
主站蜘蛛池模板: 实体店商新零售|微赢|波后|波后合作|微赢集团 | 骨密度仪-骨密度测定仪-超声骨密度仪-骨龄测定仪-天津开发区圣鸿医疗器械有限公司 | 卧涛科技有限公司科技项目申报公司|高新技术企业申报|专利申请 | 自动气象站_气象站监测设备_全自动气象站设备_雨量监测站-山东风途物联网 | ORP控制器_ORP电极价格-上优泰百科| 茶楼装修设计_茶馆室内设计效果图_云臻轩茶楼装饰公司 | 雄松华章(广州华章MBA)官网-专注MBA/MPA/MPAcc/MEM辅导培训 | 龙门加工中心-数控龙门加工中心厂家价格-山东海特数控机床有限公司_龙门加工中心-数控龙门加工中心厂家价格-山东海特数控机床有限公司 | 氟氨基酮、氯硝柳胺、2-氟苯甲酸、异香兰素-新晨化工 | 济南律师,济南法律咨询,山东法律顾问-山东沃德律师事务所 | 干式变压器厂_干式变压器厂家_scb11/scb13/scb10/scb14/scb18干式变压器生产厂家-山东科锐变压器有限公司 | 插针变压器-家用电器变压器-工业空调变压器-CD型电抗器-余姚市中驰电器有限公司 | 冷却塔降噪隔音_冷却塔噪声治理_冷却塔噪音处理厂家-广东康明冷却塔降噪厂家 | SOUNDWELL 编码器|电位器|旋转编码器|可调电位器|编码开关厂家-广东升威电子制品有限公司 | 广州企亚 - 数码直喷、白墨印花、源头厂家、透气无手感方案服务商! | 河北中仪伟创试验仪器有限公司是专业生产沥青,土工,水泥,混凝土等试验仪器的厂家,咨询电话:13373070969 | 丹佛斯变频器-Danfoss战略代理经销商-上海津信变频器有限公司 | 广州番禺搬家公司_天河黄埔搬家公司_企业工厂搬迁_日式搬家_广州搬家公司_厚道搬迁搬家公司 | PC构件-PC预制构件-构件设计-建筑预制构件-PC构件厂-锦萧新材料科技(浙江)股份有限公司 | 线材成型机,线材折弯机,线材成型机厂家,贝朗自动化设备有限公司1 | 圆盘鞋底注塑机_连帮鞋底成型注塑机-温州天钢机械有限公司 | LED太阳能中国结|发光红灯笼|灯杆造型灯|节日灯|太阳能灯笼|LED路灯杆装饰造型灯-北京中海轩光电 | 磁力加热搅拌器-多工位|大功率|数显恒温磁力搅拌器-司乐仪器官网 | AGV叉车|无人叉车|AGV智能叉车|AGV搬运车-江西丹巴赫机器人股份有限公司 | 红外光谱仪维修_二手红外光谱仪_红外压片机_红外附件-天津博精仪器 | 探伤仪,漆膜厚度测试仪,轮胎花纹深度尺厂家-淄博创宇电子 | 钢绞线万能材料试验机-全自动恒应力两用机-混凝土恒应力压力试验机-北京科达京威科技发展有限公司 | 车牌识别道闸_停车场收费系统_人脸识别考勤机_速通门闸机_充电桩厂家_中全清茂官网 | 空气能采暖,热泵烘干机,空气源热水机组|设备|厂家,东莞高温热泵_正旭新能源 | 耐力板-PC阳光板-PC板-PC耐力板 - 嘉兴赢创实业有限公司 | 披萨石_披萨盘_电器家电隔热绵加工定制_佛山市南海区西樵南方综合保温材料厂 | 污水处理设备,一体化泵站,一体化净水设备-「梦之洁环保设备厂家」 | 气动隔膜泵厂家-温州永嘉定远泵阀有限公司| RTO换向阀_VOC高温阀门_加热炉切断阀_双偏心软密封蝶阀_煤气蝶阀_提升阀-湖北霍科德阀门有限公司 | 北京网络营销推广_百度SEO搜索引擎优化公司_网站排名优化_谷歌SEO - 北京卓立海创信息技术有限公司 | 精密模具制造,注塑加工,吹塑和吹瓶加工,EPS泡沫包装生产 - 济南兴田塑胶有限公司 | 伟秀电气有限公司-10kv高低压开关柜-高低压配电柜-中置柜-充气柜-欧式箱变-高压真空断路器厂家 | 探伤仪,漆膜厚度测试仪,轮胎花纹深度尺厂家-淄博创宇电子 | ★店家乐|服装销售管理软件|服装店收银系统|内衣店鞋店进销存软件|连锁店管理软件|收银软件手机版|会员管理系统-手机版,云版,App | 齿轮减速电机一体机_蜗轮蜗杆减速马达-德国BOSERL齿轮减速机带电机生产厂家 | 铜镍-康铜-锰铜-电阻合金-NC003 - 杭州兴宇合金有限公司 |