飞象网 - 通信人每天必上的网站

首頁|必讀|視頻|專訪|運營|制造|監管|大數據|物聯網|量子|元宇宙|博客|特約記者
手機|互聯網|IT|5G|光通信|人工智能|云計算|芯片報告|智慧城市|移動互聯網|會展
首頁 >> AI人性化 >> 正文

重磅!OpenAI首個視頻生成模型發布,1分鐘流暢高清,效果炸裂

2024年2月16日 10:46  每日經濟新聞  

據OpenAI官網,OpenAI首個視頻生成模型Sora發布,完美繼承DALL·E 3的畫質和遵循指令能力,能生成長達1分鐘的高清視頻。

AI想象中的龍年春節,紅旗招展人山人海。

有緊跟舞龍隊伍抬頭好奇官網的兒童,還有不少人掏出手機邊跟邊拍,海量人物角色各有各的行為。

一位時髦女士漫步在東京街頭,周圍是溫暖閃爍的霓虹燈和動感的城市標志。

一名年約三十的宇航員戴著紅色針織摩托頭盔展開冒險之旅,電影預告片呈現其穿梭于藍天白云與鹽湖沙漠之間的精彩瞬間,獨特的電影風格、采用35毫米膠片拍攝,色彩鮮艷。

豎屏超近景視角下,這只蜥蜴細節拉滿:

OpenAI表示,公司正在教授人工智能理解和模擬運動中的物理世界,目標是訓練出能夠幫助人們解決需要與現實世界互動的問題的模型。在此,隆重推出文本到視頻模型——Sora。Sora可以生成長達一分鐘的視頻,同時保證視覺質量和符合用戶提示的要求。

如今,Sora正面向部分成員開放,以評估關鍵領域的潛在危害或風險。同時,OpenAI也邀請了一批視覺藝術家、設計師和電影制作人加入,期望獲得寶貴反饋,以推動模型進步,更好地助力創意工作者。OpenAI提前分享研究進展,旨在與OpenAI以外的人士合作并獲取反饋,讓公眾了解即將到來的AI技術新篇章。

Sora模型能夠生成包含多個角色、特定類型運動和主體及背景精確細節的復雜場景。該模型不僅能理解用戶在提示中所要求的內容,還能理解這些事物在現實世界中的存在方式。該模型對語言有深刻理解,能準確解讀提示,并生成表達豐富情感的引人入勝的角色。Sora還能在單個生成的視頻中創建多個鏡頭,使角色和視覺風格保持準確一致。

比如一大群紙飛機在樹林中飛過,Sora知道碰撞后會發生什么,并表現其中的光影變化。

一群紙飛機在茂密的叢林中翩翩起舞,在樹林中穿梭,就像候鳥一樣。

Sora還可以在單個視頻中創建多個鏡頭,并依靠對語言的深入理解準確地解釋提示詞,保留角色和視覺風格。

對于Sora當前存在的弱點,OpenAI也不避諱,模型在準確模擬復雜場景的物理特性方面可能會遇到困難,也可能無法理解具體的因果關系實例。例如“五只灰狼幼崽在一條偏僻的碎石路上互相嬉戲、追逐”,狼的數量會變化,一些憑空出現或消失。

此外,模型還可能會混淆提示的空間細節,例如左右不分,并且在處理隨時間發生的事件的精確描述方面也可能存在困難,比如跟蹤特定的攝像機軌跡。

如提示詞“籃球穿過籃筐然后爆炸”中,籃球沒有正確被籃筐阻擋。

技術方面,目前OpenAI透露的不多,簡單介紹如下:

Sora是一種擴散模型,從噪聲開始,能夠一次生成整個視頻或擴展視頻的長度,

關鍵之處在于一次生成多幀的預測,確保畫面主體即使暫時離開視野也能保持不變。

與GPT模型類似,Sora使用了Transformer架構,有很強的擴展性。

在數據方面,OpenAI將視頻和圖像表示為patch,類似于GPT中的token。

通過這種統一的數據表示方式,可以在比以前更廣泛的視覺數據上訓練模型,涵蓋不同的持續時間、分辨率和縱橫比。

Sora建立在過去對DALL·E和GPT模型的研究之上。它使用DALL·E 3的重述提示詞技術,為視覺訓練數據生成高度描述性的標注,因此能夠更忠實地遵循用戶的文本指令。

除了能夠僅根據文本指令生成視頻之外,該模型還能夠獲取現有的靜態圖像并從中生成視頻,準確地讓圖像內容動起來并關注小細節。

該模型還可以獲取現有視頻并對其進行擴展或填充缺失的幀,請參閱技術論文了解更多信息(晚些時候發布)。

Sora是能夠理解和模擬現實世界的模型的基礎,OpenAI相信這一功能將成為實現AGI的重要里程碑。

每日經濟新聞綜合OpenAI官網

編 輯:章芳
聲明:刊載本文目的在于傳播更多行業信息,本站只提供參考并不構成任何投資及應用建議。如網站內容涉及作品版權和其它問題,請在30日內與本網聯系,我們將在第一時間刪除內容。本站聯系電話為86-010-87765777,郵件后綴為#cctime.com,冒充本站員工以任何其他聯系方式,進行的“內容核實”、“商務聯系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權。
相關新聞              
 
人物
工信部辛國斌:2023年全國行政村通5G覆蓋超過80%
精彩專題
CES 2024國際消費電子展
2023年信息通信產業盤點暨頒獎禮
飛象網2023年手機評選
第24屆中國國際光電博覽會
CCTIME推薦
關于我們 | 廣告報價 | 聯系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網 CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號-1  電信與信息服務業務經營許可證080234號 京公網安備110105000771號
公司名稱: 北京飛象互動文化傳媒有限公司
未經書面許可,禁止轉載、摘編、復制、鏡像
主站蜘蛛池模板: 盐城网络公司_盐城网站优化_盐城网站建设_盐城市启晨网络科技有限公司 | 南京技嘉环保科技有限公司-杀菌除臭剂|污水|垃圾|厕所|橡胶厂|化工厂|铸造厂除臭剂 | 红酒招商加盟-葡萄酒加盟-进口红酒代理-青岛枞木酒业有限公司 | 杭州用友|用友软件|用友财务软件|用友ERP系统--杭州协友软件官网 | 软膜天花_软膜灯箱_首选乐创品牌_一站式天花软膜材料供应商! | J.S.Bach 圣巴赫_高端背景音乐系统_官网 | 南京租车,南京汽车租赁,南京包车,南京会议租车-南京七熹租车 | 沥青车辙成型机-车托式混凝土取芯机-混凝土塑料试模|鑫高仪器 | 无线联网门锁|校园联网门锁|学校智能门锁|公租房智能门锁|保障房管理系统-KEENZY中科易安 | 润滑脂-高温润滑脂-轴承润滑脂-食品级润滑油-索科润滑油脂厂家 | 高柔性拖链电缆-聚氨酯卷筒电缆-柔性屏蔽电缆厂家-玖泰电缆 | 安平县鑫川金属丝网制品有限公司,声屏障,高速声屏障,百叶孔声屏障,大弧形声屏障,凹凸穿孔声屏障,铁路声屏障,顶部弧形声屏障,玻璃钢吸音板 | 通风气楼_通风天窗_屋顶风机-山东美创通风设备有限公司 | 专业的新乡振动筛厂家-振动筛品质保障-环保振动筛价格—新乡市德科筛分机械有限公司 | 顶空进样器-吹扫捕集仪-热脱附仪-二次热解吸仪-北京华盛谱信仪器 | CPSE安博会| 昆山新莱洁净应用材料股份有限公司-卫生级蝶阀,无菌取样阀,不锈钢隔膜阀,换向阀,离心泵 | 校园气象站_超声波气象站_农业气象站_雨量监测站_风途科技 | 鼓风干燥箱_真空烘箱_高温干燥箱_恒温培养箱-上海笃特科学仪器 | TMT观察网_独特视角观察TMT行业 派财经_聚焦数字经济内容服务平台 | 防水套管|柔性防水套管|伸缩器|伸缩接头|传力接头-河南伟创管道 防水套管_柔性防水套管_刚性防水套管-巩义市润达管道设备制造有限公司 | 广东燎了网络科技有限公司官网-网站建设-珠海网络推广-高端营销型外贸网站建设-珠海专业h5建站公司「了了网」 | 海德莱电力(HYDELEY)-无功补偿元器件生产厂家-二十年专业从事电力电容器 | 智能交通网_智能交通系统_ITS_交通监控_卫星导航_智能交通行业 | 建筑资质代办-建筑资质转让找上海国信启航 | 伟秀电气有限公司-10kv高低压开关柜-高低压配电柜-中置柜-充气柜-欧式箱变-高压真空断路器厂家 | 磁粉制动器|张力控制器|气胀轴|伺服纠偏控制器整套厂家--台灵机电官网 | 【法利莱住人集装箱厂家】—活动集装箱房,集装箱租赁_大品牌,更放心 | 中红外QCL激光器-其他连续-半导体连续激光器-筱晓光子 | POS机官网 - 拉卡拉POS机免费办理|官网在线申请入口 | 直流电能表-充电桩电能表-导轨式电能表-智能电能表-浙江科为电气有限公司 | 移动机器人产业联盟官网| 知企服务-企业综合服务(ZiKeys.com)-品优低价、种类齐全、过程管理透明、速度快捷高效、放心服务,知企专家! | 干式磁选机_湿式磁选机_粉体除铁器-潍坊国铭矿山设备有限公司 | 杭州月嫂技术培训服务公司-催乳师培训中心报名费用-产后康复师培训机构-杭州优贝姆健康管理有限公司 | ★店家乐|服装销售管理软件|服装店收银系统|内衣店鞋店进销存软件|连锁店管理软件|收银软件手机版|会员管理系统-手机版,云版,App | 不锈钢水箱生产厂家_消防水箱生产厂家-河南联固供水设备有限公司 | 小型气象站_便携式自动气象站_校园气象站-竞道气象设备网 | 顺景erp系统_erp软件_erp软件系统_企业erp管理系统-广东顺景软件科技有限公司 | 偏心半球阀-电动偏心半球阀-调流调压阀-旋球阀-上欧阀门有限公司 | 气体检测仪-氢气检测仪-可燃气体传感器-恶臭电子鼻-深国安电子 |