日韩高清无码中文字幕综合一二三区 ,精品国产亚洲一区二区三区在线观看,久久男人AV资源网站,亚洲AV无码精品色午夜果冻,东京热无码一区二区三区分类视频 ,欧美黑人XXXX性高清版,青青草欧美,亚洲精品黑牛一区二区三区
正在閱讀:

網頁擠崩潰,OpenAI視頻生成大模型Sora終于正式登場

掃一掃下載界面新聞APP

網頁擠崩潰,OpenAI視頻生成大模型Sora終于正式登場

視頻生成模型領域火熱,但也面臨著嚴峻的挑戰。

圖片來源:Sora官網

界面新聞記者 | 李如嘉

界面新聞編輯 | 文姝琪

在OpenAI的“12 Days of Christmas”12天連更計劃的第3天,視頻生成大模型Sora終于正式登場。

今年2月16日,OpenAI首次向外界展示了Sora的存在。據其介紹,Sora可以直接輸出長達60秒的視頻,并且包含高度細致的背景、復雜的多角度鏡頭,以及富有情感的多個角色。OpenAI在官網上公布了數十個視頻demo,并不斷在社交平臺X上放出由Sora生成的視頻。這些內容被集合推送至OpenAI的TikTok賬號上,短短5天內便獲得了51.3萬次贊,粉絲數也漲至10.6萬。

盡管“多模態模型”并不新鮮,文本到視頻的模型也此前已存在,但從OpenAI公布的視頻中可以看到,Sora可以生成的視頻長度和準確性完全顛覆了市場上現有產品的表現,堪稱史上最強文生視頻產品。

Sora不僅為OpenAI帶來了大量粉絲,也讓其估值進一步提升。不過,當時這家公司表示,Sora在短期內不會向大眾開放,因為其“技術仍存在一些缺陷,包括一些空間問題”。

在將近10個月之后,萬眾矚目下,Sora終于在此次系列發布中重磅登場。

OpenAI表示,2月發布Sora之后,團隊開發了其新版本Sora Turbo,其性能有了顯著進步,即日起該版本將作為獨立產品提供給ChatGPT Plus和Pro用戶。

在價格上,20美元一個月的ChatGPT Plus用戶,每月可以生成最多50個視頻,分辨率最高為720p,時長為 5 秒;每月200美元的ChatGPT Pro用戶,每月最多可以生成500個視頻,可以同時生成五個視頻,時長20秒,分辨率最高為1080p,并可下載無水印視頻。

Sora Turbo可以生成最長達20秒的視頻,最高1080p清晰度,有寬屏、豎屏、方屏比例可選。在生成模式上,除了基礎的文本轉視頻 (Text-to-Video)模式,還有文本+圖像轉視頻 (Text+Image-to-Video)模式,利用圖像輔助Sora理解用戶的創作意圖,以及融入特定圖像元素;以及文本+視頻轉視頻 (Text+Video-to-Video)模式,用戶可以上傳已有的視頻,并結合文本描述來對其進行修改或擴展。

此外,Sora Turbo還有多種視頻編輯工具,包括替換、刪除或重新構想視頻中的元素;找到并隔離最佳幀,然后向任一方向延伸它們以完成場景;使用Loop剪輯并創建無縫重復的視頻以及一個名為Storyboard的選項,用戶可以通過它詳細描述希望視頻在不同時間點發生的內容,從而更好地指導一系列片段的生成。

利用Sora生成的視頻案例

目前,http://sora.com網站已經上線,美國及其他市場的ChatGPT付費用戶可以通過該網站開始使用Sora,但在歐洲大部分地區和英國還需要一段時間才能使用,中國用戶依然受限。

不過,由于實在是太火爆,Sora網站一度被擠到崩潰,OpenAI CEO山姆·奧特曼(Sam Altman)表示:“由于需求超出預期,我們將不得不間歇性地關閉新用戶注冊,并且生成內容的速度會在一段時間內減慢。”

在技術路線上,目前,業界普遍猜測Sora的成功延續了OpenAI的Scaling law法則,即通過海量的數據,大量的算力,再加上大參數模型,最終“大力出奇跡”。

OpenAI研究科學家Noam Brown在Sora Turbo發布后表示,Sora是scale力量最直觀的展示。山姆·奧特曼則表示,“大家可以將 Sora看作視頻版的GPT-1。”

市場預計,Sora的發布會對視頻制作領域帶來革命性的變化,無論是電影制作、廣告、游戲開發還是社交媒體,都可以借助視頻生成大模型降低視頻創作的門檻,產生新的機遇。

自今年2月首次預告Sora以來,OpenAI便開始與電影制片廠、媒體高管以及經紀公司展開會談。OpenAI還允許一些藝術家、知名演員和導演試用該服務。

OpenAI還表示,Sora是一項理解和模擬現實的基礎性AI技術,是開發能夠與物理世界互動模型的重要一步。

OpenAI發布Sora之后,國內互聯網大廠和大模型公司紛紛跟進視頻大模型這一賽道,包括字節跳動、快手,今年發布視頻生成模型的公司還包括阿里云、Minimax、生數科技、智譜AI等公司。就在最近,騰訊混元大模型也宣布上線視頻生成能力,正式加入競爭激烈的視頻生成賽道。

不過,視頻生成模型領域雖然看起來火熱,也面臨著非常嚴峻的挑戰。近日,百度CEO李彥宏稱“百度不做Sora”的演講被媒體曝光,李彥宏在內部講話中稱,Sora這種視頻生成模型的投入周期太長,10年、20年都可能拿不到業務收益,無論多火爆,百度都不去做。

界面新聞從一位負責視頻生成模型的技術人士處了解到,生成式AI技術正大幅降低視頻生成的門檻,導致視頻數據以20倍左右的速度增長,對計算成本和效率提出了嚴峻的挑戰。以Sora模型為例,其訓練和推理所需的算力需求分別達到了GPT-4的4.5倍和近400倍。

中國銀河證券研究院的報告也顯示,Sora對算力需求呈指數級增長。其根據Sora參數規模推演出的訓練單次算力需求或可達到2.6×10^24Flops,相當于GPT-3175B的8.2倍。目前Sora還在初級階段,伴隨不斷迭代調優,其訓練數據集規模將進一步增大,未來算力需求也會大幅增加。

上述技術人士還表示,在編解碼層和框架層,視頻生成模型也面臨著諸多挑戰。一方面是效率的問題,另一方面是在計算需求日益增長的情況下,能否靈活處理越來越復雜的需求。

這些都對視頻生成模型形成巨大考驗,但其在商業化上的形勢仍然不夠明朗,一定程度上使訓練和推理成本上的挑戰更為嚴峻。

視頻生成模型同時還面臨著安全方面的挑戰。OpenAI表示,為了防止被濫用,用Sora生成的視頻會帶有C2PA元數據,表明這些視頻是AI生成的。在上傳圖像和視頻之前,OpenAI還會要求用戶同意使用協議,包括不得上傳18歲以下未成年的照片、色情或暴力內容、受版權保護的內容。一旦被發現上傳違禁內容,賬號會被關停。

未經正式授權嚴禁轉載本文,侵權必究。

OpenAI

  • OpenAI與微軟商討未來合作
  • 搶占微軟地盤?OpenAI或開發能聊天的“AI版Office”

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

網頁擠崩潰,OpenAI視頻生成大模型Sora終于正式登場

視頻生成模型領域火熱,但也面臨著嚴峻的挑戰。

圖片來源:Sora官網

界面新聞記者 | 李如嘉

界面新聞編輯 | 文姝琪

在OpenAI的“12 Days of Christmas”12天連更計劃的第3天,視頻生成大模型Sora終于正式登場。

今年2月16日,OpenAI首次向外界展示了Sora的存在。據其介紹,Sora可以直接輸出長達60秒的視頻,并且包含高度細致的背景、復雜的多角度鏡頭,以及富有情感的多個角色。OpenAI在官網上公布了數十個視頻demo,并不斷在社交平臺X上放出由Sora生成的視頻。這些內容被集合推送至OpenAI的TikTok賬號上,短短5天內便獲得了51.3萬次贊,粉絲數也漲至10.6萬。

盡管“多模態模型”并不新鮮,文本到視頻的模型也此前已存在,但從OpenAI公布的視頻中可以看到,Sora可以生成的視頻長度和準確性完全顛覆了市場上現有產品的表現,堪稱史上最強文生視頻產品。

Sora不僅為OpenAI帶來了大量粉絲,也讓其估值進一步提升。不過,當時這家公司表示,Sora在短期內不會向大眾開放,因為其“技術仍存在一些缺陷,包括一些空間問題”。

在將近10個月之后,萬眾矚目下,Sora終于在此次系列發布中重磅登場。

OpenAI表示,2月發布Sora之后,團隊開發了其新版本Sora Turbo,其性能有了顯著進步,即日起該版本將作為獨立產品提供給ChatGPT Plus和Pro用戶。

在價格上,20美元一個月的ChatGPT Plus用戶,每月可以生成最多50個視頻,分辨率最高為720p,時長為 5 秒;每月200美元的ChatGPT Pro用戶,每月最多可以生成500個視頻,可以同時生成五個視頻,時長20秒,分辨率最高為1080p,并可下載無水印視頻。

Sora Turbo可以生成最長達20秒的視頻,最高1080p清晰度,有寬屏、豎屏、方屏比例可選。在生成模式上,除了基礎的文本轉視頻 (Text-to-Video)模式,還有文本+圖像轉視頻 (Text+Image-to-Video)模式,利用圖像輔助Sora理解用戶的創作意圖,以及融入特定圖像元素;以及文本+視頻轉視頻 (Text+Video-to-Video)模式,用戶可以上傳已有的視頻,并結合文本描述來對其進行修改或擴展。

此外,Sora Turbo還有多種視頻編輯工具,包括替換、刪除或重新構想視頻中的元素;找到并隔離最佳幀,然后向任一方向延伸它們以完成場景;使用Loop剪輯并創建無縫重復的視頻以及一個名為Storyboard的選項,用戶可以通過它詳細描述希望視頻在不同時間點發生的內容,從而更好地指導一系列片段的生成。

利用Sora生成的視頻案例

目前,http://sora.com網站已經上線,美國及其他市場的ChatGPT付費用戶可以通過該網站開始使用Sora,但在歐洲大部分地區和英國還需要一段時間才能使用,中國用戶依然受限。

不過,由于實在是太火爆,Sora網站一度被擠到崩潰,OpenAI CEO山姆·奧特曼(Sam Altman)表示:“由于需求超出預期,我們將不得不間歇性地關閉新用戶注冊,并且生成內容的速度會在一段時間內減慢。”

在技術路線上,目前,業界普遍猜測Sora的成功延續了OpenAI的Scaling law法則,即通過海量的數據,大量的算力,再加上大參數模型,最終“大力出奇跡”。

OpenAI研究科學家Noam Brown在Sora Turbo發布后表示,Sora是scale力量最直觀的展示。山姆·奧特曼則表示,“大家可以將 Sora看作視頻版的GPT-1。”

市場預計,Sora的發布會對視頻制作領域帶來革命性的變化,無論是電影制作、廣告、游戲開發還是社交媒體,都可以借助視頻生成大模型降低視頻創作的門檻,產生新的機遇。

自今年2月首次預告Sora以來,OpenAI便開始與電影制片廠、媒體高管以及經紀公司展開會談。OpenAI還允許一些藝術家、知名演員和導演試用該服務。

OpenAI還表示,Sora是一項理解和模擬現實的基礎性AI技術,是開發能夠與物理世界互動模型的重要一步。

OpenAI發布Sora之后,國內互聯網大廠和大模型公司紛紛跟進視頻大模型這一賽道,包括字節跳動、快手,今年發布視頻生成模型的公司還包括阿里云、Minimax、生數科技、智譜AI等公司。就在最近,騰訊混元大模型也宣布上線視頻生成能力,正式加入競爭激烈的視頻生成賽道。

不過,視頻生成模型領域雖然看起來火熱,也面臨著非常嚴峻的挑戰。近日,百度CEO李彥宏稱“百度不做Sora”的演講被媒體曝光,李彥宏在內部講話中稱,Sora這種視頻生成模型的投入周期太長,10年、20年都可能拿不到業務收益,無論多火爆,百度都不去做。

界面新聞從一位負責視頻生成模型的技術人士處了解到,生成式AI技術正大幅降低視頻生成的門檻,導致視頻數據以20倍左右的速度增長,對計算成本和效率提出了嚴峻的挑戰。以Sora模型為例,其訓練和推理所需的算力需求分別達到了GPT-4的4.5倍和近400倍。

中國銀河證券研究院的報告也顯示,Sora對算力需求呈指數級增長。其根據Sora參數規模推演出的訓練單次算力需求或可達到2.6×10^24Flops,相當于GPT-3175B的8.2倍。目前Sora還在初級階段,伴隨不斷迭代調優,其訓練數據集規模將進一步增大,未來算力需求也會大幅增加。

上述技術人士還表示,在編解碼層和框架層,視頻生成模型也面臨著諸多挑戰。一方面是效率的問題,另一方面是在計算需求日益增長的情況下,能否靈活處理越來越復雜的需求。

這些都對視頻生成模型形成巨大考驗,但其在商業化上的形勢仍然不夠明朗,一定程度上使訓練和推理成本上的挑戰更為嚴峻。

視頻生成模型同時還面臨著安全方面的挑戰。OpenAI表示,為了防止被濫用,用Sora生成的視頻會帶有C2PA元數據,表明這些視頻是AI生成的。在上傳圖像和視頻之前,OpenAI還會要求用戶同意使用協議,包括不得上傳18歲以下未成年的照片、色情或暴力內容、受版權保護的內容。一旦被發現上傳違禁內容,賬號會被關停。

未經正式授權嚴禁轉載本文,侵權必究。
主站蜘蛛池模板: 亚洲国产欧美中文丝袜日韩| 中文精品一卡2卡3卡4卡| 国产成人欧美日韩在线电影| 国产人成亚洲第一网站在线播放| 国产麻豆精品在线观看| 青青草无码免费一二三区| 亚洲国产精品热久久| 操国产美女| 久久天天躁狠狠躁夜夜96流白浆| 久草热久草热线频97精品| 天天综合网在线| 欲色影视天天一区二区色香欲 | 少妇人妻久久无码专区| 国产区免费精品视频| 亚洲a∨国产av综合av下载| 美女污污网站| 国产人妻777人伦精品hd| 久久亚洲色www成人网址| 国产精品女同一区二区在线| 欧美xxxx做受性欧美88| 无码毛片内射白浆视频| 久久精品人人做人人爽| 国产真人性做爰久久网站| 国产高跟黑色丝袜在线| 日韩欧美国产综合字幕| 青青草无码免费一二三区| 久久久久久久一线毛片| 色一情一伦一区二区三| 亚洲AV无码精品色午夜超碰| 亚洲日韩欧美国产高清αv| 精品尤物TV福利院在线网站| 久久久久波多野结衣高潮| 亚洲女人αV天堂在线| 亚洲成av人片一区二区| 欧美在线伊人| 人妻精品久久无码专区精东影业| 啊轻点灬大JI巴太粗太长了在线| 国产高清自产拍AV在线| 欧美大胆老熟妇乱子伦视频| 色老头av亚洲一区二区男男 | 永久无码天堂网小说区|