本報訊 (記者袁傳璽)8月21日,百度蒸汽機(MuseSteamer)音視頻一體化模型完成重大升級,Turbo版、Lite版、Pro版,及有聲版全面開放,在行業內首次實現多人有聲音視頻一體化生成。
據介紹,百度蒸汽機是全球首個中文音視頻一體化生成的I2V模型,不僅支持環境音效,更支持多角色語音的一體化生成。
這背后依托于百度蒸汽機視頻模型的五大核心技術突破:行業首次實現多人有聲音視頻一體化生成,語音與唇形、表情、動作的毫秒級精準對齊,復雜場景下依然穩定;首創多模態潛在空間規劃技術(Latent Multi-Modal Planner),自主協調多角色身份、情感與互動邏輯,保障電影級敘事連貫性;中文場景深度適配,以超98%的還原度精準呈現中文語音細節與情感表達;端到端電影級畫質生成,通過精準主體動態刻畫,打造真實細膩的人物表現力;大師級運鏡控制,內置數十種專業鏡頭語言,精準響應文本指令,實現視覺細節與創意意圖的完美對齊。
隨著百度蒸汽機全系版本開放,百度同步公布了極具競爭力的價格體系。針對不同需求用戶,平臺提供了梯度會員服務,價格低至行業同類產品的70%。
不同于業界的模型發展多由技術催生,百度蒸汽機的研發是由應用驅動模型研發的新范式。來自百度各業務場景的、旺盛的應用需求,推動著百度蒸汽機模型快速發展,而模型技術的迭代,也在反哺著應用生態的創新,包括搜索生態、內容生態、商業生態以及云生態等。AIGC的涌現,大大打開了多模態內容創作的自由度,提高了視頻生成質量和效率,并大幅降低了視頻制作成本。目前,百度蒸汽機已在百度生態廣泛使用。
在百度搜索中,用戶只需點擊視頻創作即可輕松完成從腳本到視頻免費生成,普通用戶也可獲得簡單而驚喜的AI創作體驗;在內容創作領域,百度蒸汽機模型與創作工具結合,正在百家號平臺上為創作者打破專業壁壘,釋放個體創作自由;在商業生態,百度蒸汽機視頻生成技術為營銷客戶提供了高質量、低成本的營銷創作新路徑。
目前,百度智能云千帆大模型平臺已全面接入百度蒸汽機模型服務,為企業提供高性能、低成本、安全可控的視頻生成解決方案。通過按量后付、預付費資源量包、批量計算等極致的資源利用和靈活的計費模式,助力企業及開發者低成本用好視頻生成模型。支持企業在商業營銷、影視創作、創意特效等五大場景快速落地,實現企業級AI視頻即開即用。
(編輯 張昕)
23:56 | 浙江土地市場高溢價成交頻現 |
23:56 | 政策組合拳為儲能產業鏈打開發展空... |
23:56 | 工程機械企業要握緊高質量發展的四... |
23:56 | 工程機械行業穩步邁入新一輪增長周... |
23:48 | 龍蟠科技簽下60億元磷酸鐵鋰正極材... |
23:48 | 巨星傳奇擬收購“鳥巢”運營主體1.... |
23:48 | 露笑科技子公司簽署AI機器人領域合... |
23:48 | 雅化集團:“民爆+鋰業”雙主業齊... |
23:35 | 商品期貨沉淀資金量站上4700億元關... |
23:35 | 年內62家機構申報合格境外投資者資... |
23:35 | 銀行秋季招聘加碼爭奪金融科技人才 |
23:35 | 人形機器人賽道具備“長坡厚雪”特... |
版權所有《證券日報》社有限責任公司
互聯網新聞信息服務許可證 10120240020增值電信業務經營許可證 京B2-20250455
京公網安備 11010602201377號京ICP備19002521號
證券日報網所載文章、數據僅供參考,使用前務請仔細閱讀法律申明,風險自負。
證券日報社電話:010-83251700網站電話:010-83251800 網站傳真:010-83251801電子郵件:xmtzx@zqrb.net
安卓
IOS
掃一掃,加關注
掃一掃,加關注