
AI影片生成新創公司 亮度 推出了 Uni-1,這是該公司首款將推理和圖像生成整合到單一架構中的模型,標誌著該公司從先前專注於視訊內容的策略轉變。
據該公司稱,過去三年,Luma 的工作已從場景重建發展到 3D 生成和視訊擴散規模化,但僅憑視覺媒體本身,缺乏整合理解,存在局限性。 Uni-1 是該公司首個旨在融合推理和生成能力的統一模型,旨在推動多模態通用智慧的發展。
Luma 將通用智能定義為推理、想像、操控符號和模擬環境的能力。雖然現有的 AI 系統可以分別執行這些功能,但 Uni-1 旨在將它們整合到一個統一的框架中,對時間、空間和邏輯進行建模,從而實現傳統分段式流程無法解決的問題。
該模型建構成一個僅包含解碼器的自回歸Transformer,將文字和圖像表示在一個交錯的序列中,該序列既作為輸入又作為輸出。 Uni-1能夠執行結構化的內部推理,分解指令,解決約束,規劃構圖,並據此渲染圖像。
Uni-1展現了「以語言思考,以像素想像和渲染」的能力,Luma將其描述為「像素智能」。預計後續版本將增加音訊和視訊生成等其他輸出功能。此模型的目標不僅是作為工具,更是一個平台,透過將推理直接整合到創意工作流程中,從而變革企業的運作方式。

Luma Agents 擴展統一智能
基於 Uni-1,Luma 最近推出了 Luma Agents,這是一套人工智慧驅動的工具,旨在處理跨文字、圖像、視訊和音訊的端到端創意製作流程。這些代理人使用 Luma 的統一智慧模型系列,這些模型基於單一的多模態推理系統進行訓練。 Luma 將 Luma Agents 定位為廣告公司、行銷團隊、設計工作室和企業客戶的解決方案,可實現跨多種模態的協同創意產生。
Luma Agents 與其他 AI 模型相容,包括 Luma 的 Ray 3.14、Google 的 Veo 3 和 Nano Banana Pro、位元組跳動的 Seedream 以及 ElevenLabs 的語音產生工具。根據 Luma 執行長兼聯合創始人 Amit Jain 介紹,這些 Agents 利用了 Uni-1 的整合架構,該架構經過音訊、視訊、圖像、語言和空間推理方面的訓練,使其能夠在協調、智慧的工作流程中規劃、執行和生成內容。
免责声明:本文提供的信息不是交易建议。BlockWeeks.com不对根据本文提供的信息所做的任何投资承担责任。我们强烈建议在做出任何投资决策之前进行独立研究或咨询合格的专业人士。