人民網
人民網

中國電信發布全自研視頻生成大模型 完成全模態體系構建

首屆“TeleAI 開發者大會”在廣州舉辦

2024年12月06日09:06 | 來源:人民網-廣東頻道
小字號

12月3日,在中國電信“2024數字科技生態大會”期間,首屆“TeleAI 開發者大會”在廣州舉辦。會上,TeleAI發布視頻生成大模型、視覺大模型產用一體化平台、具身智能、智傳網等一系列創新技術、產品及科研成果,並發布開發者產業聯盟計劃。中國電信總經理梁寶俊出席並致辭,CTO、首席科學家、人工智能研究院(TeleAI)院長李學龍作主旨演講。

梁寶俊表示,隨著信息技術的迅猛發展,人工智能已成為新一輪科技革命和產業變革的重要力量。人工智能是驅動新質生產力的重要引擎,中國電信牢記使命擔當,全面深化改革,強化科技自主創新和技術攻關,率先布局人工智能戰略發展,積極推進“AI+”行動。中國電信將攜手中電信人工智能公司和TeleAI研究院,持續突破人工智能的技術攻關、持續為各類客戶提供更加智能的產品方案、持續向開發者提供更優的生態環境和研發平台。

首個央企全自研視頻生成大模型

本次發布的視頻生成大模型創新地打造了“VAST(Video As Storyboard from Text)二階段視頻生成技術”,通過文本描述精准勾勒出包含視頻構圖、主體目標位置及人物姿態等關鍵信息的“故事板”(Storyboard),進而生成對應的視頻內容。

得益於 VAST 的創新能力,視頻生成大模型可以保証單個或多個主體人物在各視頻片段中的外觀一致性,實現對復雜動作和交互式動作的精確控制,並讓角色和目標物體的運動符合物理規律。基於此,通過語義、語音、文生圖、文生視頻等全棧大模型能力打通短劇及影視制作的各個環節,覆蓋文字腳本撰寫、分鏡腳本繪制、視頻拍攝及剪輯、配音及音效合成等全流程,實現降本增效。目前,TeleAI 視頻生成大模型在權威視頻生成評測榜單VBench中排名第一。

基於知識的視圖萬物布控視覺大模型

視覺大模型現已升級至TeleSearch 2.0-基於知識的視圖萬物布控,實現動態知識挂載和行業事件認知,並驅動復雜邏輯理解。TeleSearch 2.0目標打破模態間的信息孤島,支持上百個專業知識文檔挂載,在理解文檔內容的基礎上,可根據復雜長語句精准檢索圖片和視頻,從而完成跨模態復雜語義准確理解及超萬種目標精准檢索。它實現了對傳統檢索類目的指數級提升,以及對十億級目標檢索的秒級響應。

依托TeleSearch 2.0,中國電信構建了視覺大模型產用一體化平台,通過算法冷啟動回流數據,擺脫了傳統模型對大量數據的依賴,實現0訓練數據直接推理,顯著降低算法應用的准入門檻。同時,平台還支持小樣本訓練,僅需100個樣本數據就能訓練出高精度模型,實現模型生產的全自動化過程。目前,該平台已成功應用於多省應急項目,沉澱了20余個應急全流程感知場景,提升對災害研判與應急響應的核心能力。

隨著本次視頻生成大模型和視覺大模型的發布,星辰大模型系列進一步完成了其全模態能力的構建。

首屆“TeleAI 開發者大會”,共建AI開發新生態

李學龍以“當夢想照進現實”為題進行分享,並發布星海AI中台、天翼AI開放平台、星辰智能體平台等開放平台,助力開發者大幅降低開發門檻,構建低成本、高效率的創新開發生態。同時,介紹了TeleAI在大模型全模態、全尺寸、全國產化體系構建的最新進展,及讓智能可以像水一樣流動到任何地方的智傳網技術前瞻布局。

大會期間,TeleAI還宣布與華為、中興、亞信科技等在內的19家合作伙伴發布中國電信人工智能開發者產業聯盟計劃,旨在聚合各方力量,加快推動人工智能產業發展,提升技術能力與應用水平,並為全球開發者賦能。

此外,在本次數字科技生態大會的線下展台,TeleAI還展示了一系列在具身智能方向的創新成果,包括可以用於生活服務的人形機器人、面向商場及展會場景的星小辰服務機器人、為視障人士提供導盲服務的智能機器狗,及整合了一系列大模型能力的AI智能眼鏡。展出了星辰軟件工廠、星辰慧記、星辰智能體產品、中國電信家庭小管家、星辰大模型一體機等一系列智能產品,致力於讓現場觀眾感受AI就在身邊。(王雅蝶)

(責編:王雅蝶、張永生)

分享讓更多人看到

返回頂部