揭榜任務:研制高速4D面部采集技術,研究并實現(xiàn)批量化、自動化的產(chǎn)業(yè)級面部模型處理與制作流程。基于多模態(tài)信息進行多樣化采集,建設人臉高精度4D模型數(shù)據(jù)庫,實現(xiàn)高逼真數(shù)字人面部和身體的快速構建。搭建基于大模型的多模態(tài)數(shù)字人交互系統(tǒng),實現(xiàn)視覺、聽覺等多模態(tài)輸入信息的統(tǒng)一表征,實現(xiàn)基于預訓練模型的表情、動作推理。
預期目標:到2025年,數(shù)字人4D面部動態(tài)重建幀率≥30fps,綁定后生成表情誤差小于5mm,數(shù)字人的自然度、真實度等主觀體驗評分達到行業(yè)領先水平。基于多模態(tài)交互輸入結合大模型實現(xiàn)高準確度、低延遲的動作、表情、行為推理。
(七)虛擬空間創(chuàng)作平臺
揭榜任務:研究基于元宇宙虛擬空間的構建系統(tǒng),實現(xiàn)低代碼快速構建虛擬空間。研究音視頻互動平臺,實現(xiàn)在元宇宙中進行語音、視頻交流。研究多人協(xié)作系統(tǒng),實現(xiàn)數(shù)字孿生模型的多人交互協(xié)作。研究共享桌面技術,實現(xiàn)多人共享演示內(nèi)容。研究元宇宙空間與云渲染方式的融合,實現(xiàn)手機或PC訪問元宇宙空間。研究人物換裝、捏臉功能,實現(xiàn)在虛擬空間中打造個性化的數(shù)字人。集成智能助手,提供專屬場景的業(yè)務問答與指令。
預期目標:到2025年,實現(xiàn)不少于5類場景的低代碼快速構建,支持會議元宇宙、展覽元宇宙、教育元宇宙、辦公元宇宙、園區(qū)元宇宙等場景,場景運行流暢不卡頓。支持在線人數(shù)、模型加載效率、延遲時間等核心指標達到國際先進水平。
(八)3D沉浸式實時通信系統(tǒng)
揭榜任務:研究基于多模態(tài)、多視角的三維視覺技術,實現(xiàn)對人、物、場的動態(tài)三維數(shù)據(jù)采集、建模和顯示。研制基于多傳感器的三維數(shù)據(jù)捕捉設備和基于裸眼3D顯示器的沉浸式實時通信系統(tǒng),旨在提供身臨其境的沉浸感體驗,可應用于視頻會議和遠程協(xié)作,為遠程教育和培訓、遠程手術和醫(yī)學會診、游戲和文旅等領域提供新的技術手段。
預期目標:到2025年,3D沉浸式實時通信系統(tǒng)從采集到呈現(xiàn)端到端時延小于400ms,幀率大于25,三維重建平均誤差、結構相似性、感知損失指標達到行業(yè)領先水平。
(九)3D實景地圖平臺
揭榜任務:研究3D實景地圖平臺,突破3D實景地理實體在語義化、結構化等維度上的技術瓶頸。研究用時空數(shù)據(jù)編織與時空知識圖譜技術實現(xiàn)對地理實體自身屬性及實體間關系進行一致性描述,以實現(xiàn)地理實體的語義化,達到計算機可理解、可分析。研究用GeoAI方法識別分類技術,實現(xiàn)地理實體單體分割并獲取其幾何輪廓及組成結構。在城市規(guī)劃、應急防災、交通治理等場景下實現(xiàn)快速批量應用。
預期目標:到2025年,地理實體語義化覆蓋率、結構化準確率等核心指標達到行業(yè)領先。
(十)基于文本描述的3D場景生成系統(tǒng)
揭榜任務:研究基于文本描述的3D場景生成系統(tǒng),突破傳統(tǒng)方法需要大量標記3D模型數(shù)據(jù)集的限制,解決當前基于文本描述的3D場景生成算法結果過飽和、過平滑、缺少細節(jié)等問題。研究多模態(tài)室內(nèi)3D場景生成,實現(xiàn)高質(zhì)量3D內(nèi)容生成,包括復雜效果,基于文本生成多樣性3D內(nèi)容和360°場景等。研究基于分布式云渲染實現(xiàn)多模態(tài)實時3D場景生成系統(tǒng),實現(xiàn)高帶寬高質(zhì)量內(nèi)容實時傳輸,海量高質(zhì)量3D內(nèi)容實時云端生產(chǎn)、渲染、交互。
預期目標:到2025年,實現(xiàn)根據(jù)輸入的文本信息,對于實例輸入的文本生成特定實例圖像。實現(xiàn)基于文本或文本+圖像的室內(nèi)3D場景的生成,生成場景的渲染視角圖像與文本一致性指標CLIP score、渲染圖像的感知指標Inception score等核心指標達到國際領先。
三、公共支撐
(十一)元宇宙數(shù)字身份標識技術解決方案
揭榜任務:研究元宇宙數(shù)字身份標識技術,構建跨平臺、跨設備、跨系統(tǒng)的元宇宙中數(shù)字身份及作品標識體系。研究數(shù)字身份映射體系,將元宇宙中數(shù)字身份與現(xiàn)實中人員身份關聯(lián),確保元宇宙世界中數(shù)字身份活動的真實性。通過“嵌入式”標識服務,為每個數(shù)字身份及相關作品分配唯一數(shù)字標識,建立起可信賴、可查驗、可追溯的數(shù)字身份及標識管理體系。
預期目標:到2025年,實現(xiàn)元宇宙數(shù)字身份標識技術解決方案在至少1類行業(yè)領域開展應用試點;實現(xiàn)元宇宙數(shù)字身份及作品的唯一標識技術,數(shù)字身份標識可跨平臺、跨設備、跨系統(tǒng)互認互通;技術解決方案的安全性、創(chuàng)新性及實用性達到行業(yè)領先水平。
附:1.2023年未來產(chǎn)業(yè)創(chuàng)新任務揭榜單位推薦表-元宇宙方向