此外,Midjourney還提供了“-cw”標簽,用戶可以通過這個標簽來調整與指定圖片的相似程度,從而微調角色的樣貌。
騰訊聯合清華、港科大推出圖生視頻大模型“Follow Your Click”
3月15日,騰訊和清華大學、香港科技大學聯合推出全新圖生視頻模型“Follow-Your-Click“,基于輸入模型的圖片,只需點擊對應區域,加上少量提示詞,就可以讓圖片中原本靜態的區域動起來,一鍵轉換成視頻。
據了解,本聯合項目組中的騰訊混元大模型團隊,正在持續研究和探索多模態技術,擁有行業領先的視頻生成能力。此前,騰訊混元大模型作為技術合作伙伴,支持《人民日報》打造原創視頻《江山如此多嬌》,生成中國大美河山的精美視頻片段,展示出了較強的內容理解、邏輯推理和畫面生成能力。
生物模型
前Google DeepMind科學家聯手創建Biooptimus,構建首個通用生物學大模型
2月20日,總部位于巴黎的Biooptimus在獲得3500萬美元的種子輪融資,其使命是建立第一個用于生物學的通用人工智能基礎模型。這一新的開放科學模型將把不同規模的生物學與生成人工智能連接起來——從分子到細胞、組織和整個生物體。
Bioptimus聯合了一個由Google DeepMind alumni和Owkin科學家組成的團隊,其中AI生物技術初創公司Owkin本身就是一家法國獨角獸,他們將利用AWS計算和Owkin的數據生成功能,并訪問來自全球領先學術醫院的多模態患者數據。
AI應用
具身智能
英偉達成立具身智能實驗室GEAR
2月24日,英偉達宣布成立通用具身智能體研究實驗室GEAR,標志著英偉達正式入局具身智能領域的研究,加速人工智能具身化進程。
機英偉達GEAR實驗室的聯合創始人Jim Fan博士在X平臺上表示:“我們相信,在未來,每一臺移動的機器都將是自主的,機器人和模擬智能體將像iPhone一樣無處不在。我們正在構建基礎智能體:一個具有通用能力的AI,可以在許多虛擬和現實的世界中學習如何熟練地行動。2024年將是屬于機器人、游戲AI和模擬的一年。”
Jim Fan還補充道:“我們有足夠的資金一次性解決機器人基礎模型、游戲基礎模型和生成式模擬。我們團隊可能是全球最有錢的具身智能實驗室。”
特斯拉人形機器人更新,步態達到最快
2月25日,特斯拉人形機器人Optimus發布更新,達到了有史以來最快的步態,速度約為 0.6m/s,比去年12月速度提升了30%以上。
Optimus改善了前庭系統、足部軌跡和地面接觸邏輯,升級了運動規劃器,并減少了機器人的循環延遲。Optimus整體上更加穩定、更加自信——即使在轉彎時也是如此。此外,還添加了輕微的軀干和手臂擺動。
Figure AI宣布獲得6.75億美元融資,估值達到26億美元
2月29日,具身智能公司Figure宣布獲得6.75億美元融資,估值達到26億美元。投資方包括微軟、OpenAI創業基金、英偉達、杰夫·貝索斯(通過Bezos Expeditions)、Parkway Venture Capital、英特爾、Align Ventures。
Figure AI還與OpenAI簽署了合作協議,為人形機器人開發下一代人工智能模型。Figure將利用Microsoft Azure進行人工智能基礎設施、培訓和存儲。
3月13日,Figure AI的第一款產品Figure 01發布Demo視頻,能夠實現端到端的機器人指令操作。其中,OpenAI模型提供高級視覺和語言智能,圖形神經網絡提供快速、低級、靈巧的機器人動作。
伯克利團隊發布具身智能論文,用訓練GPT的方法訓練人形機器人
3月3日,伯克利團隊發布論文,名為《Humanoid Locomotion as Next Token Prediction》,論文的核心思想,就是把OpenAI訓練ChatGPT時所用到的“預測下一個token”的思路,用在人形機器人的運動控制中。
該模型是一個通過自回歸預測訓練的causal transformer(因果轉換器)。