色综合一区_免费av电影网站_久久这里有精品_超碰3_91麻豆精品国产91久久久久久_欧美一区免费

 
當前位置: 首頁 » 行業(yè)聚焦 » 科技前沿 » 正文

Sora“滿月”了,但不止一個AI在新生

可能是科技史上最密集的AI動態(tài)發(fā)布月


  來源: 澎湃新聞·澎湃號·湃客 時間:2024-03-18 作者:流川
分享到:

?

2月22日,谷歌宣布將暫停Gemini的人物圖像生成,努力解決與Gemini圖像生成功能相關的最新問題;將很快重新發(fā)布改進版本。


此前,Gemini在圖片中生成了各種性別、種族的人群,即使生成的結果與史實不符,例如以“美國開國元勛華盛頓”為主題的圖片中,出現(xiàn)了婦女和有色人種。


3月2日,50歲的谷歌聯(lián)合創(chuàng)始人謝爾蓋·布林在加州的“AGI之家”與企業(yè)家們進行了交談,談及此事時評價道:“我們在圖像生成方面搞砸得很徹底,我認為這主要由于沒有進行徹底的測試。出發(fā)點是好的,但結果卻讓很多人感到沮喪。”


谷歌發(fā)布基礎世界模型Genie


2月27日,谷歌發(fā)布了生成式AI的全新范式——生成式交互環(huán)境(Genie,Generative Interactive Environments)。


Genie是一個110億參數(shù)的基礎世界模型,可以通過單張圖像提示生成可玩的交互式環(huán)境。GenieAI是一個利用互聯(lián)網(wǎng)視頻訓練的基礎世界模型,可以從合成圖像、照片甚至素描中生成無限多的可玩(可控制動作的)世界。它的使用范圍廣泛,可以用于從圖像或文本生成整個互動世界,是訓練未來通用AI代理的有利工具。


螞蟻集團推出百靈大模型


2月28日,螞蟻集團推出20億參數(shù)多模態(tài)遙感基礎模型SkySense,其論文已被世界計算機視覺頂會CVPR 2024接收。


數(shù)據(jù)顯示,SkySense在17項測試場景中指標均超過國際同類產(chǎn)品,這也是迄今為止國際上參數(shù)規(guī)模最大、覆蓋任務最全、識別精度最高的多模態(tài)遙感基礎模型。SkySense可用于地貌、農作物觀測和解譯等,有效輔助農業(yè)生產(chǎn)和經(jīng)營。


潞晨科技復現(xiàn)Sora并開源


3月4日,國內著名開源團隊Colossal-AI(潞晨科技旗下)根據(jù)Sora技術報告、VideoGPT、擴散Transformers等資料,復現(xiàn)了Sora模型架構方案并將其開源——Open-Sora。


值得一提的是,Colossal-AI還將復現(xiàn)成本降低了46%,同時將模型訓練輸入序列長度擴充至819K patches。目前,Open-Sora在Github超過1200顆星。


Midjourney封禁Stability AI:惡意爬取數(shù)據(jù),致服務器癱瘓24小時


3月7日,Midjourney封禁Stability AI引發(fā)了一場關于數(shù)據(jù)安全和道德責任的爭議。事件起因于Stability AI的數(shù)據(jù)收集工程師對Midjourney服務器發(fā)起了惡意攻擊,導致其服務中斷24小時。盡管Stability AI CEO Emad聲稱公司并未授權此行為,但Midjourney決定暫時封禁其員工使用其軟件。


華為諾亞發(fā)布0.6B文生圖模型PixArt-Σ,可直出4K圖像


3月10日,華為諾亞方舟實驗室聯(lián)合多個研究機構共同開發(fā)的項目,推出了一款名為PixArt-Σ的擴散變換器模型(DiT)。


PixArt-Σ 的進步有兩個方面。一是高質量訓練數(shù)據(jù),引入了更高質量的圖像數(shù)據(jù),配合更精確和詳細的圖像標題;二是高效的token壓縮:在DiT框架內提出了一個新的注意力模塊,能夠壓縮鍵和值,顯著提高效率,從而支持超高分辨率圖像的生成。


這些改進使得PixArt-Σ在模型大小(0.6B參數(shù))上遠小于現(xiàn)有的文本到圖像擴散模型,如SDXL(2.6B參數(shù))和SD Cascade(5.1B參數(shù)),同時在圖像質量和用戶提示遵循能力上都有了顯著提升。此外,PixArt-Σ生成4K圖像的能力,為電影和游戲等行業(yè)的高質量視覺內容制作提供了強大支持。


Pika推出自動生成音效功能Sound Effects


3月11日,Pika 發(fā)布了全新的功能Sound Effects,實現(xiàn)了視頻和音效的無縫生成。用戶可以通過簡單的操作,通過描述prompt或讓 AI 自動生成音效,為視頻增添更多氛圍。


Sound Effects的操作十分簡單,用戶只需一個 prompt或簡單的描述就能生成音效,使視頻更加生動。通過選擇不同的音效,用戶可以為視頻增添各種聲音,從車鳴聲到煙花聲,音效都與視頻畫面高度匹配。此外,用戶還可以在生成視頻后,針對單個視頻添加音效,提升視頻質量和趣味性。


Midjourney發(fā)布角色一致性新功能


3月12日,Midjourney推出了一項新功能,使得在生成多張圖片時,能夠保持同一人物的一致性。通過使用“-cref”(角色參考)標簽,可以保留輸入圖片中的角色特征,使得在不同場景中的臉部特征、體型和服裝保持一致。


關鍵詞:openAI sora 獨角獸 算力 融資 人工智能 芯片    瀏覽量:12806

聲明:凡本網(wǎng)注明"來源:儀商網(wǎng)"的所有作品,版權均屬于儀商網(wǎng),未經(jīng)本網(wǎng)授權不得轉載、摘編使用。
經(jīng)本網(wǎng)授權使用,并注明"來源:儀商網(wǎng)"。違反上述聲明者,本網(wǎng)將追究其相關法律責任。
本網(wǎng)轉載并注明自其它來源的作品,歸原版權所有人所有。目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點或證實其內容的真實性,不承擔此類作品侵權行為的直接責任及連帶責任。如有作品的內容、版權以及其它問題的,請在作品發(fā)表之日起一周內與本網(wǎng)聯(lián)系,否則視為放棄相關權利。
本網(wǎng)轉載自其它媒體或授權刊載,如有作品內容、版權以及其它問題的,請聯(lián)系我們。相關合作、投稿、轉載授權等事宜,請聯(lián)系本網(wǎng)。
QQ:2268148259、3050252122。


讓制造業(yè)不缺測試測量工程師

最新發(fā)布
行業(yè)動態(tài)
行業(yè)聚焦
國際資訊
儀商專題
按分類瀏覽
Copyright ? 2023- 861718.com All rights reserved 版權所有 ?廣州德祿訊信息科技有限公司
本站轉載或引用文章涉及版權問題請與我們聯(lián)系。電話:020-34224268 傳真: 020-34113782

粵公網(wǎng)安備 44010502000033號

粵ICP備16022018號-4
主站蜘蛛池模板: 在线成人免费电影 | 欧美日韩一区二区视频在线观看 | 日韩精品视频在线 | 欧美日韩成人精品 | 狠狠综合久久av一区二区老牛 | 亚洲国产精品一区二区久久 | 亚洲精品一区二区三区在线 | 99久久免费精品国产男女性高好 | 国产精品久久久久久中文字 | 特黄特黄一级片 | 日韩免费在线 | 我要看日本黄色小视频 | 久久久久久中文字幕 | 久久在线视频 | 亚洲国产精品99久久久久久久久 | 午夜精品久久久久久 | 国产精品久久精品 | 久久精品亚洲精品 | 国产四区 | 亚洲一区二区视频在线观看 | 久久99深爱久久99精品 | 久久综合欧美 | а天堂中文最新一区二区三区 | 亚洲精品电影在线观看 | 亚洲精品久久久一区二区三区 | 黄色在线免费 | 伊人中文字幕 | 欧美日本在线观看 | 成人免毛片 | 亚洲九九 | 日韩视频在线观看一区 | 日本成人黄色网址 | 欧美久久久久 | 视频一区中文字幕 | 一区二区三区中文字幕 | 精品电影 | 二区影院| 国产91精品一区二区绿帽 | 日韩免费一区二区 | 国产成人综合一区二区三区 | 成人av一区二区三区 |