采用Sora同款架構,混元文生圖大模型宣布開源
5月14日,騰訊宣布其旗下混元文生圖大模型全面升級,并對外開源。據了解,這是首個中文原生的類Sora 架構開源模型,填補了國產大模型在文生圖先進架構上的空白。目前,主流的文生圖開源生態基本圍繞英文建設,如Stable Diffusion 等主流開源模型,雖然一定程度支持中文輸入,但其核心數據集仍以英文為主,對中國的語言、美食、文化、習俗都理解不夠,容易因翻譯而產生語義分歧乃至生成錯誤。建設中文原生的大模型以及相應的開源生態迫在眉睫。據騰訊文生圖負責人蘆清林介紹,混元文生圖大模型以中文原生為基礎,支持中英文雙語輸入及理解,更理解中文語境,對中國的古詩詞、俚語、美食、文化、習俗等都有更好的生成效果。升級后的混元文生圖模型采用了基于Transformer的擴散模型架構(簡稱DiT架構,是此前爆紅的文生視頻產品Sora 背后的關鍵技術),具備更強的可擴展性,參數量越多、性能越強,可持續提升視覺模型生成效果及效率。目前,騰訊混元文生圖模型......閱讀全文
騰訊大模型上線文生視頻并宣布開源
據騰訊官微消息,騰訊今日宣布,混元大模型上線并開源文生視頻能力。據介紹,該模型參數量為130億,已經在Hugging Face平臺及Github上發布,包含模型權重、推理代碼、模型算法等完整模型,可供企業與個人開發者免費使用和開發生態插件。這也是當前最大的視頻開源模型。
采用Sora同款架構,混元文生圖大模型宣布開源
5月14日,騰訊宣布其旗下混元文生圖大模型全面升級,并對外開源。據了解,這是首個中文原生的類Sora 架構開源模型,填補了國產大模型在文生圖先進架構上的空白。目前,主流的文生圖開源生態基本圍繞英文建設,如Stable Diffusion 等主流開源模型,雖然一定程度支持中文輸入,但其核心數據集仍以英
手機就能跑!騰訊推出4款可端側部署的開源模型
8月4日,騰訊混元宣布開源4款小尺寸模型,參數規模分別為0.5B、1.8B、4B、7B,消費級顯卡即可運行,適用于筆記本電腦、手機、智能座艙、智能家居等低功耗端側場景,且支持垂直領域低成本微調。據介紹,新開源的4個模型屬于融合推理模型,具備推理速度快、性價比高的特點,用戶可根據使用場景靈活選擇模型思
MOSS!今日正式開源上線
復旦大學自然語言處理實驗室開發的新版 MOSS 模型今日正式上線,成為國內首個插件增強的開源對話語言模型。目前,MOSS 模型已上線開源,相關代碼、數據、模型參數已在 Github 和 Hugging Face 等平臺開放,供科研人員下載。據介紹,MOSS 是一個支持中英雙語和多種插件的開源對話語言
LongCatVideo正式發布并開源
近日,美團LongCat團隊發布并開源LongCat-Video視頻生成模型,以統一模型在文生、圖生視頻基礎任務上達到開源SOTA,并依托原生視頻續寫任務預訓練,實現分鐘級長視頻連貫生成,保障跨幀時序一致性與物理運動合理性。據研發團隊介紹,作為基于Diffusion Transformer(DiT)
對標Sora,快手發布文生視頻大模型“可靈”
近日,國內頭部短視頻平臺“快手”發布了首個“Sora級”的文生視頻大模型“可靈”,并宣布面向用戶開放。據快手方面介紹,可靈大模型為快手AI團隊自研,采用與Sora相似的技術路線,并結合多項自研技術,能夠生成大幅度的合理運動、能夠模擬物理世界特性、具備強大的概念組合能力和想象力,效果對標Sora。其生
《自然》發文盛贊中國開源AI模型DeepSeek
最近,由來自杭州的“深度求索”初創團隊開發的DeepSeek系列AI模型,引發了全球范圍的關注。1月24日,知名學術期刊《自然》也發文關注該模型及相應產品,稱“中國開發的大語言模型DeepSeek-R1以親民價格和開放性挑戰了OpenAI的推理模型GPT-o1的地位,令科學家們感到興奮”。《中國科學
北京人工智能數據運營平臺發布
日前,北京人工智能數據運營平臺在2024北京智源大會上發布,“行業數據集—場景應用創新計劃”同步啟動。北京智源人工智能研究院理事長、北京大學教授黃鐵軍表示,構建大模型生態首先要建立數據流通機制,推動從數據到智能的正反饋。 匯聚數據超700萬億字節 “如果沒有開源數據集,很難想象人工智能怎樣才
騰訊元寶!混元大模型推出APP版
5月30日,騰訊宣布旗下混元大模型全面升級,基于混元大模型的App“騰訊元寶”正式上線,蘋果及安卓應用商店均可下載。相比此前測試階段的混元小程序版本,面向工作效率場景,騰訊元寶提供了AI搜索、AI總結、AI寫作等核心能力;面向日常生活場景,元寶的玩法也更加豐富,提供了多個特色AI應用,并新增了創建個
Meta發布最新開源大模型Llama-4
??據路透社報道,當地時間4月6日,美國科技公司Meta推出了開源人工智能模型Llama 4。據介紹,該模型目前有Scout和Maverick兩個版本,是Meta迄今為止最先進的模型,也是同類產品中多模態性最強的模型。??報道稱,Llama 4系列采用了先進的混合專家架構,這一架構在模型訓練及用戶查
全面叫板OpenAI!谷歌發布多模態大模型全家桶:從AI助手到文生視頻模型
被OpenAI搶先一天后,科技巨頭谷歌不甘示弱,推出了自己的最新多模態AI(人工智能)產品。當地時間5月14日,在谷歌I/O開發者大會上的主題演講中,谷歌展示了由升級后Gemini模型驅動的AI助手項目Project Astra、對標Sora的文生視頻模型Veo,以及在硬件方面發布的第六代Tenso
學者開源物理傳熱啟發的視覺表征模型vHeat
近日,鵬城實驗室網絡智能研究部視覺智能研究所與中國科學院大學電子電氣與通信工程學院共同合作,分別在GitHub和OpenI啟智社區開源了物理傳熱啟發的高效視覺表征模型vHeat。 研究團隊認為,CNN和ViT的卷積算子與自注意力算子都是特征內部的像素傳播過程,分別是一種信息傳遞的形式,從而聯想
學者開源物理傳熱啟發的視覺表征模型vHeat
近日,鵬城實驗室網絡智能研究部視覺智能研究所與中國科學院大學電子電氣與通信工程學院共同合作,分別在GitHub和OpenI啟智社區開源了物理傳熱啟發的高效視覺表征模型vHeat。 研究團隊認為,CNN和ViT的卷積算子與自注意力算子都是特征內部的像素傳播過程,分別是一種信息傳遞的形式,從而聯想
中國首個海洋領域開源大模型OceanGPT正式發布
近日,中國首個海洋領域開源大模型OceanGPT(滄淵)在杭州正式發布。該大模型由海洋精準感知技術全國重點實驗室(浙江大學)牽頭研發,具備基礎的海洋專業知識問答,以及聲吶圖像、海洋觀測圖等海洋特色多模態數據的自然語言解讀能力。其采用的領域知識增強“慢思考”推理機制,相較現有通用大模型能有效降低幻覺式
學者開源物理傳熱啟發的視覺表征模型vHeat
近日,鵬城實驗室網絡智能研究部視覺智能研究所與中國科學院大學電子電氣與通信工程學院共同合作,分別在GitHub和OpenI啟智社區開源了物理傳熱啟發的高效視覺表征模型vHeat。vHeat與ViT核心算子計算復雜度對比。研究團隊供圖研究團隊認為,CNN和ViT的卷積算子與自注意力算子都是特征內部的像
騰訊安全發布“數字安全免疫力”模型框架
原文地址:http://news.sciencenet.cn/htmlnews/2023/6/502954.shtm
通義千問14B模型開源,“免費可商用”
原文地址:http://news.sciencenet.cn/htmlnews/2023/9/509255.shtm9月25日,阿里云開源通義千問140億參數模型“Qwen-14B”及其對話模型“Qwen-14B-Chat”,免費可商用。阿里云CTO周靖人介紹說,Qwen-14B是一款支持多種語言的
誰會成為中國版-Sora?
鏖戰一年的“百模大戰”還未結束,兩個海外AI巨頭又給國內科技大廠出了難題。 就在春節假期的尾聲,谷歌和OpenAI毫無征兆地放出了各自的 AI新“核武”。 谷歌拿出的新一代多模態大模型Gemini 1.5 Pro,將性能提升到了百萬級別,完全秒殺了OpenAI的GPT-4 Turbo,暫居地
騰訊:以“產業實用”作為發展大模型的核心戰略
5月17日,“騰訊云生成式AI產業應用峰會”在北京舉辦。會上,騰訊集團高級執行副總裁、云與智慧產業事業群CEO湯道生介紹了騰訊混元大模型、行業大模型的最新能力升級,并推出“知識引擎”等多個智能工具和場景應用。湯道生。騰訊云 供圖會上,基于混元大模型的一站式AI智能體創作與分發平臺——騰訊元器首次亮相
鵬城實驗室發布“鵬城·腦海”通用AI大模型
原文地址:http://news.sciencenet.cn/htmlnews/2023/9/509318.shtm近日,中國工程院院士、鵬城實驗室主任高文在2023華為全聯接大會上正式發布了“鵬城·腦海”(PengCheng Mind)通用AI大模型,以國產化基座大模型為新一代AI大模型發展構筑新
2022語言與智能技術競賽這天舉辦
3月30日,聚焦自然語言處理(NLP)領域的2022語言與智能技術競賽(以下簡稱 NLP競賽)正式啟動報名。為便利參賽者,競賽將聯手“千言”數據集開源項目,發布中文領域首個搜索知識對話數據集、首個面向實際應用場景的中文大規模段落檢索數據集等多個重磅數據集。本次競賽覆蓋跨模態、知識驅動、可信學習等人工
大模型應該如何卷應用?開源閉源誰更有未來?
AI企業曾經受困于投入和回報難成比例的問題,在今年的人工智能大會上,大模型的“變現”之路也成為外界關注焦點。“(商業化)就像小時候玩打磚塊的游戲,把磚塊精準地打到一個縫隙里去,首先要知道縫隙在哪兒,路徑在哪兒。”7月5日,2024世界人工智能大會暨人工智能全球治理高級別會議(簡稱“WAIC2024”
大氣化學新機制與自主模型開源研發
在國家大氣污染治理實踐中,明確何時啟動紅色、橙色或黃色預警是一項重要需求。數值模式作為綜合表征排放源、物理傳輸及化學轉化過程的核心工具,能夠提供精準的重污染預報。 然而,以往的模式預報大氣復合污染組分偏差大,難以滿足精準治污需求。在科學家看來,這主要是由于預報模式沒有充分考慮我國大氣復合污染形
揭秘“騰訊混元”誕生背后的“生產車間”
在國內的頭部人工智能大模型研發隊伍中,騰訊混元大模型率先采用“混合專家(MoE)”結構,模型參數規模突破萬億,處于中國大模型第一梯隊。許多人可能不知道,在鍛造“混元”的過程中,騰訊選擇的是從零開始的自研路線。大模型的鍛造,是一個在約束條件下高效地把工程、算法、數據以及業務應用整個串聯起來的工作,其對
海洋傳輸帶水流模型圖公布
英國《自然》雜志網站報道,近日出版的《自然地理科學》雜志公布了科學家公認的海洋傳輸帶水流模型圖,為構建更加精確的氣候變化模型提供了依據。研究指出,在過去的50年里,經向翻轉環流(MOC)變得更加復雜,海洋環流在赤道附近增長得越來越慢,而在北方卻變得更加強烈。 論文主要作者、
首個萬字創作大模型“中文逍遙”在京發布
原文地址:http://news.sciencenet.cn/htmlnews/2023/10/510212.shtm
中關村開源生態論壇暨大模型智能應用技術大會舉辦
原文地址:http://news.sciencenet.cn/htmlnews/2024/1/516894.shtm1月27日,中關村論壇永久會址建成后的首場活動—2024中關村論壇系列活動之中關村開源生態論壇暨大模型智能應用技術大會正式舉辦。大會聚集大模型生態上下游領軍企業和技術專家,邀請海內外開
為大模型而生!騰訊云自研星脈高性能計算網絡
原文地址:http://news.sciencenet.cn/htmlnews/2023/6/503635.shtm
騰訊湯道生:行業需要可控可追溯可修正的大模型
原文地址:http://news.sciencenet.cn/htmlnews/2023/6/503207.shtm
騰訊湯道生:行業需要可控可追溯可修正的大模型
“雖然大家對通用大模型期待很高,但它不一定是滿足行業場景需求的最優解。”6月19日,騰訊云在國家科技傳播中心召開行業大模型及智能應用技術峰會。會上,騰訊集團高級執行副總裁、云與智慧產業事業群CEO湯道生作上述說。 他認為,用戶尤其企業用戶更需要有行業針對性的行業大模型:“企業所需要的是在實際場