芯片市場的角逐,自研產品推出,后續如何?
微軟在最近的年度開發者大會Microsoft Ignite上推出了兩款自研芯片——Maia 100和Azure Cobalt 100,目標是為大語言模型的訓練和推理提供動力。這一舉動標志著微軟正式加入了谷歌、亞馬遜等科技巨頭的行列,擁有了自己的定制芯片。 Maia 100是微軟首款人工智能芯片,專為大語言模型訓練而設計,是一款應用型專用集成電路(ASIC)芯片。這款芯片將與微軟的Azure軟件棧無縫集成,并預計在明年初在Azure數據中心推出。微軟表示,Maia 100的目標是減少公司對英偉達GPU的依賴。 另一款芯片Azure Cobalt 100是一款基于Arm架構的128核云原生芯片,旨在滿足通用計算任務的需求。這款芯片可以與Azure的生態系統兼容,并在微軟Cloud上運行通用計算工作負載,有助于降低成本。此外,Azure Cobalt 100還能與英特爾處理器和亞馬遜云的Graviton系列芯片展開競爭。 微......閱讀全文
新型AI芯片將大語言模型能耗減半
美國俄勒岡州立大學科研團隊研發出一種新型AI芯片,成功將大語言模型的能耗降低50%。這項成果于近期在波士頓舉行的IEEE定制集成電路會議上發布,是半導體領域的重大突破,有望成為解決大語言模型高能耗問題的“綠色鑰匙”。 當前,以谷歌“雙子座”和OpenAI的GPT-4為代表的大語言模型,因海量參
壓縮算法為大語言模型“瘦身”
據美國科學促進會旗下網站19日報道,美國普林斯頓大學和斯坦福大學團隊開發出一種新壓縮算法CALDERA,能精簡大型語言模型(LLM)的海量數據,為LLM“瘦身”。這項算法不僅有助保護數據隱私、節約能源、降低成本,還能推動LLM在手機和筆記本電腦上高效使用。團隊舉例稱,當人們使用ChatGPT時,請求
日本將開發更強日語能力的“大語言模型”人工智能技術
據共同社消息,日本東北大學和日本東京工業大學等團隊計劃開發一種更強日語能力的“大語言模型”,作為生成式人工智能(AI)的基礎技術。該團隊將利用理化學研究所的超級計算機“富岳”學習大量數據,并將在本年度內逐步公開。這一技術的開發將使國內企業和研究人員能夠為自己的公司的服務或研究而自行改良。生成式AI可
人工智能新模型可解碼DNA隱藏“語言”
DNA包含了維持生命所需的基礎信息。理解這些信息是如何存儲和組織的,一直是20世紀最大的科學挑戰之一。現在,借助GROVER這一基于人類DNA訓練的新型大型語言模型,研究人員有望解碼基因組中隱藏的復雜信息。GROVER由德國德累斯頓工業大學生物技術中心開發,它將人類DNA視為文本,通過學習其規則和上
人工智能新模型可解碼DNA隱藏“語言”
DNA包含了維持生命所需的基礎信息。理解這些信息是如何存儲和組織的,一直是20世紀最大的科學挑戰之一。現在,借助GROVER這一基于人類DNA訓練的新型大型語言模型,研究人員有望解碼基因組中隱藏的復雜信息。GROVER由德國德累斯頓工業大學生物技術中心開發,它將人類DNA視為文本,通過學習其規則和上
人工智能新模型可解碼DNA隱藏“語言”
DNA包含了維持生命所需的基礎信息。理解這些信息是如何存儲和組織的,一直是20世紀最大的科學挑戰之一。現在,借助GROVER這一基于人類DNA訓練的新型大型語言模型,研究人員有望解碼基因組中隱藏的復雜信息。GROVER由德國德累斯頓工業大學生物技術中心開發,它將人類DNA視為文本,通過學習其規則和上
人工智能新模型可解碼DNA隱藏“語言”
科技日報北京8月6日電?(記者張佳欣)DNA包含了維持生命所需的基礎信息。理解這些信息是如何存儲和組織的,一直是20世紀最大的科學挑戰之一。現在,借助GROVER這一基于人類DNA訓練的新型大型語言模型,研究人員有望解碼基因組中隱藏的復雜信息。GROVER由德國德累斯頓工業大學生物技術中心開發,它將
人工智能新模型可解碼DNA隱藏“語言”
DNA包含了維持生命所需的基礎信息。理解這些信息是如何存儲和組織的,一直是20世紀最大的科學挑戰之一。現在,借助GROVER這一基于人類DNA訓練的新型大型語言模型,研究人員有望解碼基因組中隱藏的復雜信息。GROVER由德國德累斯頓工業大學生物技術中心開發,它將人類DNA視為文本,通過學習其規則
8個小技巧“用好”大語言模型
用大語言模型,還需要技巧?在人們的印象中,這是個極其簡單的操作:只需輸入一個問題,立刻就能得到回答。但實際上,如何有效地與這些人工智能模型互動,發揮出它們的最大潛力,卻是一個經常被忽視的話題。中國科學技術大學心理學系特任研究員林志成關注到這一話題,并在他最近的評論文章中提供了一系列的策略和指導,希望
新引擎實現大語言模型推理速度顯著提升
原文地址:http://news.sciencenet.cn/htmlnews/2023/11/511841.shtm
大語言模型在線辯論說服力超人類
實驗設計示意圖。圖片來源:英國《自然·人類行為》在線版《自然·人類行為》19日發表的一項人工智能(AI)研究發現,在線辯論中,GPT-4一類的大語言模型(LLM)如能根據對手的個性化信息調整它們的論據,其說服力比人類辯手高出64%。研究結果顯示了GPT-4生成有針對性和說服力論據的能力,揭示出AI工
“AI+教育”,復旦推出大語言模型助力新生報到
8月25日,是復旦大學本科生新生報到的日子。來自全國各地和全球40多個國家的4300余名2024級本科新生,開啟了在復旦的求學生涯。新生報道現場。為幫助來自世界各地的新同學盡快融入復旦大學,學校基于大語言模型,推出“復旦迎新助手”智能Agent。作為新生的貼心小幫手,大語言模型為新同學在迎新階段提供
日本發布大規模語言模型
科技日報訊?(記者李楊)東京工業大學、日本理化學研究所及富士通公司等近日宣布,利用超級計算機“富岳”,他們開發的大規模語言模型“Fugaku-LLM”正式發布。“Fugaku-LLM”是首個完全由日本國產技術構建的AI語言模型,其在處理日語及相關文化內容上表現卓越。模型特別擅長基于日語敬語進行自然對
日本發布大規模語言模型
東京工業大學、日本理化學研究所及富士通公司等近日宣布,利用超級計算機“富岳”,他們開發的大規模語言模型“Fugaku-LLM”正式發布。 “Fugaku-LLM”是首個完全由日本國產技術構建的AI語言模型,其在處理日語及相關文化內容上表現卓越。模型特別擅長基于日語敬語進行自然對話,并展現出在人
AI語言模型“提速”藥物發現
原文地址:http://news.sciencenet.cn/htmlnews/2023/6/502762.shtm美國麻省理工學院和塔夫茨大學研究人員設計出一種基于大型語言模型(如ChatGPT)的人工智能算法,這種稱為ConPLex的新模型可將目標蛋白與潛在的藥物分子相匹配,而無需執行計算分子結
科研團隊成功利用人工智能蛋白語言模型揭示生命演化奧秘
??為什么不同生物在適應相似環境時,會獨立演化出相似的功能?一項最新研究從蛋白質的“高階特征”層面揭示了這一生命演化奧秘的重要機制。??這項研究由中國科學院動物研究所鄒征廷研究員團隊完成,成功利用人工智能領域的蛋白語言模型,揭示了蛋白高階特征在功能適應性趨同演化中的關鍵作用,為理解生命演化之謎提供了
東北大學研究團隊發布TechGPT2.0大語言模型
近日,計算機科學與工程學院任飛亮副教授主持的“東北大學知識圖譜研究組”發布了大語言模型TechGPT2.0。 TechGPT-2.0在繼承了TechGPT-1.0全部特性的同時,通過增加多領域、多任務的數據,展現出了嵌套實體的抽取、幻覺回答、回答不可回答問題和回答長文本問題的能力。這些改進使得
科研人員利用大語言模型解釋調節睡眠的分子機制
華中科技大學生命學院張珞穎團隊和薛宇團隊在Nature Communications雜志上合作發表了題為“Large-language models facilitate discovery of the molecular signatures regulating sleep and activ
科研人員利用大語言模型解釋調節睡眠的分子機制
華中科技大學生命學院張珞穎團隊和薛宇團隊在Nature Communications雜志上合作發表了題為“Large-language models facilitate discovery of the molecular signatures regulating sleep and activ
東北大學研究團隊發布TechGPT2.0大語言模型
近日,計算機科學與工程學院任飛亮副教授主持的“東北大學知識圖譜研究組”發布了大語言模型TechGPT2.0。TechGPT-2.0在繼承了TechGPT-1.0全部特性的同時,通過增加多領域、多任務的數據,展現出了嵌套實體的抽取、幻覺回答、回答不可回答問題和回答長文本問題的能力。這些改進使得模型更適
中醫藥人工智能大模型正式啟動
6月15日,在橫琴粵澳深度合作區舉行的中醫藥廣東省實驗室(以下簡稱橫琴實驗室)第一屆學術委員會第一次會議暨首屆橫琴中醫藥科技創新大會上,中醫藥橫琴大模型、中藥新藥智能自動化融合創新平臺同時啟動。這也是該實驗室揭牌半年來取得的新進展。2023年12月,橫琴實驗室正式揭牌成立,成為廣東省實驗室體系中的一
首個種業大語言模型“豐登”發布
4月28日,中國農業大學生物學院教授王喜慶團隊聯合上海人工智能實驗室、崖州灣國家實驗室發布首個種業大語言模型“豐登”(SeedLLM)。種業大語言模型“豐登”。中國農業大學供圖“豐登”集成了先進的人工智能技術(書生·浦語2.0)與大數據分析,通過深入學習我國迄今發布的科研文獻、科技書籍、種企報告和歷
清華團隊與合作者推出大語言模型RealSafeR1
2月23日,清華大學與瑞萊智慧聯合團隊推出大語言模型RealSafe-R1。研發團隊代表介紹說,實驗數據表明RealSafe-R1安全性提升顯著,“安全增強版DeepSeek”可為更多應用提供可靠堅實基座。連日來,國產開源大模型DeepSeek的優異表現備受關注,其在自然語言處理和多任務推理方面的能
360智腦通過中國信通院可信AIGC大語言模型功能評估
原文地址:http://news.sciencenet.cn/htmlnews/2023/6/502739.shtm6月12日,360智腦的360GPT-S2-V8型號產品獲得了中國信息通信研究院(以下簡稱“中國信通院”)“可信AIGC大語言模型基礎能力”評估報告(以下簡稱“報告”),報告顯示必選項
微調大語言模型,科學家開發化學文本挖掘新方法
6月7日,中國科學院上海藥物研究所研究員鄭明月課題組在五項化學文本挖掘任務上對多個大語言模型的能力進行了全面綜合的探究,展現了微調大語言模型成為一種通用高效的生成式文本挖掘方法,為大模型的落地應用提供參考。相關研究發表于《化學科學》。?近兩年,以ChatGPT為代表的大語言模型(LLM)引領了人工智
ChatGPT進入課堂:語言模型如何改變教育
最近,教育心理學家羅納德·貝格托(Ronald Beghetto)以一種引人注目的方式引領一群研究生和教育專業人員,與一系列以創造力為中心的聊天機器人進行了交流。這些聊天機器人由貝格托設計,即將托管在亞利桑那州立大學(ASU)設立的平臺上。這些機器人使用與ChatGPT相同的人工智能(AI)技術,目
神經機器模型能翻譯200種語言
科技日報北京6月5日電?(記者張夢然)《自然》5日發表的一篇論文報道了一個Meta人工智能(AI)模型的底層技術。該模型能翻譯200種不同語言,增加了機器翻譯的語言數量。神經機器翻譯模型利用人工神經網絡翻譯各種語言。這些模型通常需要大量可在線獲取的數據加以訓練,但并非所有語言數據都是公開、低成本或是
神經機器模型能翻譯200種語言
自然》5日發表的一篇論文報道了一個Meta人工智能(AI)模型的底層技術。該模型能翻譯200種不同語言,增加了機器翻譯的語言數量。神經機器翻譯模型利用人工神經網絡翻譯各種語言。這些模型通常需要大量可在線獲取的數據加以訓練,但并非所有語言數據都是公開、低成本或是普遍可及的,這類語言被稱為低資源語言。一
全面走向“人工智能+”-國內首個汽車大模型標準發布
中國信息通信研究院(簡稱“中國信通院”)今天(28日)發布了國內首個汽車大模型標準。 標準主要涵蓋三個能力域,其中場景豐富度側重評估汽車大模型對智能座艙和自動駕駛等細分場景的支持情況,能力支持度重點關注汽車大模型在感知、理解、推理、生成等人工智能技術能力上的表現,應用成熟度主要評估汽車大模型在
芯片測“功”-唯快不破-阿波羅人工智能模型來了
隨著集成電路技術的不斷發展,芯片規模越來越大、集成度越來越高。與此同時,在設計和使用芯片時,掌握并管理其功耗就變得越來越重要。 為在設計或使用過程中管理好芯片功耗,杜克大學電子與計算機工程系教授、杜克大學計算進化智能實驗室聯合主任陳怡然團隊開發出一種新的人工智能模型——阿波羅(APOLLO)