一周縱覽
本周大模型頻頻出新。馬斯克官宣Grok-1.5大模型,推理能力大升級(jí)。人工智能公司Databricks宣布開(kāi)源通用混合專(zhuān)家(MoE)大語(yǔ)言模型DBRX,最強(qiáng)開(kāi)源大模型就此易主。以色列AI初創(chuàng)公司AI21 Labs推出SSM-Transformer模型Jamba,據(jù)稱(chēng)是世界上首個(gè)基于Mamba的量產(chǎn)級(jí)模型。
更多消息依然來(lái)自O(shè)penAI。OpenAI本周新發(fā)布了語(yǔ)音生成模型Voice Engine,以及藝術(shù)家的Sora最新作品實(shí)例。圍繞GPT商店困境,本周OpenAI宣布,將挑選少量美國(guó)開(kāi)發(fā)者測(cè)試GPT商店收入分成模式。周末又有消息稱(chēng),微軟OpenAI將斥資千億美元打造“Stargate”先進(jìn)人工智能超級(jí)計(jì)算機(jī)。
其他科技巨頭動(dòng)作不斷。亞馬遜宣布將向Anthropic追加投資 27.5 億美元,以完成去年承諾的投資協(xié)議。而包括高通、谷歌和英特爾在內(nèi)的科技公司聯(lián)盟,則準(zhǔn)備從軟件入手,與英偉達(dá)芯片“脫鉤”。
Key Points
- OpenAI發(fā)布語(yǔ)音模型Voice Engine
- 馬斯克官宣Grok-1.5
- DBRX成當(dāng)前最強(qiáng)大開(kāi)源模型
- AI21 Labs首推基于Mamba架構(gòu)的量產(chǎn)級(jí)模型
- 微軟和OpenAI制定千億美金AI超算計(jì)劃
- OpenAI與開(kāi)發(fā)者聯(lián)合測(cè)試GPT創(chuàng)收
- OpenAI發(fā)布Sora首批藝術(shù)家作品實(shí)例
- 高通、谷歌、英特爾等聯(lián)合開(kāi)發(fā)AI軟件
- Transformer作者公開(kāi)承認(rèn)參與保密項(xiàng)目Q*
- 百度或?yàn)閲?guó)行iPhone16提供AI功能
- 字節(jié)跳動(dòng)推出AI角色互動(dòng)App“話(huà)爐”
- 亞馬遜追投Anthropic 27.5億美元
- AI視頻生成創(chuàng)企HeyGen正進(jìn)行6000萬(wàn)美元融資
- 90后天才少年稚暉君再獲融資
- Heygen發(fā)布Avatar in Motion 1.0
- 騰訊開(kāi)源“照片說(shuō)話(huà)”視頻生成框架
- 谷歌推出AI圖像插入新“神器”
大模型第一線(xiàn)
OpenAI發(fā)布語(yǔ)音模型Voice Engine
據(jù)界面新聞,3月30日,OpenAI在官網(wǎng)上公開(kāi)了其最新的研究成果——“Voice Engine”。這項(xiàng)技術(shù)可通過(guò)簡(jiǎn)短的15秒音頻樣本和文本輸入,生成與原始說(shuō)話(huà)者極為相似的自然語(yǔ)音。
公告中,OpenAI給出了Voice Engine的一些早期應(yīng)用場(chǎng)景。如通過(guò)自然、富有情感的聲音輔助兒童閱讀、翻譯視頻和播客等內(nèi)容、改善偏遠(yuǎn)地區(qū)的社區(qū)服務(wù)、幫助患有突發(fā)性或退化性言語(yǔ)病癥的患者恢復(fù)聲音等。
馬斯克官宣Grok-1.5
當(dāng)?shù)貢r(shí)間 3 月 28 日,馬斯克旗下的人工智能公司 xAI 正式推出了 Gork 大模型的最新版本 Grok-1.5。相比一周前開(kāi)源的Grok-1.0,Grok-1.5上下文長(zhǎng)度飆升,從8192增長(zhǎng)到128k,和GPT-4齊平。二是推理性能大幅提升,數(shù)學(xué)能力直接漲點(diǎn)50%之多、HumanEval數(shù)據(jù)集上得分超過(guò)GPT-4。Grok-1.5預(yù)計(jì)將在未來(lái)幾天向早期測(cè)試者和 X 平臺(tái)的現(xiàn)有用戶(hù)開(kāi)放。

圖源:X
DBRX成當(dāng)前最強(qiáng)大開(kāi)源模型
當(dāng)?shù)貢r(shí)間3月27日,AI初創(chuàng)公司Databricks宣布旗下Mosaic Research團(tuán)隊(duì)開(kāi)發(fā)的通用大語(yǔ)言模型DBRX將開(kāi)源。DBRX的表現(xiàn)都優(yōu)于現(xiàn)有的一切開(kāi)源模型。根據(jù)DBRX在MMLU、HumanEval和 GSM8K公布的測(cè)試數(shù)據(jù)顯示,DBRX不僅性能超過(guò)了LLaMA2-70B和馬斯克最近開(kāi)源的Grok-1,推理效率比LLaMA2-70B快2倍,總參數(shù)卻只有Grok-1的三分之一,是一款功能強(qiáng)算力消耗低的大模型。
AI21 Labs首推基于Mamba架構(gòu)的量產(chǎn)級(jí)模型
智東西3月29日消息,以色列AI初創(chuàng)公司AI21 Labs昨日在官網(wǎng)推出SSM-Transformer模型Jamba,據(jù)稱(chēng)是世界上第一個(gè)基于Mamba的量產(chǎn)級(jí)模型。通過(guò)利用傳統(tǒng)Transformer架構(gòu)的元素增強(qiáng)Mamba結(jié)構(gòu)化狀態(tài)空間模型,Jamba彌補(bǔ)了純SSM模型的固有局限性。它提供了256k上下文窗口,在吞吐量和效率方面展現(xiàn)了顯著的進(jìn)步。
大事件
微軟和OpenAI制定千億美金AI超算計(jì)劃
3月30日消息,據(jù)The Information獨(dú)家報(bào)道,消息人士稱(chēng),微軟和OpenAI的高管們?cè)跒橐粋€(gè)可能花費(fèi)高達(dá)1000億美元的數(shù)據(jù)中心項(xiàng)目制定計(jì)劃。該項(xiàng)目將包含1臺(tái)擁有數(shù)百萬(wàn)個(gè)專(zhuān)用服務(wù)器芯片的AI超級(jí)計(jì)算機(jī)Stargate,為OpenAI的AI提供動(dòng)力。項(xiàng)目成本是當(dāng)今一些最大的數(shù)據(jù)中心的100倍,微軟可能會(huì)負(fù)責(zé)為該項(xiàng)目提供資金。高管們已經(jīng)討論了最快在2028年啟動(dòng)Stargate,并將其擴(kuò)建至2030年。
OpenAI與開(kāi)發(fā)者聯(lián)合測(cè)試GPT創(chuàng)收
3月28日消息,根據(jù)X平臺(tái),OpenAI宣布其正與一小部分美國(guó)開(kāi)發(fā)者合作,測(cè)試基于使用量的GPT收費(fèi)。OpenAI表示:“我們的目標(biāo)是創(chuàng)建一個(gè)充滿(mǎn)活力的生態(tài)系統(tǒng),讓開(kāi)發(fā)者因其創(chuàng)造力和影響力而獲得獎(jiǎng)勵(lì),我們期待與建設(shè)者合作,找到實(shí)現(xiàn)這一目標(biāo)的最佳方法。”

圖源:X
OpenAI發(fā)布Sora首批藝術(shù)家作品實(shí)例
3月26日凌晨,OpenAI 發(fā)布七個(gè)最新 Sora 作品實(shí)例,意在展示藝術(shù)家、設(shè)計(jì)師、創(chuàng)意工作者和電影人等業(yè)內(nèi)人士對(duì)于 Sora 融入自身工作與業(yè)務(wù)的看法。
高通、谷歌、英特爾等聯(lián)合開(kāi)發(fā)AI軟件
3月26日,由高通、谷歌、英特爾等科技巨頭聯(lián)合參與的UXL基金會(huì)宣布,將啟動(dòng)一項(xiàng)開(kāi)源軟件開(kāi)發(fā)計(jì)劃,旨在為多種AI加速器芯片提供跨平臺(tái)支持。該項(xiàng)目旨在實(shí)現(xiàn)計(jì)算機(jī)代碼在不同芯片和硬件平臺(tái)上的無(wú)縫運(yùn)行。高通AI與機(jī)器學(xué)習(xí)主管Vinesh Sukumar表示,此舉將幫助開(kāi)發(fā)者從英偉達(dá)平臺(tái)順利遷移。
Transformer作者公開(kāi)承認(rèn)參與保密項(xiàng)目Q*
據(jù)Wired雜志,Transformer作者現(xiàn)身英偉達(dá)GTC大會(huì)后,接受Wired雜志采訪(fǎng),揭示了許多鮮為人知的研發(fā)細(xì)節(jié)。其中一位作者Lukasz Kaiser公開(kāi)承認(rèn)自己參與了OpenAI的一項(xiàng)高度保密項(xiàng)目——Q,引發(fā)了廣泛關(guān)注。當(dāng)記者試圖進(jìn)一步探究Q項(xiàng)目時(shí),OpenAI的公關(guān)人員迅速介入,阻止了Kaiser的發(fā)言。
百度或?yàn)閲?guó)行iPhone16提供AI功能
3月25日,一位百度內(nèi)部人士向時(shí)代周報(bào)記者透露,百度將為蘋(píng)果今年即將發(fā)布的iPhone16、Mac系統(tǒng)和ios18提供AI功能。但《中國(guó)日?qǐng)?bào)》后援引接近蘋(píng)果公司的知情人士稱(chēng),到目前為止,蘋(píng)果尚未與百度就AI合作達(dá)成協(xié)議。
字節(jié)跳動(dòng)推出AI角色互動(dòng)App“話(huà)爐”
據(jù)新浪科技,3月25日下午消息,近日,字節(jié)跳動(dòng)推出AI角色互動(dòng)App“話(huà)爐”。據(jù)了解,“話(huà)爐”由字節(jié)跳動(dòng)的Flow部門(mén)打造。而Flow部門(mén)隸屬于字節(jié)跳動(dòng)的產(chǎn)品研發(fā)與工程部(內(nèi)部簡(jiǎn)稱(chēng)“PDI”),目前下設(shè)四大業(yè)務(wù)線(xiàn),包括AI教育、國(guó)際化、社區(qū)和豆包,“話(huà)爐”則屬于社區(qū)業(yè)務(wù)線(xiàn)旗下。
融資動(dòng)態(tài)
亞馬遜追投Anthropic 27.5億美元
當(dāng)?shù)貢r(shí)間 3 月 27 日,亞馬遜宣布將向 AI 公司 Anthropic 追加投資 27.5 億美元(約 198.8 億人民幣),以完成去年承諾的投資協(xié)議,并將擴(kuò)大兩家公司之間的合作關(guān)系。追加投資之后,亞馬遜對(duì) Anthropic 的總投資額將達(dá)到 40 億美元,這也是亞馬遜 30 年歷史上最大的一筆外部投資。通過(guò)投資,亞馬遜將獲取 Anthropic 的少數(shù)股份,但不會(huì)在 Anthropic 的董事會(huì)占有席位。
AI視頻生成創(chuàng)企HeyGen正進(jìn)行6000萬(wàn)美元融資
當(dāng)?shù)貢r(shí)間3月23日,據(jù)The Information援引知情人士消息,HeyGen目前正在進(jìn)行一輪 6000 萬(wàn)美元的融資,完成融資后總估值將達(dá)到 4.4 億美元,是四個(gè)月前估值的六倍,本輪融資由Benchmark領(lǐng)投,它是 Snap 和 Uber 的早期投資者之一。HeyGen 的上一輪融資則是去年 11 月的560萬(wàn)美元融資,由知名投資人Sarah Guo創(chuàng)立的Conviction Partners領(lǐng)投。
90后天才少年稚暉君再獲融資
據(jù)投資界,智元機(jī)器人關(guān)聯(lián)公司上海智元新創(chuàng)技術(shù)有限公司新增股東紅杉中國(guó)、M31資本、上汽投資。此前消息流出,智元機(jī)器人投前估值達(dá)70億。公司背后的90后創(chuàng)始人曾是華為“天才少年”稚暉君彭志輝,同時(shí)在B站坐擁250萬(wàn)粉絲。公開(kāi)資料顯示,上海智元新創(chuàng)技術(shù)有限公司法定代表人為舒遠(yuǎn)春,使命為“以智能機(jī)器創(chuàng)造無(wú)限生產(chǎn)力”,致力于以Al+機(jī)器人的融合創(chuàng)新,打造世界級(jí)領(lǐng)先的具身智能機(jī)器人產(chǎn)品及應(yīng)用生態(tài)。
新玩意
Heygen發(fā)布Avatar in Motion 1.0
Heygen近期發(fā)布了其Avatar in Motion1.0新功能,這一技術(shù)革新在虛擬角色動(dòng)作捕捉和聲音克隆方面取得了重大突破。該功能可以精確地保持口型同步,并克隆用戶(hù)的語(yǔ)音語(yǔ)調(diào),甚至能保留背景聲,使得虛擬角色的語(yǔ)音表達(dá)更為生動(dòng)真實(shí)。
