北京時(shí)間5月22日凌晨,在距離蘋(píng)果WWDC 2024舉行還有不到半個(gè)月之際,微軟一年一度的Build開(kāi)發(fā)者大會(huì)如期而至。
在發(fā)布會(huì)上,微軟正式推出Team Copilot,將Copilot for Microsoft 365從幕后的個(gè)人AI助手,擴(kuò)展為團(tuán)隊(duì)助手。此外,微軟也宣布自己成為首批提供英偉達(dá)最新Blackwell AI 芯片的云服務(wù)商之一,與英偉達(dá)建立了“深厚的合作伙伴關(guān)系”。
值得注意的是,微軟Build 2024開(kāi)發(fā)者大會(huì)并沒(méi)有如之前的預(yù)測(cè)一樣推出「All in AI」的Windows 12,也沒(méi)有針對(duì)性地推出消費(fèi)者期待的AI產(chǎn)品,而是將重點(diǎn)回歸到與開(kāi)發(fā)者建立聯(lián)系身上。
由此可見(jiàn),微軟此次最具想象力的升級(jí)圍繞著AI Agent(AI個(gè)人助手)展開(kāi)。“AI Agent本質(zhì)上是通過(guò)對(duì)話式的UI來(lái)展現(xiàn)出部分人的屬性,相當(dāng)于很重要的連接器。并且增加算力后,其智力可以無(wú)限擴(kuò)張。”瀾碼科技創(chuàng)始人兼CEO周健對(duì)21世紀(jì)經(jīng)濟(jì)報(bào)道記者表示,2023年是大語(yǔ)言模型的元年,2024年將是AI Agent的爆發(fā)年,AI Agent是大語(yǔ)言模型優(yōu)先落地的最佳形態(tài)。
AI虛擬員工
微軟再次掀起了一場(chǎng)由AI驅(qū)動(dòng)的“生產(chǎn)力革命”浪潮。
在發(fā)布會(huì)上,微軟方面宣布Microsoft Copilot Studio推出全新的Agent代理功能,讓開(kāi)發(fā)者能夠根據(jù)特定任務(wù)和功能,構(gòu)建主動(dòng)響應(yīng)數(shù)據(jù)和事件。基于新功能,開(kāi)發(fā)者可通過(guò)記憶和知識(shí)了解上下文、推理操作和輸入,并基于用戶(hù)反饋進(jìn)行學(xué)習(xí),從而獨(dú)立管理復(fù)雜、長(zhǎng)期運(yùn)行的業(yè)務(wù)流程。
“用戶(hù)可在Teams、Loop、Planner等協(xié)作工具中調(diào)用Copilot。Team Copilot能夠在會(huì)議中擔(dān)任主持人,管理會(huì)議議程、跟蹤會(huì)議時(shí)間并記錄會(huì)議要點(diǎn),也可以在聊天中作為協(xié)作者,提供重要信息、跟蹤行動(dòng)項(xiàng)目并解決未決問(wèn)題。它還可以擔(dān)任項(xiàng)目經(jīng)理,幫助確保每個(gè)項(xiàng)目順利推進(jìn),并及時(shí)通知團(tuán)隊(duì)進(jìn)行輸入。這些功能將在今年晚些時(shí)候推出預(yù)覽版。”微軟CEO薩蒂亞?納德拉(Satya Nadella)說(shuō)道。
此外,Copilot還能成為項(xiàng)目經(jīng)理,通過(guò)創(chuàng)建和分配任務(wù)、跟蹤截止日期等方式推動(dòng)團(tuán)隊(duì)協(xié)作。在另一項(xiàng)產(chǎn)品更新中,微軟也表示將在今年晚些時(shí)候推出一款“AI代理”工具——類(lèi)似于“AI虛擬員工”,可以執(zhí)行監(jiān)控電子郵件、幫助新員工入職、輸入數(shù)據(jù)等一系列瑣碎的自動(dòng)化任務(wù)。微軟小心翼翼地強(qiáng)調(diào),Copilot不會(huì)接管人們的工作,只會(huì)接手其中一些無(wú)聊的部分。
而在底層芯片方面,微軟宣布Azure AI Studio現(xiàn)已支持提供GPT-4o API 將率先使用英偉達(dá)Blackwell AI芯片。納德拉介紹,由OpeanAI開(kāi)發(fā)的最新旗艦?zāi)P虶PT-4o,現(xiàn)已在Azure AI Studio中提供,并作為API提供。該多模態(tài)模型集成了文本、圖像和音頻處理能力,帶來(lái)了全新的生成式和對(duì)話式AI體驗(yàn)。
此外,由微軟開(kāi)發(fā)的Phi-3列AI小型語(yǔ)言模型(SLM)中的一種新型多模態(tài)模型Phi-3-vision現(xiàn)已在Azure中推出。Phi-3模型功能強(qiáng)大、經(jīng)濟(jì)高效,并且針對(duì)個(gè)人設(shè)備進(jìn)行了優(yōu)化。Phi-3-vision提供了輸入圖像和文本并接收文本響應(yīng)的功能。例如,用戶(hù)可以詢(xún)問(wèn)有關(guān)圖表的問(wèn)題,或詢(xún)問(wèn)有關(guān)特定圖像的開(kāi)放式問(wèn)題。
開(kāi)發(fā)人員可以在Azure AI Playground中試驗(yàn)這些前沿模型,并且可以開(kāi)始使用Azure AI Studio中的模型進(jìn)行構(gòu)建和自定義。
AI Agent落地何時(shí)到來(lái)?
此前在OpenAI首屆開(kāi)發(fā)者大會(huì)(OpenAI DevDay)上,OpenAI發(fā)布了AI Agent初期形態(tài)產(chǎn)品GPTs,并推出了相應(yīng)的制作工具GPT Builder。用戶(hù)僅僅通過(guò)跟GPT Builder聊天,把想要的GPT功能描述一遍,就能生成專(zhuān)屬GPT。
比爾·蓋茨在一篇名為《人工智能將徹底改變你使用計(jì)算機(jī)的方式》的文章中,對(duì)AI Agent將對(duì)人類(lèi)帶來(lái)的改變進(jìn)行了詳細(xì)描述。
“你不必為不同的任務(wù)使用不同的應(yīng)用程序。你只需用簡(jiǎn)單通俗的語(yǔ)言告訴你的設(shè)備你想做什么。根據(jù)你選擇與軟件分享多少信息,基于對(duì)你的生活有豐富的了解,軟件將能夠作出個(gè)性化的回應(yīng)。在不久的將來(lái),任何上網(wǎng)的人都可以擁有一個(gè)由人工智能驅(qū)動(dòng)的個(gè)人助理,這遠(yuǎn)遠(yuǎn)超出了當(dāng)今的技術(shù)水平。”比爾·蓋茨說(shuō)道。
由此可見(jiàn),在大模型這一“巨人的肩膀之上”,AI Agent的應(yīng)用之花才得以綻放。
“大語(yǔ)言模型有特點(diǎn),它能夠與人交互,從而帶來(lái)范式的轉(zhuǎn)變。過(guò)去我們所有的系統(tǒng)都是機(jī)器,人需要適應(yīng)機(jī)器,才會(huì)造成人作為一個(gè)數(shù)據(jù)的搬運(yùn)工作去填充空間。但今天因?yàn)橛辛舜笳Z(yǔ)言模型,我們就有機(jī)會(huì)讓機(jī)器去適應(yīng)人,而機(jī)器適應(yīng)人就會(huì)使得大語(yǔ)言模型背后的這個(gè)領(lǐng)域模型能發(fā)揮更大的作用。”周建對(duì)記者分析稱(chēng),因?yàn)槿丝梢栽跈C(jī)器的引導(dǎo)之下完成任務(wù),人機(jī)協(xié)同完成任務(wù)才能成為可能。
在具體的商業(yè)路徑方面,東吳證券發(fā)布研報(bào)指出,AI Agent未來(lái)有兩大落地場(chǎng)景方向。
首先是智能體模擬。國(guó)內(nèi)情緒消費(fèi)市場(chǎng)仍有較大想象空間,陪伴類(lèi)智能體或受益于情緒消費(fèi)趨勢(shì)紅利,成為L(zhǎng)LM(大語(yǔ)言模型)時(shí)代重要的AI原生應(yīng)用。東吳證券預(yù)計(jì),陪伴類(lèi)智能體大部分商業(yè)價(jià)值集中在供給方而非平臺(tái),更加看好具備豐富IP儲(chǔ)備或者能讓用戶(hù)定制智能體的玩家。
其次則是交互智能體。“智能體之間、智能體與虛擬世界內(nèi)事物之間可互動(dòng),可能涌現(xiàn)出超越設(shè)計(jì)者規(guī)劃的場(chǎng)景和能力,特別是對(duì)開(kāi)放世界游戲等行業(yè),可增強(qiáng)玩家沉浸感,解決開(kāi)放世界內(nèi)容消耗快的問(wèn)題;多可信agent技術(shù)成熟后可能會(huì)孵化出新的游戲品類(lèi)。”東吳證券指出。