微軟內(nèi)部 AI 硬件短缺,被迫實(shí)施配額制

時(shí)間:2023-03-17

來源:新浪科技

導(dǎo)語:據(jù)報(bào)道,知情人士透露,雖然微軟即將宣布一整套使用 GPT-4 人工智能(AI)軟件的 Office 365 工具,但該公司現(xiàn)在卻面臨內(nèi)部 AI 服務(wù)器硬件短缺的窘境。

  這迫使微軟不得不對(duì)硬件資源采取配額供應(yīng)的方式,限制其他內(nèi)部 AI 工具開發(fā)團(tuán)隊(duì)的使用量,從而確?;?GPT-4 的新版必應(yīng)聊天機(jī)器人和即將發(fā)布的新款 Office 工具獲得足夠的資源。這種硬件短缺的現(xiàn)狀還對(duì)微軟的客戶產(chǎn)生了影響:至少有一個(gè)客戶表示,需要等待很長(zhǎng)時(shí)間,才能使用已經(jīng)通過微軟 Azure 云服務(wù)提供的 OpenAI 軟件。

  微軟表示正在加緊添置更多硬件,以便增加 AI 計(jì)算能力,但如果速度不夠快,就有可能限制其 Azure OpenAI 服務(wù)對(duì)新客戶的吸引力。這些客戶會(huì)借助此項(xiàng)服務(wù)將 AI 功能添加到自己的應(yīng)用中。微軟原本在這種新的 AI 工具的商業(yè)化方面已經(jīng)領(lǐng)先于谷歌,但如果遲遲不能解決硬件短缺問題,這種優(yōu)勢(shì)也將難以發(fā)揮出來。

  谷歌搶在微軟之前于本周發(fā)布了自己的 AI 輔助寫作工具,包括能夠根據(jù)簡(jiǎn)短的提示,在谷歌 Docs 和 Sheets 中自動(dòng)編寫文本的軟件。

  服務(wù)器短缺正值 OpenAI 和微軟試圖快速擴(kuò)大銷售范圍之際,客戶可以使用自己的數(shù)據(jù)對(duì)這種 AI 軟件進(jìn)行微調(diào),從而開發(fā)圖片生成、文檔總結(jié)、搜索引擎和聊天機(jī)器人等定制化 AI 工具。

  微軟已經(jīng)向 OpenAI 投資了數(shù)十億美元,有權(quán)通過 Azure OpenAI 服務(wù)向創(chuàng)業(yè)公司銷售軟件。OpenAI 也將軟件直接授權(quán)給客戶使用 —— 而作為與微軟合作的一部分,所有 OpenAI 機(jī)器學(xué)習(xí)模型都必須運(yùn)行在 Azure 服務(wù)器上。這兩項(xiàng)服務(wù)的定價(jià)相同,每次請(qǐng)求收費(fèi)都不到一美分。

  這兩家公司在過去 3 個(gè)月推出的服務(wù)吸引了企業(yè)用戶的廣泛興趣,他們都希望將 OpenAI 的 ChatGPT 聊天機(jī)器人的底層技術(shù)整合到自家產(chǎn)品中。但是微軟 Azure OpenAI 服務(wù)的新客戶卻要面臨很長(zhǎng)的等待時(shí)間。

  硬件資源短缺的核心問題在于,GPT-4 等新的 AI 大模型需要在 GPU 上運(yùn)行,這種服務(wù)器芯片可以一次性處理大量數(shù)據(jù)。為了處理這個(gè)模型的龐大計(jì)算需求,微軟已將數(shù)萬個(gè) GPU 整合成一個(gè)個(gè)群集,分散到各個(gè)數(shù)據(jù)中心里。

  在明確用戶需求量之前,微軟目前不得不將現(xiàn)有的大量 GPU 資源預(yù)留給新的必應(yīng) GPT-4 聊天機(jī)器人和即將推出的 GPT-4 Office 工具。

  知情人士表示,微軟 2 月剛剛推出這項(xiàng)必應(yīng)智能聊天功能,目前還在加緊測(cè)算平均每天有多少人愿意使用這項(xiàng)服務(wù)。知情人士表示,這就導(dǎo)致工程師很難預(yù)測(cè)該功能所需的計(jì)算資源。

  而即將推出的 Office GPT-4 工具也可能導(dǎo)致微軟客戶對(duì) OpenAI 聊天機(jī)器人技術(shù)的需求大幅激增。這些新功能包括 AI 文檔總結(jié)、個(gè)性化寫作建議以及編輯建議等。

  其他從事 AI 開發(fā)的微軟團(tuán)隊(duì)不得不讓位于必應(yīng)和 Office,包括為各種機(jī)器學(xué)習(xí)模型的開發(fā)團(tuán)隊(duì),其中就包括微軟的圖靈自然語言生成模型,它可以理解文本,之前曾為電子郵件和 Office 應(yīng)用中的搜索工具提供底層技術(shù)。

  知情人士表示,當(dāng)這些團(tuán)隊(duì)想要使用 GPU 開發(fā)新的 AI 工具或測(cè)試現(xiàn)有 AI 軟件時(shí),必須向一位公司副總裁提交特別申請(qǐng),獲批后才能使用硬件。

  知情人士稱,有些申請(qǐng)需要等待幾天甚至幾周才能獲批。自 2022 年末,微軟就一直對(duì)內(nèi)部的 GPU 資源實(shí)施配額供給,但 1 月以來的等待時(shí)間越來越長(zhǎng)。

  微軟發(fā)言人在聲明中補(bǔ)充道,該公司正在為 Azure 等服務(wù)增加更多 AI 資源,并且遵循“優(yōu)先滿足客戶需求并根據(jù)需求進(jìn)行調(diào)整的流程”。他們還補(bǔ)充道,微軟并不擔(dān)心 AI 資源。

  至少有一個(gè)微軟客戶透露,他們也經(jīng)歷了延遲訪問的問題。市場(chǎng)營(yíng)銷軟件創(chuàng)業(yè)公司 TouchCast 創(chuàng)始人兼 CEO Edo Segal 說:“幾乎不可能立刻使用程序”。Edo 的公司正在為多家車企開發(fā)基于 GPT 的互動(dòng)式用戶手冊(cè),而這項(xiàng)技術(shù)正是通過微軟 Azure 授權(quán)的。

  現(xiàn)有的 AzureAI 客戶幾乎未受影響。無人駕駛汽車開發(fā)商 Cruise 和 AI 搜索創(chuàng)業(yè)公司 Perplexity 的發(fā)言人都表示,他們?cè)谑褂? Azure 的 GPU 資源時(shí)并未遇到困難。

  去年 11 月,微軟和 GPU 生產(chǎn)商英偉達(dá)共同宣布,微軟將新增數(shù)萬個(gè)處理器來擴(kuò)大 AI 處理能力,但目前還不清楚采購進(jìn)度。

  這兩家公司還在周一共同宣布,Azure 的客戶很快就能搶先使用英偉達(dá)的新款 H100 GPU—— 這款產(chǎn)品尚未廣泛發(fā)布。而知情人士稱,已經(jīng)有少部分微軟內(nèi)部團(tuán)隊(duì)開始使用 H100,但多數(shù)部門尚未獲得這項(xiàng)權(quán)限。

AI
中傳動(dòng)網(wǎng)版權(quán)與免責(zé)聲明:

凡本網(wǎng)注明[來源:中國(guó)傳動(dòng)網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國(guó)傳動(dòng)網(wǎng)(www.treenowplaneincome.com)獨(dú)家所有。如需轉(zhuǎn)載請(qǐng)與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個(gè)人轉(zhuǎn)載使用時(shí)須注明來源“中國(guó)傳動(dòng)網(wǎng)”,違反者本網(wǎng)將追究其法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明其他來源的稿件,均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請(qǐng)保留稿件來源及作者,禁止擅自篡改,違者自負(fù)版權(quán)法律責(zé)任。

如涉及作品內(nèi)容、版權(quán)等問題,請(qǐng)?jiān)谧髌钒l(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

關(guān)注伺服與運(yùn)動(dòng)控制公眾號(hào)獲取更多資訊

關(guān)注直驅(qū)與傳動(dòng)公眾號(hào)獲取更多資訊

關(guān)注中國(guó)傳動(dòng)網(wǎng)公眾號(hào)獲取更多資訊

最新新聞
查看更多資訊

娓娓工業(yè)

廣州金升陽科技有限公司

熱搜詞
  • 運(yùn)動(dòng)控制
  • 伺服系統(tǒng)
  • 機(jī)器視覺
  • 機(jī)械傳動(dòng)
  • 編碼器
  • 直驅(qū)系統(tǒng)
  • 工業(yè)電源
  • 電力電子
  • 工業(yè)互聯(lián)
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機(jī)界面
  • PLC
  • 電氣聯(lián)接
  • 工業(yè)機(jī)器人
  • 低壓電器
  • 機(jī)柜
回頂部
點(diǎn)贊 0
取消 0