最近,人工智能公司Scale AI發(fā)布 《2024年人工智能準(zhǔn)備度報(bào)告》。
該系列報(bào)告已經(jīng)是連續(xù)第三年進(jìn)行發(fā)布,本次報(bào)告調(diào)查采訪了1800 多名在企業(yè)中構(gòu)建或應(yīng)用人工智能解決方案的人工智能從業(yè)人員,以獲得相關(guān)的見解及結(jié)論。
旨在通過企業(yè)的AI應(yīng)用現(xiàn)狀,為大模型/人工智能的開發(fā)與構(gòu)建、利用現(xiàn)有的基礎(chǔ)模型的應(yīng)用及測試和評估提供參考與建議。
劃重點(diǎn),該報(bào)告發(fā)現(xiàn):
60%的受訪者正在嘗試使用生成性AI模型或計(jì)劃在未來一年內(nèi)這樣做,但只有21%的公司已經(jīng)將這些模型投入生產(chǎn)。
72%的公司計(jì)劃在今年增加他們的人工智能投資。
89%采用人工智能的公司從開發(fā)新產(chǎn)品或服務(wù)的能力中受益。
一些受訪者提到,缺乏合適的工具和框架是阻礙人工智能項(xiàng)目進(jìn)展的一個挑戰(zhàn)。
報(bào)告強(qiáng)調(diào)了組織需要在多個維度上優(yōu)化和評估他們的人工智能準(zhǔn)備度,包括開發(fā)模型、利用基礎(chǔ)模型和測試模型。
1.企業(yè)的選擇:OpenAI占“半壁江山”,LLama領(lǐng)跑開源
調(diào)查結(jié)果顯示,OpenAI是絕大多數(shù)企業(yè)的選擇,在前五中除了來自谷歌的Gemini排在第三位以外,其余產(chǎn)品均來自這家AI明星公司。
LLama2以18%的采用率位列第7,開源模型中第1。而谷歌開源的BERT、T5模型,作為NLP領(lǐng)域的老將,也有比較高的采用率。
綜合之前的調(diào)查數(shù)據(jù)來看,在模型的開源和閉源之間,企業(yè)的AI戰(zhàn)略決策、模型選擇的偏好是持續(xù)演變的。模型的開源生態(tài)會很大程度上影響企業(yè)的選擇。
今年,閉源模型的使用增長最多,有86%的組織使用這些模型,而前一年的比例是37%。這很可能是由于多種因素的結(jié)合。許多組織已經(jīng)與云服務(wù)提供商簽訂了現(xiàn)有合同,而這些提供商又與閉源模型開發(fā)者有合作關(guān)系,這使得使用閉源模型變得更加容易。此外,許多閉源模型在開箱即用的情況下也比開源模型表現(xiàn)更好。
盡管如此,開源模型的使用也有所增長,從41%增加到66%。這可能是由于開源模型為微調(diào)(fine-tuning)和托管(hosting)提供的靈活性。在2024年,自己訓(xùn)練模型的組織偏好變化最小,從22%升到24%。
值得注意的是,在調(diào)查進(jìn)行時Claude 3, Grok, DallE 3,LLama3都沒有發(fā)布,因此沒有相關(guān)數(shù)據(jù)。尤其是性能強(qiáng)大到比肩 GPT-4 的 LLama3,能否給OpenAI絕對領(lǐng)先的地位一點(diǎn)震撼,我們無從得知。
2.模型的采用:定制or開箱即用?
根據(jù)調(diào)查,受訪者中65% 的選擇了開箱即用,43%選擇了微調(diào)模型,38%選擇了RAG。受訪者的多選情況,可能來自于企業(yè)多模型部署的策略。
應(yīng)用人工智能的組織正在尋求通過提示工程、微調(diào)模型和檢索增強(qiáng)生成(RAG)使得AI更具價(jià)值。
盡管有優(yōu)化基礎(chǔ)模型的愿望,但65%的組織使用開箱即用的模型。同時,微調(diào)可以為特定任務(wù)或數(shù)據(jù)集定制模型,顯著提高其在目標(biāo)應(yīng)用中的性能和準(zhǔn)確性。RAG通過在生成過程中動態(tài)整合外部信息進(jìn)一步增強(qiáng)了這一點(diǎn),使模型能夠產(chǎn)生更相關(guān)且上下文豐富的輸出。
3.企業(yè)將在哪些工作中應(yīng)用AI?
65%的受訪者提到了使用AI進(jìn)行編程相關(guān)的需求,但考慮到 Cognition、Augment 等公司正在籌集的大額融資也就不足為奇。
緊隨其后的AI應(yīng)用領(lǐng)域依次是,內(nèi)容生成、數(shù)據(jù)分析工具、客服聊天機(jī)器人、流程自動化工具、知識庫管理、總結(jié)和報(bào)告生成、智能推薦系統(tǒng)。
此外,只有 4% 的企業(yè)沒有實(shí)施人工智能的計(jì)劃 。
4.企業(yè)如何評估模型性能?
對于企業(yè)來說,模型的可靠性和性能的重要程度不相上下,這些直接與企業(yè)的使用甚至是業(yè)務(wù)的收入掛鉤。比較來說,人們對于大模型的數(shù)據(jù)安全及安全性的評估優(yōu)先級較低。
人工智能的焦點(diǎn)正從“卷”模型性能轉(zhuǎn)向?qū)嶋H的應(yīng)用落地,可以預(yù)見的是,AI技術(shù)將在企業(yè)中變得更加易用和普及。
72%的公司計(jì)劃在本年度增加對AI的投資,驗(yàn)證著市場對AI潛力的認(rèn)同。盡管有人擔(dān)憂AI繁榮的猶如泡沫可能會一朝破滅,但實(shí)際情況可能恰恰相反——經(jīng)過時間的洗禮,人工智能的神秘面紗將逐漸褪去,它將從前沿技術(shù)轉(zhuǎn)變?yōu)橄袷謾C(jī)和電腦一樣,成為我們?nèi)粘I钪胁豢苫蛉钡膶?shí)用工具。