自從OpenAI公司研發(fā)的機器人聊天程序ChatGPT在2022年11月30日發(fā)布以來,在全世界迅速帶起了熱潮。ChatGPT是AI大模型驅(qū)動的自然語言處理工具,能夠基于在預訓練階段所見的模式和統(tǒng)計規(guī)律,來生成回答,還能根據(jù)聊天的上下文進行互動,真正像人類一樣來聊天交流,甚至能完成撰寫郵件、視頻腳本、文案、翻譯、代碼,寫論文等任務。
目前,ChatGPT背后的大模型及其應用已成為AI研究和應用的熱點。部分專家和學者提出,數(shù)字化的下一階段是智能化,而AI大模型及其應用是推動數(shù)字化轉(zhuǎn)型持續(xù)深化的引擎。
AI大模型在數(shù)字化轉(zhuǎn)型中的地位和作用還處于持續(xù)的探索之中。筆者在之前的文章中,已經(jīng)描述了數(shù)字化轉(zhuǎn)型的基本概念和方法論。那么,在我們建立的知識體系當中,AI大模型應當處于什么位置,當前和未來將會發(fā)揮什么作用呢?
1.AI大模型與“以數(shù)據(jù)為中心的業(yè)務變革”
一直以來,我們提到,數(shù)字化轉(zhuǎn)型分為“業(yè)務活動步驟化”、“步驟環(huán)節(jié)要素化”、“要素數(shù)據(jù)規(guī)格化”和“以數(shù)據(jù)為中心的業(yè)務變革”四個階段。業(yè)務活動經(jīng)過前三階段,逐步形成了規(guī)范化的業(yè)務運行數(shù)據(jù)。對于以數(shù)據(jù)為中心的AI大模型而言,其在數(shù)字化轉(zhuǎn)型中的應用理所應當處于“以數(shù)據(jù)為中心的業(yè)務變革”階段,屬于《“以數(shù)據(jù)為中心的業(yè)務變革”之三種范式》中的第三種范式“系統(tǒng)數(shù)字化、規(guī)則數(shù)字化、模型和業(yè)務相互驅(qū)動”:適合無明確的現(xiàn)有規(guī)則或僅依靠現(xiàn)有規(guī)則不足以支撐業(yè)務運行、主觀性強、容錯性高的應用場景,由于其技術(shù)特點,暫無法滿足業(yè)務規(guī)則專業(yè)型強、復雜度高的場景。
對于AI大模型在復雜專業(yè)領(lǐng)域的應用,在此舉個栗子:
數(shù)學家陶哲軒認為ChatGPT是“數(shù)學菜雞”,但在開展研究工作時,仍然很好地利用ChatGPT作為研究助理,包括以下三個步驟:1.明確GPT4的身份是“一個擅長給技巧性建議的數(shù)學合作專家”,目標是“提出一些建議”而非解決問題;2.使用Markdown輕量級標記語言而非數(shù)學算式來描述數(shù)學問題,便于GPT4理解;3.將問題描述中,涉及需要GPT-4自己查找資料的部分轉(zhuǎn)變?yōu)橐米⑨專⒃诮Y(jié)尾給出網(wǎng)址。相比讓GPT-4直接化身數(shù)學家去“解決問題”,陶哲軒把它當做一個提供靈感來源的“專家”,給自己提供研究方向的建議,很大程度提高了數(shù)學家研究工作的效率。
陶哲軒使用GPT-4的經(jīng)驗是:1.不要讓AI直接回答問題,因為這幾乎肯定會得到一些看起來專業(yè)的廢話;2.AI大模型擅長半成品的語義搜索工作,在巧妙的問題內(nèi)容和格式設(shè)計下,可以成為科學家的合作者,提供有價值的策略建議。
在現(xiàn)實中,部分企業(yè)領(lǐng)導在缺乏對業(yè)務生產(chǎn)線深入調(diào)研和理解,并且同樣缺乏對大模型技術(shù)特點和應用場景理解的基礎(chǔ)上,僅被PPT忽悠,就認為AI大模型具有完全替代專業(yè)領(lǐng)域工作人員的能力,盲目推動一些高投入的項目上馬,其前景可想而知。
2.AI大模型與知識管理
上一節(jié)提到,AI大模型擅長半成品的語義搜索工作,在巧妙的問題內(nèi)容和格式設(shè)計下,可以成為業(yè)務人員的合作者,提供有價值的策略建議,從而為業(yè)務活動創(chuàng)造便利,達到“降本增效”的效果。
看到這一點,不知道一直關(guān)注本號的讀者有沒有聯(lián)想到什么?對了,就是“知識管理”。在《數(shù)字化轉(zhuǎn)型企業(yè)需要什么樣的知識管理》中,我們提到:業(yè)務“數(shù)字化”后其運行規(guī)則發(fā)生的變化稱為知識數(shù)字化。知識數(shù)字化作為業(yè)務規(guī)則與業(yè)務“數(shù)字化”之間的橋梁,是數(shù)字化轉(zhuǎn)型企業(yè)的業(yè)務引擎。知識數(shù)字化依賴有效的知識管理來實現(xiàn),知識管理的目標是:1.通過實施管理活動,將企業(yè)運行過程中積累的智力成果有效轉(zhuǎn)化為業(yè)務運行規(guī)則并動態(tài)更新;2.將業(yè)務規(guī)則與業(yè)務活動本身緊密耦合,以便在業(yè)務活動的任何環(huán)節(jié)和階段有效運用規(guī)則。這其中涉及兩方面內(nèi)容,一是對業(yè)務運行規(guī)則也就是知識的積累和管理;二是對知識的應用。
而AI大模型作為業(yè)務人員的合作者,擁有大量模型參數(shù),在海量業(yè)務數(shù)據(jù)的訓練下,一方面可以自動化實現(xiàn)業(yè)務運行規(guī)則的有效積累、集成和管理,另一方面在知識數(shù)字化、范式化、模板化、模型化的基礎(chǔ)上,還實現(xiàn)了知識的按需提供、集成化展示和智能推薦。
從知識管理的角度,AI大模型在數(shù)字化轉(zhuǎn)型企業(yè)知識數(shù)字化、范式化、模板化、模型化的基礎(chǔ)上,實現(xiàn)了知識管理的自動化和知識應用的智能化。
3.AI大模型與數(shù)據(jù)安全
筆者認為,企業(yè)在準備深度應用AI大模型之前,首先要考慮清楚一個問題——數(shù)據(jù)安全。這里讀者可能會有疑問:數(shù)據(jù)安全只是數(shù)據(jù)治理工作的一部分,在這一場景下為什么要首先考慮?在此先給出結(jié)論:企業(yè)對自身業(yè)務數(shù)據(jù)安全的考慮,將對AI大模型的建設(shè)和應用模式產(chǎn)生決定性影響。
從技術(shù)上講,AI大模型本質(zhì)上是一個使用海量數(shù)據(jù)訓練而成的深度神經(jīng)網(wǎng)絡模型。其巨大的數(shù)據(jù)和參數(shù)規(guī)模,實現(xiàn)了智能的涌現(xiàn),展現(xiàn)出類似人類的智能。AI大模型在理解能力、推理能力、創(chuàng)作能力上的突破,建立在大量級、高質(zhì)量的訓練數(shù)據(jù)基礎(chǔ)上。據(jù)稱GPT-3模型使用了不少于45TB的原始數(shù)據(jù)和570GB的預處理數(shù)據(jù),GPT-4模型使用的數(shù)據(jù)則更多。而企業(yè)所需要的垂直領(lǐng)域AI大模型,在多領(lǐng)域、多行業(yè)及多樣性的海量數(shù)據(jù)基礎(chǔ)上,還要將更多的垂直領(lǐng)域知識、業(yè)務規(guī)則加入模型的訓練數(shù)據(jù)集,并需要業(yè)務領(lǐng)域?qū)<业纳疃葏⑴c。
而用戶在使用AI大模型過程中,需要向大模型提供輸入以獲得期望的輸出。這些持續(xù)不斷的輸入反過來為大模型的改進和完善提供了矯正數(shù)據(jù)和反饋信息,從某種程度上講需要提供部分企業(yè)業(yè)務運行的敏感數(shù)據(jù)、流程和規(guī)則信息。如果企業(yè)完全不能接受這些信息的外泄,就必須自建AI大模型及其應用,而這需要較高的資源投入。
一方面,如果企業(yè)能夠接受員工在使用公共AI大模型過程中,向大模型提供企業(yè)運行的部分敏感數(shù)據(jù),也需要進一步評估提供數(shù)據(jù)的邊界和方式,并在此基礎(chǔ)上制定相應的數(shù)據(jù)安全策略、制度和操作規(guī)程,而這些都是全新的領(lǐng)域。
另一方面,如果企業(yè)自建AI大模型,需要重點解決的是數(shù)據(jù)訪問的權(quán)限問題。簡單的說,就是在各崗位職工普遍使用AI大模型作為業(yè)務助手的情況下,需要根據(jù)崗位的知悉范圍,對其能夠從企業(yè)自建AI大模型中獲取的數(shù)據(jù)邊界進行限制,而這對于大模型提出了更高的技術(shù)和使用管理要求。
4.總結(jié)
在目前AI大模型的行業(yè)應用剛剛起步階段,部分企業(yè)領(lǐng)導寄希望大模型能夠一招定勝負,解決企業(yè)發(fā)展的數(shù)字化轉(zhuǎn)型問題的想法是不切實際的。目前,由于數(shù)據(jù)智能的技術(shù)局限性,AI大模型在數(shù)字化轉(zhuǎn)型中的作用尚未突破《“以數(shù)據(jù)為中心的業(yè)務變革”之三種范式》中第三種范式的邊界。但AI大模型在企業(yè)知識管理領(lǐng)域,可以在知識數(shù)字化、范式化、模板化、模型化的基礎(chǔ)上進一步實現(xiàn)知識管理的自動化和知識應用的智能化,進一步促進“降本增效”。而作為數(shù)據(jù)密集型的應用,AI大模型為傳統(tǒng)的數(shù)據(jù)安全和數(shù)據(jù)治理也帶來了新的課題和挑戰(zhàn)。