生成式人工智能領域正在迅速擴張,盡管帶來了巨大的挑戰(zhàn),但也帶來了巨大的好處。
生成式人工智能是人工智能的一種形式,它依賴于自然語言處理、大規(guī)模訓練數據集和先進的人工智能訓練策略,如神經網絡和深度學習,來生成類似于人類制作的原創(chuàng)內容。
技術專業(yè)人士和娛樂用戶都越來越熟悉ChatGPT這樣的內容生成模式,ChatGPT于2022年首次出現(xiàn)。但這個生成式AI的例子只觸及了生成式AI可以做什么,以及其的發(fā)展方向。
在本篇生成式人工智能領域指南中,我們將探討生成式人工智能的能力,以及它是如何出現(xiàn)并變得如此流行的。我們還將研究生成式人工智能領域的當前趨勢,并預測消費者在不久的將來對這項技術的期望。
生成式人工智能的現(xiàn)狀
盡管生成式人工智能技術仍然相對較新,但當前的人工智能模型已被用于滿足一系列個人和商業(yè)用例。以下是當今生成式人工智能領域中一些最常見的應用和人工智能示例:
個人用途:生成式人工智能工具的娛樂用戶經常使用其來生成文本內容;具體用例包括問答、旅行和活動規(guī)劃、對話和研究。
人工智能助手、聊天機器人和搜索:人工智能驅動的搜索引擎和副駕駛正在迅速發(fā)展。一些初創(chuàng)企業(yè)還提供由生成式人工智能支持的企業(yè)搜索工具。
開發(fā)人員任務:生成式AI開發(fā)人員工具可以預測代碼序列、支持問題解決、記錄現(xiàn)有代碼以及自動化編程任務。
創(chuàng)意內容生成:除了文本生成之外,多種生成式人工智能模型還可以生成音頻、視頻和圖像。人工智能內容生成的一些最新趨勢包括音樂、視頻游戲和播客內容創(chuàng)作。
計算機視覺:合成數據生成和3D模型創(chuàng)建可應用于計算機視覺用例,例如駕駛員監(jiān)控和行人檢測、AR/VR/XR、虛擬試穿等。
語音音頻合成:人工智能生成的語音可用于營銷視頻等企業(yè)項目;人工智能語音選項正在迅速以多種語言和音調提供。
如今,這些示例以及更多示例被廣泛應用于各種行業(yè)和業(yè)務部門,包括市場營銷和銷售、客戶服務和聯(lián)絡中心、醫(yī)療保健和制藥、生物學和生物物理學、娛樂、法律和政府、金融和銀行以及電子商務。
推動生成式人工智能格局的關鍵技術和創(chuàng)新
生成式人工智能目前正在大規(guī)模興起,主要原因有兩個:1)更成熟的神經網絡技術已經實現(xiàn);2)模型和計算能力現(xiàn)在更容易獲得。
2017年,Google首次提出了一種名為Transformer的神經網絡架構,為現(xiàn)今使用的生成式人工智能奠定了基礎。借助Transformer,創(chuàng)建更高質量的語言模型成為可能,這些模型可以更有效地進行訓練并具有更多可定制的功能。此時,帶有預測文本的工具和簡單的人工智能聊天機器人開始出現(xiàn)并逐漸成熟。
然而,即使有了Transformer和相關神經網絡架構的發(fā)展,生成式人工智能模型仍然極其昂貴且難以開發(fā)和操作。處理生成式人工智能查詢需要的電力資源是大多數企業(yè)所不具備的。
從2022年開始,計算能力和AI平臺基礎設施層開始趕上生成式AI工具的處理要求,使更多企業(yè)能夠開發(fā)生成式AI技術。更重要的是,這項創(chuàng)新使得現(xiàn)有的生成式人工智能開發(fā)人員能夠以實惠的價格將其模型擴展到其他用戶。
大約在同一時間,新的神經網絡技術,如擴散模型,也出現(xiàn)了,降低了生成式人工智能開發(fā)的進入門檻。
隨著生成式人工智能現(xiàn)在需要更少的能源和金融投資,生成式人工智能領域已經擴大到包括一些成熟的科技企業(yè)和生成式人工智能初創(chuàng)企業(yè)。隨著現(xiàn)有模型通過API、有限的免費版本和開源軟件擴展到更多用戶,格局不斷發(fā)展,從而定期開發(fā)新的應用和用例。
塑造生成式人工智能格局的主要參與者和初創(chuàng)企業(yè)
OpenAI顯然是生成式人工智能領域的領導者,目前估值約為800億美元。憑借與Microsoft的密切關系、其GPT-4模型、非常受歡迎的ChatGPT工具,以及在其他形式的多模式內容生成方面的持續(xù)創(chuàng)新,OpenAI已做好持續(xù)增長和第三方投資來推動增長的準備。
Amazon和IBM等主要技術企業(yè)也在推動生成式人工智能領域的發(fā)展,但目前最引人注目的巨頭是Microsoft和Google。盡管Microsoft在向公眾提供實際的生成式人工智能工具方面起步較早,但兩家企業(yè)現(xiàn)在都提供支持多模式內容生成、人工智能驅動的聊天、人工智能輔助等的工具。
這一領域的其他領導者包括:
Cohere
Jasper
Anthropic
Glean
Stability AI
Inflection AI
生成式人工智能領域的5個新興趨勢
盡管生成式人工智能的影響力迅速增強,但早期的采用率表明,未來的影響力將更加廣泛,從教育到虛擬現(xiàn)實,影響各個領域。詳細了解當今的新興趨勢,這些趨勢可能會在生成式人工智能的未來使用中發(fā)揮作用。
市場營銷自動化
目前,生成式人工智能經常用于營銷、銷售和類似的創(chuàng)意內容生成任務。雖然用戶可以手動將其內容請求輸入到生成式人工智能聊天機器人和模型中,但許多人工智能供應商現(xiàn)在可以讓用戶通過人工智能助手或副駕駛進行最少的提示,以自動執(zhí)行內容生成任務。
例如,自動化可用于社交媒體和博客內容編寫、多渠道視頻和圖像內容創(chuàng)建以及入站和出站電子郵件營銷工作流程。
目前,這些工具中的許多工具在使用的語言和支持的上下文窗口方面都受到限制。隨著該用例的成熟,預計會看到更多具有更大上下文窗口的多語言解決方案,從而可以提出更長、更復雜的查詢。
產品和軟件開發(fā)支持
無論是經驗豐富的開發(fā)人員還是沒有編碼知識的新手,現(xiàn)在有多種生成式人工智能工具可以協(xié)助完成不同的編程任務。以GitHubCopilot為例,該工具直接與用戶的GitHub帳戶和生態(tài)系統(tǒng)配合使用,幫助完成代碼、代碼片段、故障排除以及簡單語言代碼生成和解釋。隨著對自然語言輸入的重視,任何人都可以生成代碼來解決各種產品和軟件開發(fā)問題。
增加教育用途和影響
學生們已經在使用ChatGPT等工具來回答家庭作業(yè)問題或寫論文,老師和家長對此感到擔憂。
盡管這些大型語言模型不一定“知道”教育作業(yè)的答案,但其訓練使之能夠準確預測各種輸入的文本序列,從而使學生能夠使用這些工具來解決課堂問題。當然,這可能會對學生的教育產生負面影響,但如果教育系統(tǒng)學會如何將人工智能解決方案作為輔助學習工具實施,也可能使學生和老師受益。
就像過去課堂技術發(fā)生變化一樣——高射投影儀。生成式人工智能將要求教師改進其教育方法。例如,虛擬學習是生成人工智能的一個令人興奮的領域,正在快速發(fā)展。生成式人工智能游戲和人工智能講故事解決方案現(xiàn)已發(fā)布,為教師提供教學支持,并采用新的方式向學生提供教育內容。
但仍然存在基于人工智能的抄襲問題。為了打擊學生依賴ChatGPT和類似工具做作業(yè)的傾向,教師可以使用現(xiàn)已發(fā)布的眾多免費AI內容抄襲檢測器之一。盡管這些工具并不完美,但可以有效地估計人工生成的內容的百分比。
隨著教育問題的增長,用戶可以期待這些抄襲檢查工具也會不斷發(fā)展。
嵌入式人工智能應用
Microsoft等少數大型技術企業(yè)現(xiàn)在提供人工智能助手,指導用戶在網絡上的搜索體驗,或支持Microsoft365等辦公套件解決方案中的內容生成和任務完成。Google也效仿了Gemini,增加了功能,以便該工具可以使用直接在Gmail、文檔等中。此外,一些最大的生成式人工智能初創(chuàng)企業(yè),如Cohere和Glean,為用戶提供人工智能驅動的企業(yè)搜索工具。
隨著輔助企業(yè)工具不斷擴展其特性和功能,許多企業(yè)將開始效仿Microsoft、Google,將這些應用程序嵌入到其網站、產品和內部軟件中,為員工和客戶創(chuàng)造更好的自助服務用戶體驗。
情境化、全球生成人工智能
當今大多數生成式人工智能模型都存在基于時間和語言的限制,但一些生成式人工智能供應商已經擴展了其工具,以支持更多語言和方言。隨著生成式人工智能在世界各地的需求不斷增長,越來越多的供應商需要確保其工具能夠接受輸入,并以最小的錯誤創(chuàng)建符合各種語言和文化背景的輸出。
此外,生成式人工智能模型需要向用戶提供更準確、實時的信息,以保持其參與度。盡管ChatGPT是目前最流行的內容生成和大型語言模型,但最終可能會落后于Gemini等競爭對手,Gemini擁有連接到互聯(lián)網并根據最新信息生成答案的免費版本。相比之下,ChatGPT的免費版本目前可使用2023年4月停止的數據,并且沒有實時互聯(lián)網連接,但付費版本可以訪問Bing。
生成式人工智能景觀:網絡安全影響
生成式人工智能工具可用于模擬攻擊和環(huán)境、威脅情報以及敏感數據的合成數據數字孿生。雖然生成式人工智能在戰(zhàn)略性使用時支持這些更強大的安全保護和實踐,但也可能被惡意行為者和黑客操縱,這些人知道生成式人工智能模型如何訓練,以及如何使用數據的秘密和解決方法。
越來越多的生成式人工智能供應商正在將其網絡安全方法推進到向公眾提供的工具中,但仍然有許多生成式人工智能解決方案沒有也不會為高度監(jiān)管的行業(yè)中的企業(yè)或處理敏感數據提供必要的網絡安全保護。
假設生成式人工智能工具為企業(yè)提供正確的網絡安全保護,可能會導致各種問題,包括知識產權或私人數據被盜、消費者信任喪失以及法律和合規(guī)問題。
無論是使用其他供應商的AI模型還是開發(fā)自己的AI模型,都可以遵循以下一些最佳實踐來保護數據和用戶:
熟悉AI供應商數據使用和存儲策略。
請勿使用敏感數據進行訓練或輸入敏感數據。
培訓員工如何正確使用這些工具和企業(yè)數據。
制定人工智能治理政策。
使用涵蓋現(xiàn)代威脅形勢的數據治理和網絡安全工具,包括第三方人工智能應用。
生成式人工智能領域的未來方向
根據當前的發(fā)展、優(yōu)先事項和公眾的興趣,預計在未來的生成式人工智能領域將出現(xiàn)新的增長和機遇:
生成式人工智能和虛擬現(xiàn)實
視頻和3D模型是當今增長最快的生成式AI模型格式。這種增長在人工智能視頻內容營銷中尤其明顯,其利用頭像、音頻合成和其他生成式人工智能功能來大規(guī)模創(chuàng)建引人注目的營銷內容。
營銷創(chuàng)意內容、游戲和娛樂媒體當然可以從人工智能的進步中受益,但生成模型對虛擬現(xiàn)實(VR)和增強現(xiàn)實(AR)技術(元宇宙)的影響是許多人最焦急等待的。
隨著模型不斷完善,其可以處理更多數據,創(chuàng)建更高分辨率的媒體,并接受更長的上下文窗口,預計生成式人工智能技術將創(chuàng)造出身臨其境的體驗,讓虛擬現(xiàn)實感覺真實。
改變職業(yè)道路和機會
生成式人工智能工具已經在補充某些類型的工作,并且在未來可能會取代某些類型的工作。但這不應該給普通職業(yè)人士敲響警鐘,只要他們愿意隨著工作期望的變化而調整和發(fā)展自己的技能。
例如,許多作家目前專注于搜索引擎優(yōu)化寫作,這是一種主要涉及制作在搜索結果中排名靠前的內容的寫作形式。這正是人工智能模型通過算法訓練可以產生的內容類型。對于隨著大型語言模型變得更加強大而擔心自己工作保障的作家而言,發(fā)展新的戰(zhàn)略技能,如編輯規(guī)劃和內容質量保證管理,以及與重視人類創(chuàng)造力和研究的企業(yè)合作將非常重要。
從好的方面來講,這些工具已經使某些類型的重復性任務變得更加容易,例如發(fā)送電子郵件、起草電子表格、記錄操作項目和做筆記。輔助工作場所功能未來可能會擴展到更復雜的任務,例如集思廣益整個產品發(fā)布計劃,以及從頭到尾處理人力資源入職。
當員工從這些耗時的任務中解放出來時,將能夠比以往更加專注于更高價值的戰(zhàn)略工作。
專門的行業(yè)應用和工具
盡管許多專業(yè)行業(yè)應用和工具已經發(fā)布,但一些行業(yè)的復雜性和產品發(fā)布需求使得快速發(fā)布這些工具變得非常棘手。因此,其中一些行業(yè)在人工智能的使用方面落后于其他行業(yè)。
人工智能醫(yī)療保健領域就是一個很好的例子。該領域對生成式人工智能充滿活力和興奮,但目前生成式人工智能產品的發(fā)布出現(xiàn)了相當大的波動和停滯。這可能有多種原因,但可以肯定的是,受到嚴格監(jiān)管的PHI和PII數據,以及所涉及的行業(yè)特定專利(即藥品專利),使得跨越所有障礙并繼續(xù)前進變得更加困難。
未來幾年,隨著這些工具變得更加成熟,人工智能供應商提高其透明度和可解釋性,我們應該會看到受監(jiān)管和復雜行業(yè)的更多增長,包括醫(yī)療保健/患者關系、藥品和藥物發(fā)現(xiàn)、保險以及金融和銀行業(yè)。
加強監(jiān)管和道德影響
在大多數地區(qū)和行業(yè),人工智能的使用基本上不受監(jiān)管,這可能會導致一系列問題。一些用戶已經因其個人數據成為模型訓練數據和潛在輸出的一部分而遭受后果,而另一些用戶則對這些解決方案中的數據存儲和相關安全協(xié)議發(fā)出了警報。盡管一些人工智能供應商獨立選擇使其培訓流程、數據收集方法和總體戰(zhàn)略更加透明,但管理機構幾乎沒有采取任何措施來強制執(zhí)行這種透明度。
預計這種情況很快就會改變,尤其是在歐盟?!稓W盟人工智能法案》是一項全面的人工智能法律,規(guī)范人工智能供應商如何使用人工智能驅動的自動化并收集個人數據,同時要求某些類型的披露和透明度,該法案于2023年12月9日在議會和理事會之間達成了一項臨時協(xié)議。正式通過是內部市場和公民自由委員會對該法律進行投票后,預計將于2024年實施。
其他國家,包括韓國、新加坡、中國和美國,要么已經提出了人工智能監(jiān)管框架,要么正在制定零碎的人工智能法規(guī),隨著生成式人工智能工具不斷增強其能力并在公共領域發(fā)展,所有這些都可能成為更高的優(yōu)先事項要求。
隨著立法和公眾對生成人工智能危險的認識的預期增加,計劃看到更多的生成式人工智能供應商不僅遵守這些法律,而且還采取公共關系措施,進一步解釋他們正在采取的道德和負責任的人工智能步驟。
利用生成式人工智能格局進行創(chuàng)新
無論是人工智能開發(fā)人員、商業(yè)用戶還是普通用戶,生成式人工智能領域已經成熟,可以帶來新的創(chuàng)新和機遇。為了充分利用這些工具和整個技術領域,建議采取以下策略:
與成熟或利基的人工智能供應商合作:與具有特定行業(yè)或用例方面擁有豐富經驗的人工智能和AIaaS供應商進行合作,如Microsoft、Google。
試驗微調模型:微調模型允許用戶使用基線模型的高級功能,并將其自定義為更具體的功能。根據預算和內部技術專業(yè)知識,開源模型可能為微調項目提供最佳價值。
致力于多模式輸入和輸出:用戶越來越多地使用人工智能內容生成工具來創(chuàng)建文本、代碼、圖像和其他類型的內容。如果正在開發(fā)供內部或公共使用的人工智能工具,請努力創(chuàng)建適合這種多模態(tài)的界面和培訓方法。
優(yōu)先考慮多語言能力:生成式人工智能的全球民主化是生成式人工智能領域成熟的重要下一步。盡管多語言訓練可能很困難,但一些開源模型現(xiàn)在為多種語言和方言提供基線訓練和支持。
與相關業(yè)務應用集成:無論是通過API還是預構建的集成,都要關注用戶想要的集成,并確保開發(fā)的模型與這些工具無縫協(xié)作。
接受反饋和重新訓練:與Google在Gemini中添加的內容類似,考慮將用戶反饋機制納入所開發(fā)的任何工具中,允許用戶對響應進行評分、根據特定參數請求生成新內容等等。查看這些反饋數據將使團隊能夠重新訓練模型,以便在未來獲得更好的結果。
強調透明度和可解釋性:透明度和可解釋性是值得遵循的良好實踐,不僅可以跟上人工智能法規(guī),還可以讓用戶在使用工具時感到自信和放心。提供詳細的政策、用戶指南和培訓是最好的方法。
總結
隨著ChatGPT的到來,生成式人工智能在2022年底更公開地出現(xiàn)在技術領域,幾個月內,生成式AI迅速開始從根本上重塑技術行業(yè)。事實上,可以毫不夸張地說,隨著生成式人工智能技術進入越來越多的技術工具和解決方案,“生成式人工智能格局”和“整體技術格局”本質上正在融合成一個實體。
為了更好地應對當前的困境,并為未來伴隨生成式人工智能創(chuàng)新的挑戰(zhàn)做好準備,企業(yè)領導者需要密切關注市場、不同的人工智能供應商如何實現(xiàn)透明度和可解釋性,以及安全和隱私保護適用于哪種技術。以這種方式準備將有助于生成式人工智能以利大于弊的方式發(fā)展。