久久亚洲一区二区三区四区,亚洲熟妇av一区二区三区色堂,国产精品免费大片,精品无码久久久久久久久曰韩邻居

當(dāng)前位置:首頁(yè) > 最新資訊 > 行業(yè)資訊

面向2026年的推薦算法前瞻

常規(guī)的推薦系統(tǒng)范式已經(jīng)逐漸走入瓶頸,原因是在當(dāng)前固定化的問(wèn)題描述下模型和系統(tǒng)幾乎已經(jīng)發(fā)展到極限。當(dāng)前的主要范式在模型上為召回+排序+重排,系統(tǒng)上為樣本挖掘+特征工程+線上打分預(yù)估能力建設(shè)。一線大廠在上述領(lǐng)域已經(jīng)把空間挖掘殆盡。同時(shí)可以看到,我們的用戶對(duì)當(dāng)前推薦系統(tǒng)的滿意度仍然未達(dá)到理想狀態(tài)。推薦系統(tǒng)是一個(gè)非常面向于用戶滿意度的平臺(tái)系統(tǒng),而用戶滿意是一個(gè)永遠(yuǎn)存在不同理解的問(wèn)題,一千個(gè)用戶眼里有一千種對(duì)好的推薦系統(tǒng)的理解。

構(gòu)建更好的推薦系統(tǒng)需要我們重新定義“什么是好的推薦系統(tǒng)”。這并不是學(xué)術(shù)界的“強(qiáng)行挖坑”或者“繼續(xù)填坑”,而是不同層面上都在呼喚新的定義。事實(shí)上,新的推薦系統(tǒng)已經(jīng)零散地在學(xué)術(shù)界和工業(yè)界展現(xiàn)星星之火。

為何本文主題提出 2026 呢?是因?yàn)楫?dāng)前無(wú)論在業(yè)務(wù)上還是技術(shù)上都有一些亟待解決的問(wèn)題,希望在未來(lái) 3 年能找到好的解法。

一、留存提升

對(duì)于所有 APP 來(lái)說(shuō),留存是第一生命力,APP 留下多少用戶,DAU 多高,決定著公司的估值和市值。業(yè)界和留存相關(guān)的課題主要有以下三種:

通過(guò)相關(guān)性分析、因果推斷找出影響留存的因素。比如愛(ài)奇藝、騰訊視頻和優(yōu)酷等平臺(tái)。對(duì)于長(zhǎng)視頻平臺(tái),影響留存的最大因子是熱播劇,在騰訊視頻中我們會(huì)發(fā)現(xiàn)假如有熱播劇上線,那么當(dāng)季的留存和 DAU 會(huì)提升很多。但如果一個(gè)熱播劇下線,DAU 就會(huì)降低很多,這就要求平臺(tái)不斷提供爆款的熱播劇,熱播劇因素跟平臺(tái)的留存非常相關(guān)。

留存拆分為多個(gè)子目標(biāo)建模,再綜合排分。

建模多天的收益來(lái)逼近留存的概念。如果是次日留存,對(duì)用戶的正反饋,不要建模為一次點(diǎn)擊或者觀看30秒,而要建模為48小時(shí)的總體消費(fèi)指標(biāo),這樣更能夠逼近留存。

下圖中展示了兩個(gè)項(xiàng)目:

一是留存與一刷 tag 熵的關(guān)系,例如今天有 n 個(gè)用戶來(lái)到平臺(tái),明天 m 個(gè)用戶留下,留存就是 m 除以 n,這是次日留存的概念。tag 熵是指內(nèi)容多樣性,我們發(fā)現(xiàn)如果用戶看的內(nèi)容比較多樣,在當(dāng)時(shí)場(chǎng)景下留存率是比較高的。

二是基于強(qiáng)化學(xué)習(xí)的分析,我們希望逼近 30 分鐘建模,即用戶在短視頻平臺(tái)看 30 分鐘的總價(jià)值。

圖片

二、用戶增長(zhǎng)

這里使用的是狹義的用戶增長(zhǎng)定義,如何把一個(gè)新的不活躍的消費(fèi)者變成平臺(tái)的活躍用戶。

平臺(tái)僅依靠巨大的人口紅利獲得持續(xù)發(fā)展的時(shí)代已經(jīng)過(guò)去,很多平臺(tái)進(jìn)入存量競(jìng)爭(zhēng)。在新平臺(tái)新 APP 上線的階段,更是用戶增長(zhǎng)能力決定生死的關(guān)鍵階段。

相關(guān)的課題:

用戶分層優(yōu)化,預(yù)估high value action。舉個(gè)例子,比如有些用戶狀態(tài)能夠很好地區(qū)分用戶的等級(jí),我們會(huì)利用這些關(guān)鍵的動(dòng)作把用戶分層[2]。

二是營(yíng)銷手段建模uplift和推薦算法的分人群。營(yíng)銷的手段主要就是物質(zhì)獎(jiǎng)勵(lì),推薦算法就是更精準(zhǔn)的匹配,針對(duì)不同層次的用戶,有不同推薦算法的目標(biāo)。

用戶的知識(shí)融合,一個(gè)中小型APP其實(shí)非常缺乏數(shù)據(jù),無(wú)法建模用戶偏好,我們希望能夠從外部融合一些數(shù)據(jù),來(lái)彌補(bǔ)數(shù)據(jù)不足[3][4]。

圖片

三、內(nèi)容生態(tài)

內(nèi)容生態(tài)的定義是平臺(tái)供給側(cè)繁榮程度,它是平臺(tái)的 B 面,好的內(nèi)容生態(tài)應(yīng)該能充分反映用戶的需求,而且自身應(yīng)該有比較好的生長(zhǎng)發(fā)育衰退機(jī)制,就像一片森林或者是一個(gè)社會(huì)的經(jīng)濟(jì)系統(tǒng),這也是其稱為生態(tài)的一個(gè)原因。

內(nèi)容生態(tài)非常重要,是平臺(tái)真正的護(hù)城河,很多時(shí)候平臺(tái)經(jīng)濟(jì)的護(hù)城河其實(shí)不在于C 端,更多在于 B 端。例如淘寶的服飾類、拼多多的機(jī)制供應(yīng)鏈競(jìng)爭(zhēng)、抖音很大程度上靠?jī)?yōu)質(zhì)內(nèi)容供給來(lái)搞定前期用戶。

相關(guān)的課題:

內(nèi)容生態(tài)的指標(biāo):建立調(diào)性控制生態(tài)自身的繁榮程度

計(jì)劃經(jīng)濟(jì):建立保量系統(tǒng),達(dá)到運(yùn)營(yíng)調(diào)控的目標(biāo)

部分的計(jì)劃經(jīng)濟(jì):建立創(chuàng)作者的分級(jí)成長(zhǎng)、內(nèi)容生命周期管理,利用PID算法、帶約束優(yōu)化以及流量博弈等。

平臺(tái)供給&消費(fèi)是否匹配:從用戶出發(fā)設(shè)計(jì)供需機(jī)制。理解用戶平臺(tái)內(nèi)容側(cè)的需求是什么。預(yù)估主播內(nèi)容的潛力+主播內(nèi)容質(zhì)量的建模,進(jìn)行有計(jì)劃地分發(fā)。通過(guò)預(yù)估增長(zhǎng)程度指導(dǎo)內(nèi)容生產(chǎn),我們可以知道生產(chǎn)X個(gè)某種內(nèi)容到底能讓用戶側(cè)產(chǎn)生怎樣的反應(yīng)。

圖片

四、多目標(biāo)帕累托最優(yōu)

要實(shí)現(xiàn)更加精細(xì)地優(yōu)化用戶滿意度,目標(biāo)越充足越好,我們希望用戶在所有指標(biāo)上都有增長(zhǎng),即多目標(biāo)帕累托最優(yōu),比如觀看、下單、點(diǎn)贊、評(píng)論、分享等。user_satisfactinotallow= max {click,order,interaction,....}

這個(gè)問(wèn)題很重要,因?yàn)橛脩魸M意也是平臺(tái)的終極目標(biāo)之一。只有用戶滿意,平臺(tái)才能夠存活。在缺乏大規(guī)模問(wèn)卷調(diào)查的情況下,目前很多公司采用的就是優(yōu)化多目標(biāo)滿意,一般是點(diǎn)擊率、轉(zhuǎn)化率、觀看時(shí)長(zhǎng)等指標(biāo)。

帕累托最優(yōu)[5]可能難以達(dá)到,因?yàn)橛行┠繕?biāo)是相沖的,這時(shí)的帕累托最優(yōu)是在相沖的情況下最優(yōu)的一種情況。例如下圖中紅色的線,被認(rèn)為是帕累托最優(yōu)的前沿,這條線代表已經(jīng)到達(dá)臨界值。臨界值指的是在不損害某一個(gè)指標(biāo)的情況下,是無(wú)法提升其他指標(biāo)的,這被稱為帕累托前沿。我們的目標(biāo)就是找到帕累托最優(yōu)前沿,在不同指標(biāo)間進(jìn)行 trade off。

相關(guān)課題包括:

提升多個(gè)目標(biāo)-超參數(shù)尋優(yōu)算法。

在多目標(biāo)無(wú)法共同提升情況下,如何取舍。

圖片

五、時(shí)間-長(zhǎng)期價(jià)值預(yù)估

接下來(lái)介紹建立時(shí)間維度的長(zhǎng)期價(jià)值預(yù)估。當(dāng)前的推薦系統(tǒng)比較專注于瞬時(shí)價(jià)值,缺乏對(duì)更長(zhǎng)期價(jià)值的預(yù)估,而長(zhǎng)期價(jià)值更加接近 DAU 目標(biāo)。

短期價(jià)值優(yōu)化容易出現(xiàn)很多問(wèn)題,比如標(biāo)題黨、軟色情等,導(dǎo)致平臺(tái)失敗。

相關(guān)課題包括:

優(yōu)化session的總價(jià)值,將session定義為一個(gè)用戶一次不間斷的跟APP的交互。

優(yōu)化多個(gè)場(chǎng)景之間的總價(jià)值,比如淘寶現(xiàn)在是雙列流,用戶在雙列流進(jìn)行瀏覽,但又可能點(diǎn)進(jìn)去某一個(gè)具體詳情繼續(xù)瀏覽。雙列流可能會(huì)具有多樣性,單列流則更偏向于單類目。雙列流跟單列流之間也會(huì)存在此消彼長(zhǎng)的效應(yīng),需要進(jìn)行調(diào)和。

session 總價(jià)值可以用馬爾可夫過(guò)程建模成一個(gè)多輪交互。這里引用微軟謝幸老師在微軟新聞上的一個(gè)工作[6],他把推薦系統(tǒng)稱為一個(gè)智能體,把用戶稱為環(huán)境,智能體推薦給用戶一些新聞,根據(jù)用戶是否點(diǎn)擊作為反饋來(lái)建模。

另一個(gè)是騰訊視頻的一個(gè)工作[1],通過(guò)優(yōu)化 session 價(jià)值,使 VV、GTR 等提高了兩個(gè)點(diǎn)。

圖片

六、空間-全站優(yōu)化

APP 通常有多個(gè)場(chǎng)景滿足不同需求,比如首頁(yè)猜你喜歡滿足發(fā)現(xiàn)性、相似推薦滿足對(duì)于某個(gè)點(diǎn)的深入消費(fèi)、購(gòu)物車頁(yè)面滿足搭配需求。需要聯(lián)動(dòng)所有場(chǎng)景,在典型用戶行為鏈路上進(jìn)行全局優(yōu)化。

單場(chǎng)景優(yōu)化會(huì)出現(xiàn)抵消效應(yīng),所以要對(duì)用戶的典型鏈路進(jìn)行分析。利用用戶行為鏈路信息作為建模約束可以更好地實(shí)現(xiàn)單場(chǎng)景優(yōu)化。

相關(guān)課題包括:

用戶典型鏈路分析,比如逛、比價(jià)、分享等。

多場(chǎng)景聯(lián)合建模/觀察影響-使用基于共享和博弈的強(qiáng)化學(xué)習(xí)等。

圖片

七、交互式推薦系統(tǒng)(IRS)

個(gè)性化問(wèn)答助手逐漸商用,并在未來(lái)的人類生活中被寄予厚望?;谌祟愔苯诱Z(yǔ)言交互的推薦系統(tǒng),能夠更加滿足用戶意圖,并且更加便捷。

目前有兩種 IRS 系統(tǒng),隱式對(duì)話和顯式對(duì)話。前者已經(jīng)在大廠初步展示了價(jià)值,后者隨著 chatGPT 熱度再起,但是當(dāng)前仍不成熟。

相關(guān)課題包括:

顯示的對(duì)話式推薦,GPT加推薦算法以及意圖識(shí)別等。

隱式交互式推薦-意圖生成,知識(shí)圖譜,列表式推薦(Exact-K) ,下圖所示是當(dāng)時(shí)提出的騰訊視頻的心向標(biāo)項(xiàng)目。

圖片

八、千人千模

人類的理解能力很強(qiáng),基于極少的信息描述,就能夠很好地理解一個(gè)人。在主流平臺(tái)上,單個(gè)用戶的信息、行為多達(dá)上千上萬(wàn)條。是否有可能為每一個(gè)人建立一個(gè)模型以提升準(zhǔn)確度呢?雖然我們現(xiàn)在的推薦算法就是千人千面,但其實(shí) pattern 是被大部分主流人群主導(dǎo)的,對(duì)于長(zhǎng)尾用戶表現(xiàn)得并不理想。

在排序算法中,預(yù)估精度是永恒的追求,大公司通過(guò)分類別分群建模以進(jìn)一步提升效果,如果能夠在機(jī)器負(fù)載允許情況下為每一個(gè)用戶建立一個(gè)模型,那么將會(huì)實(shí)現(xiàn)真正的千人千面。

目前相關(guān)課題包括:

如何進(jìn)行系統(tǒng)和算法的聯(lián)合設(shè)計(jì)節(jié)省資源。

如何逼近千人千模分群學(xué)習(xí),工業(yè)界其實(shí)很難給每個(gè)用戶建立模型,比如淘寶有10億的用戶,如果每個(gè)用戶建一個(gè)模型,那么機(jī)器負(fù)載消耗是巨大的。但我們可以采用一些逼近方法,比如多任務(wù)學(xué)習(xí)或Meta learning。

單個(gè)人建?;蛱嵘P偷挠洃浤芰?。主流排序算法模型+千人千模。如下圖所示,Gate 特征與 CTR 模型融合來(lái)校準(zhǔn)學(xué)習(xí)[8]。

圖片

九、當(dāng)作決策問(wèn)題的推薦算法

工業(yè)界推薦的本質(zhì)不是一個(gè)常規(guī)的回歸/分類,而是一個(gè)決策問(wèn)題。平臺(tái)通過(guò)感知用戶并決策給到用戶在不同時(shí)刻想要的東西,從而希望用戶能夠喜歡這個(gè)平臺(tái)最終停留下去。同時(shí)用戶反饋(比如點(diǎn)不點(diǎn))也是一個(gè)決策問(wèn)題,里面含有不確定性。從決策角度看,推薦不同于 CV/NLP 等問(wèn)題,更加類似于 AI。當(dāng)前的解法基本上把推薦當(dāng)作分類問(wèn)題,這是存在缺陷的。

為什么推薦是決策且不確定性問(wèn)題?

平臺(tái)給用戶推薦視頻,用戶的反饋、用戶的狀態(tài)都具有一定不確定性。所以我們將其視為決策問(wèn)題。

相關(guān)課題:

針對(duì)平臺(tái)調(diào)性的留存建模。運(yùn)營(yíng)挑選的熱門物品根本不匹配用戶興趣,但是用戶卻喜歡上了平臺(tái),比如拼多多首頁(yè)。

把推薦當(dāng)作多輪交互的MDP過(guò)程。

用戶決策僅僅是興趣匹配嗎?其實(shí)決策不僅僅是興趣匹配,還包括多樣性、精細(xì)度、時(shí)效性、用戶疲勞度等,這些都對(duì)用戶決策起到了作用。

圖片

十、OneRec-推薦融合大模型[3]

大模型和推薦的共同點(diǎn)是參數(shù)量都很大,其實(shí)在大模型問(wèn)世之前,淘寶等主流平臺(tái)的推薦模型也都達(dá)到千億參數(shù)規(guī)模。

大模型的優(yōu)勢(shì)在于深度語(yǔ)義理解和廣度世界知識(shí),它能夠根據(jù)上下文做出比較精準(zhǔn)的推斷。具備廣度世界知識(shí)是因?yàn)榇竽P蛯W(xué)習(xí)了很多不同領(lǐng)域的信息。

然而大模型也有其局限性,推薦模型是高度專有化的,大模型在單獨(dú)某個(gè)任務(wù)的精度不容易超越傳統(tǒng)模型。

大模型會(huì)不會(huì)取代推薦模型?比如 GPT 是否會(huì)取代推薦算法?

一是取決于人機(jī)交互的進(jìn)化,從應(yīng)用的角度來(lái)看,近二三十年大的互聯(lián)網(wǎng)變革都是從交互方式發(fā)生的。從 PC 時(shí)代、移動(dòng)互聯(lián)網(wǎng)時(shí)代,再到當(dāng)前的 GPT 時(shí)代,交互方式是第一生產(chǎn)力。如果 GPT 控制終端入口,那么推薦將被迫作為 GPT 的子模塊,所以整體取決于人類更喜歡的前端交互形態(tài)是什么樣的。

二是 GPT 是否會(huì)成為推薦的入口。當(dāng)大模型內(nèi)置于手機(jī)等智能終端后,消費(fèi)者的使用習(xí)慣如果一直傾向于通過(guò)提問(wèn)來(lái)獲取物料,那么推薦就有可能成為 GPT 的一個(gè)后端。但如果消費(fèi)者的習(xí)慣沒(méi)有改,還是喜歡刷淘寶、抖音,那么 GPT 就不會(huì)取代傳統(tǒng)推薦系統(tǒng)。

三是推薦算法不會(huì)消失,因?yàn)橥扑]算法的準(zhǔn)確度非常高,最差的情況下它也會(huì)作為一種 backend 內(nèi)嵌于大模型當(dāng)中。

后續(xù)的演進(jìn)方向:

交互性。chatGPT類催生新的業(yè)務(wù)場(chǎng)景,比如基于問(wèn)答的推薦場(chǎng)景,類似于淘寶問(wèn)答中的答案生成和推薦。

深度語(yǔ)義理解,大模型對(duì)內(nèi)容理解能力的提升。當(dāng)前推薦建模依賴大量離散特征以及統(tǒng)計(jì)后驗(yàn)特征,如果未來(lái)能通過(guò)大模型的內(nèi)容理解能力,直接匹配用戶理解,這樣端到端的新范式會(huì)重塑推薦系統(tǒng)的發(fā)展線路。

廣度知識(shí),改善長(zhǎng)尾。

生成能力。需要得到 chatGPT 類模型,當(dāng)前難度較大。下圖中的 case 就是對(duì)比一些大模型和原來(lái) Facebook 的 DLIM 模型,可以看到大模型的參數(shù)集中在 FC 層,而推薦集中在 embedding 層,F(xiàn)C 層模型有更好的語(yǔ)義理解,集中在 embedding 層模型就有更好的記憶。

基于以上的判斷,我們并沒(méi)有把大模型和推薦系統(tǒng)直接結(jié)合起來(lái),而是先開(kāi)發(fā)了OneRec 項(xiàng)目,試圖融入各種各樣的更廣闊的業(yè)務(wù)知識(shí),從而拿到業(yè)務(wù)效果。在我們可以靈活有效地進(jìn)行多信號(hào)信息融合基礎(chǔ)上,探索統(tǒng)一的大模型之路。

圖片

從 2019 年我們開(kāi)始關(guān)注多種信息的萃取融合,提出了 OneRec 算法[3],希望通過(guò)平臺(tái)或外部各種各樣的信息來(lái)進(jìn)行知識(shí)集成,打破數(shù)據(jù)孤島,極大擴(kuò)充推薦的“Extra World Knowledge”。我們認(rèn)為這是當(dāng)下非常可行的推薦大模型演進(jìn)方向。

已實(shí)踐的算法包括行為數(shù)據(jù)、內(nèi)容描述、社交信息、知識(shí)圖譜等。在 OneRec,每種信息和整體算法的集成是可插拔的,一方面方便大家在自己的業(yè)務(wù)數(shù)據(jù)下靈活組合各種信息,另一方面方便開(kāi)源共建,大家集成自己的各種算法。相關(guān)代碼和論文已經(jīng)開(kāi)源,項(xiàng)目地址:https://github.com/xuanjixiao/onerec。

圖片

十一、Q&A

Q1:在用戶增長(zhǎng)部分提到 42 秒,這里分析很細(xì)致。請(qǐng)問(wèn)這個(gè) 42 秒的來(lái)源是什么?

A1:對(duì)于 high value action 可以選 41 或 40 秒。42 秒是經(jīng)過(guò)統(tǒng)計(jì)分析和模型預(yù)估最終得出的結(jié)果。

大于 42 秒的用戶跟小于 42 秒的用戶的長(zhǎng)期價(jià)值差別非常大。比如大于 40 秒的用戶大概平均每年能買 3 單,如果小于 40 秒的用戶平均能買 1 單,那么 DIFF 就是兩單。再來(lái)看為什么不選 40 秒,大于 40 秒的用戶可能平均每年只買兩單,小于 42 秒的用戶可能每年只買 1 單,他們的 DIFF 是 1 單。我們認(rèn)為 42 秒更能區(qū)分用戶,他們的 deep 更大,這就是我們選 42 秒的原因。

Q2:內(nèi)容生態(tài)部分提到計(jì)劃經(jīng)濟(jì)會(huì)用到 PID 控制,它的約束和優(yōu)化目標(biāo)是什么?

A2:對(duì)于 PID 控制算法,舉個(gè)例子,比如我們現(xiàn)在引入了 1 萬(wàn)個(gè)網(wǎng)紅,是跟 MCN 機(jī)構(gòu)簽約的,假設(shè)我是其他平臺(tái)競(jìng)爭(zhēng)方,我們從那邊挖過(guò)來(lái) 1 萬(wàn)個(gè)網(wǎng)紅,那么每天要給他們 1 萬(wàn)個(gè) view,這是我們跟他們協(xié)議的一部分。

要達(dá)到這 1 萬(wàn) view 量,就由 PID 算法來(lái)保證的。比如可能一小時(shí)給他 1 萬(wàn) view,按照每分鐘給予數(shù)量相同的 view。

帶約束優(yōu)化則是更進(jìn)階的算法,在做計(jì)劃經(jīng)濟(jì)的時(shí)候我們經(jīng)常會(huì)對(duì)原來(lái)的市場(chǎng)經(jīng)濟(jì)算法的自然分發(fā)造成效果的損失。那么如何調(diào)節(jié)兩個(gè) PID 呢?

我們可以將其轉(zhuǎn)換為一個(gè)帶約束的優(yōu)化問(wèn)題,描述為最大化 C 端的收益,比如說(shuō) Max CTR(最大化點(diǎn)擊率)??梢蕴砑右粋€(gè)超參數(shù) Pij,Pij 代表對(duì)于這個(gè)用戶這次要不要推薦這個(gè)短視頻或直播,I 代表這個(gè)用戶,j 代表直播間。比如在當(dāng)下要不要推薦這個(gè)直播,我們自然流量分發(fā)的目標(biāo)是 CTR,約束就是比如每小時(shí)給的量不要大于 12000,也不要少于 8000,這樣將其變成一個(gè)帶約束的固化問(wèn)題。Max CTR*Pij,subject 這個(gè)約束指的是,我們給的量,比如 Pij sum 要大于 8000,小于等于 12000,這樣可能是一個(gè)更好的描述形態(tài),但這個(gè)問(wèn)題可能是非凸的。

Q3:大模型和推薦系統(tǒng)的主要區(qū)別是什么?

A3:推薦的最大優(yōu)勢(shì)是在單個(gè)問(wèn)題上,比如 CTR 建模上,推薦系統(tǒng)精度非常高。但大模型做不到高精度。

大模型的優(yōu)勢(shì)是有深度的語(yǔ)義理解,還有廣度的世界知識(shí)。

猜你喜歡