伊人大杳蕉2_第一福利精品500在线导航_亚洲综合在人线播放器_最新国产免费AV片在线观看_97se亚洲综合自在线尤物

您現(xiàn)在的位置:?首頁(yè)>> 動(dòng)態(tài) >> 正文

淘寶直播流量與供給端到端聯(lián)動(dòng)探索

來(lái)源: DataFunTalk

導(dǎo)讀 淘寶直播以輕松友好的內(nèi)容導(dǎo)購(gòu)形式,相對(duì)高性價(jià)比的購(gòu)物屬性,滿足了用戶在休閑時(shí)間進(jìn)一步碎片化的情況下,對(duì)高節(jié)奏生活、社交屬性和碎片化娛樂(lè)場(chǎng)景的需求。用戶可以方便地關(guān)注自己喜歡的店鋪、達(dá)人和品牌,同時(shí)回歸生活消費(fèi)。隨著用戶滲透率的提升,淘寶直播對(duì)整個(gè)核心電商業(yè)務(wù)的貢獻(xiàn)也越來(lái)越大。目前,淘寶直播已吸引了大量主播入駐并開(kāi)播,成為淘系生態(tài)圈中不可或缺的一環(huán)。

全文目錄:


【資料圖】

1. 淘寶直播體系化調(diào)控能力演進(jìn)

2. 實(shí)時(shí)動(dòng)態(tài)多元價(jià)值路徑人群建模

3. 流量調(diào)控與共給端到端聯(lián)動(dòng)

4. Q&A

分享嘉賓| 李偉民(為明) 阿里巴巴大淘寶直播技術(shù) 算法專家

編輯整理| 王鑫民 同濟(jì)大學(xué)

出品社區(qū)|DataFun

01

淘寶直播體系化調(diào)控能力演進(jìn)

目前淘寶直播推薦算法工作階段性重心轉(zhuǎn)向發(fā)現(xiàn)性和實(shí)時(shí)性。從C端用戶的視角出發(fā),重新定義人貨場(chǎng)的匹配推薦,以提高用戶的真實(shí)體感。而對(duì)于流量調(diào)控算法而言,為了鼓勵(lì)主播開(kāi)播、加速主播成長(zhǎng)、優(yōu)化主播生態(tài),流量扶持或流量激勵(lì)是重要的方式組成,更多的是從B端視角即主播商家側(cè)出發(fā),提供業(yè)務(wù)運(yùn)營(yíng)可控途徑,扶持激勵(lì)主播成長(zhǎng),促進(jìn)生態(tài)平衡繁榮。

圍繞直播主播生態(tài)與主播成長(zhǎng)大目標(biāo),直播流量調(diào)控系統(tǒng)承擔(dān)了多維度的業(yè)務(wù)訴求,構(gòu)建了較為完善流量調(diào)控機(jī)制體系。比如產(chǎn)品功能上的分享任務(wù)、排位賽,運(yùn)營(yíng)杠桿下的領(lǐng)航計(jì)劃、營(yíng)銷活動(dòng),產(chǎn)算機(jī)制內(nèi)的新主播冷啟、實(shí)時(shí)賽馬、潛力主播、場(chǎng)觀保底等等。

與商品、圖文、短視頻等業(yè)務(wù)場(chǎng)景相比較,直播場(chǎng)景具有較大的差異性,無(wú)論是供給的時(shí)效性,其他場(chǎng)景內(nèi)容供給是全周期的,即生產(chǎn)出來(lái)后可以時(shí)時(shí)刻刻作為內(nèi)容池子去分發(fā),而直播不一樣,其生命周期僅存在于直播間從創(chuàng)建到關(guān)閉這段時(shí)間,即只有主播開(kāi)播期間才能生產(chǎn)內(nèi)容并進(jìn)行流量分發(fā)或調(diào)控,因此有較強(qiáng)的實(shí)效性。另外內(nèi)容的動(dòng)態(tài)變化性,其他場(chǎng)景內(nèi)容是離線生產(chǎn)的,生產(chǎn)后各種屬性信息基本就確定下來(lái)了,而直播的內(nèi)容是實(shí)時(shí)生產(chǎn)的,是流式的內(nèi)容,很難知道下一刻的直播內(nèi)容是什么,主播上架商品、商品秒殺、評(píng)論抽獎(jiǎng)、紅包雨、粉絲互動(dòng)等一系列直播間動(dòng)作或狀態(tài)都隨時(shí)會(huì)發(fā)生或變化,會(huì)影響到直播間的氛圍或直播間對(duì)用戶的吸引力或承接能力,無(wú)疑會(huì)對(duì)流量調(diào)控工作提出了更高的挑戰(zhàn)要求。

進(jìn)一步,從主播的生命周期價(jià)值來(lái)看,從LTV的視角出發(fā),其價(jià)值在時(shí)刻發(fā)生變化,無(wú)論在每場(chǎng)內(nèi)還是不同場(chǎng)間。無(wú)論在技術(shù)還是業(yè)務(wù)上,流量調(diào)控在直播領(lǐng)域存在很多挑戰(zhàn)和問(wèn)題。除了一些調(diào)控原始的問(wèn)題,在預(yù)估主播開(kāi)播時(shí)長(zhǎng)、保持流量平穩(wěn)性、提升推薦算法和調(diào)控算法效率等方面都需要持續(xù)優(yōu)化,以實(shí)現(xiàn)用戶找到符合興趣的直播間,實(shí)現(xiàn)用戶側(cè)價(jià)值、主播匹配到高互動(dòng)意愿和高轉(zhuǎn)化意愿的用戶以調(diào)動(dòng)主播積極性的目標(biāo),實(shí)現(xiàn)主播側(cè)價(jià)值,進(jìn)而最終實(shí)現(xiàn)平臺(tái)價(jià)值。

目前,淘寶直播涉及多個(gè)核心場(chǎng)域,每個(gè)場(chǎng)域都有不同的業(yè)務(wù)邏輯和產(chǎn)品認(rèn)知。圍繞主播生態(tài)和主播成長(zhǎng)兩大目標(biāo),我們希望建立一個(gè)統(tǒng)一的流量平臺(tái)管理能力,協(xié)調(diào)差異化的傳控訴求的同時(shí),緩解業(yè)務(wù)需求與分發(fā)協(xié)調(diào)的困難。同時(shí),希望支持主播、貨品、用戶等多維度的調(diào)控訴求,構(gòu)建一個(gè)更實(shí)時(shí)化、精細(xì)化、業(yè)務(wù)多維度可控的體系化調(diào)控能力,服務(wù)整個(gè)直播生態(tài)的健康發(fā)展和流量規(guī)劃可控。

目前,淘寶直播已經(jīng)迭代了一套相對(duì)完善的直播調(diào)控流量中控系統(tǒng),以滿足多維度的調(diào)控業(yè)務(wù)訴求。從技術(shù)和架構(gòu)的角度來(lái)看,整個(gè)系統(tǒng)可以從三個(gè)視角進(jìn)行討論,即調(diào)控策略維度、流量調(diào)控目標(biāo)維度和調(diào)控場(chǎng)景維度。

首先,調(diào)控策略維度。我們構(gòu)建了包括主播場(chǎng)次維度、貨品維度、營(yíng)銷活動(dòng)維度、用戶PV維度等多方面的調(diào)控能力。每個(gè)部分下又涵蓋了不同的調(diào)控細(xì)化能力。能夠覆蓋像主播場(chǎng)次的宏觀多類型保量,增量調(diào)控,分時(shí)段精準(zhǔn)調(diào)控等,還有像搭建了以品為核心的商品調(diào)控鏈路,強(qiáng)化貨品供給端到端聯(lián)動(dòng)流量分發(fā)的能力。基于貨品的人群圈選+商品維度流量調(diào)控,結(jié)合看點(diǎn)的實(shí)時(shí)消息做到在主播講解品的瞬間起量,分鐘級(jí)精準(zhǔn)快速保量。營(yíng)銷玩法聯(lián)動(dòng)流量機(jī)制,用戶pv粒度精準(zhǔn)控制等等。

其次,調(diào)控目標(biāo)維度。類似于我們向主播宣導(dǎo)時(shí)長(zhǎng)和成交是流量上升的重要考核因素,對(duì)于調(diào)控流量,不同的調(diào)控業(yè)務(wù)類型,不同類型的人設(shè)主播,不同場(chǎng)次預(yù)期目標(biāo)安排對(duì)于調(diào)控的業(yè)務(wù)訴求也是不同的,比如針對(duì)內(nèi)容型主播或者新咖入淘,對(duì)于調(diào)控流量是否能帶來(lái)更高的粉絲轉(zhuǎn)化和留存有著更強(qiáng)的需求,針對(duì)帶貨主播大場(chǎng)成交轉(zhuǎn)化無(wú)疑是更加重要的目標(biāo)等,那么站在調(diào)控目標(biāo)角度,如何去強(qiáng)化明確激勵(lì)流量的ROI屬性:時(shí)長(zhǎng)、轉(zhuǎn)粉、轉(zhuǎn)化、用戶拉新等,而不僅僅是pv完成率,這是傳統(tǒng)調(diào)控所難以達(dá)到的。那么針對(duì)調(diào)控架構(gòu)的設(shè)計(jì),我們也希望擁有這種可以多元目標(biāo)轉(zhuǎn)變的定制化能力。

最后,調(diào)控場(chǎng)景維度。淘寶直播目前覆蓋核心場(chǎng)景眾多,緩解直播流量控制的確定性業(yè)務(wù)訴求與跨域各分發(fā)場(chǎng)景在流量調(diào)控上的協(xié)同困難,中控系統(tǒng)構(gòu)建了多場(chǎng)景的動(dòng)態(tài)實(shí)時(shí)協(xié)調(diào)能力,結(jié)合主播歷史渠道流量分布,場(chǎng)景流量規(guī)模,是否新人主播,是否預(yù)設(shè)pvr信息等進(jìn)行分渠道流量預(yù)規(guī)劃,調(diào)控過(guò)程中,結(jié)合調(diào)控現(xiàn)狀(當(dāng)前目標(biāo),流量進(jìn)度,計(jì)算誤差,時(shí)間信息等),進(jìn)行各場(chǎng)景實(shí)時(shí)pvr動(dòng)態(tài)調(diào)整規(guī)劃,結(jié)合調(diào)控實(shí)時(shí)反饋,緩解調(diào)控難度保障完成率,避免流量過(guò)度集中到某個(gè)特定場(chǎng)景,同時(shí)提升流量效率。中控統(tǒng)一架構(gòu)下的差異化各場(chǎng)景調(diào)控人群生成,保證調(diào)控穩(wěn)定性的同時(shí),提升流量效率,兼顧平穩(wěn)性與效率。

在整個(gè)架構(gòu)下,算法也是進(jìn)行了多維度多切口的迭代優(yōu)化,例如營(yíng)銷活動(dòng)聯(lián)動(dòng)流量調(diào)控,淘寶直播動(dòng)態(tài)精準(zhǔn)端到端人群構(gòu)建,直播流量多價(jià)值路徑建模,如何優(yōu)雅的進(jìn)行貨找人/人找人多粒度人群匹配,流量池下的直播網(wǎng)絡(luò)流建模,調(diào)控特色的排序體系化建設(shè)等等。

那么縱觀整個(gè)直播流量調(diào)控體系,圍繞眾多業(yè)務(wù)訴求,算法側(cè)我們可以整體抽象出來(lái)一些核心問(wèn)題:

1.眾多差異化的調(diào)控訴求,構(gòu)建體系化的解決方案

2.流量控制的確定性業(yè)務(wù)訴求與各分發(fā)場(chǎng)景在流量調(diào)控上的協(xié)同困難

3.流量調(diào)控任務(wù)的完成率與平穩(wěn)性保證

4.持續(xù)提升調(diào)控流量的效率價(jià)值

5.直播端到端供給如何聯(lián)動(dòng)分發(fā)

6.調(diào)控激勵(lì)流量是否多元ROI屬性可定制

02

實(shí)驗(yàn)實(shí)時(shí)動(dòng)態(tài)多元價(jià)值路徑人群建模

對(duì)于激勵(lì)流量調(diào)控而言,各差異化類型的調(diào)控計(jì)劃本質(zhì)均是在已有推薦系統(tǒng)的基礎(chǔ)上,調(diào)控算法通過(guò)干預(yù)公域推薦流量的分發(fā)來(lái)給到主播額外的推薦流量。在面向B端視角的情況下,我們可以從另一個(gè)視角去詮釋推薦和調(diào)控的差異性,推薦重視給特定用戶推薦更加契合的候選主播列表,而調(diào)控側(cè)重給調(diào)控目標(biāo)主播推薦更加契合的候選用戶列表。舉一個(gè)更加通俗的例子,從推薦角度來(lái)看,假設(shè)全用戶召回的情況下,對(duì)于用戶A,興趣相關(guān)性較高的主播B是一個(gè)較好的優(yōu)質(zhì)候選待推薦主播。而從調(diào)控角度來(lái)看,對(duì)于B主播的調(diào)控計(jì)劃,用戶A不一定在最match當(dāng)前主播的高調(diào)控目標(biāo)價(jià)值用戶集合中。

那么針對(duì)上述算法抽象核心問(wèn)題和我們對(duì)調(diào)控的另一個(gè)視角的闡述,一個(gè)較好的可通用化的切入點(diǎn)就是如何更加合理有效的構(gòu)建調(diào)控人群方案,那么我們可以一起討論如何創(chuàng)新性的將主播調(diào)控人群圈選問(wèn)題轉(zhuǎn)化為給主播實(shí)時(shí)推薦直播在線用戶問(wèn)題,引入面向主播側(cè)的算法實(shí)時(shí)個(gè)性化推薦能力,并對(duì)整個(gè)系統(tǒng)流程架構(gòu)進(jìn)行簡(jiǎn)介,一方面兼顧調(diào)控平穩(wěn)性與調(diào)控完成率,持續(xù)提升調(diào)控流量效率價(jià)值,另一方面,能夠端到端的聯(lián)動(dòng)直播供給與分發(fā),更深入的,我們希望調(diào)控人群架構(gòu)的設(shè)計(jì)能夠強(qiáng)化明確激勵(lì)流量的ROI屬性等。

直播業(yè)務(wù)中,傳統(tǒng)的圈選人群通常是業(yè)務(wù)和算法團(tuán)隊(duì)根據(jù)業(yè)務(wù)經(jīng)驗(yàn)、調(diào)控計(jì)劃規(guī)模、主播人設(shè)和貨品招商情況進(jìn)行定向圈選的。然而,傳統(tǒng)的圈選方式通常會(huì)存在以下幾個(gè)潛在問(wèn)題:

1. 離線調(diào)控人群很難在效率和完成率之間做到較好的平衡,且調(diào)控過(guò)程平穩(wěn)性有待加強(qiáng):

這是因?yàn)橹辈ラg的實(shí)時(shí)在線用戶相對(duì)于整個(gè)用戶群體來(lái)說(shuō)是一個(gè)相對(duì)較小的群體。為了保證調(diào)控任務(wù)的可執(zhí)行性和完成率,傳統(tǒng)人群的圈選量級(jí)通常會(huì)達(dá)到上千萬(wàn)規(guī)模,不僅規(guī)模巨大,而且人群內(nèi)部的用戶質(zhì)量良莠不齊,因此導(dǎo)致難以保證推薦效率。如果要提高推薦效率,將推薦人群圈選得較小,那么任務(wù)的完成率就會(huì)受到影響,難以實(shí)現(xiàn)平穩(wěn)調(diào)控。此外,離線人群的用戶到達(dá)分布是不穩(wěn)定的,容易出現(xiàn)抖動(dòng)或毛刺等現(xiàn)象。

2. 離線調(diào)控人群圈選,難以做到“千主播千人群”以及根據(jù)主播和用戶的實(shí)時(shí)行為動(dòng)態(tài)調(diào)整人群。

通常,圈選規(guī)則是根據(jù)歷史的業(yè)務(wù)經(jīng)驗(yàn)和主播的歷史表現(xiàn)行為進(jìn)行制定的,這導(dǎo)致了無(wú)法根據(jù)用戶和主播的實(shí)時(shí)行為狀態(tài)進(jìn)行動(dòng)態(tài)調(diào)整,只能進(jìn)行一些簡(jiǎn)單的人工增減活動(dòng)等。在這種情況下,更難以實(shí)現(xiàn)實(shí)時(shí)的千主播千人群。

3. 如何去強(qiáng)化明確激勵(lì)流量的ROI屬性:時(shí)長(zhǎng)、轉(zhuǎn)粉、轉(zhuǎn)化、用戶拉新等,而不僅僅是pv完成率。

對(duì)于推薦系統(tǒng)而言,階段性時(shí)間內(nèi)推薦系統(tǒng)輸出的流量或?qū)蚴敲鞔_的。但對(duì)于調(diào)控計(jì)劃來(lái)說(shuō),不同的調(diào)控計(jì)劃、類型和主播等都可以具有更加明確的偏向?qū)傩?,調(diào)控人群的多元屬性可明確定制化是我們的架構(gòu)希望能夠達(dá)到的。

針對(duì)上述問(wèn)題,在流量調(diào)控的人群方案上,我們經(jīng)歷了三個(gè)階段的探索:

第一階段, 離線人群圈定,屬于傳統(tǒng)調(diào)控人群圈定的方案。在這個(gè)過(guò)程中,我們和業(yè)務(wù)方合作積累一定的直播典型人群,能夠滿足不同類型的流量調(diào)控訴求,如不同類型的大咖入淘,領(lǐng)航計(jì)劃等。 第二階段, 離線人群圈定結(jié)合動(dòng)態(tài)人群擴(kuò)展方案。在第一階段的基礎(chǔ)上,我們搭建動(dòng)態(tài)人群擴(kuò)展場(chǎng)景,聯(lián)動(dòng)調(diào)控系統(tǒng),構(gòu)建基于調(diào)控誤差、調(diào)控目標(biāo)規(guī)模的動(dòng)態(tài)人群包擴(kuò)展功能。對(duì)整個(gè)人群生成寫(xiě)入邏輯進(jìn)行了全鏈路梳理優(yōu)化,線上基本保證10min內(nèi)更新完畢千萬(wàn)級(jí)疊加人群。 在這種機(jī)制保障下,一方面我們可以在離線的時(shí)候?qū)θ巳哼M(jìn)行更精細(xì)化的邏輯控制生成,而不用擔(dān)心由于人群規(guī)模問(wèn)題導(dǎo)致線上計(jì)劃的不可執(zhí)行或者流量后續(xù)乏力,另一方面調(diào)控的整體完成率得到了進(jìn)一步的提升,避免了人工預(yù)估調(diào)整的繁瑣工作,同時(shí)平均調(diào)控完成率進(jìn)一步提升。 第三階段, 端到端直播間在線用戶精準(zhǔn)動(dòng)態(tài)人群調(diào)控方案。結(jié)合前兩階段的方案積累和優(yōu)勢(shì),進(jìn)一步創(chuàng)新性的將主播人群圈選問(wèn)題轉(zhuǎn)化為給主播實(shí)時(shí)推薦用戶問(wèn)題,引入主播側(cè)算法實(shí)時(shí)個(gè)性化推薦能力。

整體的方案結(jié)構(gòu)如上圖,重點(diǎn)在于如何將主播調(diào)控人群?jiǎn)栴}轉(zhuǎn)化為給主播實(shí)時(shí)推薦直播在線用戶,并引入個(gè)性化推薦能力。模型造方面需要解決主播視角下推薦系統(tǒng)面臨的負(fù)載問(wèn)題,例如,對(duì)于一個(gè)主播,候選用戶量級(jí)比用戶視角推薦主播的候選量級(jí)明顯大很多,這對(duì)于任何推薦系統(tǒng)來(lái)說(shuō)都是很高的負(fù)載。而在線調(diào)控方面需要兼顧用戶規(guī)模和調(diào)控精準(zhǔn)性,同時(shí)能夠兼顧主播人群的泛化性能力。

人群模型的整體構(gòu)造分為兩部分:離線大模型和線上實(shí)時(shí)化模型。離線大模型容納了大量多元異構(gòu)行為信息,線上實(shí)時(shí)化模型則采用了一些創(chuàng)新性優(yōu)化,如 attention算力下沉等,并引入人群聚類算法可以很好地在調(diào)控精度和計(jì)算負(fù)載之間做出權(quán)衡。在實(shí)時(shí)在線用戶的底池中,所有用戶都是對(duì)直播間實(shí)時(shí)在線的,保證推薦的精準(zhǔn)度。此外,還引入了針對(duì)人群規(guī)模的個(gè)性化預(yù)估和實(shí)時(shí)的誤差修正,以及基于人群的曝光過(guò)濾和子人群的失效時(shí)間預(yù)估,比較自然的將推薦系統(tǒng)的能力遷移過(guò)來(lái),提高主播側(cè)的調(diào)控計(jì)劃的效率和pv價(jià)值。

首先介紹人群模型部分。離線大模型和線上實(shí)時(shí)化模型。第一個(gè)是以雙塔為基準(zhǔn)的在線人群推薦模型,主要是快速實(shí)時(shí)地進(jìn)行人群的推薦;另一個(gè)是離線的大模型,引入更多更復(fù)雜的多元異構(gòu)信息,從而進(jìn)行更加全面的用戶信息刻畫(huà)。

整體而言,人群模型主要在以下幾個(gè)方向進(jìn)行了優(yōu)化:

1.直播自序列表征能力的增強(qiáng)

2.直播用戶商品心智刻畫(huà)

3.多元異構(gòu)興趣建模及融合

4.模型算力與精度共同提升

關(guān)于直播序列信息表征方面。探索挖掘用戶行為信息,我們可以發(fā)現(xiàn),用戶關(guān)于直播領(lǐng)域的興趣覆蓋往往較少,拉取較長(zhǎng)時(shí)間跨度后興趣主播覆蓋量并沒(méi)有得到有效的提升。故直接構(gòu)建直播長(zhǎng)期序列會(huì)使得整體興趣會(huì)偏向于用戶的較久遠(yuǎn)的直播興趣,且信息增益沒(méi)有得到明顯提升,那么如何就直播自序列的節(jié)點(diǎn)表征信息進(jìn)行增強(qiáng)則顯得較為重要。

直播自序列擴(kuò)展建模這方面我們進(jìn)行了一些相關(guān)探索嘗試,首先是關(guān)于自行為序列節(jié)點(diǎn)的信息擴(kuò)展,可靠興趣節(jié)點(diǎn)在a2a(主播to主播)數(shù)據(jù)中按帶截?cái)鄼?quán)重search出每個(gè)key對(duì)應(yīng)的權(quán)重topN的新account list,保證每個(gè)擴(kuò)展主播都和源節(jié)點(diǎn)主播具有著高度的相關(guān)性,隨后多個(gè)新擴(kuò)展主播list按照行為時(shí)間和a2a關(guān)系權(quán)重聚合形成該用戶的transfer直播序列,transfer直播序列擴(kuò)展提供了一種快捷高效的序列信息擴(kuò)展方式,再此之外,我們也建模了如何進(jìn)一步提升直播序列本身的表征能力的同時(shí)把點(diǎn)邊關(guān)系信息刻畫(huà)也融入進(jìn)來(lái),把用戶行為序列向網(wǎng)狀化的擴(kuò)展,以此來(lái)反應(yīng)用戶層級(jí)興趣。

如下圖所示,類似ripple net網(wǎng)絡(luò)的信息聚合方式,通過(guò)異構(gòu)行為節(jié)點(diǎn)的自然聚合,使得模型表達(dá)能力的進(jìn)一步提升,行為節(jié)點(diǎn)間relation的刻畫(huà),點(diǎn)和點(diǎn)之間的鏈接不僅增強(qiáng)了對(duì)于點(diǎn)本身的刻畫(huà),而且?guī)?lái)可解釋的關(guān)系推薦。

關(guān)于直播用戶的商品心智。通常離不開(kāi)“人,貨,場(chǎng)”,三種要素的刻畫(huà),而對(duì)于手淘,用戶一般具有體很強(qiáng)的商品心智。直播作為手淘中的一種重要內(nèi)容供給,在推薦系統(tǒng)構(gòu)建的時(shí)候也需要重視用戶的商品心智,重視品在推薦中的重要性,同時(shí)通過(guò)深度挖掘用戶在商品域的不同時(shí)期的興趣及興趣隨時(shí)間的變化情況并泛化到直播域的興趣表達(dá),可以較好的提升直播低活,零活人群的效率指標(biāo)以及推薦準(zhǔn)確性。

具體來(lái)說(shuō),商品興趣轉(zhuǎn)移擴(kuò)展建模,我們通過(guò)嚴(yán)口徑下item2account數(shù)據(jù)構(gòu)建,將用戶在商品域興趣隨時(shí)間的變化情況泛化到直播域興趣表達(dá),找到用戶可能潛在的興趣主播。超長(zhǎng)商品序列分時(shí)段建模,引入超長(zhǎng)全域商品序列及LSH等輕量級(jí)attention建模方式,通過(guò)刻畫(huà)用戶長(zhǎng)期興趣及興趣演變,尤其是對(duì)直播低活零活用戶,超長(zhǎng)商品域序列的引入對(duì)該部分用戶興趣泛化起到了比較重要的作用。

主播實(shí)時(shí)講解類目檢索建模,一般而言target attention 中相關(guān)性較低兩個(gè)實(shí)體的attention的加權(quán)系數(shù)往往很低,通過(guò)超長(zhǎng)序列結(jié)合類目過(guò)濾的方式能夠比較好的完整聚合當(dāng)前candidate相關(guān)性較高的動(dòng)態(tài)激活的用戶興趣序列,對(duì)于直播業(yè)務(wù)而言,商品域超長(zhǎng)序列如何通過(guò)合理有效的方式關(guān)于直播candidate進(jìn)行檢索是需要探索的問(wèn)題。最后我們采用主播類目作為使得檢索序列相關(guān)性得到提升。雖然用戶對(duì)于主播一跳行為通常受到已有認(rèn)知的影響,但是更加精準(zhǔn)的二跳信息匹配,預(yù)期能夠更好的留住用戶,進(jìn)而觸達(dá)用戶的購(gòu)買需求。

關(guān)于融合多元異構(gòu)信息的建模,如上所述我們對(duì)直播用戶商品心智進(jìn)行了較為全面的刻畫(huà),基于此我們進(jìn)一步思考,如何能夠更加全面合理的建模用戶的全域興趣,手淘用戶在其他域上通常有著一定豐富度的興趣覆蓋,如商品,短視頻等,能夠合理全面的刻畫(huà)商品域,短視頻域的用戶興趣,可以較好的泛化到直播域可能的潛在興趣,此最后有了用戶在各個(gè)領(lǐng)域的興趣表征之后,如何進(jìn)行合理化的整合和表達(dá)也則顯得十分重要。

傳統(tǒng)模型架構(gòu)中關(guān)于直播域seq與商品域seq等序列的應(yīng)用方式通常為target attention后concat進(jìn)入mlp的方式,這里探索如何進(jìn)一步挖掘其他非直播域行為序列中的信息,之前的seq利用的方式本質(zhì)上是通過(guò)seq生成candidate的一個(gè)embedding表達(dá),而其他域的seq所生成的直播的embedding表達(dá)不一定完全合適直播域建模,根據(jù)之前pvr數(shù)據(jù)反饋來(lái)看有傾向于熱品等的情況。我們通過(guò)建模多域異構(gòu)興趣匹配問(wèn)題,不單單生產(chǎn)target的embedding表達(dá),而是進(jìn)一步挖掘比如短視頻域上哪些行為的組合表達(dá)和當(dāng)前的target有著更高的匹配程度,從而探索他域異構(gòu)序列到直播域興趣的泛化方式。

對(duì)于直播業(yè)務(wù),如引入短視頻序列,商品序列等他域異構(gòu)序列,除了進(jìn)行target attention以外,再引入序列興趣匹配問(wèn)題建模,通過(guò)利用attention過(guò)程中產(chǎn)生的相關(guān)性向量進(jìn)行匹配性特征抽取,基礎(chǔ)模型該過(guò)程通過(guò)一個(gè)兩層的cnn進(jìn)行,獲取如何的組合方式與當(dāng)前的target具有更好的匹配性,而不是僅僅獲取一個(gè)target的embedding表達(dá),最終得到不同域的用戶興趣匹配和target attention表征組,然后接入全聯(lián)接的底層,使得用戶他域異構(gòu)序列興趣能夠更好泛化到直播域來(lái)。此外值得一提的是,商品序列,短視頻序列等進(jìn)行按照序列異構(gòu)序列匹配建模實(shí)驗(yàn),均帶來(lái)了auc的提升,而直播序列本身進(jìn)行序列匹配建模后auc持平不變,這說(shuō)明了對(duì)于自身序列而言,target attention本身已經(jīng)是一種較為友好的建模方式。

關(guān)于多域活躍度影響下的興趣融合,有了各個(gè)domain下的用戶直播興趣表達(dá),進(jìn)一步研究如何更好的去整合多域異構(gòu)興趣信息,特征工程中我們構(gòu)建了一部分活躍度相關(guān)的特征表達(dá),然而該部分特征對(duì)個(gè)性化推薦的影響其實(shí)而言相對(duì)較小,更加合理化的應(yīng)用該部分特征,同時(shí)更好的整合用戶多域異構(gòu)興趣。

這里我們?cè)谠械幕钴S度表征的基礎(chǔ)上,豐富了用戶關(guān)于不同域的活躍情況,近期在直播,短視頻,商品等的偏好情況,如果能夠比較合理的高效進(jìn)行多域興趣間的交互和融,借鑒DCNv2的類似思想則是一個(gè)潛在可行的解決方案,把輸入映射到低維空間,再映射回來(lái),在多個(gè)子空間里學(xué)習(xí)異構(gòu)興趣及domain活躍度的多階交叉,既控制了復(fù)雜度的同時(shí)較好的完成了多域興趣的交互融合,模型在現(xiàn)有大模型的基礎(chǔ)上加入異構(gòu)興趣交互融合網(wǎng)絡(luò)模塊,模塊的輸入為多域異構(gòu)序列不同域的興趣匹配和target attention表征組以及用戶關(guān)于各域近期的活躍度信息,向上通過(guò)一個(gè)三層的DCNv2交叉網(wǎng)絡(luò),每層的expert和映射空間維度逐漸降低,進(jìn)行顯示的活躍度信息,異構(gòu)興趣信息交互。

關(guān)于模型算力與精度共同提升。為了緩解直播用戶規(guī)模群體與調(diào)控模型精準(zhǔn)的性訴求矛盾,兼顧主播人群泛化性能,對(duì)于實(shí)時(shí)在線模型,我們?cè)陔p塔的基礎(chǔ)上,拆解計(jì)算圖為原有雙塔部分和基于path 分解形成的行為主播到關(guān)聯(lián)主播的分?jǐn)?shù)融合部分,繼續(xù)擴(kuò)展i2a等多種path,線下共同訓(xùn)練,線上進(jìn)行計(jì)算圖拆解,path 部分通過(guò)查表完成,用這種方式可以去逼近和下沉target attention的性能指標(biāo)。

直播人群聚類部分。人群推薦模型的建立讓我們擁有了對(duì)每個(gè)主播去選擇用戶的能力,而維護(hù)在直播間內(nèi)所有實(shí)時(shí)在線的用戶數(shù)據(jù)底表表,作為調(diào)控人群召回底表,這樣保障了我們的調(diào)控人群底池,一方面底池最大規(guī)模即為直播間在線實(shí)時(shí)用戶量級(jí),另一方面所有進(jìn)入底池的用戶均為直播實(shí)時(shí)在線用戶。

進(jìn)一步,在此基礎(chǔ)上引入人群聚類算法建模,使得我們可以控制推薦給主播的用戶集合顆粒度從單個(gè)用戶到相似子用戶群體自由縮放可控,同時(shí)子人群的概念就單用戶而言,更加便于進(jìn)行人群曝光率(曝光量/召回量),人群失效時(shí)間等預(yù)估計(jì)算,也可以在計(jì)算開(kāi)銷和調(diào)控精度上做一個(gè)較好的權(quán)衡。具體來(lái)說(shuō),將用戶向量embedding進(jìn)行算法聚類得到用戶子類,離線用戶聚類子類在join上直播間實(shí)時(shí)用戶數(shù)據(jù)后形成數(shù)據(jù)底表。從而可以將主播的人群圈選問(wèn)題轉(zhuǎn)化為給主播個(gè)性化推薦每個(gè)動(dòng)態(tài)變化的cluster,除了引入實(shí)時(shí)推薦個(gè)性化能力,另一方面我們機(jī)制的設(shè)計(jì)也便于進(jìn)行主播側(cè)的曝光過(guò)濾等類似用戶側(cè)的推薦算法邏輯。

個(gè)性化人群規(guī)模預(yù)估部分。主播個(gè)性化實(shí)時(shí)調(diào)控人群圈選基于直播間實(shí)時(shí)在線的用戶構(gòu)建,隨后我們結(jié)合曝光率(曝光量/召回量)就可以相對(duì)準(zhǔn)確的去預(yù)估線上調(diào)控任務(wù)所需人群的大小。但是不同于商品短視頻等推薦,直播是一個(gè)實(shí)時(shí)流的狀態(tài),其曝光率會(huì)隨著時(shí)間和自身講解狀態(tài)以及當(dāng)貨品的信息實(shí)時(shí)發(fā)生變化,因此我們會(huì)基于主播離線曝光率預(yù)估計(jì)算初始人群的量級(jí),然后線上根據(jù)實(shí)時(shí)曝光率統(tǒng)計(jì)來(lái)動(dòng)態(tài)修正預(yù)估人群量級(jí)。

主播調(diào)控人群線上推薦部分。線上對(duì)主播調(diào)控子人群推薦過(guò)程中,我們將主播的高相關(guān)性候選人群向量召回并寫(xiě)入的同時(shí),記錄下每個(gè)人群cluster的量級(jí)和時(shí)間戳,結(jié)合歷史停留時(shí)長(zhǎng)數(shù)據(jù)預(yù)估判斷調(diào)控子人群的失效時(shí)間,動(dòng)態(tài)維護(hù)曝光cluster的列表。調(diào)控子人群失效時(shí)間判斷結(jié)合調(diào)控子人群窗口曝光過(guò)濾機(jī)制,能夠保證每次寫(xiě)入的均為當(dāng)前直播在線用戶中和主播實(shí)時(shí)高相關(guān)性的候選人群子集,同時(shí)整體開(kāi)銷較低、實(shí)時(shí)性好、量級(jí)穩(wěn)定維持在設(shè)定的大小,因此可以很好的平衡效率和完成率,避免因離線人群到達(dá)分布不穩(wěn)定而導(dǎo)致的流量\"尖刺\"等問(wèn)題。

最后,實(shí)時(shí)動(dòng)態(tài)多元價(jià)值路徑人群建模部分。如何去強(qiáng)化明確激勵(lì)流量的ROI屬性:時(shí)長(zhǎng)、轉(zhuǎn)粉、轉(zhuǎn)化、用戶拉新等,而不僅僅是調(diào)控pv完成率,是我們對(duì)調(diào)控任務(wù)的預(yù)期。那么針對(duì)調(diào)控人群架構(gòu)的設(shè)計(jì),我們也希望擁有這種可以多元目標(biāo)轉(zhuǎn)變的定制化能力,而這是傳統(tǒng)人群圈選所難以達(dá)到的。

進(jìn)一步的,對(duì)于推進(jìn)系統(tǒng),在一個(gè)相對(duì)的時(shí)間階段內(nèi),推薦系統(tǒng)的主流衡量標(biāo)準(zhǔn)是相對(duì)穩(wěn)定的,即便推薦多目標(biāo)建模,ltr的融合的方式也是階段性確定性的,但是對(duì)于具體的調(diào)控計(jì)劃任務(wù),我們希望它是多元變化可定制的。對(duì)于調(diào)控流量,不同的調(diào)控業(yè)務(wù)類型和人設(shè)主播,每場(chǎng)對(duì)于調(diào)控的業(yè)務(wù)訴求也是不一樣的,比如針對(duì)內(nèi)容型主播或者新咖入淘,對(duì)于調(diào)控流量是否能帶來(lái)更高的粉絲轉(zhuǎn)化和留存有著更強(qiáng)的需求,針對(duì)帶貨主播大場(chǎng)成交轉(zhuǎn)化無(wú)疑是更加重要的目標(biāo)?;诖耍覀兇罱嘶诤诵娜巳旱亩嗄繕?biāo)調(diào)控鏈路,之前的人群鏈路主要影響推薦的召回,而核心人群的調(diào)控鏈路影響全鏈路,細(xì)粒度pv可控。

具體來(lái)說(shuō),定義一個(gè)更加精準(zhǔn)輕量的核心人群,通過(guò)核心人群pid控制對(duì)應(yīng)側(cè)重目標(biāo)的核心人群在調(diào)控流量中的實(shí)時(shí)pvr占比。通過(guò)退化流量調(diào)控pid,來(lái)表征對(duì)于非場(chǎng)觀看目標(biāo)下的任務(wù),實(shí)時(shí)流量進(jìn)度相比時(shí)間進(jìn)度可以損失的目標(biāo)值,代表了可以置換其他側(cè)重roi屬性的一個(gè)退讓上界限,模型上,鑒于排序限制和對(duì)調(diào)控模型精準(zhǔn)性的進(jìn)一步要求,下沉attention計(jì)算能力,通過(guò)拆解計(jì)算圖為原有雙塔部分和基于path分解形成的行為主播到關(guān)聯(lián)主播的分?jǐn)?shù)融合部分,線下共同訓(xùn)練,線上進(jìn)行計(jì)算圖拆解,結(jié)合之前的人群聚類自由度放縮機(jī)制,從而使得模型能夠保證大規(guī)模打分的基礎(chǔ)上可以逼近精排的效果。當(dāng)然對(duì)于重點(diǎn)提前明確排期的和長(zhǎng)期扶持主播,離線大模型打分也會(huì)引入系統(tǒng)作為重要參考。整體方案兼顧了調(diào)控激勵(lì)的實(shí)時(shí)性,精準(zhǔn)性,平穩(wěn)性,泛化性等多方面訴求。

03

流量調(diào)控與供給端到端聯(lián)動(dòng)

對(duì)于直播數(shù)智化營(yíng)銷基礎(chǔ)建設(shè),豐富貨品側(cè)智能運(yùn)營(yíng)工具和能力,我們構(gòu)建了一系列營(yíng)銷能力,如主播爆品預(yù)估、潛力新品預(yù)估、主播PV價(jià)值預(yù)估等。加強(qiáng)業(yè)務(wù)同學(xué)對(duì)于流量?jī)r(jià)值的心理預(yù)期,提高與主播團(tuán)隊(duì)和業(yè)務(wù)團(tuán)隊(duì)之間的溝通和環(huán)節(jié)把控,同時(shí)也落地成了一些相關(guān)的業(yè)務(wù)產(chǎn)品。我們圍繞用戶、主播和商品三元圖網(wǎng)絡(luò)結(jié)構(gòu)建模結(jié)合直播間在線用戶精準(zhǔn)動(dòng)態(tài)人群方案,端到端的聯(lián)動(dòng)營(yíng)銷供給與流量調(diào)控分發(fā),提升流量的確定性,從而實(shí)現(xiàn)流量的整體閉環(huán)。

實(shí)際上,無(wú)論是爆品預(yù)估、新品發(fā)現(xiàn),還是PV價(jià)值預(yù)估、流量預(yù)估等,本質(zhì)上都是在這個(gè)三元網(wǎng)絡(luò)圖上進(jìn)行若干限定并求解一個(gè)最大值或最小值的問(wèn)題。這也是我們解決營(yíng)銷問(wèn)題的主要思路,擴(kuò)展主播樣本,主播商品樣本到用戶-主播-商品三元網(wǎng)絡(luò)樣本,結(jié)合直播用戶到達(dá)率預(yù)估建模,以及特定待預(yù)估問(wèn)題的目標(biāo)維度聚合,那么我們就有了可以解決通用問(wèn)題的一套方案。

當(dāng)然我們還嘗試過(guò)小樣本的遷移學(xué)習(xí),同樣取得了還不錯(cuò)的效果,主體思路的難點(diǎn)在于,如何動(dòng)態(tài)的的挑選推薦樣本中哪些樣本時(shí)具備營(yíng)銷樣本遷移學(xué)習(xí)價(jià)值的,我們給出的解決方案通過(guò)對(duì)齊營(yíng)銷樣本與推薦樣本,通過(guò)聚類和動(dòng)態(tài)迭代不斷挑選出和營(yíng)銷域樣本更相關(guān)的推薦樣本,以及對(duì)于主播寶貝袋多商品的建模方式等。

結(jié)合流控方面的工作與營(yíng)銷部分的探索,我們可以衍生出很多相關(guān)的流控與供給端到端聯(lián)動(dòng)的應(yīng)用落地方案,下面簡(jiǎn)單的介紹一部分應(yīng)用方案:

泛精細(xì)化流量匹配:結(jié)合我們的爆品預(yù)估/pv價(jià)值預(yù)估結(jié)果,聯(lián)動(dòng)直播間端到端實(shí)時(shí)動(dòng)態(tài)人群,可以比較自然的實(shí)現(xiàn):貨找人/人找人。我們可以用我今天想要的貨品集合思路去找到直播間當(dāng)前最相關(guān)的一批在線用戶,進(jìn)行流量的激勵(lì)和調(diào)控,也可以通過(guò)主播的人設(shè),對(duì)標(biāo)的主播,對(duì)這場(chǎng)直播的預(yù)期,找具有成熟直播體系的成功標(biāo)桿主播,用它的受眾人群模式去為自己的落地,扶持自身的成長(zhǎng)。包括一些爆品的流量打爆等等。

都比較自然的結(jié)合了我們營(yíng)銷與流控兩部分工作。 實(shí)時(shí)精準(zhǔn)流量匹配:通過(guò)主播貨品信息結(jié)合潛在爆品預(yù)估/主播看點(diǎn)/貨品rundown信息,可以比較自然的構(gòu)建主播貨品粒度直播間實(shí)時(shí)動(dòng)態(tài)人群調(diào)控的應(yīng)用方案,根據(jù)u-a-i的三元關(guān)系能力,即針對(duì)主播和主播實(shí)時(shí)講解的貨品信息進(jìn)行動(dòng)態(tài)人群實(shí)時(shí)圈選,是很合理的思路演化,例如在主播入淘的調(diào)控計(jì)劃過(guò)程中上,主播的貨品基本很多都是跨類目的,業(yè)務(wù)訴求自然的也會(huì)希望調(diào)控流量能夠結(jié)合實(shí)時(shí)貨品的信息,保證實(shí)時(shí)調(diào)控人群更加切合當(dāng)前時(shí)段的商品信息。

實(shí)時(shí)商品信息+主播信息共同inference出復(fù)合主播embedding向量實(shí)時(shí)召回對(duì)應(yīng)的人群數(shù)據(jù),在基于直播間實(shí)時(shí)用戶鏈路基礎(chǔ)上,直播動(dòng)態(tài)人群信息數(shù)據(jù)更新能夠在10s量級(jí)內(nèi)完成,通常而言,主播講解商品排期具有階段相似性,這個(gè)人群時(shí)效性已經(jīng)能夠比較好的切合同一場(chǎng)次下的貨品實(shí)時(shí)講解變化。

新咖主播扶持:提到調(diào)控算法建模與營(yíng)銷相關(guān)工作,新咖主播的精準(zhǔn)扶持是一項(xiàng)重要的業(yè)務(wù)需求,對(duì)于這一部分主播嚴(yán)重缺乏歷史信息參考,開(kāi)播場(chǎng)次少,主播的embedding信息學(xué)習(xí)不充分。在設(shè)計(jì)端到端直播精準(zhǔn)人群調(diào)控方案中對(duì)于新咖主播扶持也可以比較好的兼容進(jìn)來(lái),對(duì)于有一定開(kāi)播場(chǎng)次歷史數(shù)據(jù)的新咖主播,算法可以相對(duì)精準(zhǔn)的計(jì)算出新咖主播相似擴(kuò)展主播,結(jié)合貨品類目信息,整體pv價(jià)值段預(yù)估參考可以相對(duì)比較好的鎖定新咖主播的相似主播集合,隨后對(duì)相似主播進(jìn)行信息聚合產(chǎn)出新咖主播embedding向量來(lái)實(shí)現(xiàn)實(shí)時(shí)動(dòng)態(tài)人群調(diào)控。

當(dāng)然我們也經(jīng)常遇到相對(duì)極端的案例,首秀零粉絲開(kāi)播。在進(jìn)行動(dòng)態(tài)調(diào)控人群的構(gòu)建時(shí)候,我們則采用參考結(jié)合行業(yè)先驗(yàn)知識(shí)的方式構(gòu)建主播embedding,結(jié)合對(duì)標(biāo)主播類目下其他關(guān)聯(lián)主播信息,主播到主播相似擴(kuò)展,基于知識(shí)相似/類目相似主播結(jié)合貨品類目信息產(chǎn)出候選主播embedding向量,實(shí)時(shí)去拓用戶,實(shí)驗(yàn)表明對(duì)于純冷啟動(dòng)新咖主播引入同樣獲得了較好的效果業(yè)務(wù)指標(biāo)。

多元流量?jī)r(jià)值路徑:對(duì)于流控調(diào)控,不同的調(diào)控業(yè)務(wù)類型,不同類型的人設(shè)主播,主播不同的成長(zhǎng)階段,不同場(chǎng)次預(yù)期目標(biāo)安排,對(duì)于調(diào)控的業(yè)務(wù)訴求通常有著明顯的差異性,在調(diào)控完成率的基礎(chǔ)上,進(jìn)一步強(qiáng)化明確激勵(lì)流量的ROI屬性:時(shí)長(zhǎng)、轉(zhuǎn)粉、轉(zhuǎn)化、用戶拉新等是更加自然的業(yè)務(wù)訴求。我們利用流控端到端聯(lián)動(dòng)供給的技術(shù)架構(gòu),在時(shí)長(zhǎng),互動(dòng),成交等不同的roi側(cè)重任務(wù)中都取得了顯著甚至翻倍的核心指標(biāo)提升。

04

Q&A

Q:在流量管控和推薦的分發(fā)邏輯中,在人群管控上是否可能存在業(yè)務(wù)或數(shù)據(jù)邏輯上的沖突?例如,流量管控認(rèn)為某些用戶不適合接收某一類內(nèi)容,因此不會(huì)向他們分發(fā)內(nèi)容;但是后續(xù)的算法邏輯可以認(rèn)為這些被丟棄的用戶實(shí)際上是高價(jià)值用戶,這種沖突如何處理呢?

A:實(shí)際上,這個(gè)問(wèn)題在各種內(nèi)容場(chǎng)景下相對(duì)普遍。核心問(wèn)題在于我們對(duì)于價(jià)值的定義,對(duì)于內(nèi)容場(chǎng),我們認(rèn)為通常價(jià)值構(gòu)成其實(shí)有三部分,用戶價(jià)值,創(chuàng)作者價(jià)值,平臺(tái)價(jià)值。用戶價(jià)值比較容易理解,推薦系統(tǒng)通常要解決的核心問(wèn)題即面向用戶進(jìn)行高效推薦。但在實(shí)際業(yè)務(wù)中,其他價(jià)值也是不能忽略甚至至關(guān)重要的,像淘寶直播業(yè)務(wù),我們需要考慮創(chuàng)作者價(jià)值(主播視角價(jià)值),平臺(tái)價(jià)值(主播生態(tài),主播成長(zhǎng))等,所以需要在一個(gè)更高的維度去進(jìn)行體系化的方案設(shè)計(jì),達(dá)到多價(jià)值的共同繁榮。

以上就是本次分享的內(nèi)容,謝謝大家。

▌2023數(shù)據(jù)智能創(chuàng)新與實(shí)踐大會(huì)

數(shù)據(jù)架構(gòu)/數(shù)據(jù)效能/智能應(yīng)用/算法創(chuàng)新……

4大體系,專業(yè)解構(gòu)數(shù)據(jù)智能

16個(gè)主題論壇,覆蓋當(dāng)下熱點(diǎn)與趨勢(shì)

70+演講,兼具創(chuàng)新與最佳實(shí)踐

1000+專業(yè)觀眾,內(nèi)行人的技術(shù)盛會(huì)

點(diǎn)擊下方鏈接了解詳情:

相關(guān)新聞