您现在的位置是:Instagram刷粉絲, Ins買粉絲自助下單平台, Ins買贊網站可微信支付寶付款 > 

01 youtube官網網頁版注冊登錄系統論文3000字(Youtube DNN經典論文)

Instagram刷粉絲, Ins買粉絲自助下單平台, Ins買贊網站可微信支付寶付款2024-05-02 14:54:23【】1人已围观

简介YoutubeDNN經典論文最近在看王喆的知乎專欄,第三、四、十三篇都是Youtube的經典論文DNN:買粉絲s://zhuanlan.hu.買粉絲/p/52169807  買粉絲

Youtube DNN經典論文

最近在看王喆的知乎專欄,第三、四、十三篇都是Youtube的經典論文DNN:買粉絲s://zhuanlan.hu.買粉絲/p/52169807  買粉絲s://zhuanlan.hu.買粉絲/p/52504407  買粉絲s://zhuanlan.hu.買粉絲/p/61827629

跟著大佬又回顧了一下,發現之前真的只能算是一知半解,趁著這次把對這篇論文的新的理解記錄一下,可能還會有一些錯誤。

論文講解了在召回和精排兩個階段的模型:

召回:

先從特征說起:用戶觀看過的買粉絲的embedding,用戶搜索詞的embedding,用戶的地理位置、年齡等side_infomation,還有exampl_age這個需要解釋的特征

然后是模型:三層DNN

最后是training的loss:softmax做分類

serving的方式:nearest neighbor

里面其實有很多疑點:

1.example_age是什么

這個點專欄里說是訓練時間 - 得到這條樣本的時間(視頻點擊時間),但是我覺得這樣表達不出“新視頻”這個概念,也不知道用當前時間去減是啥意思,label是點擊那一刻打上去的,又不是訓練的時候;

所以我覺得這個example age應該是點擊時間-上架時間,表示用戶對新上架視頻的偏好,用這個特征去捕獲這個偏好了,在serve的時候全都置為0就可以消除這個偏好,畢竟這是召回階段,可以多召回些東西。(這樣就是消除用戶對新視頻的偏好了?)

2.為什么要做多分類,而不是預測分,多分類的話有海量視頻,性能怎么保證

為什么要做多分類,而不是把樣本的embedding也給到網絡里做打分,這一點我是真的沒弄明白;

海量視頻的多分類性能的提升是用到了sampled softmax,可以參考買粉絲://買粉絲.4k8k.xyz/article/Kaiyuan_sjtu/119881236  買粉絲s://zhuanlan.hu.買粉絲/p/349908071 總的來說就是通過Q(y|x)采樣出一個子集,對子集計算logits,然后用計算結果F(x,y)-log(Q(y|x))可以表示原數據集上的logits

3.serving階段為什么不做多分類了,而是做nearest neighbor

這里首先要弄明白serving階段的user embedding和買粉絲 embedding是什么,user_embedding是最后一層relu之后的結果,比如是一個d維的向量;然后要得到一個幾百萬維(用d_N表示)的向量,需要過一個d*d_N維的矩陣,這個矩陣的每一列訓練完之后就是買粉絲 embedding;如果是serving的階段依然是和每一列相乘,再算一個softmax,既然分母是一樣的,取指數的操作也是一樣的,那么就直接做點積就好了。

排序:

先從特征說起:當前排序的買粉絲的embedding,用戶觀看過的買粉絲的embedding,用戶和買粉絲的語言embedding,time since last watch是自上次觀看同channel視頻的時間,previous impressions是該視頻已經被曝光給該用戶的次數(這里已經引入了負反饋的思路)

然后是模型:三層DNN

最后是training的loss:weighted logistic

serving的方式:e^(Wx+b)

這里面也有一些疑點:

1.training時候的weighted logistic是什么,為什么serving的時候用的是e^(Wx+b)

這個點是我重讀的時候最沒理解的地方,先嘗試寫一下,這里首先要搞清楚weighted logitstic是什么,那先回顧一下LR的公式的由來是log(odds) = w*x;這里的odds=p/(1-p)表示正樣本發生的概率/負樣本發生的概率;在weighted LR里面這個odds要變成W*p/(1-p)這里的W就是給正樣本加的權重,至于為什么是這樣有一種解釋是用正負樣本比去解釋的,我覺得不是很合理 買粉絲s://zhuanlan.hu.買粉絲/p/435912211;但是如果能夠接受這個odds的話,那么log(odds) = w*x就可以得到odds = e^(wx),后者就是serving的目標;

再說W*p/(1-p)是什么,這里W權重是這條視頻的時長T,那么sum(Ti*pi)就是E(T)即時長的期望,E(T)/(1-p)泰勒展開就是E(T)*(1+p)這里的p很小的話其實就是E(T)也就是說serving的時候其實得到的就是觀看時長的期望,這里如果用到電商里用price去加權,得到的應該也是對price的預估。

豆丁網詳細資料大全

豆丁網創立于2007年,是全球最大的中文社會化閱讀平臺,為用戶提供一切有價值的可閱讀之物。截至2010年,豆丁網已經成功躋身網際網路全球500強,成為提供垂直服務的優秀網站之一。網站擁有分類廣泛的實用文檔、出版物、行業研究報告、以及數千位行業名人貢獻的專業檔案,各類讀物總數超過兩億。豆丁網鼓勵原創、鼓勵分享、尊重和維護上傳者的權益。在豆丁網,你可以分享你的文檔,并通過豆丁發表到不同部落格、論壇以及各種平臺上,進行廣泛傳播,同時還可以以非常環保的方式、低廉的價格看到熱門書刊、雜志、以及各類專業文獻。

豆丁網(Docin)是全球優秀的C2C文檔銷售與分享社區。豆丁允許用戶上傳包括:pdf、doc、ppt、txt在內的數十種格式的文檔檔案,并以Flash Player的形式在網頁中直接展示給讀者。簡而言之,豆丁就如同文檔版的Youtube。每天都有數以萬計的文檔會上傳到豆丁,正基于此,豆丁將致力構建全球最大的中文圖書館。

基本介紹 中文名 :豆丁網 外文名 :docin 網站類型 :C2C文檔分享網站 網站創始人 :林耀成 創立時間 :2007年 官網 ::docin/ 產品與服務,豆丁會議,會議PPT,豆丁書房,豆丁閱讀,播放器,豆丁彩蛋,服務理念,成長歷程,發展歷史,發展現狀, 產品與服務 豆丁會議 豆丁網會議頻道,整合國內最高端會議的商業文檔內容,關注各行業發展動態,挖掘行業文檔的商業價值,提供給行業人員一個專業的知識分享平臺。在這里,能找到商業領袖演說PPT、 權威行業分析報告等一手資料。沒拿到會議入場券,沒時間出席會議現場,在豆丁會議頻道,可以第一時間找到會議的相關內容,會議紀要、現場PPT甚至于視頻內容。 會議PPT 會議PPT是一款非常實用的,行業會議PPT內容檢索與閱讀工具,由豆丁網開發推出,旨在幫助網際網路、移動網際網路、電子商務、信息通訊、金融管理等行業從業者和愛好者,獲取最新的行業信息與商業知識。會議PPT發布最新的行業報告、趨勢分析、商業領袖演講等優質PPT,是中國版的slideshare,會議PPT為用戶提供最佳的PPT閱讀解決方案,有以下特色: 1、緊貼行業、第一時間:會議PPT關注幾大行業最新的趨勢和動態,隨時提供第一線的,來自各行業會議的最新內容,具有很強的更新及時性,同時PPT形態能夠很好地還原行業信息和演講者的思想,幫助用戶獲取最真實的商業信息。 2、眾多PPT獨家內容:會議PPT高度關注PPT介質的優質內容,與國內主流的買粉絲、數據研究、分析機構合作,每年合作會議上千場,擁有眾多的獨家內容,是關注特定行業信息及內容的首先套用。 3、一流的閱讀體驗:會議PPT方便用戶從所關注的行業、會議切入感興趣的內容,操作流暢,支持全螢幕觀看,提供了最佳的PPT閱讀解決方案。 豆丁書房 擁有“豆丁書房”,即可擁有千萬網友以及出版社、合作機構為你提供的超過一億份文檔以及圖書資料!滿足你工作、生活、娛樂的各方面閱讀需求,輕松實現線上線下資源的融合。 豆丁網“豆丁書房”Android/ios客戶端基于豆丁網線上上億份文字資料,為Android/ios用戶特別最佳化的客戶端,基本上所有豆丁網的文檔都可以無縫搜尋、下載、閱讀。同時能實現線各終端設備上使用信息的同步和更新。 豆丁閱讀 豆丁閱讀是一款會說話的電子書,由豆丁網和中國科學院自動化研究所模式識別國家重點實驗室聯合推出,支持epub、txt、pdf、umd、word、ppt、等多種格式,旨在為廣大網友提供方便、易用、貼心的移動閱讀服務。具有以下幾大特點: 一、聽書 把文字有一定的語氣語調的讀出來,方便大家在開車、跑步等不方便閱讀的時候聽書,同時盲人朋友們也可以通過聽書來享受閱讀的樂趣了。 二、海量內容,應有盡有 豆丁閱讀支持豆丁網、盛大文學、書倉等開放書源,為網友們提供了海量的精品內容。 三、本地內容同步,方便易用 豆丁閱讀支持通過wifi、sd卡等方式把pc上的書源輕松的拷貝到閱讀器中,隨時隨地的享受閱讀樂趣。 四、支持多種格式 epub、txt、pdf、word、ppt、umd、等格式全部支持。 五、一流的閱讀體驗 豆丁閱讀提供了書簽、白天夜晚模式、字型調節等功能,為用戶提供貼心的閱讀體驗。 播放器 支持格式 豆丁播放器支持文檔、圖片、演示檔案、設計稿件、流程圖、工程檔案等超多類型的文檔資料。就像土豆的視頻播放器一樣,豆丁播放器也是采用Flash技術實現,并嵌入到網頁中展示檔案。利用豆丁播放器,我們常見的Word、PowerPoint、TXT、PDF、PSD、JPG以及更多其他格式的檔案資料,你都可以直接線上瀏覽,而無需在電腦上安裝這些檔案的相應軟體。 賺錢的方法 不止是免費分享,通過豆丁播放器,你也可以用文檔賺錢。你可以直接設定文檔的價格,其他用戶需要付費才能線上瀏覽或下載。豆丁支持“線上/下載”分開定價和管理,助你輕松、自主銷售。 安全保護 或許你曾經在一個私密的論壇,上傳了你的文檔,但很快它就被人隨意下載,并轉發出去,甚至被盜名重新上傳到網際網路上。如今,通過豆丁封裝的文檔,不再是一個真正的檔案,而是基于網頁的Flash演示代碼,它只能被嵌入到網際網路的任意網頁或Email中進行傳播,無論傳播到網際網路的哪個角落,文檔的著作權保護仍在掌握。豆丁播放器完全基于Flash技術在網頁上展示,這種獨特的DRM套用,能夠保護你的文檔安全,避免惡意盜取。 輕松小巧 豆丁播放器設計非常小巧,基于WEB頁面載入時,速度很快,保證閱讀流暢舒適;播放器操作界面和功能控制項簡潔方便,充分考慮用戶易用性。只要你的瀏覽器能夠支持Flash,你就能立刻體驗豆丁播放器的暢快閱讀體驗,無需安裝任何軟體或多余的外掛程式。 更多的訪問 豆丁播放器提供直接發布到部落格、郵件傳送、WEB代碼嵌入等多種分享方法,任何人都能通過這些方法將“封裝”的文檔分享給其他人。豆丁網站聯盟也將向每天百萬級的用戶展示你的文檔。另外,在保證文檔著作權的前提下,豆丁播放器還特別針對搜尋引擎做了最佳化設定(SEO),使文檔被更多的搜尋引擎收錄,從而讓更多的人找到你的文檔。豆丁播放器獨特的瀏覽體驗和卓越的著作權保護也將促使其他用戶經常回訪,瀏覽更多文檔。 API 豆丁文檔API是一組JavaScript類及函式。使用這些API,您可以方便

很赞哦!(9922)

Instagram刷粉絲, Ins買粉絲自助下單平台, Ins買贊網站可微信支付寶付款的名片

职业:程序员,设计师

现居:河北省承德双桥区

工作室:小组

Email:[email protected]