您现在的位置是:Instagram刷粉絲, Ins買粉絲自助下單平台, Ins買贊網站可微信支付寶付款 > 

08 facebook權重算法(騰訊算法高級研究員陳松堅:智能問答技術及其應用)

Instagram刷粉絲, Ins買粉絲自助下單平台, Ins買贊網站可微信支付寶付款2024-04-29 09:54:36【】0人已围观

简介話機器人,而實際應用中,往往存在需要需要交互的場景,比如查詢社保余額,就需要用戶提供指定信息,如姓名,身份證號,手機號等。這種是所謂任務導向型機器人,而另一種,基于知識圖譜的機器人也往往會涉及到多輪交

話機器人,而實際應用中,往往存在需要需要交互的場景,比如查詢社保余額,就需要用戶提供指定信息,如姓名,身份證號,手機號等。這種是所謂任務導向型機器人,而另一種,基于知識圖譜的機器人也往往會涉及到多輪交互。這里簡單介紹一下多輪對話機器人的架構,整體上是一個對話管理系統,總的來說是管理會話狀態,包含4個模塊,分別是輸入部分:自然語言理解模塊NLU,負責意圖識別和抽取槽位實體,比如這里匹配到了意圖是查詢社保余額,抽取到了社保號1234。得到的意圖和槽位值會送入到對話狀態追蹤模塊,DST,他負責會話狀態的更新,形式化來說是一個函數,輸入是當前狀態s和當前的query經過NLU處理過得到的意圖和槽位值q, 輸出新的狀態s‘,下一步是把s’送入DPL,對話策略模塊,這個模塊是根據新的狀態s‘輸出行動a,通常這個決策選擇會依賴于一個外部數據庫或知識圖譜,最后,由輸出部分,自然語言生成模塊NLG負責將行動轉換為自然語言文本,返回給用戶。

前面提到的單輪FAQ機器人,有一個問題是問答準確率依賴于問答庫的質量,而問答庫的構建耗時費力,所以針對數據較大的非結構化文檔,如果可以直接從中抽取答案,是非常理想的做法。比如斯坦佛大學開源的drQA,就是基于wikipedia的語料做的一個開放域上的問答機器人,我們來看看這種閱讀理解機器人的架構示意,他也是基于檢索重排的思路,首先把可能的文段從語料庫中摘取出來,然后送入閱讀理解模型進行答案定位,打分,排序和選擇得分最高的答案。閱讀理解模型與匹配模型是類似的,需要先對問題和候選文段進行編碼表示,不同之處在于最終預測的目標是答案的起始和結束位置。我所在的團隊在去年,在閱讀理解的權威公開測評Squad v1中取得過第一的成績,同時參加這個測評的包括了google, facebook, 微軟,阿里idst, 科大訊飛等國內外同行。說明業界對這種技術還是非常看重的。

下面分享小知在把以上技術落地產品化的經驗。首先我們來看看小知的整體架構圖,核心引擎有兩部分,一塊是上面重點闡述的深度語義匹配模型,另一塊是本次分享沒有展開的知識圖譜引擎,在此之上,我們構建了FAQ機器人,多輪會話機器人(任務機器人),閑聊機器人等。以下是我們單輪和多輪機器人的示例。

在我們實際的落地項目中,得益于深度遷移模型的語義匹配能力和行業知識圖譜的的精準匹配和輔助追問,小知機器人能夠做到95%左右的問答準確率,并且節省了50%以上的服務人力,切實為政府和企業提升效率和降低成本。

在智能客服的基礎上,我們又打造了基于語音的電話機器人,力主融合智能客服,人工在線客服,工單系統和電話機器人,為客戶打造從售前售中售后的整體解決方案。

以下是電話機器人的整體架構圖,核心是自然語言理解NLU模塊,負責識別用戶提問意圖

提取相關實體。根據NLU輸出的結果,內置的對話管理引擎會進行流程狀態流轉和跟蹤。

另外,ASR語音識別和TTS語音合成是不可或缺的重要服務,這三個模塊相互協作,共同完成與用戶的交互。

最后對智能問答的未來發展提幾點我的看法。目前學術界比較公認的一個方向是,需要更有機地結合模型和規則,而在問答領域,規則的一大組成部分就是知識圖譜,包括開放領域的知識圖譜和專業領域知識圖譜。而更進一步地,我們需要研究帶有推理性質的事理型知識圖譜去描述領域內的規則和知識,讓機器人能夠處理帶有復雜條件的問題,提供更智能的回復。在我看來,智能問答的一個突破口就在于解決以上三個問題。以上就是今天分享的內容,謝謝大家。

主講人介紹:

陳松堅,騰訊數據平臺部算法高級研究員,有著8 年的 NLP 研發經驗,2017 年加入騰訊 TEG 數據平臺部,負責智能客服產品騰訊小知的算法規劃和落地。負責過多個智能客服項目,對封閉領域的智能問答有豐富的實戰經驗。

今日頭條、知乎、豆瓣不同自媒體的算法

一、不同平臺下的自媒體生態

對于平臺來說,創作者是什么?

如果把平臺比作一個商場的話,不同的平臺會有不同的選擇,最典型的兩種類型莫過于:自營 V.S 第三方運營。

一種情況下,整個商場全部是直營的店鋪。

在這樣的平臺下,每個貨架都是商場自營,所有的創作者對于商場而言,都只是供貨商。

另一種情況下,商場只提供位置,所有交得起入場費的店鋪都可以入駐。

在這樣的平臺下,每個貨架都是創作者自己運營的。

直營商場的好處當然是體驗可控、甚至于能夠在某個特定垂類人群身上做到近乎可量化范圍內的極致。

由于其收取的是商品流通中的利潤,所以在短期內可以攫取巨大的紅利,并用這些利潤去給商場自身打廣告,做新客獲取。

但這樣做的壞處也很顯然,就在于供貨商的角度缺乏靈動性,只作為供貨商的創作者,由于缺乏足夠的利潤激勵,很難生長出全新的品牌。

開放給第三方運營的商場,其好處當然是供貨商的靈活性和多樣性,商場賺取的是房租而非商品流通過程的利潤。

一個常見的問題是,這種完全開放給第三方運營的商場是否會用戶體驗崩塌,比如會有各種在商場入口發小廣告的,以各種圖謀短線的方式來吸收商場的流量。

這就是局部失控與全局可控的關系。

在國內,全部直營的商場比比皆是;近乎完全開放給第三方運營的大商場,則恐怕只有買粉絲了吧。

在所有平臺都在告訴你什么是對的時候,只有買粉絲很克制地告訴你什么是錯的。

二、數據驅動自媒體迭代

站在自媒體的角度,又該如何面對平臺?

如何應用數據驅動的方式,更加目標導向的面對不同平臺呢?

首先,自媒體面臨的問題是平臺選擇。

由于不同的平臺有不同的分發規模和不同的發展階段,所以,更應該選擇適合自己品牌調性的平臺,選擇符合自己長線商業化變現角度的平臺。

要區分清楚,哪些平臺是叫好不叫座、哪些平臺是叫座不叫好。

如果做電商導向的自媒體,那么基本上微博買粉絲是必選項。

通過匯集全網各平臺的流量,來實現自己對廣告主的全網閱讀量(播放量)的承諾。

因為每個平臺的投入都需要牽涉到運營人力,所以如果一個平臺的投入產出比不能夠達到預期,就應該主動止損,避免進一步的資源投入。

在自媒體確定了自己選擇的平臺之后,就需要深究不同平臺的分發特點,來進行針對性的運營從而提升自己在相應平臺的曝光量。

常見的三種平臺:編輯分發、訂閱分發和算法分發平臺。

對于編輯分發平臺,最快速的方法一定是維系好和平臺的關系。

因為在這樣的平臺上,其推薦位置都是人工分配的,更好的編輯關系能夠保證自媒體有更好的流量曝光。

在編輯分發的平臺上,時不時的會有相應的官方活動、積極地配合官方導向,就能從流量傾斜政策中獲取紅利。

對于訂閱分發平臺,做粉絲,做垂直品類粉絲是不二法門。

借由買粉絲,其實大家能夠看到一些常見的誘導分享的手段。

由于買粉絲是一個規定行業下限,而非設定上限的開放式環境。所以在這樣的平臺上進行運營,首先需要保證自己有足夠高的敏感度,對于一些新的傳播形態可以及時跟進,從而最大化的獲取時間差的紅利。

比如,最近的買粉絲小游戲,在前兩周鋪天蓋地的通過買粉絲群分享獲得拉新機會;而最近幾日,這條通路就完全被官方封禁了。

對于算法分發平臺,盡管平臺關系維護和粉絲數積累都需要,但是最需要投入的還是對于內容的包裝。

因為你的內容不僅僅要抓住人的眼球,同時也要能夠對機器算法的胃口。

通過研究過往一段時間的平臺熱門關鍵詞,能夠給內容的標題封面包裝提供一些借鑒。

在我看來,運營的非常好的一個自媒體品牌非二更莫屬,細細觀察,其在不同的平臺上都有不同的運營策略。

比如,在頭條上的分發,二更就全面的在使用雙標題、雙封面的方式進行自己的內容包裝。

一些視頻內容能夠在非常短的時間內就獲得了上百萬的曝光量。

不同平臺上的不同運營方式,本質上還是一個數據驅動,目標導向的過程。

以下進行更細粒度的拆解:

他山之石可以攻玉,首先和大家介紹的是在國外,將數據分析指導內容生產做的非常極致的BuzzFeed。

BuzzFeed的員工總數逾千人,擁有全球新聞團隊、自家視頻制作工作室、尖端數據運算中心和內部創意廣告機構,每月全網超過50億次閱讀,怎么看都是一個龐大的媒體集團。

然而,當我們深入了解BuzzFeed的工作流程后就會發現,與其說它是一家媒體公司,不如說它是一家科技公司。

“數據驅動內容創作”,這是BuzzFeed給自己貼上的標簽。

在這家公司的內容創作和分發過程中,反饋閉環(FeedbackLoop)是出現頻次最高的術語:

通過將市場環境和讀者反饋數據盡可能的量化和結構化,及時反饋給運營人員、內容編輯,從而構成了輔助創作的一個閉環。

由于很早就樹立了“將內容分發到用戶常駐的平臺,而非吸引用戶到自己的平臺看內容”的思路,YouTube、Facebook,Twitter、Vine等一眾平臺都成為了BuzzFeed的戰場。

為了更好的理解用戶反饋,BuzzFeed追蹤收集并匯總了各個平臺上的閱讀傳播和互動數據。

比起閱讀量、分享量這些結果指標,其更關心內容分發和傳播的過程。

以下圖為例:如果只看終態數據,那么報表展示給你的無非是一篇內容從不同的平臺渠道上獲取了多少流量而已(下圖左)。

但是深究下來,這些流量是如何來的呢?

是通過Facebook或Twitter上的分享,還是通過郵件的傳播?

哪些節點帶來了更大的輻射量和擴散量?

只有深入分析傳播路徑,才能給出這個問題的答案(下圖右)。

不止于結果, BuzzFeed開始探究一篇內容的傳播軌跡,他們開了一套名為Pound(Process for Optimizing andUnderstanding Network Diffusion)的系統。

通過給同一頁面的不同分享追加不同參數的方式,來追溯內容在網絡上的傳播過程。

通過這套系統,人們意識到:傳播并不是一棵簡單的傳播樹,而是一片密集的傳播森林。

每一次分享都構成了一棵新樹,如果一個人的社交好友很多,那么這個節點的一度關系觸達就會很廣。

如果內容的質量一般沒有引發進一步的傳播,那么就會止步為一棵低矮的樹;如果內容引發了大量的傳播,就會變為一個繁茂的大樹。

由于社交傳播對于內容的影響力貢獻巨大,BuzzFeed在衡量內容價值時,會更看重社交分享所帶來的閱讀量,并以名為“病毒傳播提升系數(ViralLift)”的指標來衡量這一過程。

對于粉絲已經超過百萬、內容閱讀篇篇10W 的自媒體大號來說,這一衡量指標的制定不難理解。

有了技術追溯的支持,內容團隊才能夠總結出不同平臺之上的內容偏好和病毒傳播模式。

人們往往會夸大BuzzFeed的內容三把斧

很赞哦!(3654)

Instagram刷粉絲, Ins買粉絲自助下單平台, Ins買贊網站可微信支付寶付款的名片

职业:程序员,设计师

现居:山东济宁梁山县

工作室:小组

Email:[email protected]