您现在的位置是:Instagram刷粉絲, Ins買粉絲自助下單平台, Ins買贊網站可微信支付寶付款 > 

01 社交媒體虛假信息檢測(如何在社交媒體上識別虛假信息)

Instagram刷粉絲, Ins買粉絲自助下單平台, Ins買贊網站可微信支付寶付款2024-05-29 04:04:56【】2人已围观

简介如何在社交媒體上識別虛假信息如何在社交媒體上識別虛假信息?如今,社交媒體已成為人們獲取信息的主要渠道之一,然而,社交媒體上存在著大量虛假信息,這些信息會誤導人們,影響公共輿論,甚至對人們產生不良影響。

如何在社交媒體上識別虛假信息

如何在社交媒體上識別虛假信息?

如今,社交媒體已成為人們獲取信息的主要渠道之一,然而,社交媒體上存在著大量虛假信息,這些信息會誤導人們,影響公共輿論,甚至對人們產生不良影響。因此,如何在社交媒體上識別虛假信息變得非常重要。以下是一些有助于在社交媒體上識別虛假信息的方法:

1.查看信息發布者身份

首先,我們可以通過查看信息發布者的身份來判斷信息的真實性。我們需要核實發布者的姓名、頭像、賬號等信息是否可信,尤其是在一些敏感話題和熱點事件中,我們需要格外關注這些信息,以避免受到虛假信息的誤導。

2.核實信息來源

其次,我們需要根據信息的來源來判斷其真實性。我們可以通過搜索引擎、媒體報道等方式來核實信息的來源是否真實可靠。此外,我們可以關注官方機構或知名媒體的認證賬號,獲取公正的信息。

3.對照多方信息

此外,我們需要對照多方信息來進行判斷。我們可以通過搜索引擎、社交媒體等獲取多方面的信息,進行比對分析,以找出信息中的矛盾或不合理之處。只有當多重證據都指向同一個方向,我們才可以認為這個信息是真實的。

4.識別信息的語言和風格

另外,我們還可以從信息的語言和風格入手來判斷信息的真實性。虛假信息通常會夸大事實、用詞不當、偏離主題等,在這些方面我們需要特別關注,以避免被虛假信息所誤導。

總之,在社交媒體上不斷涌現的虛假信息,給公眾帶來了巨大的挑戰。而要識別虛假信息,我們需要進行信息真實性的判斷,根據信息的發布者身份、信息的來源、多方面的信息對照、語言和風格等多方面入手,并要注意保持警惕,不輕信具有爭議性的信息。

GCAN:可解釋的社交媒體假新聞檢測方法

目前假新聞檢測問題仍然存在一些重要的挑戰。比如:

①目前的一些方法要求文檔為長文本,以便于能夠更好地學習詞和句子的表示。然而社交媒體上的一些推文大多是短文本,這就導致了一些數據稀疏性問題。

②一些SOTA的方法要求收集大量的用戶評論,然而大多數用戶僅僅是簡單地轉發推文而并不留下任何評論。

③一些研究認為社交網絡中的信息擴散(即retweet)路徑有助于錯誤信息的分類,從而學習基于樹的傳播結構的表示。然而,由于隱私問題,獲取轉發的擴散結構往往代價高昂,許多用戶選擇隱藏或刪除社交記錄。

④目前的一些方法缺乏可解釋性,不能為支持謠言的可疑用戶以及他們在制造謠言時關心的話題提供證據。

本文提出的方法利用源推文的短文本內容、轉發用戶序列以及用戶資料來進行假新聞檢測。也就是說本文的方法滿足以下設置:

①短文本源推文;

②沒有使用用戶評論文本;

③沒有使用社交網絡和擴散網絡的網絡結構。

此外,我們要求假新聞檢測模型具有可解釋性,即在判斷新聞是否虛假時突出證據。該模型將指出支持傳播假新聞的可疑轉發者,并突出他們特別關注的源推文中的詞。

本文提出一個新的模型,即Graph-aware Co-Attention Network(GCAN)。首先從用戶資料和社交互動中提取用戶特征,然后使用CNN和RNN來學習基于用戶特征的轉發傳播表示。另外使用圖來建模用戶之間的潛在交互,并且采用GCN來學習graph-aware的用戶交互的表示。同時提出了al 買粉絲-attention機制來學習源推文和轉發傳播之間的相關性,以及源推文和用戶交互之間的相互影響。最終利用學習到的embedding來進行假新聞的二分類預測。

1. 問題陳述

是推文的集合, 是用戶的集合。每個 都是短文本文檔(也叫做源推文)。 表明 由 個單詞組成。 中的每個用戶 都對應一個用戶特征向量 。當一個推文 發布以后,一些用戶將會轉發 從而形成一個轉發記錄的序列,這被稱為 傳播路徑 。給定一個推文 ,它的傳播路徑表示為 , 表明第 個用戶(其用戶特征向量為 )轉發了 ,這里 。轉發了 的用戶集合記作 ,最先轉發 的用戶記作 ,轉發時間記作 ,其余用戶 在時間 轉發了 ( )。每個 有一個binary的標簽 表明是否是假新聞( 代表 是假新聞)。我們希望能夠利用上述數據來利用神經網絡模型識別 是否是假新聞,另外,希望模型能夠突出能夠表明 真實性的一部分用戶 和一些推文中的詞 。

2. GCAN框架

GCAN主要包括5個部分:

①user characteristics extraction,創建特征來量化用戶如何參與在線社交網絡;

②new story en買粉絲ding,生成源推文中單詞的表示;

③user propagation representation,使用提取的用戶特征建模和表示源推文如何由用戶傳播;

④al 買粉絲-attention mechanisms,捕獲源推文和用戶交互/傳播之間的相關性;

⑤making prediction,通過連接所有學習的表示生成檢測結果。

GCAN的架構圖如下:

3. 模型

用戶 的特征向量 是定義得到的,具體的,包含以下特征:

①用戶自我描述的字數;

②用戶賬戶名的字數;

③關注用戶 的數量;

④用戶關注的人的數量;

⑤用戶創建的story數量;

⑥舉例用戶第一個story經過的時間;

⑦用戶的賬戶是否被驗證過;

⑧用戶是否允許地理空間定位;

⑨源推文發布時間和用戶轉發時間的時差;

⑩用戶和源推文之間轉發路徑的長度(如果用戶轉發源推文則為1)。

最終得到 , 是特征的數量。

給定的源推文將使用一個word-level的en買粉絲der進行編碼,輸入是 中的每一個單詞的獨熱向量。由于每個推文長度都不一樣,這里設置 為最大長度,不足 的推文進行zero padding。使用 來表示源推文的獨熱編碼表示, 是詞的獨熱向量,使用一個全連接網絡來獲得word embedding , 是word embedding的維度,過程是:

然后使用GRU來學習詞序列表示,也就是 ,最終得到 。

我們的目的是利用提取的用戶特征 以及推文的傳播序列來學習用戶傳播表示。其根本觀點是,真實新聞傳播中的用戶特征與虛假新聞傳播中的用戶特征是不同的。這里的輸入是推文 的轉發用戶特征向量序列,用 表示, 是選定的固定長度的轉發用戶數量。如果轉發用戶數量超過 則截取前 個,如果少于 則從 中重采樣直至長度為 。

給定傳播序列 ,使用GRU來學習傳播表示, ,最終通過平均池化獲得傳播表示 , 。

采用2D卷積來學習 內特征的相關性,考慮 個連續用戶來建模其序列相關性,比如 ,卷積核 的大小就是 ,總共使用 個卷積核,因此最終學習到的表示序列 。

我們的目的是創建一個圖來建模轉發用戶之間潛在的交互,想法是擁有特殊特征的用戶之間的相關性對揭示源推文是否是假新聞能夠起到作用。每個源推文 的轉發用戶集合 都被用來構建一個圖 。由于用戶間的真實交互是不清楚的,因而這個圖是全連接的,也就是任意節點相連, 。結合用戶特征,每條邊 都被關聯到一個權重 ,這個權重也就是節點用戶特征向量 和 的余弦相似度,即 ,圖的鄰接矩陣 。

然后使用第三代GCN來學習用戶交互表示。給定鄰接矩陣 和用戶特征矩陣 ,新的 維節點特征矩陣 計算過程為:

是層數, , 是度矩陣, 是第 層的學習參數, 是激活函數。這里 ,實驗時選擇堆疊兩層GCN層,最終學習到的表示為 。

我們認為假新聞的證據可以通過調查源推文的哪些部分是由哪些類型的轉發用戶關注的來揭開,并且線索可以由轉發用戶之間如何互動來反映。因此,本文提出了al 買粉絲-attention機制,來建模:

①源推文( )與用戶傳播embedding( )之間以及

②源推文( )與graph-aware的交互embedding( )之間

的相互作用。通過al 買粉絲-attention的注意力權重,模型可以具有可解釋性。

首先計算一個相似性矩陣 :

這里 是一個 的參數矩陣。接著按照以下方式得到 和 :

這里 ,這里的 和 可以看做在做user-interaction attention空間和source story word attention空間的轉換。接下來得到attention的權重:

這里 , 是學習的參數。最后可以得到源推文和用戶交互的attention向量:

和 描述源推文中的單詞是如何被用戶參與互動的。

按照上述類似過程生成 和 的attention向量 和 。

注意基于GRU的傳播表示沒有用來學習與 的交互。這是因為對于假新聞的預測來說,轉發序列的用戶特征能夠起到重要的作用。因此本文采用基于GRU和CNN的兩種方式來學習傳播表示,其中基于CNN的傳播表示被用來學習與 的交互,基于GRU的傳播表示在進行最終預測時用作最終分類器的直接輸入。

最終使用 來進行假新聞檢測:

損失函數采用交叉熵損失。

對比了多項baseline的結果,效果有明顯的提升:

GCAN也可以用于假新聞早期的檢測,也就是在轉發用戶不多的時候進行檢測,實驗改動了使用的轉發用戶數量來進行驗證:

另外移除了一部分組件進行了消融實驗,圖中-A,-R,-G,-C分別代表移除al 買粉絲-attention,基于GRU的表示,graph-aware的表示和基于CNN的表示:

-S-A代表既沒有源推文embedding也沒有al 買粉絲-attention,由于源推文提供了基本線索,因此-S-A有一個明顯的性能下降。

source-propagation 買粉絲-attention學習到的attention權重可以用來為預測假新聞提供證據,采用的方式就是標識出源推文中的重要的詞和可疑的用戶。注意,我們不考慮source-interaction Co-attention的可解釋性,因為從構造的圖中學到的用戶交互

很赞哦!(958)

Instagram刷粉絲, Ins買粉絲自助下單平台, Ins買贊網站可微信支付寶付款的名片

职业:程序员,设计师

现居:贵州安顺西秀区

工作室:小组

Email:[email protected]