Files / 新興技術

社群媒體情緒分析:以X為例

基於深度學習與卷積神經網絡-循環神經網絡模型,對萬條推文進行正負向情感分類的實證研究

Detail

Published

23/12/2025

關鍵章節標題列表

  1. 引言
  2. 相關研究
  3. 情緒分析
  4. 詞嵌入
  5. 深度學習
  6. 深度學習演算法與技術類型
  7. 循環神經網路
  8. 評估指標方法
  9. 研究方法
  10. 實驗結果
  11. 結論

文件簡介

在社交媒體影響力日益凸顯的背景下,公眾情緒分析已成為企業市場響應研判、政治選舉預測及宏觀經濟現象預判等領域的關鍵支撐。Twitter作為全球知名的微型部落格與社交網路平台,擁有超過2億註冊用戶及1億活躍用戶,每日產生約2.5億條推文,其海量非結構化數據為情緒挖掘提供了豐富樣本,也帶來了技術挑戰。本研究聚焦Twitter平台的情緒分析問題,核心目標是構建高效模型實現推文正負向情感的精准分類。

研究首先梳理了情緒分析的核心概念與應用場景,明確了主觀性與情緒分析(SSA)的分類維度,包括文件級、句子級及特徵層面的情感分類框架。同時,系統回顧了該領域的相關研究成果,涵蓋機器學習演算法、語義分析技術及情感詞典融合等多種研究路徑,為後續模型構建奠定理論基礎。

在技術方法層面,研究採用深度學習方法論,構建了融合卷積神經網路(CNN)與循環神經網路(RNN)的混合模型,重點引入長短期記憶網路(LSTM)解決傳統RNN的長期依賴問題。數據處理環節遵循嚴格的標準化流程,包括數據集獲取與預處理(去除停用詞、標點符號、特殊字元等)、文本表示(基於詞嵌入技術將文本轉化為向量)、數據集分割(80%訓練集與20%測試集)等關鍵步驟,確保數據質量與模型訓練有效性。

研究使用來自kaggle.com的160萬條推文數據集(含80萬條正向推文與80萬條負向推文)進行模型訓練與驗證,通過準確率、精確率、召回率及F1分數等多重指標進行性能評估。實驗結果顯示,所構建的模型在推文情感識別中實現了93.91%的成功率,其中詞嵌入層的應用、LSTM單元的參數優化及Adam優化演算法的採用對分類精度提升起到關鍵作用。

該研究驗證了深度學習模型在社交媒體非結構化數據情緒分析中的有效性,其高準確率模型可為政治行銷等實際場景提供決策支持,同時為後續構建整合化即時情緒分析系統奠定了技術基礎。研究過程中形成的數據集處理流程、模型架構設計及超參數選擇經驗,也為同類社交媒體情緒分析研究提供了可複用的實證參考。