您的位置:首頁 ->> 觀察與思考 】 【打 印
【 第1頁 第2頁 】 
于強:從大數據看台灣網民如何攻擊譚德塞

http://www.CRNTT.com   2020-04-14 00:06:56  


台灣網民在台灣最大的網絡論壇PTT討論譚德塞的詞雲圖(圖片由作者提供)
  中評社北京4月14日電(作者 于強)我們對於台灣最大的網絡論壇PTT的主版塊Gossiping進行了全文數據抓取,然後按照譚德塞、世衛組織(WHO)、總幹事(秘書長、幹事長)的關鍵詞對數據進行了清洗提取,最終發現,台灣網絡上對於譚德塞的談論是從1月27日開始的,截止4月12日,譚德塞的總聲量是79120。

  我們對於所有的網友的討論的整體文本(共111萬5092字)進行了詞頻分析,除去語氣助詞(真的、就是、這樣、還是、應該)和一些表達基本含義的詞語(中國、WHO、譚德塞、世衛、世界、組織、全世界、病毒、疫情、新聞、台灣、表示、看到),得到了詞雲圖。

  從詞頻當中看,排名第一的詞是“尼哥”(英語Negro的音譯)聲量達到了4031,與總聲量的比例竟然達到1:20,意味著平均每20次發言中就會辱罵譚德塞一次“尼哥”,比例已經驚人的高。除此之外,“垃圾”、“黑人”、“黑鬼”、“惡心”、“智障”、“廢物”等對譚德賽進行辱罵的詞語也排在了詞頻的前50名。另外,值得注意的是,台灣網友還對於譚德塞的名字進行了惡意的改寫,把“譚”寫成“痰”,聲量頻次是560。

  另外,台灣網民定居于譚德塞進行攻擊的同時,也對大陸進行了惡劣的攻擊和抹黑,辱罵大陸是“支那”的聲量達到了2028,與總聲量的比例竟然達到1:39。

  譚德塞說台灣網民對他進行人身攻擊、辱罵和種族歧視是完全成立的,大數據分析的結果完全支持譚德塞的判斷。
 


【 第1頁 第2頁 】