CNML格式】 【 】 【打 印】 
【 第1頁 第2頁 第3頁 】 
圓周率原來是首優美宋詞

http://www.chinareviewnews.com   2011-12-11 10:42:06  


  中評社香港12月11日電/《揚子晚報》報道,你羨慕那些出口就會吟詩的文人嗎?現在可以不用再羨慕他們了!因為有一位理科生“yixuan”閑來無事,把《全宋詞》拿出來“搗鼓”,算出了其中的99個高頻詞匯。熟記這些高頻詞,你就可以隨性所欲進行創作了!你還可以用“無序”的數字來創造一首“美妙絕倫”的宋詞,圓周率也可以哦!

  簡化宋詞就是“東風何處在人間”

  署名為“yixuan”的網友在個人博客里寫道:“突然想看看宋詞裡面什麼樣的意象是最常見的,比如可以做個頻率分析什麼的。當然文本挖掘需要分詞,我沒法在其中花太多時間,於是想出了一個土辦法。宋詞的句子都很短,如果窮舉可能的字的組合的話並不是太多,況且最常見的詞語一般是兩三個字,這樣可能的組合就更少了。”比如“猶解嫁東風”這句話,可能的二字組合是“猶解”“解嫁”“嫁東”“東風”,三字組合是“猶解嫁”“解嫁東”“嫁東風”,詞的字數越多,可能的組合就越少。如果把每句話可能的字的組合都列舉出來,就可以整體統計頻率了。”大家一致分析這位網友一定是個理科生。

  隨後, “yixuan”貼出了他算出來的高頻詞,排在前面的分別是:1、1485 2、東風(1382)3、何處(1230)4、人間(1202)5、風流(857) 6、歸去(812)7、春風(802)8、西風(779)9、歸來(771)10、江南(765)……至於為什麼第一名是數字,他解釋:“排在第一的是無效字符,這跟數據源有關。”這個結果一出來,一位網友就一語道破了“玄機”,“原來,最流行的宋詞就是‘東風何處在人間’啊!” 


【 第1頁 第2頁 第3頁 】 


CNML格式】 【 】 【打 印】 

 相關新聞: