|
“碎片集”項目正在將數以萬計的楔形文字數字化。圖為一份天文學文本。(圖片來源:科技日報) |
中評社北京1月14日電/據科技日報報導,從金融到醫學,人工智能(AI)正深刻改變著現代生活。如今,它開始進軍古代文本研究:從希臘與拉丁典籍到中國甲骨文,人工神經網絡正成為解讀古文字的鑰匙。它不僅能駕馭浩瀚檔案,填補字符空缺,還能解碼幾乎無跡可尋的罕見或滅絕語言,令古代智慧在現代科技之光下重現輝煌。
2023年10月,費德里卡·尼科拉爾迪收到了一封電子郵件,郵件附帶的一張圖片徹底改變了她的研究。此圖顯示了從公元79年維蘇威火山浩劫中幸存的一卷莎草紙殘骸,它於18世紀在赫庫蘭尼姆古城的一處豪華別墅遺跡中被發現。這些歷經滄桑的莎草紙,曾是數百卷古籍之一,卻因歲月侵蝕而變得脆弱不堪,多數已無法展開。
尼科拉爾迪是意大利那不勒斯大學的一名莎草紙學者,她曾參與一項利用AI讀取難解文字的研究。而今,她見證了一項奇跡:圖片上,一片莎草紙帶上,希臘字母密布如織,於幽暗中煥發新生。
這一名為“維蘇威挑戰”的項目只是AI重塑古代歷史研究的“冰山一角”。
神經網絡重建古代文本
幾十年來,計算機一直被用於對數字化文本進行分類和分析,但目前最令人興奮的是神經網絡的使用。神經網絡由相互連接的節點組成的分層結構組成,尤其是具有多個內部層的“深層”神經網絡。
卷積神經網絡(CNN)模型能夠從這些圖像中精準捕捉網格狀數據結構。CNN模型在光學字符識別領域大放異彩的同時,也開辟了其他多元化的應用途徑。例如,中國研究團隊在探索甲骨文時,巧妙地運用這些模型來復原遭受嚴重侵蝕的文字圖案,深入分析甲骨文隨時間的演變軌跡,並將破碎的文物碎片重新拼凑起來,重現歷史原貌。
與此同時,循環神經網絡(RNN)作為一種專為處理線性序列數據設計的模型,開始展現出在搜索、翻譯以及填補已轉錄古代文本缺失內容方面的巨大潛力。RNN已被用於為古巴比倫時期數百份格式嚴謹的行政和法律文本提供缺失字符的智能化建議。 |