中評社北京10月14日電/科技日報報道,開學季,美國一款號稱服務兩萬所學校的AI閱卷系統遭到質疑,學生們只要借助系統漏洞,輸入相應關鍵詞,即使關鍵詞之間並無關聯,也能輕易獲得高分。
隨著人工智能的發展,不少教育App都應用了智能評分系統,評分系統閱卷迅速,及時出分,受到不少師生的歡迎。但同時,也有不少家長吐槽智能評分系統,像英語跟讀App的評分系統,有時候即使擁有英語專業八級水平的人,測試得分也只有80分。
除了應用於英語口語的智能評分系統,人工智能還被應用於判卷上。不過這種智能閱卷系統也時有“翻車”現象。據報道,在開學季,一款號稱服務於美國兩萬所學校的AI閱卷系統就受到了質疑,學生們借助它的漏洞,“裸考”就能輕鬆及格。之所以被學生們鑽了空子,是由於該系統只是通過關鍵詞進行評分,學生們只要輸入相應關鍵詞,即使幾個關鍵詞之間沒有關係,也能順利過關甚至獲得高分。
閱卷前需先設定評判標準
“自動測評打分系統一般需要先設定評測的標準,而後根據設定的標準去設計合適的評測算法與模型。”天津大學智能與計算學部教授、博士生導師熊德意介紹,比如像口語測評打分,就需要機器去評判人的發音是否標準,所讀句子的重音是否正確,讀出的語句是否連貫流暢,連讀部分是否準確等。
AI閱卷系統則涉及到對語言文字的評判,涵蓋很多方面,如語法、語義等,會大量運用到自然語言處理技術。
“自然語言處理技術是人工智能的一個重要分支,研究利用計算機對自然語言進行智能化處理,基礎的自然語言處理技術主要圍繞語言的不同層級展開,包括音位(語言的發音模式)、形態(字、字母如何構成單詞、單詞的形態變化)、詞匯(單詞之間的關係)、句法(單詞如何形成句子)、語義(語言表述對應的意思)、語用(不同語境中的語義解釋)、篇章(句子如何組合成段落)7個層級。”熊德意強調,這些基本的自然語言處理技術經常被運用到下游的多種自然語言處理任務(如機器翻譯、對話、問答、文檔摘要等)中,自動閱卷中的語言文字評測通常涉及這7個層級的若干層。
|