中評社北京4月1日電/浙江在線訊,“以前人工1分鐘才編碼兩條,現在系統1秒鐘可以編碼4000條。”溫州市統計局統計師姜志淵提及自己參與研發的“黑科技”,自豪之情溢於言表。日前,國家統計局特地發函溫州市統計局,肯定這套“黑科技”為全國統計系統首創,為全國節約普查經費5500萬元。
據悉,被稱為中國經濟“大體檢”的全國經濟普查,每5年進行一次,第4次普查目前正處於現場登記階段。隨著海量數據不斷匯聚,一幅清晰反映中國經濟社會發展形態的圖景將逐漸成形。而從“體檢”數據到“體檢”結果,離不開信息的歸並和分類,行話稱其為“編碼”。姜志淵說,編碼依據是一本484頁厚的《國民經濟分類注釋》,傳統辦法就是靠“人工分類”,“上一次大普查,我們20多人花了1個月時間才完成龍灣區3.5萬家經濟活動主體編碼。”
人工編碼不僅效率低,而且出錯概率也會高。溫州市統計局決定向智能科技要效率,由計算機系畢業的姜志淵牽頭,整合技術力量,開始了行業分類智能編碼的探索與實踐,經過1年時間反覆研磨,一套“行業分類智能編碼程序”上線。“484頁分類注釋已經全部被系統消化,它會根據經濟普查員輸入的業務活動描述自動匹配,給出符合其分類的最優推薦列表,準確率在90%以上,後期可再通過人工核查修正。”溫州市統計局局長瞿自傑介紹。
目前,這款程序已被國家統計局推廣應用於此次全國經濟普查,負責對全國1.1億家單位和個體經營戶進行智能編碼。 |