在今年8月召開的百度技術創新大會上,百度CEO李彥宏重磅拋出“框計算”這一全新技術理念,并成為行業、企業以及學術界持續熱議的話題。近日,哈爾濱工業大學信息檢索中心主任、中國中文信息處理領域學術帶頭人劉挺對這一理念發表了自己的看法。
他指出,“框計算”理念的提出,將大力推動中文信息處理技術的研發進程,給自然語言處理的研究者帶來機會。
所謂“自然語言處理”,就是用計算機去處理語言文字。隨著互聯網的大規模應用,其所呈現出爆炸式增長的數據量在客觀上推動了對語言信息處理的需求。語言信息處理的中心目標是讓機器理解人類的語言,但互聯網上過大的信息量往往造成處理速度的延遲,導致語言處理只能采用分詞這樣的最簡單的處理方法,把漢語的句子切分成詞,然后進行檢索。
劉挺指出,2000年前后業內便已提出“開放域問答系統”這樣的課題,試圖理解用戶的提問,并給出精準的答案。如果系統無法理解清楚用戶的搜索請求,還可以自動產生反問,在交互中尋求解答。但由于技術難度非常大,離實際應用還很遠,不太容易做好。而百度目前基于“框計算”技術所提供的諸如“火車時刻表”等搜索服務,通過簡捷的交互方式提供了一個實用的“問答系統”應用范例。
“可以說,框計算把我們原來有點破滅的開放域問答的理想激活了,同時又啟示了我們真正的應用應該是什么樣子的。”劉挺表示,受框計算的啟發,自己接下來將重點研發開放問答系統,這其中包括三部分:問題的理解、文檔片段的檢索和答案抽取,而其中又將把“問題的分類與理解”作為重中之重。
在劉挺看來,框計算不只是極大地擴展了搜索引擎的概念,更具有與操作系統緊密結合的可能。“原來我們認為搜索引擎就是信息獲取的一個工具,用戶要找什么信息,搜索引擎就提供什么信息給他,但是在框計算理念下,未來的框就相當于用戶的一個助手,不光能回答問題找尋信息,還可以幫助用戶執行具體操作。”
比如,如果用戶的冗余文件過多,現在的做法是打開資源管理器,手動輸入指令;但是在未來,用戶一開機彈出來的就是相當于用戶助手的框,它不光能回答問題,還可以幫助用戶執行具體操作。比如輸入“請你幫我把**文件刪除”、“請你對**文件進行排序”、“請你給我預定去**的航班”等語句,框就能自動幫用戶完成這些需求。 不過他也指出,要想真正實現這一過程,還需要解決許多難點,因為漢語的形態和應用要比英語靈活多變,這也為句法和語義分析的準確性提出了很高的挑戰。
“框計算背后對應的就是互聯網的智能人機交互界面、一站式和集中式的服務等理念,它的出現是歷史發展的必然。百度目前已經找對了方向。”劉挺評價認為,中國的互聯網信息處理領域將從框計算中受益,框計算把相關應用都提升到了新的高度,而這“也得益于百度CEO李彥宏的戰略眼光”。
為了更好地實現框計算技術向實際應用的轉化,劉挺特別建議稱,百度應當和高校、研究所等學術研究機構緊密合作,結合雙方的優勢來共同開發“框計算”,以便更好地滿足用戶需求。
|