構建開放域智能問答系統是人工智能研究領域的一項重要前沿課題。近日,由搜狗搜索聯合中國中文信息學會共同舉辦的“CIPS-SOGOU問答比賽”,正式啟動了“非事實類問答子任務”。搜狗搜索將公開百萬級真實用戶問答數據集,為參賽者提供一展身手的舞臺,從而促進學術界及業界交流,提升智能問答領域的研究水平,推動智能問答系統更加廣泛地面向公眾提供信息服務。
“CIPS-SOGOU問答比賽”,是國內首檔基于大規模真實用戶問答數據集的問答評測任務。大賽根據問題類型將比賽任務分為“事實類問答子任務”和“非事實類問答子任務”,分別對應事實類問題和非事實類問題。去年9月,該大賽伴隨著“事實類問答子任務”的啟動已正式開賽。
而于近日啟動的“非事實類問答子任務”,無疑又為大賽注入新機,將賽事推向高潮。相較于“事實類問題”,“非事實類問題”包括更廣泛的問答內容形式,包括列舉(list)、定義(definition)、方式(how)、原因(why)、假設(hypothetical)等等。
根據賽制,基于搜狗搜索提供的問題,以及相對應的若干候選答案篇章,參賽者需設計算法從候選篇章中抽取合適的詞語、短語或句子,形成一段正確、完整、簡潔的文本,作為預測答案,以正確、完整、簡潔地回答該問題,答案文本長度限定在500字內。
針對大賽中的每個問題,參賽者只需提供一個預測答案。“非事實類問答子任務”將針對該預測答案與標準答案計算ROUGE-L和BLEU值,再以測試集上兩個指標的平均值作為最終指標。此次比賽將在2018年11月CIPS年會上舉行頒獎儀式,授予獲勝者獎金和榮譽證書。

(圖:CIPS-SOGOU問答比賽任務說明)
值得期待的是,此次“非事實類問答子任務”中,搜狗搜索將公開百萬級真實用戶問答數據集。包含10萬個非事實型問題,代表了最真實廣泛的網民信息需求;以及100萬個對應問題的候選篇章及答案標注(每個問題對應給出10個候選答案篇章),候選篇章都是從搜索引擎檢索真實網頁結果中抽取的文本。
實際上,搜狗搜索在此次任務中提供百萬級真實用戶數據集,除了促使大賽正常開展外,更有意義的是,此舉為構建開放域智能問答系統的研究提供了剛需的數據支撐,有助于促進智能問答領域技術的發展和應用,從而推動智能問答系統更加廣泛地面向公眾提供信息服務,讓用戶更加便捷地獲取信息和知識。
作為國內第二大搜索引擎,搜狗搜索憑借自身數據優勢及在人工智能領域研究的持續大力投入,已經在智能問答領域處于領先地位,率先實現了“直接為用戶提供答案”。搜狗搜索已上線的“立知”智能問答系統,就是其研發的面向未來的搜索。該系統能夠理解用戶搜索意圖,并直接提供答案。目前,“立知”智能問答系統在事實性問題、分析類問題、觀點類問題、數字類問題、隱式問題等方面,都能為用戶直接返回精確答案。
現在,作為智能問答領域的帶路黨,搜狗搜索開放技術能力,向學界及業界提供百萬級真實用戶問答數據集,助力行業向“非事實性問答”領域研究開拓,促進智能問答領域的學術交流。有興趣進行技術切磋,提升研究水平的高校師生及業內研究人員,均可通過“搜狗實驗室”官網提交報名信息參賽。
推薦閱讀
線上線下大招頻發,TCL 5.18聚劃算日多重壕禮燃爆消費熱情
截至5月19日24時,TCL&聚劃算5.18優惠活動整體銷售額突破3007萬,覆蓋人群破千萬。且TCL在520告白日來臨之際,放大鉅惠政策,以大國品牌之力向全民告白。TCL5.18聚劃算優惠>>>詳細閱讀
本文標題:搜狗搜索“CIPS-SOGOU問答比賽”賽程加碼 正式啟動“非事實類問答子任務”
地址:http://www.xglongwei.com/a/05/306062.html