域名預(yù)訂/競(jìng)價(jià),好“米”不錯(cuò)過(guò)
7月12日至14日,第二十三屆全國(guó)信息檢索學(xué)術(shù)會(huì)議(簡(jiǎn)稱CCIR2017)在上海召開(kāi)。大會(huì)最后一天,由搜狗搜索與CCIR2017聯(lián)合舉辦的全國(guó)首屆“面向智能問(wèn)答的篇章排序”比賽評(píng)測(cè)報(bào)告、九支代表隊(duì)伍技術(shù)報(bào)告及頒獎(jiǎng)典禮也隆重舉行,標(biāo)志著這場(chǎng)歷時(shí)三個(gè)多月的大型評(píng)測(cè)比賽圓滿落下帷幕。
為了持續(xù)推動(dòng)中文信息檢索技術(shù)和自然語(yǔ)言處理技術(shù)的發(fā)展及應(yīng)用,搜狗搜索于今年4月1日聯(lián)合CCIR2017共同發(fā)起“面向智能問(wèn)答的篇章排序”比賽。作為國(guó)內(nèi)首次大規(guī)模真實(shí)用戶問(wèn)答數(shù)據(jù)集上的問(wèn)答評(píng)測(cè)任務(wù),本次大賽吸引了國(guó)內(nèi)近85所高校學(xué)生及一批業(yè)內(nèi)研究者的積極參與。
按照賽制,參賽者需在給定問(wèn)題下,設(shè)計(jì)排序方法對(duì)候選篇章進(jìn)行排序,并盡可能將包含正確答案的篇章排在前面,最終按照篇章所含答案的完整度進(jìn)行評(píng)定。本次大賽中,北京大學(xué)、華中科技大學(xué)、哈爾濱工業(yè)大學(xué)語(yǔ)言技術(shù)研究中心三支戰(zhàn)隊(duì),從眾多參賽隊(duì)伍中脫穎而出榮膺三甲,分別獲得由CCIR2017與中國(guó)計(jì)算機(jī)協(xié)會(huì)(CCF)提供的成績(jī)證書(shū),及搜狗搜索提供的豐厚獎(jiǎng)金。
作為大賽的聯(lián)合主辦方,搜狗搜索除了為廣大高校學(xué)生、業(yè)內(nèi)研究者提供展示和學(xué)習(xí)的平臺(tái)外,更是借此機(jī)會(huì),提供智能問(wèn)答領(lǐng)域的大規(guī)模公開(kāi)數(shù)據(jù)集,以促進(jìn)學(xué)術(shù)界和業(yè)界在智能問(wèn)答領(lǐng)域的研究發(fā)展,鼓勵(lì)學(xué)術(shù)交流,提升研究水平。
目前在智能問(wèn)答研究領(lǐng)域,可用的大規(guī)模公開(kāi)數(shù)據(jù)集,尤其是反映真實(shí)用戶問(wèn)答需求的中文數(shù)據(jù)集非常稀缺。這很大程度上限制了業(yè)界及學(xué)術(shù)界關(guān)于智能問(wèn)答的研究,使其研究局限于“事實(shí)性問(wèn)答”領(lǐng)域,而無(wú)法涉及以滿足廣泛用戶的通用問(wèn)答需求為目標(biāo)的“開(kāi)放域智能問(wèn)答”領(lǐng)域。
作為國(guó)內(nèi)第二大搜索引擎,搜狗搜索是當(dāng)前用戶獲取信息的重要手段,為大規(guī)模高質(zhì)量問(wèn)答數(shù)據(jù)的生成提供了可能性。據(jù)了解,構(gòu)建“開(kāi)放域智能問(wèn)答系統(tǒng)”涉及到復(fù)雜的自然語(yǔ)言理解、大規(guī)模數(shù)據(jù)處理、機(jī)器學(xué)習(xí)、知識(shí)抽取和表示等人工智能研究領(lǐng)域的前沿技術(shù),對(duì)這些技術(shù)的研究依賴大規(guī)模高質(zhì)量的數(shù)據(jù)。此次“面向智能問(wèn)答的篇章排序”比賽中,搜狗搜索先后公布了來(lái)自用戶真實(shí)搜索需求的5萬(wàn)個(gè)問(wèn)題,以及從搜狗搜索全網(wǎng)檢索結(jié)果提供的50萬(wàn)條候選篇章。
事實(shí)上,基于對(duì)用戶搜索行為及需求的洞察,搜狗搜索早已前瞻性地指出,搜索的未來(lái)是“智能問(wèn)答”。通過(guò)“智能問(wèn)答”,用戶可以用自然語(yǔ)言與機(jī)器交流,搜索引擎不再是返回10條結(jié)果,而是像人一樣給出答案和建議。搜索結(jié)果不只是匹配,而更是走到了理解的角度?;诖?,搜狗搜索的人工智能技術(shù)堅(jiān)持以自然語(yǔ)言處理為核心,在語(yǔ)言的基礎(chǔ)上做自然交互和知識(shí)計(jì)算,并著力問(wèn)答方向的技術(shù)創(chuàng)新,切實(shí)推進(jìn)產(chǎn)品落地,服務(wù)用戶搜索場(chǎng)景。
目前已經(jīng)上線的搜狗“立知問(wèn)答系統(tǒng)”就是搜狗研發(fā)的面向未來(lái)的搜索技術(shù),在理解用戶的問(wèn)題或信息需求后,“立知問(wèn)答系統(tǒng)”利用海量網(wǎng)絡(luò)信息及大規(guī)模知識(shí)庫(kù),能夠直接給用戶提供答案。目前,搜狗立知不僅能精準(zhǔn)回答事實(shí)性問(wèn)題,在分析類問(wèn)題、觀點(diǎn)類問(wèn)題、數(shù)字類問(wèn)題等領(lǐng)域,都能直接返回精確答案。而“立知問(wèn)答系統(tǒng)”直接給出答案的背后,則包含了語(yǔ)義分析、問(wèn)題理解、信息抽取、知識(shí)圖譜、信息檢索、深度學(xué)習(xí)等眾多人工智能技術(shù)。
“智能問(wèn)答”能夠讓信息和知識(shí)的獲取變得更加便捷,是自然語(yǔ)言處理和人工智能領(lǐng)域的前沿研究課題。作為行業(yè)引領(lǐng)者的搜狗搜索,以開(kāi)放態(tài)度向?qū)W術(shù)界及業(yè)界提供智能問(wèn)答領(lǐng)域的大規(guī)模公開(kāi)數(shù)據(jù)集,鼓勵(lì)學(xué)術(shù)交流,對(duì)行業(yè)“智能問(wèn)答”研究的推進(jìn)意義重大。
據(jù)悉,第二屆“CIPS-SOGOU問(wèn)答比賽”已經(jīng)在籌備階段。屆時(shí),作為主辦方的搜狗搜索,將會(huì)公開(kāi)更多數(shù)據(jù)集,為廣大高校生和業(yè)內(nèi)研究者提供更大的學(xué)習(xí)展示平臺(tái),從而引領(lǐng)學(xué)界和業(yè)界在智能問(wèn)答研究領(lǐng)域不斷取得突破。
申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!