亚洲精品久久久久久久久久久,亚洲国产精品一区二区制服,亚洲精品午夜精品,国产成人精品综合在线观看,最近2019中文字幕一页二页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

深度剖析人工智能知識(shí)圖譜與認(rèn)知智能

8g3K_AI_Thinker ? 來(lái)源:未知 ? 作者:李倩 ? 2018-04-08 10:31 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

今天跟大家分享的主題是《知識(shí)圖譜與認(rèn)知智能》。

知識(shí)圖譜自2012年提出至今,發(fā)展迅速,如今已經(jīng)成為人工智能領(lǐng)域的熱門(mén)問(wèn)題之一,吸引了來(lái)自學(xué)術(shù)界和工業(yè)界的廣泛關(guān)注,在一系列實(shí)際應(yīng)用中取得了較好的落地效果,產(chǎn)生了巨大的社會(huì)與經(jīng)濟(jì)效益。那么到底是什么在支撐著知識(shí)圖譜技術(shù)的繁榮景象?是一股什么力量讓知識(shí)圖譜技術(shù)吸引了如此多的關(guān)注?換句話說(shuō),知識(shí)圖譜到底能解決什么問(wèn)題?何以能夠解決這些問(wèn)題?今天的報(bào)告主要圍繞著這些問(wèn)題,給大家做一個(gè)初步的解答。

先簡(jiǎn)單介紹一下整個(gè)報(bào)告的總體思路。人類(lèi)社會(huì)已經(jīng)進(jìn)入智能時(shí)代,智能時(shí)代的社會(huì)發(fā)展催生了大量的智能化應(yīng)用,智能化應(yīng)用對(duì)機(jī)器的認(rèn)知智能化水平提出了前所未有的要求,機(jī)器認(rèn)知智能的實(shí)現(xiàn)依賴(lài)的就是知識(shí)圖譜技術(shù)。

我想大家已經(jīng)深刻地感受到我們身處在一個(gè)智能化的時(shí)代。

從2012年Google的圖像識(shí)別錯(cuò)誤率顯著下降,機(jī)器在圖像識(shí)別方面接近人類(lèi)水平;到2016年AlphaGo戰(zhàn)勝了人類(lèi)圍棋冠軍;再到2017年AlphaZero戰(zhàn)勝了AlphaGo,以及DeepMind去嘗試星際爭(zhēng)霸游戲,這一系列AI發(fā)展的標(biāo)志性事件讓我們看到了人工智能技術(shù)幫助解決人類(lèi)社會(huì)發(fā)展若干問(wèn)題的希望。我們已經(jīng)見(jiàn)證的這一系列人工智能技術(shù)的發(fā)展,本質(zhì)上是受益于大數(shù)據(jù)給人工智能帶來(lái)的數(shù)據(jù)紅利。

這一波人工智能熱潮是在大數(shù)據(jù)所給予的海量標(biāo)注樣本以及超強(qiáng)計(jì)算能力這兩個(gè)強(qiáng)大的支撐作用下所形成的??梢哉f(shuō),這一波人工智能的發(fā)展本質(zhì)上是大數(shù)據(jù)喂養(yǎng)出來(lái)的。到了今天,可以很自豪地宣告機(jī)器智能在感知智能和計(jì)算智能等若干具體問(wèn)題上已經(jīng)達(dá)到甚至超越人類(lèi)水平。現(xiàn)在,在語(yǔ)音識(shí)別與合成、圖像識(shí)別、封閉環(huán)境有限規(guī)則的游戲領(lǐng)域等問(wèn)題上,機(jī)器智能水平堪比、甚至超越人類(lèi)水準(zhǔn)。

這一系列人工智能技術(shù)的突破性進(jìn)展,促使各行各業(yè)紛紛走向了一條智能化升級(jí)和轉(zhuǎn)型的道路。智能化技術(shù)尤其為我國(guó)傳統(tǒng)行業(yè)的發(fā)展帶來(lái)了全新機(jī)遇,對(duì)于我國(guó)經(jīng)濟(jì)結(jié)構(gòu)升級(jí),以及傳統(tǒng)實(shí)體行業(yè)擺脫當(dāng)前一系列發(fā)展困境帶來(lái)了全新的機(jī)遇。智能化升級(jí)和轉(zhuǎn)型已經(jīng)成為各行各業(yè)的普遍訴求。各行業(yè)走向智能化的發(fā)展道路,在某種意義上也是人類(lèi)社會(huì)發(fā)展的必然趨勢(shì)。

自計(jì)算機(jī)面世以來(lái),人類(lèi)社會(huì)在經(jīng)歷了計(jì)算機(jī)技術(shù)發(fā)展的一系列浪潮之后,基本完成了信息化的使命。信息化時(shí)代最重要的任務(wù)是數(shù)據(jù)記錄與采集,這勢(shì)必造就大數(shù)據(jù)。當(dāng)我們邁進(jìn)大數(shù)據(jù)時(shí)代之后,我們勢(shì)必對(duì)大數(shù)據(jù)的價(jià)值挖掘提出訴求。大數(shù)據(jù)的價(jià)值挖掘需要智能化手段。因此大數(shù)據(jù)時(shí)代的到來(lái),某種意義上只是智能化時(shí)代的短暫序曲。我相信,未來(lái)若干年,計(jì)算機(jī)技術(shù)的主要使命是幫助人類(lèi)社會(huì)實(shí)現(xiàn)智能化。

在各行業(yè)的智能化發(fā)展進(jìn)程中,AI+或者AI賦能成為了傳統(tǒng)行業(yè)智能化升級(jí)和轉(zhuǎn)型的一個(gè)基本模式。在AI的賦能下,傳統(tǒng)行業(yè)面臨著非常多的機(jī)遇,其所關(guān)心的一系列核心問(wèn)題,比如增加收入、降低成本、提高效率和安全保障等,都將顯著受益于智能化技術(shù)。比如智能客服系統(tǒng)已經(jīng)在很多行業(yè)大規(guī)模應(yīng)用,大大降低了人工客服的巨大勞動(dòng)力成本;一些企業(yè)利用知識(shí)圖譜,對(duì)企業(yè)內(nèi)部的研發(fā)資源進(jìn)行管理,顯著提升研發(fā)效率,這些都是AI可以賦能傳統(tǒng)行業(yè)的具體體現(xiàn)。

智能化的升級(jí)和轉(zhuǎn)型對(duì)整個(gè)傳統(tǒng)行業(yè)產(chǎn)生的影響將是顛覆性的,將重塑整個(gè)行業(yè)的形態(tài),革新傳統(tǒng)行業(yè)的各個(gè)關(guān)鍵環(huán)節(jié),智能化技術(shù)將逐步滲透到傳統(tǒng)行業(yè)的各個(gè)角落。最近幾年我們看到越來(lái)越多的傳統(tǒng)行業(yè)將人工智能領(lǐng)域升格為企業(yè)的核心戰(zhàn)略,在電商、社交、物流、金融、醫(yī)療、司法、制造等很多領(lǐng)域涌現(xiàn)出越來(lái)越多的AI賦能傳統(tǒng)行業(yè)的發(fā)展案例。

智能化對(duì)機(jī)器的智能水平提出了要求,包括機(jī)器的計(jì)算智能、感知智能,尤其是機(jī)器的認(rèn)知智能。所謂讓機(jī)器具備認(rèn)知智能是指讓機(jī)器能夠像人一樣思考,而這種思考能力具體體現(xiàn)在機(jī)器能夠理解數(shù)據(jù)、理解語(yǔ)言進(jìn)而理解現(xiàn)實(shí)世界的能力,體現(xiàn)在機(jī)器能夠解釋數(shù)據(jù)、解釋過(guò)程進(jìn)而解釋現(xiàn)象的能力,體現(xiàn)在推理、規(guī)劃等等一系列人類(lèi)所獨(dú)有的認(rèn)知能力上。

相較于感知能力,認(rèn)知能力的實(shí)現(xiàn)難度更大,價(jià)值也更大。前幾年在深度學(xué)習(xí)的推動(dòng)下,機(jī)器感知能力顯著提升。但是感知能力動(dòng)物也具備,比如我們家里的小貓小狗也能識(shí)別主人,識(shí)別物體。所以讓機(jī)器具備感知能力只是讓機(jī)器具備了一般動(dòng)物所具備的能力,還不是那么值得“炫耀”的事情。但是,認(rèn)知能力是人類(lèi)獨(dú)有的能力,一旦機(jī)器具備認(rèn)知能力,AI技術(shù)將會(huì)給人類(lèi)社會(huì)帶來(lái)顛覆性革命,同時(shí)也將釋放出巨大的產(chǎn)業(yè)能量。所以實(shí)現(xiàn)機(jī)器的認(rèn)知能力是人工智能發(fā)展進(jìn)程中具有里程碑意義的重大事件。

隨著大數(shù)據(jù)紅利的消失殆盡,以深度學(xué)習(xí)為代表的感知智能水平日益接近其“天花板”。以深度學(xué)習(xí)為代表的統(tǒng)計(jì)學(xué)習(xí)嚴(yán)重依賴(lài)大樣本,這些方法只能習(xí)得數(shù)據(jù)中的統(tǒng)計(jì)模式。然而,現(xiàn)實(shí)世界很多實(shí)際問(wèn)題的解決單單依靠統(tǒng)計(jì)模式是不夠的,還需要知識(shí),特別是符號(hào)化的知識(shí)。

我們?nèi)祟?lèi)的語(yǔ)言理解、司法判案、醫(yī)療診斷、投資決策等等很多領(lǐng)域都是顯著依賴(lài)我們的知識(shí)才能實(shí)現(xiàn)的。很多從事自然語(yǔ)言處理的研發(fā)人員普遍有個(gè)深刻的感受:即便數(shù)據(jù)量再大,模型再先進(jìn),很多自然語(yǔ)言處理任務(wù),比如中文分詞、情感分析達(dá)到一定準(zhǔn)確率之后,就很難再改進(jìn)了。

比如,中文分詞的一個(gè)經(jīng)典案例:“南京市長(zhǎng)江大橋”,不管是分為“南京市長(zhǎng)+江大橋”還是“南京市+長(zhǎng)江大橋”都依賴(lài)我們的知識(shí)。如果從上下文我們得知是在討論南京市長(zhǎng),并且有個(gè)人叫“江大橋”,我們會(huì)傾向于分為“南京市長(zhǎng)+江大橋”,否則我們會(huì)根據(jù)我們已有的知識(shí)斷句為“南京市+長(zhǎng)江大橋”。不管是哪種情況,我們都在利用我們的知識(shí)。我記得我國(guó)知名統(tǒng)計(jì)學(xué)者徐宗本院士在去年年底一個(gè)論壇上說(shuō)過(guò):“數(shù)據(jù)不夠模型補(bǔ)”。我想傳達(dá)類(lèi)似的觀點(diǎn):“數(shù)據(jù)不夠知識(shí)補(bǔ)”,甚至“數(shù)據(jù)足夠了,知識(shí)也不能缺失”。而知識(shí)圖譜就是這種不可或缺的知識(shí)的重要表現(xiàn)形式之一。

機(jī)器認(rèn)知智能絕不是束之高閣、高高在上的前沿技術(shù)。它是一類(lèi)能夠?qū)崒?shí)在在落地的、有著廣泛且多樣的應(yīng)用需求的、能夠產(chǎn)生巨大社會(huì)經(jīng)濟(jì)價(jià)值的技術(shù)。機(jī)器認(rèn)知智能的發(fā)展過(guò)程本質(zhì)上是人類(lèi)腦力不斷解放的過(guò)程。在工業(yè)革命和信息化時(shí)代,我們的體力被逐步解放;而隨著人工智能技術(shù)的發(fā)展,尤其是認(rèn)知智能技術(shù)的發(fā)展,我們的腦力也將會(huì)逐步解放。越來(lái)越多的知識(shí)工作將逐步被機(jī)器所代替,伴隨而來(lái)的將是機(jī)器生產(chǎn)力的進(jìn)一步解放。機(jī)器認(rèn)知智能在應(yīng)用方面是廣泛和多樣的,體現(xiàn)在精準(zhǔn)分析、智慧搜索、智能推薦、智能解釋、更自然的人機(jī)交互和深層關(guān)系推理等各個(gè)方面。

認(rèn)知智能的第一個(gè)應(yīng)用抓手就是大數(shù)據(jù)的精準(zhǔn)與精細(xì)分析。如今,越來(lái)越多的行業(yè)或者企業(yè)積累了規(guī)??捎^的大數(shù)據(jù)。但是這些數(shù)據(jù)并未發(fā)揮出應(yīng)有的價(jià)值,很多大數(shù)據(jù)還需要消耗大量的運(yùn)維成本。大數(shù)據(jù)非但沒(méi)有創(chuàng)造價(jià)值,在很多情況下還成為了一筆負(fù)資產(chǎn)。這一現(xiàn)象的根本原因在于,當(dāng)前的機(jī)器缺乏諸如知識(shí)圖譜這樣的背景知識(shí),機(jī)器理解大數(shù)據(jù)的手段有限,限制了大數(shù)據(jù)的精準(zhǔn)與精細(xì)分析,從而大大降低了大數(shù)據(jù)的潛在價(jià)值。

舉個(gè)親身體驗(yàn)的例子,在娛樂(lè)圈王寶強(qiáng)離婚案剛剛開(kāi)始的時(shí)候,新浪微博的熱搜前三位分別是“王寶強(qiáng)離婚”、“王寶寶離婚”和“寶強(qiáng)離婚”。也就是說(shuō),當(dāng)時(shí)的微博平臺(tái)還沒(méi)有能力將這三件事自動(dòng)歸類(lèi)到一件事,不知道這三件事其實(shí)說(shuō)的是一件事。機(jī)器在統(tǒng)計(jì)事件熱度的時(shí)候就分開(kāi)統(tǒng)計(jì)了,這就是因?yàn)楫?dāng)時(shí)機(jī)器缺乏背景知識(shí),不知道王寶強(qiáng)又稱(chēng)為“王寶寶”或“寶強(qiáng)”,所以沒(méi)有辦法做到大數(shù)據(jù)的精準(zhǔn)分析。

事實(shí)上,輿情分析、互聯(lián)網(wǎng)的商業(yè)洞察,還有軍事情報(bào)分析和商業(yè)情報(bào)分析都需要大數(shù)據(jù)的精準(zhǔn)分析,而這種精準(zhǔn)分析就必須要有強(qiáng)大的背景知識(shí)支撐。除了大數(shù)據(jù)的精準(zhǔn)分析,數(shù)據(jù)分析領(lǐng)域另一個(gè)重要趨勢(shì):精細(xì)分析,也對(duì)知識(shí)圖譜和認(rèn)知智能提出了訴求。比如很多汽車(chē)制造廠商都希望實(shí)現(xiàn)個(gè)性化制造。個(gè)性化制造希望從互聯(lián)網(wǎng)上搜集用戶對(duì)汽車(chē)的評(píng)價(jià)與反饋,并以此為據(jù)實(shí)現(xiàn)汽車(chē)的按需與個(gè)性化定制。為了實(shí)現(xiàn)個(gè)性化定制,廠商不僅需要知道消費(fèi)者對(duì)汽車(chē)的褒貶態(tài)度,還需要進(jìn)一步了解消費(fèi)者不滿意的細(xì)節(jié)之處,以及消費(fèi)者希望如何改進(jìn),甚至用戶提及了哪些競(jìng)爭(zhēng)品牌。顯然面向互聯(lián)網(wǎng)數(shù)據(jù)的精細(xì)化數(shù)據(jù)分析必需要求機(jī)器具備關(guān)于汽車(chē)評(píng)價(jià)的背景知識(shí)(比如汽車(chē)的車(chē)型、車(chē)飾、動(dòng)力、能耗等等)。因此,大數(shù)據(jù)的精準(zhǔn)和精細(xì)化分析需要智能化的技術(shù)支撐。

認(rèn)知智能的第二個(gè)非常重要的應(yīng)用抓手是智慧搜索。下一代智慧搜索對(duì)機(jī)器認(rèn)知智能提出了需求。智慧搜索體現(xiàn)在很多方面。

首先,體現(xiàn)在搜索意圖的精準(zhǔn)理解方面。比如在淘寶上搜索“iPad充電器”,用戶的意圖顯然是要搜索一個(gè)充電器,而不是一個(gè)iPad,這個(gè)時(shí)候淘寶應(yīng)該反饋給用戶若干個(gè)充電器以供選擇,而不是iPad。再比如在Google上搜索“toys kids”或者“kids toys”,不管搜索這兩個(gè)中的哪一個(gè),用戶的意圖都是在搜索給孩子的玩具,而不是玩玩具的小孩,因?yàn)橐话悴粫?huì)有人用搜索引擎搜孩子?!皌oys kids”和“kid’s toys”中兩個(gè)詞都是名詞,要辨別出哪一個(gè)是核心詞,哪一個(gè)是修飾詞,在缺乏上下文的短文本上,仍然是個(gè)具有挑戰(zhàn)性的難題。

其次,搜索的對(duì)象越來(lái)越復(fù)雜多元化。以前搜索的對(duì)象以文本為主,現(xiàn)在大家希望能搜索圖片和聲音,甚至還能搜代碼,搜視頻,搜設(shè)計(jì)素材等等,要求一切皆可搜索。

第三、搜索的粒度也越來(lái)越多元化?,F(xiàn)在的搜索不僅能做篇章級(jí)的搜索,還希望能做到段落級(jí)、語(yǔ)句級(jí)、詞匯級(jí)的搜索。尤其是在傳統(tǒng)知識(shí)管理領(lǐng)域,這個(gè)趨勢(shì)已經(jīng)非常明顯。傳統(tǒng)的知識(shí)管理大都只能做到文檔級(jí)搜索,這種粗粒度的知識(shí)管理已經(jīng)難以滿足實(shí)際應(yīng)用中細(xì)粒度的知識(shí)獲取需求。

最后,是跨媒體的協(xié)同搜索。傳統(tǒng)搜索以面向單質(zhì)單源數(shù)據(jù)的搜索居多。比如針對(duì)文本搜索難以借力視頻、圖片信息,針對(duì)圖片的搜索主要還是利用圖片自身的信息,對(duì)于大量文本信息利用率還不高。最近的趨勢(shì)是跨媒體的協(xié)同搜索。比如前幾年,明星王珞丹在微博上曬了張自家小區(qū)的照片,然后就有好事者根據(jù)她的微博社交網(wǎng)絡(luò)、百度地圖、微博文本與圖片信息等多個(gè)渠道多種媒體的信息,通過(guò)聯(lián)合檢索準(zhǔn)確推斷出其所在小區(qū)位置。所以,未來(lái)的趨勢(shì)是一切皆可搜索,并且搜索必達(dá)。

認(rèn)知智能的第三個(gè)應(yīng)用抓手是智能推薦。智能推薦表現(xiàn)在很多方面。

首先是場(chǎng)景化推薦。比如用戶在淘寶上搜“沙灘褲”、“沙灘鞋”,可以推測(cè)這個(gè)用戶很有可能要去沙灘度假。那么平臺(tái)是否能推薦“泳衣”、“防曬霜”之類(lèi)的沙灘度假常用物品呢?事實(shí)上,任何搜索關(guān)鍵字背后,購(gòu)物籃里的任何一件商品背后都體現(xiàn)著特定的消費(fèi)意圖,很有可能對(duì)應(yīng)到特定的消費(fèi)場(chǎng)景。建立場(chǎng)景圖譜,實(shí)現(xiàn)基于場(chǎng)景圖譜的精準(zhǔn)推薦,對(duì)于電商推薦而言至關(guān)重要。

第二、任務(wù)型推薦。很多搜索背后的動(dòng)機(jī)是完成特定任務(wù)。比如用戶購(gòu)買(mǎi)了“羊肉卷”、“牛肉卷”、“菠菜”、“火鍋底料”,那么用戶很有可能是要做一頓火鍋,這種情況下,系統(tǒng)推薦火鍋調(diào)料、火鍋電磁爐,用戶很有可能買(mǎi)單。

第三、冷啟動(dòng)下的推薦。冷啟動(dòng)階段的推薦一直是傳統(tǒng)基于統(tǒng)計(jì)行為的推薦方法難以有效解決的問(wèn)題。利用外部知識(shí),特別是關(guān)于用戶與物品的知識(shí)指引冷啟動(dòng)階段的匹配與推薦,是有可能讓系統(tǒng)盡快渡過(guò)這個(gè)階段的。第四、跨領(lǐng)域的推薦。

當(dāng)阿里剛剛?cè)牍尚吕藭r(shí),我們?cè)谠O(shè)想是否能將淘寶的商品推薦給微博的用戶。比如,如果一個(gè)微博用戶經(jīng)常曬九寨溝、黃山、泰山的照片,那么為這位用戶推薦一些淘寶的登山裝備準(zhǔn)沒(méi)錯(cuò)。這是典型的跨領(lǐng)域推薦,微博是一個(gè)媒體平臺(tái),淘寶是一個(gè)電商平臺(tái)。他們的語(yǔ)言體系、用戶行為完全不同,實(shí)現(xiàn)這種跨領(lǐng)域推薦顯然商業(yè)價(jià)值巨大,但卻需要跨越巨大的語(yǔ)義鴻溝。

如果能有效利用知識(shí)圖譜這類(lèi)背景知識(shí),不同平臺(tái)之間的這種語(yǔ)義鴻溝是有可能被跨越的。比如百科知識(shí)圖譜告訴我們九寨溝是個(gè)風(fēng)景名勝,是個(gè)山區(qū),山區(qū)旅游需要登山裝備,登山裝備包括登山杖、登山鞋等等,從而就可以實(shí)現(xiàn)跨領(lǐng)域推薦。第五、知識(shí)型的內(nèi)容推薦。在淘寶上搜索“三段奶粉”,能否推薦“嬰兒水杯”,同時(shí)我們是否能推薦用戶一些喝三段奶粉的嬰兒每天的需水量是多少,如何飲用等知識(shí)。這些知識(shí)的推薦,將顯著增強(qiáng)用戶對(duì)于推薦內(nèi)容的信任與接受程度。消費(fèi)背后的內(nèi)容與知識(shí)需求將成為推薦的重要考慮因素。

所以未來(lái)的推薦趨勢(shì)就是精準(zhǔn)感知任務(wù)與場(chǎng)景,想用戶之未想。推薦技術(shù)演進(jìn)的重要趨勢(shì)是從單純基于行為的推薦過(guò)渡到行為與語(yǔ)義融合的推薦。換言之,基于知識(shí)的推薦,將逐步成為未來(lái)推薦技術(shù)的主流。

認(rèn)知智能的第四個(gè)應(yīng)用抓手是智能解釋。2017年年底的時(shí)候,微信上流傳Google17年最流行的搜索關(guān)鍵字是“how”,這說(shuō)明人們希望Google平臺(tái)能做“解釋”。類(lèi)似于“如何做蛋炒飯”,“怎么來(lái)北理工”等這類(lèi)問(wèn)題在搜索引擎上出現(xiàn)次數(shù)日益增多,這些問(wèn)題都在考驗(yàn)機(jī)器的解釋水平。一個(gè)更有意思的例子是,當(dāng)我們?cè)贕oogle上搜索“Donald Trump”相關(guān)的問(wèn)題時(shí),你會(huì)發(fā)現(xiàn)Google會(huì)自動(dòng)提示詢(xún)問(wèn)“為什么特朗普的老婆嫁給他”而不再是“特朗普老婆是誰(shuí)”這類(lèi)簡(jiǎn)單事實(shí)問(wèn)題?!皐hy”和“how”問(wèn)題在現(xiàn)實(shí)應(yīng)用中越來(lái)越多。這一趨勢(shì)實(shí)際上體現(xiàn)了人們的一個(gè)普遍訴求,那就是希望智能系統(tǒng)具備可解釋性。所以可解釋性將是智能系統(tǒng)一個(gè)非常重要的體現(xiàn),也是人們對(duì)智能系統(tǒng)的普遍期望。

可解釋性決定了AI系統(tǒng)的決策結(jié)果能否被人類(lèi)采信??山忉屝猿蔀榱撕芏囝I(lǐng)域(金融、醫(yī)療、司法等)中阻礙AI系統(tǒng)落地應(yīng)用的最后一公里。比如在金融領(lǐng)域的智能投資決策,即便AI決策的準(zhǔn)確超過(guò)90%,但是如果系統(tǒng)不能給出作出決策的理由,投資經(jīng)理或者用戶恐怕也是十分猶豫的。再比如在醫(yī)療領(lǐng)域,即便系統(tǒng)判斷疾病的準(zhǔn)確率在95%以上,但是如果系統(tǒng)只是告訴病患得了什么病或者開(kāi)了一個(gè)藥方,卻不能解釋為什么作出這類(lèi)判斷的話,病人是不會(huì)為此買(mǎi)單的。

智能系統(tǒng)的可解釋性體現(xiàn)在很多具體任務(wù)中,包括解釋過(guò)程、解釋結(jié)果、解釋關(guān)系、解釋事實(shí)。事實(shí)上,可解釋人工智能最近受到了越來(lái)越多的關(guān)注。在學(xué)術(shù)界,機(jī)器學(xué)習(xí),特別是深度學(xué)習(xí)的黑盒特性,日益成為學(xué)習(xí)模型實(shí)際應(yīng)用的主要障礙之一。越多越多的學(xué)術(shù)研究項(xiàng)目旨在打開(kāi)深度學(xué)習(xí)的黑盒。美國(guó)軍方也有項(xiàng)目在嘗試解釋機(jī)器的學(xué)習(xí)過(guò)程。我個(gè)人也曾做過(guò)《基于知識(shí)圖譜的可解釋人工智能》的研究與思考,旨在強(qiáng)調(diào)知識(shí)圖譜在可解釋性方面的重要作用。

智能系統(tǒng)另外一個(gè)非常重要的表現(xiàn)方式就是自然人機(jī)交互。人機(jī)交互將會(huì)變得越來(lái)越自然,越來(lái)越簡(jiǎn)單。越自然簡(jiǎn)單的交互方式越依賴(lài)強(qiáng)大的機(jī)器智能水平。自然人機(jī)交互包括自然語(yǔ)言問(wèn)答、對(duì)話、體感交互、表情交互等等。特別是自然語(yǔ)言交互的實(shí)現(xiàn)需要機(jī)器能夠理解人類(lèi)的自然語(yǔ)言。會(huì)話式(Conversational UI)、問(wèn)答式(QA)交互將逐步代替?zhèn)鹘y(tǒng)的關(guān)鍵字搜索式交互。對(duì)話式交互還有一個(gè)非常重要的趨勢(shì)就是一切皆可問(wèn)答。我們的BOTs(對(duì)話機(jī)器人)將代替我們閱讀文章、新聞,瀏覽圖譜、視頻,甚至代替我們看電影、電視劇,然后回答我們所關(guān)心的任何問(wèn)題。自然人機(jī)交互的實(shí)現(xiàn)顯然需要機(jī)器的較高認(rèn)知智能水平,以及機(jī)器具備強(qiáng)大的背景知識(shí)。

認(rèn)知智能還體現(xiàn)在機(jī)器的深層關(guān)系發(fā)現(xiàn)與推理能力方面。人們?cè)絹?lái)越不滿足于“葉莉是姚明妻子”這樣的簡(jiǎn)單關(guān)聯(lián)的發(fā)現(xiàn),而是希望發(fā)現(xiàn)和挖掘一些深層、潛藏關(guān)系。這里有一些來(lái)自互聯(lián)網(wǎng)的例子。王寶強(qiáng)離婚的時(shí)候,就有人挖過(guò)為什么王寶強(qiáng)找張起淮當(dāng)律師。后來(lái)有人把人物關(guān)聯(lián)圖譜建立起來(lái),發(fā)現(xiàn)王寶強(qiáng)與馮小剛關(guān)系很好,而馮小剛有徐靜蕾和趙薇兩個(gè)經(jīng)常合作的演員,而張起淮是這兩個(gè)演員的法律顧問(wèn)。這樣的關(guān)系鏈路一定程度上揭示了王寶強(qiáng)與他的律師之間的深層次關(guān)聯(lián),也解釋了王寶強(qiáng)為何選擇這位律師。更多類(lèi)似例子發(fā)生在金融領(lǐng)域。在金融領(lǐng)域,我們可能十分關(guān)注投資關(guān)系,比如為何某個(gè)投資人投資某家公司;我們十分關(guān)注金融安全,比如信貸風(fēng)險(xiǎn)評(píng)估需要分析一個(gè)貸款人的相關(guān)關(guān)聯(lián)人物和關(guān)聯(lián)公司的信用評(píng)級(jí)。

我們可以看到,剛才所說(shuō)的這些需求都在各領(lǐng)域醞釀、發(fā)生,這些需求要求機(jī)器具備認(rèn)知能力,要求機(jī)器具備理解、解釋、規(guī)劃、推理、演繹、歸納等一系列能力。其中,尤其以理解和解釋較為突出。讓機(jī)器具備認(rèn)知能力不是今天才提出的問(wèn)題,早在圖靈時(shí)代,阿蘭-圖靈在設(shè)計(jì)圖靈機(jī)的時(shí)候就在想象機(jī)器能不能像人一樣思考。而機(jī)器認(rèn)知智能的實(shí)現(xiàn)在本質(zhì)上就是讓機(jī)器能夠像人一樣思考。

這里有一個(gè)非常重要的觀點(diǎn)要分享給大家,我認(rèn)為實(shí)現(xiàn)認(rèn)知智能是當(dāng)前以及今后一段時(shí)間里AI發(fā)展的重要使命之一。更具體一點(diǎn),理解和解釋將是后深度學(xué)習(xí)時(shí)代人工智能最重要的使命之一。之所以說(shuō)后深度學(xué)習(xí)時(shí)代,是因?yàn)樯疃葘W(xué)習(xí)的發(fā)展對(duì)于大數(shù)據(jù)紅利的使用基本上已經(jīng)到了盡頭,深度學(xué)習(xí)日益面臨性能瓶頸,需要尋求新的思路和方向進(jìn)行突破。而一個(gè)非常重要的突破方向在于知識(shí),在于對(duì)于符號(hào)知識(shí)的利用,在于符號(hào)知識(shí)與數(shù)值模型的融合。而這些努力的最終結(jié)果就是使機(jī)器具備理解和解釋的能力。

如何實(shí)現(xiàn)機(jī)器的認(rèn)知能力?或者更具體一點(diǎn),如何讓機(jī)器具備理解和解釋的能力?我認(rèn)為知識(shí)圖譜,或者說(shuō)以知識(shí)圖譜為代表的這一波知識(shí)工程的一系列技術(shù),在認(rèn)知智能的實(shí)現(xiàn)中起到非常關(guān)鍵的作用。一言以蔽之,知識(shí)圖譜是實(shí)現(xiàn)機(jī)器智能的使能器(Enabler)。也就是說(shuō)沒(méi)有知識(shí)圖譜,或許就沒(méi)有機(jī)器認(rèn)知智能的實(shí)現(xiàn)。

知識(shí)圖譜是什么?我認(rèn)為知識(shí)圖譜本質(zhì)上是一種大規(guī)模語(yǔ)義網(wǎng)絡(luò)。理解知識(shí)圖譜的概念,有兩個(gè)關(guān)鍵詞。首先是語(yǔ)義網(wǎng)絡(luò)。語(yǔ)義網(wǎng)絡(luò)表達(dá)了各種各樣的實(shí)體、概念及其之間的各類(lèi)語(yǔ)義關(guān)聯(lián)。比如“C羅”是一個(gè)實(shí)體,“金球獎(jiǎng)”也是一個(gè)實(shí)體,他們倆之間有一個(gè)語(yǔ)義關(guān)系就是“獲得獎(jiǎng)項(xiàng)”?!斑\(yùn)動(dòng)員”、“足球運(yùn)動(dòng)員”都是概念,后者是前者的子類(lèi)(對(duì)應(yīng)于圖中的subclassof 關(guān)系)。理解知識(shí)圖譜的第二個(gè)關(guān)鍵詞是“大規(guī)?!薄UZ(yǔ)義網(wǎng)絡(luò)并非新鮮事物,早在上個(gè)世紀(jì)七八十年代知識(shí)工程盛行之時(shí),就已存在。相比較于那個(gè)時(shí)代的語(yǔ)義網(wǎng)絡(luò),知識(shí)圖譜規(guī)模更大。關(guān)于這一點(diǎn)后面還會(huì)深入介紹。

從2012年Google提出知識(shí)圖譜直到今天,知識(shí)圖譜技術(shù)發(fā)展迅速,知識(shí)圖譜的內(nèi)涵遠(yuǎn)遠(yuǎn)超越了其作為語(yǔ)義網(wǎng)絡(luò)的狹義內(nèi)涵。當(dāng)下,在更多實(shí)際場(chǎng)合下,知識(shí)圖譜是作為一種技術(shù)體系,指代大數(shù)據(jù)時(shí)代知識(shí)工程的一系列代表性技術(shù)進(jìn)展的總和。去年我國(guó)學(xué)科目錄做了調(diào)整,首次出現(xiàn)了知識(shí)圖譜的學(xué)科方向,教育部對(duì)于知識(shí)圖譜這一學(xué)科的定位是“大規(guī)模知識(shí)工程”,這一定位是十分準(zhǔn)確且內(nèi)涵豐富的。這里需要指出的是知識(shí)圖譜技術(shù)的發(fā)展是個(gè)持續(xù)漸進(jìn)的過(guò)程。

從上個(gè)世紀(jì)七八十年代的知識(shí)工程興盛開(kāi)始,學(xué)術(shù)界和工業(yè)界推出了一系列知識(shí)庫(kù),直到2012年Google推出了面向互聯(lián)網(wǎng)搜索的大規(guī)模的知識(shí)庫(kù),被稱(chēng)之為知識(shí)圖譜。理解今天的知識(shí)圖譜內(nèi)涵,是不能割裂其歷史臍帶的。

知識(shí)圖譜的歷史發(fā)展必然帶來(lái)一個(gè)非常有意思的問(wèn)題,那就是上世紀(jì)七八十年代的知識(shí)表示與我們今天的知識(shí)圖譜到底有什么本質(zhì)差別?知識(shí)工程在圖靈獎(jiǎng)獲得者費(fèi)根鮑姆以及AI先驅(qū)馬文明斯基的帶領(lǐng)下,曾經(jīng)興盛一時(shí),解決了一系列實(shí)際應(yīng)用問(wèn)題,甚至在數(shù)學(xué)定理證明等看上去很難的問(wèn)題上取得了顯著進(jìn)展。時(shí)至今日,我們?cè)俅斡懻撟鳛橐环N語(yǔ)義網(wǎng)絡(luò)的知識(shí)圖譜,會(huì)不會(huì)只是冷炒飯的再次煎炒而已?知識(shí)圖譜在當(dāng)下的火熱到底是知識(shí)工程的回光返照還是再次中興?這一系列問(wèn)題需要得到合理回答。

傳統(tǒng)語(yǔ)義網(wǎng)絡(luò)與知識(shí)圖譜的差別首先表現(xiàn)在其規(guī)模上。知識(shí)圖譜是一種大規(guī)模語(yǔ)義網(wǎng)絡(luò),與上世紀(jì)七八十年代的各類(lèi)語(yǔ)義網(wǎng)絡(luò)相比較,最顯著的差異就是規(guī)模差異。推而廣之,以知識(shí)圖譜為代表的大數(shù)據(jù)時(shí)代的各種知識(shí)表示與傳統(tǒng)的知識(shí)表示的根本差別首先體現(xiàn)在規(guī)模上。傳統(tǒng)知識(shí)工程一系列知識(shí)表示都是一種典型的“小知識(shí)”(small knowledge)。而到了大數(shù)據(jù)時(shí)代,受益于海量數(shù)據(jù)、強(qiáng)大計(jì)算能力以及群智計(jì)算,我們?nèi)缃衲軌蜃詣?dòng)化構(gòu)建、或者眾包構(gòu)建大規(guī)模、高質(zhì)量知識(shí)庫(kù),形成所謂的“大知識(shí)”(big knowledge,合肥工業(yè)大學(xué)的吳興東教授在很多場(chǎng)合下也提到類(lèi)似觀點(diǎn))。所以知識(shí)圖譜與傳統(tǒng)知識(shí)表示在淺層次上的區(qū)別,就是大知識(shí)與小知識(shí)的差別,是在規(guī)模上的顯而易見(jiàn)的差別。

更深刻的進(jìn)行分析就會(huì)發(fā)現(xiàn),這樣的一個(gè)知識(shí)規(guī)模上的量變帶來(lái)了知識(shí)效用的質(zhì)變。知識(shí)工程到了上世紀(jì)八十年代之后就銷(xiāo)聲匿跡了。根本原因在于傳統(tǒng)知識(shí)庫(kù)構(gòu)建主要依靠人工構(gòu)建、代價(jià)高昂、規(guī)模有限。舉個(gè)例子,我國(guó)的詞林辭海是上萬(wàn)名專(zhuān)家花了10多年編撰而成的,但是它只有十幾萬(wàn)詞條。而現(xiàn)在任何一個(gè)互聯(lián)網(wǎng)上的知識(shí)圖譜,比如DBpedia,動(dòng)輒包含上千萬(wàn)實(shí)體。

人工構(gòu)建的知識(shí)庫(kù)雖然質(zhì)量精良,但是規(guī)模有限。有限的規(guī)模使得傳統(tǒng)知識(shí)表示難以適應(yīng)互聯(lián)網(wǎng)時(shí)代的大規(guī)模開(kāi)放應(yīng)用的需求?;ヂ?lián)網(wǎng)應(yīng)用的特點(diǎn)在于:

一、規(guī)模巨大,我們永遠(yuǎn)不知道用戶下一個(gè)搜索關(guān)鍵詞是什么;

二、精度要求相對(duì)不高,搜索引擎從來(lái)不需要保證每個(gè)搜索的理解和檢索都是正確的;

三、簡(jiǎn)單知識(shí)推理,大部分搜索理解與回答只需要實(shí)現(xiàn)簡(jiǎn)單的推理,比如搜索劉德華推薦歌曲,是因?yàn)橹绖⒌氯A是歌星,至于“姚明老婆的婆婆的兒子有多高”這類(lèi)的復(fù)雜推理在實(shí)際應(yīng)用中所占比率是不高的。

互聯(lián)網(wǎng)上的這種大規(guī)模開(kāi)放應(yīng)用所需要的知識(shí)很容易突破傳統(tǒng)專(zhuān)家系統(tǒng)由專(zhuān)家預(yù)設(shè)好的知識(shí)庫(kù)的知識(shí)邊界。我想這一定程度上回答了,為何谷歌在2012年這個(gè)時(shí)間節(jié)點(diǎn)推出知識(shí)圖譜,利用一個(gè)全新名稱(chēng)以表達(dá)與傳統(tǒng)知識(shí)表示毅然決裂的態(tài)度。

有人或許會(huì)問(wèn),那么傳統(tǒng)知識(shí)表示對(duì)于領(lǐng)域應(yīng)用應(yīng)該依然有效,為何專(zhuān)家系統(tǒng)后來(lái)在領(lǐng)域應(yīng)用中也不多見(jiàn)了?

這個(gè)問(wèn)題我也曾思考了很長(zhǎng)時(shí)間,直到后來(lái)在很多領(lǐng)域知識(shí)圖譜的應(yīng)用實(shí)踐中意識(shí)到一些知識(shí)應(yīng)用的有趣現(xiàn)象,我姑且將這個(gè)現(xiàn)象叫做“領(lǐng)域知識(shí)的偽封閉”現(xiàn)象。領(lǐng)域知識(shí)看似應(yīng)該是封閉的,也就是不會(huì)蔓延至專(zhuān)家預(yù)先設(shè)定的知識(shí)邊界范圍之外。

但是事實(shí)恰好相反,很多領(lǐng)域知識(shí)的應(yīng)用十分易于突破原先設(shè)定的邊界。比如,我們現(xiàn)在做金融知識(shí)圖譜,原先我們覺(jué)得只有股票、期貨、上市公司與金融密切相關(guān),但是實(shí)際應(yīng)用中,幾乎萬(wàn)事萬(wàn)物在某種意義下都與金融相關(guān),比如某個(gè)龍卷風(fēng),可能影響農(nóng)作物產(chǎn)量,進(jìn)而影響農(nóng)業(yè)機(jī)械的出貨量,進(jìn)而影響了農(nóng)機(jī)發(fā)動(dòng)機(jī),最終影響了這個(gè)發(fā)動(dòng)機(jī)的上市公司股價(jià)。類(lèi)似這樣的關(guān)聯(lián)分析,不正是我們期望智能金融實(shí)現(xiàn)的么?而這樣的深度關(guān)聯(lián)分析,顯然十分容易超出任何專(zhuān)家系統(tǒng)的預(yù)先設(shè)定的知識(shí)邊界。因此,某種意義上,知識(shí)是普遍關(guān)聯(lián)的,當(dāng)然關(guān)聯(lián)也是有條件的;領(lǐng)域知識(shí)的領(lǐng)域性通常是個(gè)偽命題,很多領(lǐng)域知識(shí)庫(kù)的構(gòu)建要直面通用知識(shí)庫(kù)的構(gòu)建所面臨的同樣挑戰(zhàn)。

換句話說(shuō),領(lǐng)域知識(shí)庫(kù)的深度應(yīng)用勢(shì)必涉及通用知識(shí)庫(kù)。這也在一定程度上解釋了,我曾經(jīng)強(qiáng)調(diào)的一個(gè)觀點(diǎn),那就是通用知識(shí)庫(kù)的研究具有戰(zhàn)略意義,不容有失;一萬(wàn)個(gè)領(lǐng)域知識(shí)研究通透了也未必有一個(gè)通用知識(shí)庫(kù)研究透徹價(jià)值來(lái)的高。通用知識(shí)庫(kù)的研究是在搶占知識(shí)庫(kù)研究的戰(zhàn)略制高點(diǎn),對(duì)于領(lǐng)域知識(shí)庫(kù)能夠形成戰(zhàn)略俯沖。

如果你仍然不滿足于我當(dāng)前的回答,進(jìn)一步追問(wèn)決定了領(lǐng)域知識(shí)庫(kù)與通用知識(shí)庫(kù)這種粘連特性的根本原因是什么。那么我想答案在于人類(lèi)的知識(shí)體系。我們的知識(shí)是有體系架構(gòu)的,這個(gè)架構(gòu)的最底層,也就是作為地基支撐整個(gè)知識(shí)體系的知識(shí)就是通用知識(shí)。而在通用知識(shí)中的最底層應(yīng)該是常識(shí),也就是我們每個(gè)人都知道的知識(shí),特別是我們?nèi)祟?lèi)關(guān)于時(shí)間、空間以及因果的基本常識(shí)。整個(gè)知識(shí)體系是建基在這些通用常識(shí)之上,再通過(guò)隱喻作為主要手段,逐步形成我們的高層、抽象或者領(lǐng)域性知識(shí)。

因此,我想通過(guò)一個(gè)簡(jiǎn)單的公式表明傳統(tǒng)知識(shí)工程與以知識(shí)圖譜為代表的新一代知識(shí)工程的聯(lián)系與區(qū)別:Small knowledge + Bigdata=Big knowledge。通過(guò)這個(gè)公式表達(dá)兩層意思。一、以知識(shí)圖譜為代表的大數(shù)據(jù)時(shí)代知識(shí)工程有著悠久的歷史淵源;知識(shí)圖譜脫胎于傳統(tǒng)知識(shí)表示,但是在規(guī)模上顯著優(yōu)于傳統(tǒng)語(yǔ)義網(wǎng)絡(luò);而這種量變也帶來(lái)知識(shí)效用上的質(zhì)變。這層含義剛才已經(jīng)闡述,不再贅述。我通過(guò)這個(gè)公式想強(qiáng)調(diào)的是另一層含義:傳統(tǒng)知識(shí)表示形式林林總總,通過(guò)大數(shù)據(jù)的賦能,這些知識(shí)表示將在各個(gè)應(yīng)用場(chǎng)景下發(fā)揮巨大能量。知識(shí)圖譜只不過(guò)是傳統(tǒng)的語(yǔ)義網(wǎng)絡(luò)在規(guī)模上顯著提升,就已經(jīng)能夠解決大量實(shí)際問(wèn)題。

試想一下,我們還有大量其他的知識(shí)表示,比如本體、框架、謂詞邏輯、馬爾科夫邏輯網(wǎng)、決策樹(shù)等等各種知識(shí)表示仍然被鎖在規(guī)模的牢籠里,一旦規(guī)模瓶頸被突破,我相信整個(gè)知識(shí)工程的產(chǎn)業(yè)能量將得到巨大釋放。正是在這個(gè)意義上,我認(rèn)為知識(shí)圖譜只是知識(shí)工程復(fù)興的序曲,知識(shí)圖譜將引領(lǐng)知識(shí)工程復(fù)興。我有一種強(qiáng)烈的感覺(jué),好比我們?cè)?jīng)經(jīng)歷了小數(shù)據(jù)到大數(shù)據(jù)的轟轟烈烈的時(shí)代轉(zhuǎn)變,我們也必將經(jīng)歷從小知識(shí)走向大知識(shí)的時(shí)代轉(zhuǎn)變。

為什么知識(shí)圖譜對(duì)于機(jī)器實(shí)現(xiàn)人工智能如此重要呢?我們先從形而上的角度來(lái)分析這個(gè)問(wèn)題。具體而言,我們分析知識(shí)圖譜實(shí)現(xiàn)機(jī)器認(rèn)知智能的兩個(gè)核心能力:“理解”和“解釋”。我嘗試給機(jī)器“理解與解釋”提出一種解釋。我認(rèn)為機(jī)器理解數(shù)據(jù)的本質(zhì)是建立起從數(shù)據(jù)到知識(shí)庫(kù)中的知識(shí)要素(包括實(shí)體、概念和關(guān)系)映射的一個(gè)過(guò)程。

比如如果我說(shuō)到“2013年的金球獎(jiǎng)得主C羅”這句話,我們之所以說(shuō)自己理解了這句話,是因?yàn)槲覀儼选癈羅”這個(gè)詞匯關(guān)聯(lián)到我們腦子中的實(shí)體“C羅”,把“金球獎(jiǎng)”這個(gè)詞匯映射到我們腦中的實(shí)體“金球獎(jiǎng)”,然后把“得主”一詞映射到邊“獲得獎(jiǎng)項(xiàng)”這個(gè)關(guān)系。

我們可以仔細(xì)體會(huì)一下我們的文本理解過(guò)程,其本質(zhì)是建立從數(shù)據(jù),包括文本、圖片、語(yǔ)音、視頻等數(shù)據(jù)到知識(shí)庫(kù)中的實(shí)體、概念、屬性映射的過(guò)程。再來(lái)看我們?nèi)祟?lèi)是如何“解釋”的。比如我問(wèn)“C羅為什么那么牛?”,我們可以通過(guò)知識(shí)庫(kù)中的“C羅獲得獎(jiǎng)項(xiàng)金球獎(jiǎng)”以及“金球獎(jiǎng)地位影響力最大的足球獎(jiǎng)項(xiàng)之一”這兩條關(guān)系來(lái)解釋這一問(wèn)題。這一過(guò)程的本質(zhì)就是將知識(shí)庫(kù)中的知識(shí)與問(wèn)題或者數(shù)據(jù)加以關(guān)聯(lián)的過(guò)程。有了知識(shí)圖譜,機(jī)器完全可以重現(xiàn)我們的這種理解與解釋過(guò)程。有過(guò)一定計(jì)算機(jī)研究基礎(chǔ)的,是不難完成上述過(guò)程的數(shù)學(xué)建模的。

知識(shí)圖譜對(duì)機(jī)器認(rèn)知智能的必要性還可以從若干具體問(wèn)題來(lái)進(jìn)行闡述。

首先,我們來(lái)看機(jī)器認(rèn)知的核心能力之一:自然語(yǔ)言理解。我的觀點(diǎn)是機(jī)器理解自然語(yǔ)言需要類(lèi)似知識(shí)圖譜這樣的背景知識(shí)。自然語(yǔ)言是異常復(fù)雜的:自然語(yǔ)言有歧義性、多樣性,語(yǔ)義理解有模糊性且依賴(lài)上下文。機(jī)器理解自然語(yǔ)言困難的根本原因在于,人類(lèi)語(yǔ)言理解是建立在人類(lèi)的認(rèn)知能力基礎(chǔ)之上的,人類(lèi)的認(rèn)知體驗(yàn)所形成的背景知識(shí)是支撐人類(lèi)語(yǔ)言理解的根本支柱。

我們?nèi)祟?lèi)彼此之間的語(yǔ)言理解就好比是根據(jù)冰山上浮出水面的一角來(lái)揣測(cè)冰山下的部分。我們之所以能夠很自然地理解彼此的語(yǔ)言,是因?yàn)楸舜斯蚕眍?lèi)似的生活體驗(yàn)、類(lèi)似的教育背景,從而有著類(lèi)似的背景知識(shí)。冰山下龐大的背景知識(shí)使得我們可以彼此理解水面上有限的幾個(gè)字符。我們可以做個(gè)簡(jiǎn)單的思想實(shí)驗(yàn),假如現(xiàn)在有個(gè)外星人坐在這里聽(tīng)我講報(bào)告,他能聽(tīng)懂么?我想還是很困難的,因?yàn)樗麤](méi)有在地球上生活的經(jīng)歷,沒(méi)有與我相類(lèi)似的教育背景,沒(méi)有與我類(lèi)似的背景知識(shí)庫(kù)。

再舉個(gè)很多人都有體會(huì)的例子,我們?nèi)⒓訃?guó)際會(huì)議時(shí),經(jīng)常遇到一個(gè)尷尬的局面,就是西方學(xué)者說(shuō)的笑話,我們東方人很難產(chǎn)生共鳴。因?yàn)槲覀兒退麄兊谋尘爸R(shí)庫(kù)不同,我們?cè)绮统詿灐⒂蜅l,西方吃咖啡、面包,不同的背景知識(shí)決定了我們對(duì)幽默有著不同的理解。所以語(yǔ)言理解需要背景知識(shí),沒(méi)有強(qiáng)大的背景知識(shí)支撐,是不可能理解語(yǔ)言的。要讓機(jī)器理解我們?nèi)祟?lèi)的語(yǔ)言,機(jī)器必需共享與我們類(lèi)似的背景知識(shí)。

實(shí)現(xiàn)機(jī)器自然語(yǔ)言理解所需要的背景知識(shí)是有著苛刻的條件的:規(guī)模足夠大、語(yǔ)義關(guān)系足夠豐富、結(jié)構(gòu)足夠友好、質(zhì)量足夠精良。以這四個(gè)條件去看知識(shí)表示就會(huì)發(fā)現(xiàn),只有知識(shí)圖譜是滿足所有這些條件的:知識(shí)圖譜規(guī)模巨大,動(dòng)輒包含數(shù)十億實(shí)體;關(guān)系多樣,比如在線百科圖譜DBpedia包含數(shù)千種常見(jiàn)語(yǔ)義關(guān)系;結(jié)構(gòu)友好,通常表達(dá)為RDF三元組,這是一種對(duì)于機(jī)器而言能夠有效處理的結(jié)構(gòu);質(zhì)量也很精良,因?yàn)橹R(shí)圖譜可以充分利用大數(shù)據(jù)的多源特性進(jìn)行交叉驗(yàn)證,也可利用眾包保證知識(shí)庫(kù)質(zhì)量。所以知識(shí)圖譜成為了讓機(jī)器理解自然語(yǔ)言所需的背景知識(shí)的不二選擇。

既然機(jī)器理解自然語(yǔ)言需要背景知識(shí),我對(duì)于當(dāng)前的自然語(yǔ)言處理有個(gè)重要看法:我認(rèn)為自然語(yǔ)言處理走向自然語(yǔ)言理解的必經(jīng)之路是知識(shí),我將我的這個(gè)觀點(diǎn)表達(dá)為NLP+KB=NLU的公式。很多NLP從業(yè)人員有個(gè)體會(huì),明明論文里面報(bào)道的在某個(gè)benchmark數(shù)據(jù)95%準(zhǔn)確率的模型一旦用到實(shí)際數(shù)據(jù)上,至少有10個(gè)百分點(diǎn)的下降。而最后那幾個(gè)點(diǎn)的準(zhǔn)確率的提升需要機(jī)器理解自然語(yǔ)言。這一點(diǎn)在司法、金融、醫(yī)療等知識(shí)密集型的應(yīng)用領(lǐng)域已經(jīng)體現(xiàn)的非常明顯了。比如在司法領(lǐng)域,如果不把司法背后的事理邏輯、知識(shí)體系賦予機(jī)器,單純依賴(lài)字符數(shù)據(jù)的處理,是難以實(shí)現(xiàn)司法數(shù)據(jù)的語(yǔ)義理解的,是難以滿足司法文本的智能化處理需求的。

因此,NLP將會(huì)越來(lái)越多地走向知識(shí)引導(dǎo)的道路。NLP與KB將走向一條交迭演進(jìn)的道路。在知識(shí)的引導(dǎo)下,NLP模型的能力越來(lái)越強(qiáng),越來(lái)越強(qiáng)大的NLP模型,特別是從文本中進(jìn)行知識(shí)抽取的相關(guān)模型,將會(huì)幫助我們實(shí)現(xiàn)更為精準(zhǔn)地、自動(dòng)化抽取,從而形成一個(gè)質(zhì)量更好、規(guī)模更大的知識(shí)庫(kù)。更好的知識(shí)庫(kù)又可以進(jìn)一步增強(qiáng)NLP模型。這種循環(huán)迭代持續(xù)下去,NLP最后將會(huì)非常接近NLU,甚至最終克服語(yǔ)義鴻溝,實(shí)現(xiàn)機(jī)器的自然語(yǔ)言理解。

最近幾年,這條技術(shù)演進(jìn)路線日漸清晰,越來(lái)越多的頂尖學(xué)者有著與我類(lèi)似的看法,我的研究團(tuán)隊(duì)沿著這條路徑做了很多嘗試,初步看來(lái)效果顯著。當(dāng)然這些都是一家之言。也有不少人認(rèn)為依靠純數(shù)據(jù)驅(qū)動(dòng)的自然語(yǔ)言處理模型也可實(shí)現(xiàn)機(jī)器的自然語(yǔ)言理解,特別是當(dāng)下深度學(xué)習(xí)在自然語(yǔ)言處理方面還十分流行,我所倡導(dǎo)的知識(shí)引導(dǎo)下的NLP發(fā)展路徑多少有些顯得不合時(shí)宜。

這里,通過(guò)一個(gè)實(shí)際案例論證知識(shí)對(duì)于NLP的重要作用。在問(wèn)答研究中,自然語(yǔ)言問(wèn)題的理解或者語(yǔ)義表示是一個(gè)難題。

同樣語(yǔ)義的問(wèn)題表達(dá)方式往往是多樣的,比如不論是how many people are there in Shanghai? 還是 what isthe population of Shanghai,都是在問(wèn)上海人口。又或者形式上看上去很接近的問(wèn)題,實(shí)質(zhì)語(yǔ)義相差很大,比如“狗咬人了嗎”與“人咬狗了嗎”語(yǔ)義完全不同。

當(dāng)問(wèn)題答案來(lái)自于知識(shí)庫(kù)時(shí),這類(lèi)問(wèn)題就屬于KBQA(面向知識(shí)庫(kù)的自然語(yǔ)言問(wèn)答)的研究?jī)?nèi)容。KBQA的核心步驟是建立從自然語(yǔ)言問(wèn)題到知識(shí)庫(kù)中的三元組謂詞的映射關(guān)系。比如上面的兩個(gè)與上海人口相關(guān)的問(wèn)題,都可以映射到知識(shí)庫(kù)中的Population這個(gè)謂詞。一種簡(jiǎn)單的辦法是讓機(jī)器記住問(wèn)題到謂詞的映射規(guī)則,比如機(jī)器記住“How many people are there in Shanghai?”映射到上海這個(gè)實(shí)體的Population謂詞上。但這種方法沒(méi)有把握問(wèn)題語(yǔ)義本質(zhì),如果用同樣的句式問(wèn)及北京、南京,甚至任何一個(gè)城市人口呢?難道機(jī)器需要為每個(gè)實(shí)例記住這些映射么?顯然我們?nèi)祟?lèi)不是如此理解問(wèn)題語(yǔ)義的,我們是在“How many people are there in $City?”這個(gè)問(wèn)題概念模板層次把握問(wèn)題語(yǔ)義的實(shí)質(zhì)的。利用概念模板不僅避免了暴力式的記憶,同時(shí)也能讓機(jī)器具備類(lèi)人的推理能力。

比如,如果問(wèn)到“How many people are there in XXX?”,機(jī)器只要知道XXX是個(gè)city,那么這個(gè)問(wèn)題一定是在問(wèn)XXX的人口數(shù)量。那么我們?cè)趺瓷蛇@種問(wèn)題概念模板呢,我們用概念圖譜。概念圖譜里面含有大量的類(lèi)似shanghai isa city,beijing isa city 這類(lèi)知識(shí)。充分利用這些知識(shí)可以得到自然語(yǔ)言問(wèn)題的有效表示,從而實(shí)現(xiàn)機(jī)器對(duì)于自然語(yǔ)言問(wèn)題的語(yǔ)義理解。

知識(shí)圖譜對(duì)于認(rèn)知智能的另一個(gè)重要意義在于:知識(shí)圖譜讓可解釋人工智能成為可能?!敖忉尅边@件事情一定是跟符號(hào)化知識(shí)圖譜密切相關(guān)的。因?yàn)榻忉尩膶?duì)象是人,人只能理解符號(hào),沒(méi)辦法理解數(shù)值,所以一定要利用符號(hào)知識(shí)開(kāi)展可解釋人工智能的研究??山忉屝允遣荒芑乇芊?hào)知識(shí)的。

我們先來(lái)看幾個(gè)解釋的具體例子。比如,我若問(wèn)鯊魚(yú)為什么可怕?你可能解釋說(shuō):因?yàn)轷忯~(yú)是食肉動(dòng)物,這實(shí)質(zhì)上是用概念在解釋。若問(wèn)鳥(niǎo)為什么能飛翔?你可能會(huì)解釋因?yàn)樗谐岚?。這是用屬性在解釋。若問(wèn)鹿晗關(guān)曉彤前些日子為什么會(huì)刷屏?你可能會(huì)解釋說(shuō)因?yàn)殛P(guān)曉彤是鹿晗的女朋友。這是用關(guān)系在解釋。我們?nèi)祟?lèi)傾向于利用概念、屬性、關(guān)系這些認(rèn)知的基本元素去解釋現(xiàn)象,解釋事實(shí)。而對(duì)于機(jī)器而言,概念、屬性和關(guān)系都表達(dá)在知識(shí)圖譜里面。因此,解釋離不開(kāi)知識(shí)圖譜。

沿著這個(gè)思路,我們做了一些初步嘗試,我們首先試著利用知識(shí)圖譜做可解釋推薦。我們目前的互聯(lián)網(wǎng)推薦,只能給我們推薦結(jié)果,卻無(wú)法解釋為什么??山忉屚扑]將是未來(lái)推薦研究的重要領(lǐng)域,將是具有巨大商業(yè)價(jià)值的研究課題。我們初步實(shí)現(xiàn)了可解釋的實(shí)體推薦。若用戶搜索了“百度”和“阿里”,機(jī)器推薦“騰訊”,并且解釋為什么推薦“騰訊”,因?yàn)樗麄兌际腔ヂ?lián)網(wǎng)巨頭、都是大型IT公司。這里實(shí)質(zhì)上是在利用概念展開(kāi)解釋?zhuān)@些概念可以在很多概念圖譜,比如英文概念圖譜Probase,和中文概念圖譜CN-Probase里找到。

另一個(gè)例子是讓機(jī)器解釋概念。比如向機(jī)器提及“單身漢”這個(gè)概念,機(jī)器能否自動(dòng)產(chǎn)生“男性”、“未婚”這樣的屬性用于解釋這個(gè)概念。我們針對(duì)富含實(shí)體、概念和屬性信息的大型百科圖譜展開(kāi)挖掘,自動(dòng)挖掘出常見(jiàn)概念的定義性屬性。這些定義性屬性可以幫助我們完善概念圖譜,也就是為概念圖譜上的每個(gè)概念補(bǔ)充定義性屬性信息;進(jìn)一步可以利用這些信息讓機(jī)器利用屬性對(duì)于實(shí)體進(jìn)行準(zhǔn)確歸類(lèi)。這一歸類(lèi)過(guò)程本質(zhì)上是在模擬人類(lèi)的范疇化過(guò)程。

知識(shí)圖譜的另一個(gè)重要作用體現(xiàn)在知識(shí)引導(dǎo)將成為解決問(wèn)題的主要方式。前面已經(jīng)多次提及用戶對(duì)使用統(tǒng)計(jì)模型來(lái)解決問(wèn)題的效果越來(lái)越不滿意了,統(tǒng)計(jì)模型的效果已經(jīng)接近“天花板”,要想突破這個(gè)“天花板”,需要知識(shí)引導(dǎo)。

舉個(gè)例子,實(shí)體指代這樣的文本處理難題,沒(méi)有知識(shí)單純依賴(lài)數(shù)據(jù)是難以取得理想效果的。比如“張三把李四打了,他進(jìn)醫(yī)院了”和“張三把李四打了,他進(jìn)監(jiān)獄了”,人類(lèi)很容易確定這兩個(gè)不同的“他”的分別指代。因?yàn)槿祟?lèi)有知識(shí),有關(guān)于打人這個(gè)場(chǎng)景的基本知識(shí),知道打人的往往要進(jìn)監(jiān)獄,而被打的往往會(huì)進(jìn)醫(yī)院。但是當(dāng)前機(jī)器缺乏這些知識(shí),所以無(wú)法準(zhǔn)確識(shí)別代詞的準(zhǔn)確指代。很多任務(wù)是純粹的基于數(shù)據(jù)驅(qū)動(dòng)的模型所解決不了的,知識(shí)在很多任務(wù)里不可或缺。比較務(wù)實(shí)的做法是將這兩類(lèi)方法深度融合。

實(shí)際上在很多NLP應(yīng)用問(wèn)題中,我們?cè)趪L試用知識(shí)引導(dǎo)突破性能瓶頸。比如在中文實(shí)體識(shí)別與鏈接中,針對(duì)中文短文本,在開(kāi)放語(yǔ)境下,在沒(méi)有充分上下文,缺乏主題信息的前提下,這一問(wèn)題仍然十分困難,現(xiàn)在工業(yè)界最高準(zhǔn)確率大概60%多的水平。當(dāng)前機(jī)器仍然難以理解中文文本中的實(shí)體。最近,我們利用中文概念圖譜CN-Probase,給予中文實(shí)體識(shí)別與鏈接任務(wù)以豐富的背景知識(shí),取得了十分顯著的效果。我們知道打球的李娜和唱歌的李娜不是同一個(gè)人,現(xiàn)在即便這兩人在文本中同時(shí)被提及,機(jī)器也能準(zhǔn)確識(shí)別并加以區(qū)分。

知識(shí)對(duì)于認(rèn)知智能又一個(gè)很重要的意義就是將顯著增強(qiáng)機(jī)器學(xué)習(xí)的能力。

當(dāng)前的機(jī)器學(xué)習(xí)是一種典型的“機(jī)械式”學(xué)習(xí)方式,與人類(lèi)的學(xué)習(xí)方式相比顯得比較笨拙。我們的孩童只需要父母告知一兩次:這是貓,那是狗,就能有效識(shí)別或者區(qū)分貓狗。而機(jī)器卻需要數(shù)以萬(wàn)計(jì)的樣本才能習(xí)得貓狗的特征。我們中國(guó)學(xué)習(xí)英語(yǔ),雖然也要若干年才能小有所成,但相對(duì)于機(jī)器對(duì)于語(yǔ)言的學(xué)習(xí)而言要高效的多。

機(jī)器學(xué)習(xí)模型落地應(yīng)用中的一個(gè)常見(jiàn)問(wèn)題是與專(zhuān)家知識(shí)或判斷不符合,這使我們很快陷入進(jìn)退兩難的境地:是相信學(xué)習(xí)模型還是果斷棄之?機(jī)器學(xué)習(xí)與人類(lèi)學(xué)習(xí)的根本差異可以歸結(jié)為人是有知識(shí)的且能夠有效利用知識(shí)的物種。

我相信,未來(lái)機(jī)器學(xué)習(xí)能力的顯著增強(qiáng)也要走上知識(shí)的充分利用的道路。符號(hào)知識(shí)對(duì)于機(jī)器學(xué)習(xí)模型的重要作用會(huì)受到越來(lái)越多的關(guān)注。這一趨勢(shì)還可以從機(jī)器智能解決問(wèn)題的兩個(gè)基本模式方面加以論述。機(jī)器智能的實(shí)現(xiàn)路徑之一是習(xí)得數(shù)據(jù)中的統(tǒng)計(jì)模式,以解決一系列實(shí)際任務(wù)。另一種是專(zhuān)家系統(tǒng),專(zhuān)家將知識(shí)賦予機(jī)器構(gòu)建專(zhuān)家系統(tǒng),讓機(jī)器利用專(zhuān)家知識(shí)解決實(shí)際問(wèn)題。

如今,這兩種方法有合流的趨勢(shì),無(wú)論是專(zhuān)家知識(shí)還是通過(guò)學(xué)習(xí)模型習(xí)得的知識(shí),都將顯式地表達(dá)并且沉淀到知識(shí)庫(kù)中。再利用知識(shí)增強(qiáng)的機(jī)器學(xué)習(xí)模型解決實(shí)際問(wèn)題。這種知識(shí)增強(qiáng)下的學(xué)習(xí)模型,可以顯著降低機(jī)器學(xué)習(xí)模型對(duì)于大樣本的依賴(lài),提高學(xué)習(xí)的經(jīng)濟(jì)性;提高機(jī)器學(xué)習(xí)模型對(duì)先驗(yàn)知識(shí)的利用率;提升機(jī)器學(xué)習(xí)模型的決策結(jié)果與先驗(yàn)知識(shí)的一致性。我個(gè)人傾向于認(rèn)為:機(jī)器學(xué)習(xí)也面臨一次全新機(jī)遇。我將其總結(jié)為ML+KB=ML2,也就是說(shuō)機(jī)器學(xué)習(xí)在知識(shí)增強(qiáng)下或許就是下一代機(jī)器學(xué)習(xí)。

沿著上面的思路我們也做了一些嘗試。在自然語(yǔ)言生成任務(wù)中,我們的機(jī)器學(xué)習(xí)模型,特別是深度生成模型會(huì)經(jīng)常生成很多不符合語(yǔ)法、或者不符合語(yǔ)義的句子。我們?nèi)祟?lèi)顯然可以總結(jié)出很多語(yǔ)法語(yǔ)義規(guī)則用于描述什么是好的自然語(yǔ)言語(yǔ)句。但是這些知識(shí)還很難被機(jī)器有效利用。這就需要把語(yǔ)法、語(yǔ)義知識(shí)用規(guī)則、符號(hào)的方式表達(dá)出來(lái),并有效融合到深度生成模型里面。最近,我們基于對(duì)抗生成網(wǎng)絡(luò)初步實(shí)現(xiàn)了這一目標(biāo)。并將融合了先驗(yàn)知識(shí)的語(yǔ)言生成模型用于從知識(shí)庫(kù)三元組自動(dòng)生成自然語(yǔ)言問(wèn)題,并將這一技術(shù)用于文本驗(yàn)證碼。具體技術(shù)細(xì)節(jié)可以參考我曾做過(guò)的一個(gè)技術(shù)報(bào)告《未來(lái)人機(jī)區(qū)分》。

知識(shí)將成為比數(shù)據(jù)更為重要的資產(chǎn)。前幾年大數(shù)據(jù)時(shí)代到來(lái)的時(shí)候,大家都說(shuō)“得數(shù)據(jù)者得天下”。去年,微軟研究院的沈向陽(yáng)博士曾經(jīng)說(shuō)過(guò)“懂語(yǔ)言者得天下”。而我曾經(jīng)論述過(guò),機(jī)器要懂語(yǔ)言,背景知識(shí)不可或缺。因此,在這個(gè)意義下,將是“得知識(shí)者得天下”。如果說(shuō)數(shù)據(jù)是石油,那么知識(shí)就好比是石油的萃取物。如果我們只滿足賣(mài)數(shù)據(jù)盈利,那就好比是直接輸出石油在盈利。但是石油的真正價(jià)值蘊(yùn)含于其深加工的萃取物中。石油萃取的過(guò)程與知識(shí)加工的過(guò)程也極為相像。都有著復(fù)雜流程,都是大規(guī)模系統(tǒng)工程。我今天的報(bào)告就是在當(dāng)前的時(shí)代背景下重新解讀圖靈獎(jiǎng)獲得者,知識(shí)工程的鼻祖,費(fèi)根鮑姆曾經(jīng)說(shuō)過(guò)的一句話“knowledge is the power in AI”。這句話已經(jīng)出現(xiàn)幾十年了,在當(dāng)今語(yǔ)境下需要重新解讀。

最后用三個(gè)總結(jié)結(jié)束今天的報(bào)告??偨Y(jié)1概括了這個(gè)報(bào)告的主要觀點(diǎn)??偨Y(jié)2試圖再次強(qiáng)調(diào)我的三個(gè)觀點(diǎn)??偨Y(jié)3想用一句話再次強(qiáng)調(diào)知識(shí)的重要性。知識(shí)的沉淀與傳承鑄就了人類(lèi)文明的輝煌,也將成為機(jī)器智能持續(xù)提升的必經(jīng)之路。只不過(guò)到了機(jī)器身上,知識(shí)的沉淀變成了知識(shí)的表示,知識(shí)的傳承變成了知識(shí)的應(yīng)用。所以,知識(shí)的沉淀和傳承不僅鑄就了人類(lèi)文明的輝煌,或許也將造就機(jī)器智能的全新高度。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1813

    文章

    49598

    瀏覽量

    260139
  • 大數(shù)據(jù)
    +關(guān)注

    關(guān)注

    64

    文章

    9006

    瀏覽量

    142804
  • 知識(shí)圖譜
    +關(guān)注

    關(guān)注

    2

    文章

    132

    瀏覽量

    8234

原文標(biāo)題:復(fù)旦大學(xué)肖仰華:深度剖析知識(shí)圖譜與認(rèn)知智能

文章出處:【微信號(hào):AI_Thinker,微信公眾號(hào):人工智能頭條】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    知識(shí)圖譜相關(guān)應(yīng)用

    智慧風(fēng)控的背后,是知識(shí)圖譜深度應(yīng)用
    發(fā)表于 08-22 14:40

    KGB知識(shí)圖譜基于傳統(tǒng)知識(shí)工程的突破分析

    知識(shí)庫(kù)構(gòu)建主要依靠人工構(gòu)建、代價(jià)高昂、規(guī)模有限,投入極大且效率不高。同時(shí),傳統(tǒng)知識(shí)圖譜不具有深度知識(shí)結(jié)構(gòu),無(wú)法解決專(zhuān)業(yè)的業(yè)務(wù)問(wèn)題?;ヂ?lián)網(wǎng)時(shí)代
    發(fā)表于 10-22 15:25

    KGB知識(shí)圖譜技術(shù)能夠解決哪些行業(yè)痛點(diǎn)?

    層面。在知識(shí)表示層面,行業(yè)應(yīng)用領(lǐng)域知識(shí)圖譜的廣度、深度和粒度都和傳統(tǒng)知識(shí)圖譜有差別。從廣度來(lái)看,傳統(tǒng)知識(shí)圖譜廣度更高。從
    發(fā)表于 10-30 15:34

    知識(shí)圖譜的三種特性評(píng)析

    。2、知識(shí)質(zhì)量智能核查:知識(shí)圖譜加工廠實(shí)現(xiàn)對(duì)多種知識(shí)錯(cuò)誤與沖突的智能核查與校驗(yàn),并對(duì)知識(shí)庫(kù)進(jìn)行實(shí)
    發(fā)表于 12-13 13:57

    KGB知識(shí)圖譜通過(guò)智能搜索提升金融行業(yè)分析能力

    費(fèi)時(shí)耗力,利用KGB知識(shí)圖譜智能搜索功能,可以通過(guò)簡(jiǎn)單的操作,可以快速、精準(zhǔn)地找到想要的數(shù)據(jù)、報(bào)告等內(nèi)容,從以往低效、重復(fù)的信息搜集整理中解脫出來(lái),告別信息過(guò)載的困擾。KGB知識(shí)圖譜基于深度
    發(fā)表于 06-22 21:23

    中國(guó)人工智能的現(xiàn)狀與未來(lái)

    機(jī)器學(xué)習(xí),計(jì)算機(jī)視覺(jué)等等,總的說(shuō)來(lái),人工智能研究的一個(gè)主要目標(biāo)是使機(jī)器能夠勝任通常需要人類(lèi)智能才能完成的復(fù)雜工作。那人工智能知識(shí)體系有哪些內(nèi)容呢?下面是新一代人工智能知識(shí)體系大全
    發(fā)表于 07-27 06:40

    AI虛擬偶像 知識(shí)圖譜制造富有生命感的人工智能

    如果要為這一切找出緣由,知識(shí)圖譜顯然是其中之一。最近中國(guó)信息通信研究院云計(jì)算與大數(shù)據(jù)研究所聯(lián)合Gowild人工智能研究院以及業(yè)內(nèi)多家企業(yè)推出了業(yè)內(nèi)首份《知識(shí)圖譜白皮書(shū)》,為此,我們采訪了來(lái)自Gowild
    發(fā)表于 05-30 03:02 ?7881次閱讀

    知識(shí)圖譜是什么?與傳統(tǒng)知識(shí)表示的區(qū)別

    知識(shí)圖譜是實(shí)現(xiàn)機(jī)器認(rèn)知智能的基礎(chǔ)。機(jī)器認(rèn)知智能的兩個(gè)核心能力:“理解”和“解釋”,均與知識(shí)圖譜
    的頭像 發(fā)表于 10-29 10:03 ?2.8w次閱讀

    人工智能什么時(shí)候才會(huì)有認(rèn)知能力

    人工智能領(lǐng)域如果和知識(shí)工程、神經(jīng)科學(xué)結(jié)合的話,從認(rèn)知方面擴(kuò)展,比如說(shuō)我們的大腦和我們的人機(jī)接口、知識(shí)圖譜,這會(huì)把人工智能的用途變得更加寬闊,
    發(fā)表于 12-27 14:17 ?1226次閱讀

    打破人工智能認(rèn)知天花板

    知識(shí)圖譜作為人工智能的重要研究領(lǐng)域,其核心理念可追溯到第一次人工智能浪潮。但直至進(jìn)入人工智能下半場(chǎng),當(dāng)具備能理解、會(huì)思考、可解釋等特征的認(rèn)知
    的頭像 發(fā)表于 01-07 11:02 ?2910次閱讀
    打破<b class='flag-5'>人工智能</b>的<b class='flag-5'>認(rèn)知</b>天花板

    全面了解人工智能的重要分支技術(shù)知識(shí)圖譜

    與大數(shù)據(jù)、深度學(xué)習(xí),這三大“秘密武器”已經(jīng)成為推動(dòng)互聯(lián)網(wǎng)和人工智能發(fā)展的核心驅(qū)動(dòng)力之一。 ? 知識(shí)圖譜的概念與分類(lèi) 知識(shí)圖譜(Knowledge Graph)于2012年由谷歌提出并成
    的頭像 發(fā)表于 01-29 16:27 ?4246次閱讀

    知識(shí)圖譜劃分的相關(guān)算法及研究

    知識(shí)圖譜人工智能的重要基石,因其包含豐富的圖結(jié)構(gòu)和屬性信息而受到廣泛關(guān)注。知識(shí)圖譜可以精確語(yǔ)義描述現(xiàn)實(shí)世界中的各種實(shí)體及其聯(lián)系,其中頂點(diǎn)表示實(shí)體,邊表示實(shí)體間的聯(lián)系。知識(shí)圖譜劃分是大
    發(fā)表于 03-18 10:10 ?14次下載
    <b class='flag-5'>知識(shí)圖譜</b>劃分的相關(guān)算法及研究

    什么是知識(shí)圖譜?人工智能世界知識(shí)圖譜的發(fā)展

    1.1 什么是知識(shí)圖譜 ? 知識(shí)圖譜是一種用圖模型來(lái)描述知識(shí)和建模世界萬(wàn)物之間的關(guān)聯(lián)關(guān)系的技術(shù)方法[1]。知識(shí)圖譜由節(jié)點(diǎn)和邊組成。節(jié)點(diǎn)可以是實(shí)體,如一個(gè)人、一本書(shū)等,或是抽象的概念,如
    的頭像 發(fā)表于 06-01 19:54 ?7551次閱讀
    什么是<b class='flag-5'>知識(shí)圖譜</b>?<b class='flag-5'>人工智能</b>世界<b class='flag-5'>知識(shí)圖譜</b>的發(fā)展

    知識(shí)圖譜基礎(chǔ)知識(shí)應(yīng)用和學(xué)術(shù)前沿趨勢(shì)

    知識(shí)圖譜(Knowledge Graph)以結(jié)構(gòu)化的形式描述客觀世界中概念、實(shí)體及其關(guān)系。是融合了認(rèn)知計(jì)算、知識(shí)表示與推理、信息檢索與抽取、自然語(yǔ)言處理、Web技術(shù)、機(jī)器學(xué)習(xí)與大數(shù)據(jù)挖掘等等方向的交叉學(xué)科。
    的頭像 發(fā)表于 01-08 10:57 ?1945次閱讀
    <b class='flag-5'>知識(shí)圖譜</b>基礎(chǔ)<b class='flag-5'>知識(shí)</b>應(yīng)用和學(xué)術(shù)前沿趨勢(shì)

    知識(shí)圖譜與大模型之間的關(guān)系

    人工智能的廣闊領(lǐng)域中,知識(shí)圖譜與大模型是兩個(gè)至關(guān)重要的概念,它們各自擁有獨(dú)特的優(yōu)勢(shì)和應(yīng)用場(chǎng)景,同時(shí)又相互補(bǔ)充,共同推動(dòng)著人工智能技術(shù)的發(fā)展。本文將從定義、特點(diǎn)、應(yīng)用及相互關(guān)系等方面深入探討
    的頭像 發(fā)表于 07-10 11:39 ?2448次閱讀