人工智能與互聯(lián)網(wǎng)或5G等技術(shù)本質(zhì)上存在差別,后者解決的是信息的發(fā)出、傳遞、接收與反饋的閉環(huán)問題,而人工智能的本質(zhì)是進(jìn)行生產(chǎn)力升級(jí),因此評(píng)判人工智能使用的是否有價(jià)值,要看其技術(shù)應(yīng)用是否貼近生產(chǎn)核心。
webkit-text-stroke-width: 0px; text-decoration-style: initial; text-decoration-color: initial>人們?yōu)槭裁撮_始重視知識(shí)圖譜的發(fā)展了?
人工智能與互聯(lián)網(wǎng)或5G等技術(shù)本質(zhì)上存在差別,后者解決的是信息的發(fā)出、傳遞、接收與反饋的閉環(huán)問題,而人工智能的本質(zhì)是進(jìn)行生產(chǎn)力升級(jí),因此評(píng)判人工智能使用的是否有價(jià)值,要看其技術(shù)應(yīng)用是否貼近生產(chǎn)核心。
人類生產(chǎn)力可以歸類為知識(shí)生產(chǎn)力和勞動(dòng)生產(chǎn)力,人工智能走入產(chǎn)業(yè)后,可以分為感知智能、認(rèn)知智能和行為智能,后兩者更與生產(chǎn)力相對(duì)應(yīng)。以計(jì)算機(jī)視覺、語(yǔ)音識(shí)別為代表的感知智能應(yīng)用深度學(xué)習(xí),在算力與數(shù)據(jù)的支撐下突破了工業(yè)紅線,實(shí)現(xiàn)了機(jī)器對(duì)于自然界具象事物的判斷與識(shí)別,但僅僅如此并沒有觸及核心生產(chǎn)環(huán)節(jié),所以也就限制了其商業(yè)應(yīng)用半徑。當(dāng)人們使用機(jī)器能識(shí)別更多事物的時(shí)候,自然而然的引發(fā)了,對(duì)事物背后的事理,理解、分析和決策的深層次需求,認(rèn)知智能呼之欲出。
認(rèn)知智能核心解決的問題是對(duì)人類文明抽象概念的識(shí)別與聯(lián)想,通過自然語(yǔ)言處理(NLP)技術(shù)對(duì)文字內(nèi)容在語(yǔ)義上進(jìn)行初步認(rèn)知和自動(dòng)抓取,經(jīng)由知識(shí)圖譜對(duì)概念間的關(guān)系屬性進(jìn)行聯(lián)結(jié)、轉(zhuǎn)換,從而對(duì)人類社會(huì)生產(chǎn)、生活行為進(jìn)行描繪,實(shí)現(xiàn)業(yè)務(wù)規(guī)范梳理、生產(chǎn)流程可視化、人際關(guān)系挖掘等代表應(yīng)用,這與注重經(jīng)驗(yàn)、邏輯和方法論累積的知識(shí)生產(chǎn)力產(chǎn)生了直接對(duì)應(yīng),而與勞動(dòng)生產(chǎn)力相對(duì)應(yīng)的行為智能同樣需要知識(shí)的指導(dǎo),所以認(rèn)知智能的發(fā)展才是人工智能回歸本質(zhì)的表征,而搭建知識(shí)圖譜是認(rèn)知智能可以參與生產(chǎn)的基礎(chǔ)錨點(diǎn)。
人工智能與生產(chǎn)力之間的關(guān)系
知識(shí)圖譜的搭建邏輯
知識(shí)圖譜從邏輯上可以分為概念層和數(shù)據(jù)層,數(shù)據(jù)層指以三元組為表現(xiàn)形式的客觀事實(shí)集合,而概念層是它的“上層建筑”,是經(jīng)過積累沉淀的知識(shí)集合。
建設(shè)中以本體模型和實(shí)體數(shù)據(jù)庫(kù)為核心,根據(jù)二者的建設(shè)順序又分為先定義本體和數(shù)據(jù)規(guī)范,再抽取數(shù)據(jù)的“自頂向下型”和先抽取實(shí)體數(shù)據(jù),再逐層構(gòu)建本體的“自底向上型”兩種模式,前者適用于場(chǎng)景較為固定,存在可量化行業(yè)邏輯的領(lǐng)域,如金融、醫(yī)療、法律等;后者適用于新拓展的,有大量數(shù)據(jù)積累,行業(yè)邏輯難以直接展現(xiàn)的領(lǐng)域。
總體而言,搭建知識(shí)圖譜從數(shù)據(jù)源開始,經(jīng)歷了知識(shí)抽取、知識(shí)融合、知識(shí)加工等步驟。原始的數(shù)據(jù)通過知識(shí)抽取或數(shù)據(jù)整合的方式轉(zhuǎn)換為三元組形式,然后三元組數(shù)據(jù)再經(jīng)過實(shí)體對(duì)齊,加入數(shù)據(jù)模型,形成標(biāo)準(zhǔn)的知識(shí)表示,過程中如產(chǎn)生新的關(guān)系組合,通過知識(shí)推理形成新的知識(shí)形態(tài),與原有知識(shí)共同經(jīng)過質(zhì)量評(píng)估,完成知識(shí)融合,最終形成完整形態(tài)上的知識(shí)圖譜。
人工智能結(jié)構(gòu)拓?fù)鋱D
知識(shí)圖譜的應(yīng)用價(jià)值
知識(shí)圖譜是人工智能符號(hào)學(xué)派中知識(shí)工程的代表應(yīng)用,其核心價(jià)值在于對(duì)多源異構(gòu)數(shù)據(jù)和多維復(fù)雜關(guān)系的處理與可視化展示。
其底層邏輯是將人類社會(huì)生活與生產(chǎn)活動(dòng)中難以用數(shù)學(xué)模型直接表示的關(guān)聯(lián)屬性,利用語(yǔ)義網(wǎng)絡(luò)和專業(yè)領(lǐng)域知識(shí)進(jìn)行組織存儲(chǔ),形成一張以關(guān)系為紐帶的數(shù)據(jù)網(wǎng)絡(luò),通過對(duì)關(guān)系的挖掘與分析,能夠找到隱藏在行為之下的利益鏈條和價(jià)值鏈條,并進(jìn)行直觀的圖例展示。
在面對(duì)數(shù)據(jù)多樣、復(fù)雜,孤島化,且單一數(shù)據(jù)價(jià)值不高的應(yīng)用場(chǎng)景時(shí),存在關(guān)系深度搜索、規(guī)范業(yè)務(wù)流程、規(guī)則和經(jīng)驗(yàn)性預(yù)測(cè)等需求,使用知識(shí)圖譜解決方案將帶來(lái)最佳的應(yīng)用價(jià)值。
連接主義中的深度學(xué)習(xí)算法幾乎代表了當(dāng)代整個(gè)人工智能技術(shù),但深度學(xué)習(xí)需要具有明確因果關(guān)系的數(shù)據(jù)對(duì)訓(xùn)練,且存在尚缺乏解釋性的黑箱問題,在摻雜眾多非線性問題的復(fù)雜場(chǎng)景中應(yīng)用價(jià)值有限,通過與知識(shí)圖譜的配合使用,在一定程度上可以解決此類問題,隨著關(guān)系向量法深入研究,圖神經(jīng)網(wǎng)絡(luò)將走向產(chǎn)業(yè)應(yīng)用,屆時(shí)依托于行業(yè)知識(shí)與經(jīng)驗(yàn)的深度學(xué)習(xí)將產(chǎn)生更多貼近產(chǎn)業(yè)核心的認(rèn)知智能應(yīng)用,人工智能技術(shù)也將跟進(jìn)一步實(shí)現(xiàn)生產(chǎn)力升級(jí)的終極目標(biāo)。
主要涵蓋知識(shí)圖譜、NLP和智能BI分析的大數(shù)據(jù)智能行業(yè)市場(chǎng)規(guī)模和結(jié)構(gòu)
據(jù)艾瑞咨詢統(tǒng)計(jì)推算,2019年涵蓋大數(shù)據(jù)分析預(yù)測(cè)、領(lǐng)域知識(shí)圖譜及NLP應(yīng)用的大數(shù)據(jù)智能市場(chǎng)規(guī)模約為106.6億元,預(yù)計(jì)2023年將突破300億元,年復(fù)合增長(zhǎng)率為30.8%.
其中2019年市場(chǎng)中以金融領(lǐng)域和公安領(lǐng)域應(yīng)用份額占比最大,金融領(lǐng)域因標(biāo)準(zhǔn)化數(shù)據(jù)積累豐富,行業(yè)認(rèn)知與直接需求最為明顯等因素,成為數(shù)據(jù)智能最早落地并產(chǎn)生價(jià)值的行業(yè).
公安領(lǐng)域經(jīng)過三年的感知智能基礎(chǔ)設(shè)施建設(shè),已經(jīng)初步形成人工智能應(yīng)用環(huán)境,在黨中央和公安部的號(hào)召指導(dǎo)下,公安大數(shù)據(jù)建設(shè)將成為下一階段的主題,這一趨勢(shì)也在2019年相關(guān)招標(biāo)項(xiàng)目中得以體現(xiàn)。
隨著整體市場(chǎng)數(shù)據(jù)基礎(chǔ)的完善和需求喚醒,大數(shù)據(jù)智能領(lǐng)域規(guī)模持續(xù)走高,但在行業(yè)可落地性和理性建設(shè)的限制下,預(yù)計(jì)市場(chǎng)增速將呈現(xiàn)下降趨勢(shì),期間咨詢性需求將會(huì)大量出現(xiàn),從整體發(fā)展來(lái)看增速處于良性區(qū)間,對(duì)真正有價(jià)值的公司和產(chǎn)品有正向意義。
知識(shí)圖譜應(yīng)用——搜索引擎領(lǐng)域
搜索引擎是互聯(lián)網(wǎng)發(fā)展中最具代表性的應(yīng)用之一,它解決了人們?nèi)绾畏奖惬@取信息的問題,一度成為大部分流量的入口。但隨著網(wǎng)絡(luò)中信息沉積越來(lái)越多,人們真正需要的,隱藏在大量無(wú)用信息中有價(jià)值的部分,我們稱之為知識(shí)的內(nèi)容,往往得不到直觀展現(xiàn),這成為了搜索引擎領(lǐng)域重點(diǎn)要解決的問題。
2012年5月,谷歌率先提出知識(shí)圖譜概念,用以更好的描述現(xiàn)實(shí)世界中實(shí)體關(guān)聯(lián)性問題,進(jìn)而提高信息搜索中的知識(shí)獲取效率,隨后搜狗、微軟、百度紛紛推出相關(guān)概念架構(gòu),知識(shí)圖譜被視為下一代搜索引擎的核心技術(shù)。
傳統(tǒng)搜索引擎一般采用網(wǎng)頁(yè)索引,按照“網(wǎng)頁(yè) --(預(yù)處理)--> 臨時(shí)庫(kù) --(索引)--> 索引好的庫(kù) --(由用戶行為觸發(fā)檢索)--> 為用戶展示網(wǎng)頁(yè)結(jié)果”的流程執(zhí)行,信息源來(lái)自網(wǎng)頁(yè),展現(xiàn)內(nèi)容也是網(wǎng)頁(yè)鏈接。而基于知識(shí)圖譜的搜索作為和網(wǎng)頁(yè)索引同級(jí)、并行的另一套知識(shí)索引,更注重信息間的關(guān)聯(lián)性和自然語(yǔ)言理解,通過圖存儲(chǔ)的形式從新組織互聯(lián)網(wǎng)中的信息,再以人類的語(yǔ)言習(xí)慣進(jìn)行查詢和展現(xiàn),從而提高搜索體驗(yàn),因?yàn)橹R(shí)的存儲(chǔ)形式發(fā)生了變化,所以知識(shí)索引信息來(lái)源和展現(xiàn)載體都不再局限于網(wǎng)頁(yè)文字,語(yǔ)音交互和更加豐富的IoT場(chǎng)景將會(huì)是未來(lái)的發(fā)展方向。
知識(shí)圖譜在搜索引擎中的應(yīng)用
知識(shí)圖譜應(yīng)用——金融領(lǐng)域
在金融領(lǐng)域中無(wú)論是傳統(tǒng)金融或是互聯(lián)網(wǎng)金融,信用評(píng)估、反欺詐和風(fēng)險(xiǎn)控制都是最為關(guān)鍵的環(huán)節(jié),隨著近些年金融數(shù)據(jù)的爆發(fā)式增長(zhǎng),傳統(tǒng)風(fēng)控系統(tǒng)逐漸力有不逮,而應(yīng)用機(jī)器學(xué)習(xí)算法和知識(shí)圖譜的智能風(fēng)控系統(tǒng)在風(fēng)險(xiǎn)識(shí)別能力和大規(guī)模運(yùn)算方面具有突出優(yōu)勢(shì),逐漸成為金融領(lǐng)域風(fēng)控反欺詐的主要手段。
機(jī)器學(xué)習(xí)和知識(shí)圖譜相結(jié)合是目前主流的解決方案,其中機(jī)器學(xué)習(xí)算法通過概率計(jì)算的方式,以數(shù)學(xué)運(yùn)算特征反應(yīng)風(fēng)險(xiǎn)情況,形成易于機(jī)器計(jì)算的風(fēng)控模型;而知識(shí)圖譜通過權(quán)威經(jīng)驗(yàn)和規(guī)則創(chuàng)建本體模型和抽取實(shí)體的范圍,根據(jù)實(shí)體間關(guān)系形成關(guān)聯(lián)數(shù)據(jù)網(wǎng)的圖譜形式,描畫囊括個(gè)人基礎(chǔ)信息、金融行為、社交網(wǎng)絡(luò)行為等用戶綜合畫像,根據(jù)畫像情況和模型對(duì)應(yīng),形成具有金融業(yè)務(wù)特性的風(fēng)控體系,在解決方案的決策環(huán)節(jié)結(jié)合規(guī)則和概率的綜合評(píng)價(jià),給出最終的風(fēng)險(xiǎn)評(píng)估,整個(gè)過程能夠?qū)崿F(xiàn)秒級(jí)響應(yīng)。
知識(shí)圖譜的應(yīng)用不僅能夠?yàn)槿狈山忉屝缘臋C(jī)器學(xué)習(xí)算法帶來(lái)必要的參考系,還可以串聯(lián)金融業(yè)務(wù)中產(chǎn)生的大量多源異構(gòu)數(shù)據(jù)形成數(shù)據(jù)中臺(tái),挖掘數(shù)據(jù)深層價(jià)值,為實(shí)現(xiàn)精準(zhǔn)營(yíng)銷、投資關(guān)系梳理、產(chǎn)業(yè)鏈風(fēng)險(xiǎn)預(yù)警、智能催收等上層應(yīng)用打下基礎(chǔ)。
知識(shí)圖譜在智能金融解決方案中的應(yīng)用
知識(shí)圖譜應(yīng)用——投研領(lǐng)域
對(duì)一級(jí)市場(chǎng)或二級(jí)市場(chǎng)的投資研究,一直是泛金融領(lǐng)域重要的課題,上市公司或一些重要的標(biāo)的公司在公開網(wǎng)絡(luò)中披露了眾多如財(cái)務(wù)數(shù)據(jù)、定期公告、公司研報(bào)等有價(jià)值的信息,為投資者行為提供了充分的參考依據(jù)。
傳統(tǒng)投研工作需要分析師通過各種渠道去搜集和判別信息,憑借個(gè)人經(jīng)驗(yàn)對(duì)零散的數(shù)據(jù)進(jìn)行組織建模,以報(bào)告的形式產(chǎn)出趨勢(shì)觀點(diǎn)和數(shù)據(jù)分析,大部分的物料和時(shí)間成本都花費(fèi)在信息和數(shù)據(jù)的搜集上,而且成果可控性不高,縱使頭部金融數(shù)據(jù)機(jī)構(gòu)提供了相應(yīng)的軟件產(chǎn)品,但數(shù)據(jù)的顆粒度和產(chǎn)業(yè)鏈關(guān)聯(lián)性仍難以滿足多元需求,這成為了該行業(yè)長(zhǎng)久存在的痛點(diǎn)。
投研知識(shí)圖譜以公司信息、產(chǎn)業(yè)鏈關(guān)聯(lián)為切入點(diǎn),利用NLP技術(shù)自動(dòng)抓取關(guān)鍵信息,搭建投研領(lǐng)域知識(shí)圖譜,將各個(gè)行業(yè)的發(fā)展變化抽象導(dǎo)入數(shù)字層面,為知識(shí)查詢和應(yīng)用開發(fā)提供實(shí)現(xiàn)基礎(chǔ)。據(jù)統(tǒng)計(jì),券商研報(bào)中80%的數(shù)據(jù)指標(biāo)在傳統(tǒng)軟件產(chǎn)品中無(wú)法查詢到,分析師在進(jìn)入一個(gè)新領(lǐng)域時(shí)要耗費(fèi)一周左右的時(shí)間搜集類似數(shù)據(jù),而利用投研知識(shí)圖譜可以將其必要?jiǎng)趧?dòng)時(shí)間縮短到一分鐘,大幅提高投研效率。
除靜態(tài)領(lǐng)域圖譜外,還可以利用時(shí)間序列搭建對(duì)網(wǎng)絡(luò)報(bào)道、新聞事件進(jìn)行抓取的事理圖譜,兩相結(jié)合,從行業(yè)固有邏輯和實(shí)時(shí)信息雙管齊下,推導(dǎo)事情的發(fā)展脈絡(luò)和趨勢(shì)走向,為投研機(jī)構(gòu)和投資者清晰的梳理關(guān)聯(lián)脈絡(luò),為后續(xù)判斷投資機(jī)會(huì)和持倉(cāng)股票風(fēng)險(xiǎn)等研判類應(yīng)用提供數(shù)據(jù)支撐。
投研知識(shí)圖譜與傳統(tǒng)產(chǎn)品的對(duì)比
知識(shí)圖譜應(yīng)用——司法領(lǐng)域
司法領(lǐng)域是以公檢法等國(guó)家司法機(jī)關(guān)及司法人員依照法定職權(quán)和法定程序,運(yùn)用法律處理案件的專業(yè)領(lǐng)域。
近年,司法領(lǐng)域積極運(yùn)用大數(shù)據(jù)、云計(jì)算、人工智能等先進(jìn)技術(shù),深入業(yè)務(wù)場(chǎng)景解決痛點(diǎn)問題,有效提升辦案質(zhì)效、輔助司法管理、服務(wù)群眾訴訟,加速推進(jìn)司法智慧化、數(shù)字化、現(xiàn)代化轉(zhuǎn)型升級(jí)。
知識(shí)圖譜的構(gòu)建是實(shí)現(xiàn)智慧司法不可或缺的基礎(chǔ)工程。司法知識(shí)圖譜將法律領(lǐng)域中的實(shí)體、屬性和關(guān)系進(jìn)行體系化梳理,并建立邏輯關(guān)聯(lián),通過知識(shí)圖譜和大數(shù)據(jù)技術(shù)進(jìn)行數(shù)據(jù)挖掘,輔助決策,洞察知識(shí)領(lǐng)域動(dòng)態(tài)發(fā)展規(guī)律?;谒痉ㄖR(shí)圖譜,通過技術(shù)手段可實(shí)現(xiàn)司法業(yè)務(wù)場(chǎng)景的智能應(yīng)用,解決“案多人少”“同案不同判”等現(xiàn)實(shí)問題。
目前,司法知識(shí)圖譜已廣泛運(yùn)用于法律知識(shí)檢索和推送、文書自動(dòng)生成、裁判結(jié)果預(yù)測(cè)預(yù)警、知識(shí)智能問答、數(shù)據(jù)可視化等方面,為司法人員辦案提供高效參考和科學(xué)依據(jù),全新定義司法數(shù)據(jù)應(yīng)用和司法智能化,凝練司法智慧,服務(wù)法治建設(shè)。
知識(shí)圖譜在司法領(lǐng)域中的應(yīng)用
知識(shí)圖譜應(yīng)用——教育領(lǐng)域
當(dāng)前的教育場(chǎng)景可以劃分為教、管、學(xué)、考,主要圍繞教育者和受教育者進(jìn)行授課、答疑、閱卷和學(xué)習(xí)、練習(xí)、考試等活動(dòng),本質(zhì)上是通過系統(tǒng)化的知識(shí)傳授與強(qiáng)化練習(xí),使受教育者掌握知識(shí)點(diǎn)的過程。
傳統(tǒng)教育模式以教師集中授課為主要方式,存在著特級(jí)教師資源少、優(yōu)質(zhì)教學(xué)資源分配不佳、教學(xué)內(nèi)容和教學(xué)節(jié)奏制式化,以及作業(yè)練習(xí)布置缺乏個(gè)性化等問題。在教育信息化和線上教育發(fā)展普及之后,AI+教育的概念隨之產(chǎn)生,人工智能公司和教育機(jī)構(gòu)希望通過利用AI技術(shù)部分解決上述痛點(diǎn),以達(dá)到對(duì)教育參與者減負(fù)增效的目的。
教育領(lǐng)域參與個(gè)體眾多,采集到的數(shù)據(jù)駁雜且零碎,難以直接有效應(yīng)用,所以目前AI技術(shù)更多應(yīng)用在如拍照搜題、口語(yǔ)評(píng)測(cè)、課堂監(jiān)控等外圍需求的工具上面,并未能有效深入到教學(xué)場(chǎng)景中。而類似課題推送等應(yīng)用更多是將教學(xué)資源再分配,重視知識(shí)的點(diǎn)狀強(qiáng)化練習(xí),卻不深究知識(shí)的掌握程度,以至實(shí)際使用者反饋平平。
人工智能技術(shù)真正產(chǎn)生生產(chǎn)價(jià)值,一定要建立在充分且必要的數(shù)據(jù)基礎(chǔ)上,搭建貫穿教材知識(shí)體系、教學(xué)資源管理和受教育者學(xué)習(xí)軌跡的知識(shí)圖譜,將教與學(xué)的全過程進(jìn)行可視化展現(xiàn),使靜態(tài)知識(shí)點(diǎn)數(shù)據(jù)與動(dòng)態(tài)教學(xué)活動(dòng)(如考試、作業(yè)等)數(shù)據(jù)產(chǎn)生關(guān)聯(lián),為算法應(yīng)用提供支撐環(huán)境,是AI+教育能落地到產(chǎn)業(yè)核心的關(guān)鍵前提。
免責(zé)聲明:本文內(nèi)容由互聯(lián)網(wǎng)用戶自發(fā)貢獻(xiàn)自行上傳,本網(wǎng)站不擁有所有權(quán),也不承認(rèn)相關(guān)法律責(zé)任。如果您發(fā)現(xiàn)本社區(qū)中有涉嫌抄襲的內(nèi)容,請(qǐng)發(fā)送郵件至:operations@xinnet.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),本站將立刻刪除涉嫌侵權(quán)內(nèi)容。