當前位置:首頁  科學頭條

OpenKS知識計算引擎取得重大進展

讓人工智能更加智能

發布時間:2021-04-25來源:浙大新聞辦作者:吳雅蘭 柯溢能 盧紹慶4

如果你輸入一段文字“我喜歡小米”,計算機能分析出小米指的是手機還是一個人嗎?

計算機能根據高中生歷年成績與特點,提供填報高考志愿的建議嗎?

計算機能提供購房、買車的建議,能幫人打官司嗎?

……

這些年來,人工智能的迅速發展深刻地改變著人類的社會生活,但是我們仍然時不時發現人工智能還有很多不夠“聰明”的地方,甚至會有些懊惱:“怎么就不能明白我的意思呢?怎么就得不到我想要的結果呢?”

記者從424日浙江大學召開的OpenKS(知目)知識計算引擎開源項目發布會上獲悉,浙大與合作單位研發的OpenKS知識計算引擎取得重大進展,有望解決“人工智能不夠智能”的問題。

中國工程院院士、國家新一代人工智能戰略咨詢委員會組長、浙江大學計算機學院教授潘云鶴說,本次發布的OpenKS,作為知識計算引擎項目中的基礎軟件架構,定義并豐富了知識計算的內涵,這種從跨領域知識自動歸納與遷移,到可泛化的知識演化與協同推理,再到永不停息的自主知識學習與計算服務的思路,將會加速眾多知識密集型行業向智能化過度的過程,是我國在大數據人工智能方向的又一次有益嘗試。

將大數據轉化成結構化信息

在學習工作中,我們常會接觸到表格和文檔兩種工具。比如,我們在錄入一些個人信息的時候,可以在表格中設計好表頭,按條目分別輸入姓名、年齡、出生地等信息,計算機能夠很容易地讀取這些信息并加以整合、應用。而如果用一段文字“小A1982年出生在杭州”來描述的話,計算機讀取信息的時候可能就會懵圈。

為什么?因為表格是有結構的,而文字是非結構性的。對于目前的人工智能來說,非結構性數據只是數據,還不是知識,更不能被用于決策了。

其中關鍵的原因就是數據與知識之間的轉化還不是很順暢。在沒有“學習”之前,計算機不知道西湖區是杭州的一個城區,無法判斷一個名詞是人名、產品名亦或是公司名,而視頻也只是一段數據流。

為了解決這個難題,201912月,以浙江大學計算機學院莊越挺教授作為首席科學家的科技創新2030“新一代人工智能”首批重大項目——“可泛化的領域知識學習與計算引擎”正式啟動。

該項目由浙江大學牽頭,聯合北京大學、北京航空航天大學、哈爾濱工業大學、西北工業大學、之江實驗室等頂尖學術機構,以及百度、??低?、同盾科技、科大訊飛等行業領軍企業,旨在建立一整套可服務于知識密集型行業共性需求的知識計算工具、算法與系統,幫助這些行業快速地構建行業知識圖譜,提供行業相關的智能規劃與決策支持。

目前,經過各課題組的深入研究和課題間的緊密協作,基于百度飛槳深度學習框架,團隊共同研發了可用于支撐各行業知識服務系統構建的OpenKS知識計算引擎算法庫,“目前OpenKS已基本支持知識學習與計算全流程主要任務,涉及非結構化數據集與知識圖譜載入、多模態數據知識抽取、知識表征、分布式知識學習與計算、知識服務與智能應用等環節模塊?!鼻f越挺說。

OpenKS項目整體架構


幫助行業快速建立知識圖譜

新一代人工智能中,知識圖譜作為最重要的知識表示方式,已成為研究熱點。知識的自動發現,知識圖譜的構建、演化和協同推理是知識計算的核心技術,而融合數據、算法與人類智慧,協同一體的大規模分布式知識計算引擎則是實際應用的關鍵。

簡單地說,知識圖譜就是對信息的結構化表達,比如把一篇文章‘改成’一個表格?!?莊越挺說,從全社會來看,眾多知識密集型行業,如安防、金融風控、智慧城市、工程教育等均有著從海量數據中構建知識圖譜并基于此進行快速決策的共性需求。然而,目前的人工智能技術在應對上述共性需求時,并沒有通用、完整的解決方案,也無法同時解決數據不全、預測不準和計算不快等應用挑戰,“這極大地制約了知識密集型行業的智能化改造?!?/span>

團隊研發的OpenKS知識計算引擎算法庫的一個重要功能就是從數據中提煉出知識并在此基礎上做出決策。比如,在氣象預報系統中,搭建地名、氣象術語等知識庫,讓人工智能“學習”之后能夠讀取、檢索、推理。

項目主要參與人員、浙大計算機學院教授肖俊介紹說,OpenKS知識計算引擎算法庫集成了大量算法和解決方案,提供了一系列知識學習與計算的多層級接口標準,可供各機構研發人員以統一的形式進行算法模型研究成果的封裝、集成與服務。

OpenKS知識學習與計算的多層級接口標準

以工程科技教育行業為例,目前我國存在很大的工程人才缺口,然而工程科技門類眾多、知識體系繁復、知識點之間關聯復雜,教材層次各異給自學帶來了門檻。另一方面,學生背景各異、學習目的各異,統一培訓效率低下。OpenKS知識計算引擎包含的知識抽取算法API、知識表征學習API、分布式知識計算API、知識圖譜應用API可為工程科教構建工程科教知識圖譜,并基于圖譜為不同的學生設計個性化的教育路線,滿足差異化學習的需要。

第一階段我們的主要工作是算法庫和知識圖譜的搭建以及分布式計算?!?項目主要參與人員、浙大計算機學院副教授湯斯亮演示了一個簡單的小程序,當我們輸入商品信息后,這套系統能自動識別、整理,最終生成一條商品推介。


開源式打造“木匠的工具間”

目前,這套系統已經應用到了多個行業領域。比如,在產業鏈的梳理中,系統幫助建立行業中上下游各企業的知識圖譜,尋找生產的薄弱環節或是缺少的零部件。

而且項目的研發過程采用了開源機制,支持企業和社區開發者根據不同的場景需求對接口服務進行調用和進一步開發。也就是說,各行各業可以選擇引擎中的算法,快速地搭建行業系統應用,以應對多變的決策需求。當行業與需求發生變化,系統也能夠及時地提供算力、算法支撐,以縮短行業智能化改造的時間。這樣的計算引擎能源源不斷地產生各個行業的知識,進而碰撞產生新產業、新業態和新模式。

打一個比方,我們是打造了一個‘木匠的工具間’,里面有鋸子、刨子、榔頭、釘子等各種工具,桌子、柜子這些常用的家具,系統可以幫忙做,如果是個性化的需求,木匠也可以在工具間里利用我們提供的這些工具來自己做?!鼻f越挺說,項目的研發過程中,行業專家、算法開發者和用戶都發揮了各自作用,“達到越用越聰明的效果?!?/span>

如何運用大數據智能手段助力區域產業發展升級及科技創新決策? OpenKS給出了新路徑新方法。杭州量知數據科技有限公司以OpenKS知識計算引擎為內核,研制了SuperMind智能計算平臺,借助大數據智能技術和人機協同方式,從資訊、研報、專利、企業信息等海量非結構化數據中實現關鍵“知識”自動發現與抽取,相較于傳統人工方式,最快只需一周即可構建完成高質量的產業鏈及創新鏈知識圖譜,全方位展示關鍵要素,深入分析區域產業優勢和短板,輔助推理決策,目前已服務于浙江省全球產業鏈精準合作招商平臺、浙江省產業鏈數據中心和浙江省三大科創高地關鍵核心技術攻關數字化平臺等項目,應用效果良好。

目前OpenKS項目已經并正在融合吸收來自跨媒體知識圖譜構建、知識表征推理、可泛化協同求解、自適應學習中間件等方面的優秀成果,形成了一系列擁有自主知識產權的發明專利與軟件著作產權,發表了一系列高水平學術論文。在后續項目的實施過程中,項目組將持續推動知識計算引擎的研發,讓OpenKS知識計算引擎項目更好地為行業賦能,助力各類傳統行業基礎設施的智能化改造。

(文 吳雅蘭 柯溢能/攝影 盧紹慶)

玖玖爱这里只有精品视频_两个人看的www在线观看视频_亚洲AV无码无限在线观看_无限在线观看动画免费