通俗地說,“互聯(lián)網(wǎng)+”就是“互聯(lián)網(wǎng)+各個(gè)傳統(tǒng)行業(yè)”,充分發(fā)揮互聯(lián)網(wǎng)的優(yōu)勢,完成傳統(tǒng)產(chǎn)業(yè)的轉(zhuǎn)型與升級?,F(xiàn)如今,各行各業(yè)都開始進(jìn)軍互聯(lián)網(wǎng)時(shí)代,在這樣一個(gè)大背景下,傳統(tǒng)的自然語言行業(yè)當(dāng)然也不能“免俗”
國務(wù)院印發(fā)的《關(guān)于積極推進(jìn)“互聯(lián)網(wǎng)+”行動的指導(dǎo)意見》(以下簡稱《意見》)首次從國家層面提出了一系列“互聯(lián)網(wǎng)+”的重點(diǎn)行動。重點(diǎn)行動從“互聯(lián)網(wǎng)+”創(chuàng)業(yè)創(chuàng)新開始,繼之以“互聯(lián)網(wǎng)+”制造、農(nóng)業(yè)、能源、金融、服務(wù)、物流、電子商務(wù)、交通、生態(tài)等一系列重要產(chǎn)業(yè),最后是“互聯(lián)網(wǎng)+”人工智能。筆者認(rèn)為,此《意見》勾畫了一個(gè)以創(chuàng)新為源頭,以產(chǎn)業(yè)為主體,以智能為技術(shù)支撐的“互聯(lián)網(wǎng)+”發(fā)展藍(lán)圖。
首先,互聯(lián)網(wǎng)是高度創(chuàng)新的生產(chǎn)力,其生命在于創(chuàng)新,只有互聯(lián)網(wǎng)本身具有巨大的創(chuàng)造力和生命力,才能促進(jìn)其他產(chǎn)業(yè)的發(fā)展。因此,“互聯(lián)網(wǎng)+”創(chuàng)業(yè)創(chuàng)新是“互聯(lián)網(wǎng)+”行動的源頭。其次,正如《意見》所指出的,“互聯(lián)網(wǎng)+”是把互聯(lián)網(wǎng)的創(chuàng)新成果與經(jīng)濟(jì)社會各領(lǐng)域的深度融合。因此,“互聯(lián)網(wǎng)+”制造等產(chǎn)業(yè)是行動的主體。尤為值得重視的是,互聯(lián)網(wǎng)與經(jīng)濟(jì)社會各領(lǐng)域的“+”不應(yīng)當(dāng)、也不可能是簡單地將原有產(chǎn)業(yè)的工具換成“互聯(lián)網(wǎng)”,而應(yīng)該是二者的深度融合,只有這樣才有可能實(shí)現(xiàn)《意見》提出的融合發(fā)展,形成基于互聯(lián)網(wǎng)的新業(yè)態(tài)。而要實(shí)現(xiàn)這種深度融合,智能化是必由之路,“互聯(lián)網(wǎng)+”人工智能提供了支撐這種深度融合的核心技術(shù)路線,“互聯(lián)網(wǎng)+”各產(chǎn)業(yè)的深度融合都需要“互聯(lián)網(wǎng)+”人工智能的支撐。
那么,“互聯(lián)網(wǎng)+”人工智能如何為“互聯(lián)網(wǎng)+”各產(chǎn)業(yè)的深度融合提供支撐呢?以下,本文僅以《意見》在“互聯(lián)網(wǎng)+”人工智能中提出的自然語言理解這一人工智能領(lǐng)域的重要技術(shù)為例,首先闡述該技術(shù)如何進(jìn)行“互聯(lián)網(wǎng)+”,之后闡述其如何為互聯(lián)網(wǎng)與產(chǎn)業(yè)進(jìn)行深度融合提供核心技術(shù)支持。
簡單地說,自然語言理解(或者更一般地稱為自然語言處理)是研究使機(jī)器能理解人類語言(像中文、英文等人類語言稱為自然語言)的技術(shù)。這種技術(shù)有非常廣泛的應(yīng)用。例如,如果有一臺機(jī)器既能理解中文又能理解英文,那么,這臺機(jī)器就可以為人類充當(dāng)翻譯;如果電視能理解中文,那么,用戶就可以不用按鈕,而是通過說話來遙控電視。
自從上世紀(jì)40年代計(jì)算機(jī)發(fā)明以來,人們就開始了對自然語言理解技術(shù)的探索,取得了一系列的進(jìn)展。尤其是近20年來,隨著互聯(lián)網(wǎng)的發(fā)展引發(fā)了對這一技術(shù)的強(qiáng)勁需求,這一技術(shù)在得到長足發(fā)展的同時(shí),也在有力地促進(jìn)互聯(lián)網(wǎng)核心能力的增強(qiáng)。比如,目前互聯(lián)網(wǎng)提供的一個(gè)基礎(chǔ)性能力是信息檢索。人們在搜索引擎中輸入關(guān)鍵詞,就可以獲得相關(guān)信息。在20年前,互聯(lián)網(wǎng)剛開始發(fā)展的初期,給搜索引擎輸入“和服”,返回的結(jié)果中很可能包含不少生產(chǎn)、銷售“鞋子和服裝”的公司的信息。現(xiàn)在這種錯(cuò)誤已經(jīng)比較少了,而促進(jìn)其質(zhì)量不斷提升的一個(gè)核心就是采用了不斷改進(jìn)的自然語言理解技術(shù)。“互聯(lián)網(wǎng)+”自然語言理解已經(jīng)成為互聯(lián)網(wǎng)發(fā)展的一個(gè)共識,并在不斷深化。
筆者認(rèn)為,“互聯(lián)網(wǎng)+”自然語言理解有兩個(gè)互相補(bǔ)充的發(fā)展方向,一是發(fā)展大規(guī)模語言數(shù)據(jù)的分析處理能力,二是發(fā)展自然的人-機(jī)器交互方式。
基于“互聯(lián)網(wǎng)+”自然語言理解發(fā)展大規(guī)模語言數(shù)據(jù)的分析處理能力,是指基于自然語言理解技術(shù)對廣泛存在的語言信息進(jìn)行獲取、分析、推理和整合,并提供決策輔助。其需求存在于“互聯(lián)網(wǎng)+”制造、農(nóng)業(yè)、能源、金融、服務(wù)、物流、電子商務(wù)、交通、生態(tài)等各個(gè)行業(yè)中。例如,在智能制造中,《意見》中著重提到了制造業(yè)服務(wù)化轉(zhuǎn)型:鼓勵制造企業(yè)利用物聯(lián)網(wǎng)、云計(jì)算、大數(shù)據(jù)等技術(shù),整合產(chǎn)品全生命周期數(shù)據(jù),形成面向生產(chǎn)組織全過程的決策服務(wù)信息,為產(chǎn)品優(yōu)化升級提供數(shù)據(jù)支撐。實(shí)際上,在產(chǎn)品全生命周期里確實(shí)存在大量的數(shù)據(jù),其中關(guān)于產(chǎn)品的需求、設(shè)計(jì)、工藝、加工和銷售各環(huán)節(jié)的數(shù)據(jù)(來自企業(yè)內(nèi)部、企業(yè)外部以及互聯(lián)網(wǎng)上)很大一部分是以自然語言方式存在的,要基于這些語言數(shù)據(jù)形成全過程的決策服務(wù),很關(guān)鍵的一點(diǎn)就是要自動分析和理解這些語言數(shù)據(jù)。利用機(jī)器自動進(jìn)行這些信息的分析,與人工分析相比,具有信息全面、快速響應(yīng)的特點(diǎn),可以作為人工決策的有力支撐。這方面的研究目前被稱為企業(yè)競爭力情報(bào),已經(jīng)得到各類企業(yè)的重視。不單對于制造業(yè),農(nóng)業(yè)、能源、金融、醫(yī)療等行業(yè)也有著類似的需求。因此,基于“互聯(lián)網(wǎng)+”自然語言理解發(fā)展大規(guī)模語言數(shù)據(jù)的分析處理能力是“互聯(lián)網(wǎng)+”行動的一個(gè)重要技術(shù)支撐。
基于“互聯(lián)網(wǎng)+”自然語言理解發(fā)展自然的人-機(jī)器交互方式是指基于自然語言理解技術(shù)重塑人與機(jī)器之間的交互方式,使自然語言成為人-機(jī)器之間進(jìn)行交互的自然接口。目前,技術(shù)人員在賦予產(chǎn)品某項(xiàng)功能時(shí),需要采用專門為機(jī)器設(shè)計(jì)的語言編寫程序來“告知”機(jī)器,普通大眾在使用產(chǎn)品某項(xiàng)功能時(shí),需要按要求進(jìn)行按鍵選擇,“告知”機(jī)器執(zhí)行某個(gè)指令。不論是開發(fā)還是使用機(jī)器,人們在和機(jī)器交流時(shí)都要使用另外一套專門的交流語言或方式,不同的機(jī)器可能要使用不同的語言或方式,為了開發(fā)或使用這些機(jī)器,人們需要去學(xué)習(xí)這些不同的語言,這對于人來說,是一個(gè)極大的負(fù)擔(dān),尤其是隨著機(jī)器日益走進(jìn)社會生產(chǎn)和生活的各個(gè)方面。如果每個(gè)機(jī)器都有一套不同的交互語言,那將嚴(yán)重影響人們對機(jī)器的開發(fā)和使用,因此,最好是使用一種統(tǒng)一的交互方式。統(tǒng)一所有交互語言的一個(gè)很自然的方式是使用人類的自然語言。由于自然語言是人類天生就能逐步習(xí)得的語言,因此,對于人類而言,這是一種最自然、最方便的交流方式,對于人類而言更不容易出錯(cuò),更能體現(xiàn)每個(gè)人的個(gè)性。而要達(dá)成此目標(biāo),就需要采用自然語言理解技術(shù),使機(jī)器具有理解人類自然語言的能力,實(shí)現(xiàn)基于自然語言的人機(jī)交互。
基于“互聯(lián)網(wǎng)+”自然語言理解發(fā)展自然的人-機(jī)器交互方式同樣對于“互聯(lián)網(wǎng)+”行動的其他主體方面具有重要的需求。典型的,如《意見》在“互聯(lián)網(wǎng)+”益民服務(wù)中提到:加快互聯(lián)網(wǎng)與政府公共服務(wù)體系的深度融合,推動公共數(shù)據(jù)資源開放,促進(jìn)公共服務(wù)創(chuàng)新供給和服務(wù)資源整合,構(gòu)建面向公眾的一體化在線公共服務(wù)體系。實(shí)際上,面向普通大眾的各種服務(wù),如果交互方式煩雜不自然、不便捷,那么就難以得到普通大眾的響應(yīng),提供服務(wù)就成為一句空話。在“互聯(lián)網(wǎng)+”電子商務(wù)等行業(yè)中也是如此。因此,基于“互聯(lián)網(wǎng)+”自然語言理解發(fā)展自然的人-機(jī)器交互方式同樣是“互聯(lián)網(wǎng)+”行動的一個(gè)重要技術(shù)支撐。
總之,“互聯(lián)網(wǎng)+”自然語言理解作為“互聯(lián)網(wǎng)+”人工智能的一個(gè)具體方面,不論是發(fā)展大規(guī)模語言數(shù)據(jù)的分析處理能力,還是發(fā)展自然的人-機(jī)器交互方式,都是“互聯(lián)網(wǎng)+”行動中的一個(gè)重要組成部分,在推動“互聯(lián)網(wǎng)+”人工智能中發(fā)揮巨大作用的同時(shí),也為“互聯(lián)網(wǎng)+”各產(chǎn)業(yè)的深度融合提供有效的技術(shù)支撐。
(原標(biāo)題:基于“互聯(lián)網(wǎng)+”自然語言理解是實(shí)現(xiàn)人工智能的關(guān)鍵)