人工智能提升網(wǎng)絡(luò)輿情分析能力作者:未知輿論是“社會(huì)的皮膚”,是反映社會(huì)局勢(shì)的晴雨表。而輿情分析是根據(jù)特定需要,針對(duì)社會(huì)輿論問題對(duì)于相關(guān)數(shù)據(jù)進(jìn)行深層次的思想加工和分析研討,得到相關(guān)結(jié)論的過程。網(wǎng)絡(luò)是當(dāng)下社會(huì)輿論的主要載體之一,在互聯(lián)網(wǎng)時(shí)代,尤其是移動(dòng)互聯(lián)網(wǎng)時(shí)代,大數(shù)據(jù)及大數(shù)據(jù)分析技能為輿情分析和研判提供了全新的資源、方法與范式。
從整體上說,現(xiàn)階段網(wǎng)絡(luò)輿情分析的基本框架為:信息采集、熱點(diǎn)發(fā)現(xiàn)、熱點(diǎn)評(píng)估與熱點(diǎn)跟蹤和分析處理。
由于網(wǎng)絡(luò)輿情數(shù)據(jù)存在著海量、多維度等特點(diǎn),輿情數(shù)據(jù)的深度價(jià)值挖掘一直是這一領(lǐng)域發(fā)展的瓶頸之一。近年來,人工智能技能的興起與實(shí)用化,為我們借助于人工智能實(shí)現(xiàn)網(wǎng)絡(luò)輿情分析的自動(dòng)化、智能化、精準(zhǔn)化提供了新的手段和路徑。為此,一些研討者也做出有益的探索,如使用小波分析分解輿論發(fā)展過程,再利用人工神經(jīng)網(wǎng)絡(luò)進(jìn)行建模預(yù)測輿論走向;使用神經(jīng)網(wǎng)絡(luò)仿真模擬輿論發(fā)展過程;使用灰度預(yù)測和模式識(shí)別預(yù)測輿論走勢(shì)等。
本文試圖在梳理輿情研討的現(xiàn)狀與特點(diǎn)的前提下,探討在現(xiàn)有技能條件下,網(wǎng)絡(luò)輿情分析的實(shí)踐范式存在的缺陷與不足,而人工智能技能能夠?yàn)榫W(wǎng)絡(luò)輿情分析帶來哪些有應(yīng)用前景的改變。
人工智能提升網(wǎng)絡(luò)輿情分析能力的環(huán)節(jié)
現(xiàn)階段網(wǎng)絡(luò)輿情分析的不足能夠主要?dú)w結(jié)為“人機(jī)不協(xié)調(diào)”的問題。在應(yīng)當(dāng)使用機(jī)器進(jìn)行學(xué)習(xí)和處理的權(quán)重配比、走勢(shì)預(yù)測、情感分析、效果檢查上,現(xiàn)實(shí)應(yīng)用顯得機(jī)械、淺層次;而在應(yīng)當(dāng)使用人工進(jìn)行分析的特征維度劃分、對(duì)策建議提供上,現(xiàn)實(shí)應(yīng)用又顯得粗糙、反復(fù),且機(jī)器對(duì)人的輔助不夠有力,分工協(xié)同的模式還不成熟。
得益于數(shù)理算法和計(jì)算機(jī)科學(xué)的發(fā)展,人工智能時(shí)代的機(jī)器學(xué)習(xí)能力日益增強(qiáng),這為網(wǎng)絡(luò)輿情分析領(lǐng)域?qū)崿F(xiàn)自動(dòng)化、精準(zhǔn)化、智能化創(chuàng)造了新的契機(jī),而實(shí)現(xiàn)新要求的關(guān)鍵點(diǎn)在于切實(shí)實(shí)現(xiàn)網(wǎng)絡(luò)輿情分析領(lǐng)域中的人機(jī)互動(dòng)與雙向協(xié)同。
1.數(shù)據(jù)預(yù)處理環(huán)節(jié):特征的人工識(shí)別與機(jī)器匹配的協(xié)同。
在互聯(lián)網(wǎng)的社交網(wǎng)絡(luò)中充斥著非結(jié)構(gòu)、半結(jié)構(gòu)數(shù)據(jù),數(shù)據(jù)庫需要為這些數(shù)據(jù)提供合適的存儲(chǔ)標(biāo)簽,方便分類和調(diào)用。在數(shù)據(jù)特征分類上,人的作用至關(guān)重要。完全依賴無監(jiān)督的學(xué)習(xí),不但需要大量數(shù)據(jù)擬合,而且速度慢、容易產(chǎn)生偏差。因此,在首先的特征分類中,能夠由人工盡量設(shè)計(jì)較細(xì)的分類,此后通過信息增益等算法,履歷半監(jiān)督式機(jī)器學(xué)習(xí)的訓(xùn)練,在分類環(huán)節(jié)能夠去除影響力較小的局部,留下影響力較大的局部,在機(jī)器能力支撐下建立合理的特征維度數(shù)量,并賦予權(quán)重。這種特征的構(gòu)建方式更能體現(xiàn)輿情信息的原貌,對(duì)現(xiàn)實(shí)的解釋力更強(qiáng)。
2.熱點(diǎn)發(fā)現(xiàn)環(huán)節(jié):話題預(yù)測的機(jī)器提示與人工選擇的協(xié)同。
人工智能是建立在數(shù)理模型和計(jì)算機(jī)支持上的一種應(yīng)用,其內(nèi)核依賴因果邏輯和幾率統(tǒng)計(jì)。即使人工智能能夠自動(dòng)探索不同事物之間的關(guān)聯(lián),它判斷是非的方式只可是:第一,A能推導(dǎo)出B,或不能。第二,根據(jù)以往經(jīng)驗(yàn),某事件有多大的幾率會(huì)發(fā)生。所以,想讓人工智能做出準(zhǔn)確的判斷,要么存在必然的因果邏輯,要么有足夠的案例用以輔助統(tǒng)計(jì)。
但是,現(xiàn)實(shí)生活中有許多事物并不真正按照因果邏輯運(yùn)行。很多情況下,人工智能需要依靠幾率預(yù)測事物的走向,但又不是任何事情都有足夠的先例可供學(xué)習(xí)。
對(duì)輿論的預(yù)測很難按照因果邏輯執(zhí)行,想做到正確預(yù)測只可先依靠足夠多的、已完結(jié)的輿論話題作為機(jī)器學(xué)習(xí)的對(duì)象,尋找它們幾率上的特征。憑借之前的這些經(jīng)驗(yàn),將有可能產(chǎn)生重大影響的輿論在萌芽期識(shí)別出來,并設(shè)計(jì)回應(yīng)辦法。即便如此,機(jī)器也不可能完全精準(zhǔn)地預(yù)測輿論,在一定范圍內(nèi)的預(yù)測建議中,需要人的智慧進(jìn)行分析判斷,找出真正存在進(jìn)一步發(fā)酵可能的輿論。同時(shí),這樣的人工選擇行為需要完整的記錄,作為機(jī)器進(jìn)一步學(xué)習(xí)的訓(xùn)練集,以供下一次輿論預(yù)測參考。這種人機(jī)互動(dòng)的模式能夠提升機(jī)器學(xué)習(xí)的能力,使人工智能逐漸達(dá)到更高水平,更加智能地為人提供輔助。
3.對(duì)策分析環(huán)節(jié):專家?guī)斓慕?jīng)驗(yàn)及其量化。
技能領(lǐng)域公認(rèn),操縱機(jī)器進(jìn)行情感分析,比真相分析要困難得多。機(jī)器能夠通過分詞法、訓(xùn)練集的重復(fù)訓(xùn)練學(xué)會(huì)分析句子成分、找到陳說的真相,但對(duì)于微妙情感的辨析、反諷修辭的運(yùn)用,機(jī)器極難進(jìn)行判斷。鑒于此,在對(duì)輿論進(jìn)行整理、分析和預(yù)測的過程中,人工智能對(duì)于真相的理解能力能夠提升到與人類比肩的程度,但對(duì)于輿論的情感判斷,機(jī)器恐怕很難達(dá)到人類的理解高度。
在互聯(lián)網(wǎng)時(shí)代,情感是一種十分重要的邏輯,許多互聯(lián)網(wǎng)事件的發(fā)酵、擴(kuò)散,背后都有情感訴求的影子,偶爾情感訴求甚至超出理智訴求,成為左右輿論極其重要的一個(gè)因素。因此,在輿情分析的對(duì)策環(huán)節(jié)中,梳理的真相能夠由機(jī)器提供,但對(duì)策建議始終要依賴專家的經(jīng)驗(yàn)。當(dāng)然,對(duì)專家?guī)熘械慕?jīng)驗(yàn)予以量化,能夠?yàn)轭愃戚浨樵俪霈F(xiàn)時(shí)提供輔助建議,逐步使機(jī)器的智慧能為人類提供更高水平的咨詢意義上的幫助,乃至應(yīng)對(duì)一些常見的、并不新穎的輿情危機(jī)――而這類輿情危機(jī)常常占危機(jī)發(fā)生總量的80%以上。
人工智能條件下的網(wǎng)絡(luò)輿情分析新范式
人機(jī)互動(dòng)是人工智能應(yīng)用于網(wǎng)絡(luò)輿情分析的重要邏輯,聯(lián)合現(xiàn)有網(wǎng)絡(luò)輿情分析模式與流程,以及每一環(huán)節(jié)的技能支持情況,我們提出人工智能技能支撐下的網(wǎng)絡(luò)輿情分析的新范式。即遵循從現(xiàn)實(shí)問題,到量化建模,再到探索結(jié)論的基本方向,并在每一詳細(xì)環(huán)節(jié)中遵循人機(jī)互動(dòng)與協(xié)同的原則,對(duì)人工智能技能加以有效應(yīng)用(見圖2)。
應(yīng)該說,人工智能的實(shí)現(xiàn),得益于科學(xué)界量化整個(gè)世界的嘗試??茖W(xué)界試圖構(gòu)建模型來表達(dá)紛繁復(fù)雜的客觀世界,并得到了許多成就。這些成就在一定程度上鼓舞了“計(jì)算主義”哲學(xué)的發(fā)展,信奉計(jì)算主義的人認(rèn)為世界在極大程度上是能夠被量化的,因此,人工智能才可以比我們想象的更接近人類。顯然,這種信仰并不代表真理,相反,有更多的學(xué)者質(zhì)疑,我們的世界中不能量化的問題遠(yuǎn)遠(yuǎn)多于能夠量化的問題。現(xiàn)代經(jīng)濟(jì)學(xué)、社會(huì)學(xué)、政治學(xué)的一些研討也證明,不同于自然法則,在人為世界中,人的復(fù)雜程度遠(yuǎn)超過人類自己的想象和技能能夠完全把握的能力。
因而,唯有人和機(jī)器相互促進(jìn),人的創(chuàng)造力才能被釋放,而非被科技所奴役。人類憑借本身的經(jīng)驗(yàn)、判斷和天賦提出新的理論,解決問題的框架,而人工智能強(qiáng)大的數(shù)據(jù)處理能力和邏輯演繹能力能夠?yàn)檫@些新穎的想法提供驗(yàn)證、修正或否定。人機(jī)互動(dòng)的視角不但對(duì)人工智能條件下的輿情分析具有啟示作用,對(duì)所有社會(huì)科學(xué)而言,人機(jī)互動(dòng)也能夠成為普遍遵循的解決問題的模式。