在萬物互聯(lián)的背景下,以云計算為用,以個人數(shù)據(jù)為體,以機(jī)器學(xué)習(xí)為主的智能應(yīng)用已經(jīng)“潤物細(xì)無聲”。從今日頭條的個性化推送到螞蟻金服的芝麻信用評分,從京東的“奶爸當(dāng)家指數(shù)”到某旅游網(wǎng)站用大數(shù)據(jù)“殺熟”,個人信息自動化分析深嵌入到我們?nèi)粘I钪小?/p>
與此同時,越來越多的數(shù)據(jù)產(chǎn)生,算法逐漸從過去單一的數(shù)學(xué)分析工具轉(zhuǎn)變?yōu)槟軌驅(qū)ι鐣a(chǎn)生重要影響的力量,建立在大數(shù)據(jù)和機(jī)器深度學(xué)習(xí)基礎(chǔ)上的算法,具備越來越強(qiáng)的自主學(xué)習(xí)與決策功能。
算法通過既有知識產(chǎn)生出新知識和規(guī)則的功能被急速地放大,對市場、社會、政府以及每個人都產(chǎn)生了極大的影響力。算法一方面給我們帶來了便利,比如智能投顧或智能醫(yī)療,但另一方面,卻絕非完美無缺,由于算法依賴于大數(shù)據(jù),而大數(shù)據(jù)并非中立,這使得算法不僅可能出錯,甚至還可能存在“惡意”。
一般來說,算法是為解決特定問題而對一定數(shù)據(jù)進(jìn)行分析、計算和求解的操作程序。算法,最初僅用來分析簡單的、范圍較小的問題,輸入輸出、通用性、可行性、確定性和有窮性等是算法的基本特征。
算法存在的前提就是數(shù)據(jù)信息,而算法的本質(zhì)則是對數(shù)據(jù)信息的獲取、占有和處理,在此基礎(chǔ)上產(chǎn)生新的數(shù)據(jù)和信息。簡言之,算法是對數(shù)據(jù)信息或獲取的所有知識進(jìn)行改造和再生產(chǎn)。
由于算法的“技術(shù)邏輯”是結(jié)構(gòu)化了的事實和規(guī)則“推理”出確定可重復(fù)的新的事實和規(guī)則,以至于在很長一段時間里人們都認(rèn)為,這種脫胎于大數(shù)據(jù)技術(shù)的算法技術(shù)本身并無所謂好壞的問題,其在倫理判斷層面上是中性的。
然而,隨著人工智能的第三次勃興,產(chǎn)業(yè)化和社會化應(yīng)用創(chuàng)新不斷加快,數(shù)據(jù)量級增長,人們逐漸意識到算法所依賴的大數(shù)據(jù)并非中立。它們從真實社會中抽取,必然帶有社會固有的不平等、排斥性和歧視的痕跡。
此外,正是深度學(xué)習(xí)引領(lǐng)了第三次人工智能的浪潮,目前大部分表現(xiàn)優(yōu)異的應(yīng)用都用到了深度學(xué)習(xí),AlphaGo就是一個典型的例證。與傳統(tǒng)機(jī)器學(xué)習(xí)不同,深度學(xué)習(xí)并不遵循數(shù)據(jù)輸入、特征提取、特征選擇、邏輯推理、預(yù)測的過程,而是由計算機(jī)直接從事物原始特征出發(fā),自動學(xué)習(xí)和生成高級的認(rèn)知結(jié)果。
在人工智能深度學(xué)習(xí)輸入的數(shù)據(jù)和其輸出的答案之間,存在著人們無法洞悉的“隱層”,它被稱為“黑箱”。這里的“黑箱”并不只意味著不能觀察,還意味著即使計算機(jī)試圖向我們解釋,人們也無法理解。
事實上,早在1962年,美國的埃魯爾在其《技術(shù)社會》一書中就指出,人們傳統(tǒng)上認(rèn)為的技術(shù)由人所發(fā)明就必然能夠為人所控制的觀點是膚淺的、不切實際的。技術(shù)的發(fā)展通常會脫離人類的控制,即使是技術(shù)人員和科學(xué)家,也不能夠控制其所發(fā)明的技術(shù)。
進(jìn)入人工智能時代,算法的飛速發(fā)展和自我進(jìn)化已初步驗證了埃魯爾的預(yù)言,深度學(xué)習(xí)更是凸顯了“算法黑箱”現(xiàn)象帶來的某種技術(shù)屏障。以至于無論是程序錯誤,還是算法歧視,在人工智能的深度學(xué)習(xí)中,都變得難以識別。