首頁 >> 新聞傳播學 >> 綜合研究
人工智能時代的數據意識形態 ——基于大數據對價值觀和行為活動影響的思考
2020年02月10日 10:27 來源:《新聞與傳播評論》2019年第1期 作者:鄭二利 王穎吉 字號

內容摘要:

關鍵詞:

作者簡介:

  摘 要:在人人都無法脫離數據的大數據時代,大數據的影響不容小覷,它挑戰了現代社會的既定秩序,也引發了新的社會問題。大數據給予未來世界無窮可能性,人們在歡呼大數據的美好前景時,也應該警惕新技術的威脅,理性看待大數據的影響。在大眾傳播領域,面對大數據技術,人是盲目和被動的,他的思想和行為會被誘導,會不經意間泄露自己的隱私,甚至侵犯他人的隱私。大數據技術把一切納入算法中,大數據并不是完備的,算法也并不總是客觀公正的,人們應該知道算法是否具有價值偏向、算法是誰的工具、它是為誰服務的。因此,人們需要了解大數據對人的價值觀和行為活動的影響,了解算法滲透的意識形態性,警惕被數據和算法控制。說到底,數據既是社會商品,又是裹挾政治、經濟、文化、資本等復雜權力關系的信息載體,它既關系到個體的虛擬身份認同,又關系到數據倫理的建構。

  關鍵詞:大數據;人工智能;數據意識形態;數據倫理

  作者單位:鄭二利,天津工業大學人文學院;王穎吉,北京師范大學新聞傳播學院

 

  大數據與人工智能革命的基石是數據,放眼當下世界,大到全球經濟走勢,小到個人網上社交行為,各類數據一同匯入龐大的數據浪潮之中,數據之大與數據傳播之快速都是前所未有的。大數據技術產生之后,人們推測未來是人工智能制造神話的時代,由于人工智能善于學習,能利用算法提取數據,形成有效分析模型,因此它能模仿人類,甚至替代、趕超人類。利用人工智能醫學診斷、自動駕駛、識別圖像和語音等,都有非常好的前景。有學者預言,到超人工智能階段時①,人工智能會完勝人類。但是,人們在受益的同時,也應對其心存警惕。人類應該警惕自己對新技術的盲區,就在媒體歡呼大數據的美好前景時,大眾在大數據面前往往顯得盲目和被動。在大眾傳播領域中,大眾的思想和行為常常被誘導,有時候不經意間泄露隱私,甚至侵犯他人隱私,大眾對此卻渾然不覺。因此我們應審視數據控制,并揭示其對人類觀念和行為產生的影響。

  其實,技術的歷次革命,都會挑戰傳統秩序,繼而影響人類的觀念和行為。工業革命推動了啟蒙理性,撼動了西方世界的神學秩序和王權秩序。大數據革命必然也會挑戰現代社會的既定秩序,引發新的社會問題,如人與機器的關系問題、數據倫理問題等。生物科學、計算科學的發展,未來仿生生命極有可能威脅人類世界,科幻電影、科幻文學都表述過這種擔憂,即在未來某個時間點,機器人侵犯人類世界,毀滅性災難來臨??傊?,科技給予未來世界無窮的可能性,同時也可能引發種種危險性。而當下,我們正生活在一個任何人都無法擺脫數據的大數據時代,我們在滿懷期待的同時也應心存警惕,理性看待大數據的影響。本研究著重分析在傳播領域中,大數據對人的價值觀和行為活動產生的影響,茲從以下幾個方面展開論述。

  一、大數據主義——一切納入算法中

  大數據即廣義的數據,它是一切可以用作數據資料的統稱,即可以被收集、測量、分析,能進行可視化處理的信息或知識,包含產生于自然和人類世界中的文字、圖片、音頻、視頻等,以及各種物質材料,甚至宇宙粒子。人類使用數據的歷史非常悠久,“已故的圖靈獎得主吉姆·格雷在其《事務處理》一書中提到:6000年前,蘇美爾人就使用了數據記錄的方法,已知最早的數據是寫在土塊上的,上面記錄著皇家稅收、土地、谷物、牲畜、奴隸和黃金等情況?!盵1] 傳統數據是手工記錄、整理的數據,主要服務于數字記錄與統計。大數據是智能計算機運算、分析的數據。大數據一方面指數據生產規模擴大、種類多樣化,海量數據自動生產;另一方面指人工智能可以學習和分析大數據,代替人進行預判。

  如果說傳統數據的主要職能是數字記錄與統計,那么大數據的職能并不局限于此。大數據催生了人類對生命和世界的一種全新認識,即認為所有的生物都是算法生物,人和其他動物都是如此,也就是說,算法支配人和動物做出吃飯、睡覺、交友等行為。此外,當一切都是數據,甚至某些事物被概念化為數據時,那么一切都可以納入算法的框架,而基于大數據的算法能描述包括自然、人類世界在內的一切。這樣看來過去的金融、經濟、政治等話題,其實都可以看成是基于數據管理和分析的算法問題。如以色列學者尤瓦爾·赫拉利談到:“一般人看來,經濟就是有農民種小麥,有工人做衣服,有顧客買面包和衣服。但在經濟學家眼中,經濟機制就是收集關于欲望和能力的數據,再轉化為決策”[2] 。在政治領域中,“自由市場資本主義和蘇聯式國家控制共產主義也不是意識形態、倫理教條或政治制度上的競爭,而根本是不同數據處理系統間的競爭。資本主義采取分散式處理,而蘇聯式共產主義則是集中式處理?!盵2]

  可見,大數據建構了數據化世界理念,一切需通過數據呈現,大數據能呈現一切。同時,人類的自主判斷會減少,而更依附于算法的分析和預判。比如在總統選舉中,媒體利用大數據分析和描述總統和選民屬性,預測選舉結果;在體育賽事中,利用大數據分析球隊的進球指數,預判冠軍球隊……在過去的旅行中,旅途充滿了不確定性,人們需要按照地圖提前規劃行程,并留心公路上的指示牌,隨時規劃路線,防止走錯路。有了數字地圖,這一切都迎刃而解了。數字地圖利用大數據解決了所有問題,它實時采集、分析用戶數據,并上傳共享,它能分分鐘為用戶規劃行程。用戶不必再擔心旅途的不確定性了,因為數字地圖提供的服務更及時,它比用戶自己規劃得更精準。正因為大數據能消除不確定性,所以數據科學大行其道,它沖擊了傳統的政治、經濟、文化等制度,并迫使其轉型。數據經濟已成為全球經濟的重要組成部分,同時也成為傳統行業轉型的生長點,馬云稱其為“鼠標與水泥的結合”。文化領域同樣受到數據科學的沖擊,更傾向于依靠數據決策,如有的社交媒體利用大數據寫稿。早在2015年9月10日,騰訊研發的機器人Dreamwriter寫了首篇談CPI增長的新聞稿,稿件內容是根據算法自動生成的。Dreamwriter能根據指令在0.5秒內生成圖文并茂的新聞稿,這是新聞記者辦不到的。

  在算法為王的時代,一切被納入算法中,算法是否具有價值偏向、算法能否得出客觀公正的結論、大數據是否一定是完備的數據等,這些都會左右算法的結果,進而影響人的觀念和行為。算法是基于系統方法描述解決問題的指令,普通人幾乎完全不了解算法的原理,而這恰恰就是盲區。今日頭條的智能總工程師曾說,算法加加減減就能改變情緒,能把快樂的情緒通過算法加減變成悲傷的情緒。頭條算法工程師的說法揭示了算法會被人為干預的事實,看來它并不總是客觀、公正的?;蛟S正因此,2018年初今日頭條宣布公開算法,今日頭條的做法是為了樹立客觀公正的市場形象,告訴大眾他們不會干預算法,今日頭條的算法沒有價值偏向。不過,讓算法公開透明并不能保障客觀、公正,因為數據體量大并不意味著數據是完備的。如果數據有問題,那么分析的結果也是有問題的,這也是需要警惕的。正如一位美國學者所說:“大數據不僅意味著有更多好的分析,也意味著有更多壞的分析。要知道,即便是專家大牛也有掉鏈子的時候。如果一些不好的數據被心懷叵測的可疑人員添油加醋地利用,事情會變得更糟糕;不過,即便是動機純潔的分析人員稍有不慎也會上當受騙。在這個充滿數據的世界中,消費者得有一幅火眼金睛才行啊!”[3] 顯然,大數據是非常復雜的,我們不能低估它的復雜性,尤其應該關注它是為誰服務的,它是誰的工具。在數據分析過程中,不僅僅數據在起作用,支撐數據的理論、定義數據的方式,都參與了數據管理與計算,都能干預算法。如果定義方式發生變化、數據理論發生變化,那么數據分析結果也會出現變化,這也應了頭條工程師那句話,在算法加加減減之間,主導情緒變化。如搜索引擎中的頭條、資訊平臺中的頭條,都有很強的導向性,百度就曾陷入為“莆田系”醫院打廣告的丑聞中。

  當然,對每天裹挾著我們的各種社交媒體、資訊平臺來說,大數據技術是其最得力的助手,在他們那里,龐大的客戶數據就是資本,資本可以衍生權力和利益。對于普通大眾來說,減少依附性,并對這一切保持理性變得非常重要。

  二、數據管理與控制:隱形的權力爭奪

  在移動互聯網普及的大背景下,數據量呈指數級增長,現實就是海量數據的堆積。顯然,大數據的意義不只是體量大,關鍵還在于它的價值,即信息量大。香農在20世紀建構了信息論,用信息熵度量信息量的大小,解決了信息量無法測量的問題?!跋戕r指出,信息量與不確定性有關系:假如我們需要搞清楚一件非常不確定的事,或是我們一無所知的事情,就需要了解大量的信息。信息的度量就等于不確定性的多少,這樣香農就把熵和信息量聯系起來了?!盵4] 信息熵代表不確定性,信息熵越大,不確定性越大,減少不確定性需要引入的信息量越大。

  信息熵可以用來定義大數據時代的世界觀[4] 。依據量子力學的觀點,世界是測不準的,充滿了不確定性。要降低世界的不確定性、減少信息熵,還需要引入更多的信息。大數據信息量大,更有利于消除不確定性。阿爾法狗打敗了棋王李世石,就是因為它存儲了足夠多的圍棋對弈數據,包括李世石下棋的數據,阿爾法狗有效利用大數據減少了棋局中的不確定性。引入更多信息消除不確定性,我們既需留意算法揭示的數據規律,也需警惕算法滲透的意識形態觀念。因為算法是理論與數據的結合,它隱含著設計者的意圖,設計者的意圖支配計算的結果,這就導致結果出現價值偏向。就拿我們常見的搜索引擎來說,它們常常把商業廣告放在首頁中最醒目的位置,這種搜索結果明顯是人為干預過的,也就是說,搜索引擎的算法體現了設計者的意圖,即效益至上。

  事實上,在大眾傳播領域中,數據信息并不能完全自由流通,也就是說數據信息雖然量大,但是并不完備。政治、經濟等權力體系常常干涉數據信息流通,并試圖占有、制造或阻礙信息。影視傳媒公司操控數據的丑聞值得關注,有些制片方為了牟取票房暴利,在影片上映前刷票、鎖場,通過偽造售票數據營造搶票信息,進而誤導觀眾。制片方為了利益,不惜違規制造虛假數據,因為對他們來說,數據就是資本,控制數據就能控制觀眾。這里,數據控制的落差提出了全新的挑戰,正如美國學者丹·席勒說:“大數據一方面,它會賦予那些靠信息獲利的壟斷資本更大的權力;另一方面,其他人卻在毫不知情的情況下被剝奪掉一部分權力。這會造成更大的權力落差,預計將來會成為一個政治問題?!盵5]

  當大數據關系到資本、權力時,數據爭奪就變得更激烈了。也就是說,權力和財富的爭奪有時表現為爭奪和控制數據。對普通大眾來說,更應該警惕被大數據隱含的資本和權力所操控。尼爾·波茲曼曾在《技術壟斷》中談到,“我們強大的意識形態工具就是我們的語言”[6] ,因為人常常被深鎖在自己語言的邊界里,理解其對世界和人的描述。而渾然不覺那些邊界外的人有著怎樣的世界。同理,大數據時代,人們常常被深鎖在數據結構中,依據數據思維、判斷、抉擇,甚至算法完全代替人做出選擇,而人們對其中隱含的權力關系卻渾然不覺。簡言之,數據信息并不是客觀、中立的,它有主動施為性,能導向人的價值判斷和行為選擇。

  數據本身是中性的,而且龐大的數據堆積是沒有意義的。為了實現數據的價值,必須把數據關聯起來,并使其成為一種結構化的存在。在龐大的數據洪流中,有被關聯的數據,也有不發生關聯閑置的數據。管理和使用大數據需要數據挖掘技術,數據挖掘就是在一定范圍內設定關鍵詞,通過語法、詞法、修辭分析,建立模型,處理數據?!霸诠雀?,至少有四成的工程師天天在處理數據。由于大數據的原始數據常常是沒有固定格式、顯得雜亂無章的,因此使用大數據的第一步是對數據的過濾和整理,去除與要解決的問題無關的維度,將與問題有關的數據內容進行格式化的整理,以便進一步使用?!盵4] 不管是傳媒業還是互聯網、金融等行業,這些技術都已是標配。因為數據挖掘技術能幫助其從數據大雜燴中建立模型,分析數據,做出更有效的決策。顯然,“這種借助數據進行決策活動的潛在機會不斷涌現,其影響力涉及企業以及整個經濟體的方方面面。正因此美國經濟學家埃里克·布萊恩約弗森認為大數據將引發‘管理革命’?!盵7]

  大眾傳媒領域的“管理革命”主要是針對用戶的,用戶被概念化為數據信息,這些數據信息被篩選、結構化處理后,用來預測用戶可能帶來多少利潤,并方便管理者調整相應政策。針對用戶的數據管理和分析,受市場意識形態支配,數據管理者考慮的是利潤而非用戶的利益。當用戶信息被概念化為數據,用戶被抽象化了,他的情緒、情感、尊嚴等這些無法數據化的指標多被忽略了。如果大眾過多依附于大數據做出的決策,那么他們已經在不經意間被控制其中了。

  最典型的現象是大眾傳媒中的數據推送和供給。圍繞在人們周圍的資訊平臺、社交媒體常常會“主動”把信息推送給用戶??此七@些數據的推送是依據算法為用戶“量身定制”,但實際上主導這一切的是算法設計者的意圖。當然,算法設計者的意圖是非常復雜的,除了追求利潤之外,還與意識形態和文化環境密切相關。社會的政治、文化、道德等因素也會介入其中,這些都間接影響數據推送,政經新聞推送便是如此。

  數據屏蔽、數據過濾決定有些數據被關聯起來成為有用的信息,有些數據被閑置或屏蔽成為“噪音”,信息屏蔽既是設立一種屏障,也是在設定價值導向。區分哪些數據是“噪音”,哪些數據是有用的信息,需要明確的判斷標準。這里設立的判斷標準往往出于某種利益訴求,而非信息本身的質量和價值。資訊平臺的數據推送,通常依據用戶過往瀏覽記錄篩選信息,對于吃貨,那就給他美食類信息;對于購物狂,那就給他購物信息。顯然,這種數據信息過濾只為更大概率占據用戶視線,并不是出于為用戶負責,而篩選的高質量信息。約翰·博斯利說過:“數據不僅僅是數字,它本質上源于人類的交互和社會協商,是一種社會商品?!盵8] 約翰·博斯利只說了數據的一個維度,顯然,數據既是社會商品,它還是裹挾著政治、文化等復雜社會權力關系的信息載體。在很多國家的總統選舉中,在國際上的民族性事件中,在引起全球關注的各種政治丑聞中,都能見出這樣的事實,即誰控制了數據信息,那他就控制了話語權。

  總之,基于用戶的數據分析剔除了多余的數據,保留有效的數據,在這個過程中,不是所有數據都被平等對待。那些指向性明確的數據信息,關乎用戶既往經驗的、符合用戶喜好的信息,還有推送者有意推送的信息是有效的。顯然,指向性明確的數據信息意在把用戶控制在數據結構中,看似開放的虛擬社會被其設置了種種屏障和壁壘。越來越多的資訊、短視頻“主動占據”用戶的中心視點,試圖引導和控制用戶,這里既有國家意識形態的動因,也有資本逐利的動因,百度公司就多次被公眾質疑為商戶推廣廣告。畢竟,我們處在人人都無法擺脫數據的大數據時代,那些“主動占據”我們中心視點的信息,更可能被我們關注。反過來說,當數據成為資本,點擊率意味著效益,針對用戶的計算越來越精準,這也意味著用戶可能被結構化、被固化,在某種程度上個性被消弭。

  三、大數據鏡像中的個體——身份分離

  在人人都無法擺脫數據的大數據時代,人被概念化為數據,人的身份屬性用數據描述。利用算法分析人的身份屬性,是基于算法把人的身份數據進行結構化處理,這樣做的原因是平臺試圖精準定義用戶。值得注意的是,算法并不能分析人的所有特性,也就是說,只有那些能納入算法框架下的部分才能被描述,其他內容無法描述。一般來說,性別、年齡這些確定性的信息能用數據描述,除此之外,算法會著重分析行為偏好、個人趣味、甚至深層欲望等。但是,這些數據并不是完備的,因此人的虛擬身份與真實身份之間是分離的。這就需要我們思考數據鏡像中人的身份問題,以及虛擬自我與他者之間的關系。鏡像是拉康提出的范疇,他用鏡像描述嬰兒自我認同的過程,嬰兒通過“鏡中之像”區分自我與他者,并形成對自我形象的認知。在鏡像階段,嬰兒的自我形象映射在對他者的幻想上,通過鏡像中他者的形象體驗自己。但是,嬰兒將自己映射到外部形象中,又會導致自我的疏離,這就是作為主體的自我與他者爭奪的過程。數據鏡像類似于拉康所說的鏡像,不過二者性質不同。數據鏡像是虛擬鏡像,是網絡空間中那些標識用戶身份的大數據形成的虛擬鏡像。在網絡空間中,幾乎每個用戶都有在社交平臺、購物平臺、支付平臺等通用的身份。虛擬身份是由數據信息建構的,是用戶在互聯網上注冊、瀏覽、購物、社交等產生的數據。標識用戶身份的數據是元數據,元數據用來標識用戶年齡、性別、社會地位、財富指數、文化指數、行為偏好、位置關系、個人趣味等信息。所謂元數據是關于數據的數據,是對事物進行命名、分類、結構化處理,用來管理數據的數據。美國學者克里斯汀L·伯格曼說:“元數據是一種事物命名、數據表示和關系表示的手段……元數據是對信息資源進行描述、解釋和定位等操作的結構化信息,其通過前述操作使信息資源更易檢索、使用或管理”。[1] 元數據是管理數據的數據,用元數據描述用戶身份屬性,能把用戶群結構化,并且精準化定位具體用戶。這種操作終究是服務于平臺檢索、使用和管理用戶,算法設計者通過算法引導、控制用戶,而用戶對這一切并不知情,用戶常常不自覺地被平臺推送的信息誘導就印證了這一點??梢?,不管有意還是無意,用戶似乎已經認同了數據鏡像中的身份,最典型的表現是用戶越來越依附于平臺的定制和推送。在用戶的身份數據中,算法側重分析用戶的個人趣味、行為偏好等信息,這些信息與用戶的消費偏好關系密切。這與人的社會身份屬性不同,人的社會身份關乎階層、職業等與社會秩序相關的信息。相反,描述虛擬身份側重關聯人的消費偏好,而與其社會身份關系不大。說到底數據鏡像強化了用戶的消費偏好,而用戶又受其誘導,常常會依此進行判斷和選擇。這一切導致人處于“信息繭房”中,難以主動進行理性分析,打破數據鏡像。如電商用大數據“殺熟”,之所以有的電商能用大數據“殺熟”,就是因為算法把用戶結構化為新老用戶兩類,并對新老用戶實行不同的價格策略,吸引新用戶采取的優惠政策會屏蔽老用戶,這就出現同一商品老用戶購買價格高,新用戶購買價格低的情況。有意思的是,當老用戶把既往信息全部清除之后,他的老用戶身份就解除了,“數據鏡像”被打破,他的虛擬身份又會被重新定義??梢?,用戶虛擬身份并不是同質的、穩定的,因為用戶在資訊平臺、購物平臺、社交平臺中所處的“結構”并不是一成不變的。

  平臺依據大數據精準把控用戶,用戶的數據量越大、數據越完備,運算誤差越小。這里值得注意的是用戶的數據信息并不會被平等對待,有些數據是活的數據,關聯度高,有些數據關聯度低,是被閑置的數據。關聯度較高的數據,產生于社交平臺、購物平臺、支付平臺、數字地圖平臺等,這些數據信息是“互信息”,能綜合分析用戶的消費和社交等情況,相反,其他與消費無關的個性化的信息并不被關注。

  綜上可見,虛擬身份與社會身份是分離的,社會身份是依據既往社會規則描述和確立的,與性別、年齡、職業、階層、教育經歷等這些因素相關,社會身份具有穩定性。平臺并不在乎用戶的真實社會身份,它更關注用戶在虛擬空間的表現,特別是用戶在虛擬空間中消費什么,關注什么,以及他的嗜好和偏好等。如有些平臺的短視頻推送,顯然是利用算法分析了用戶的偏好。因為其推送的短視頻內容都是關聯的,而且多與用戶過去關注過的內容相關,也就是說,用戶喜歡哪類短視頻,平臺就會推送大量同類視頻給用戶。當然,算法不僅計算內容,還計算視頻時長、關聯度等,多數兩分鐘左右的短視頻以形式取勝,內容并無深度,形式卻足夠刺激視聽感官。那些經過算法分析、篩選過的短視頻能有效刺激用戶神經系統分泌多巴胺,控制用戶不停點擊,迫使其“上癮”。反過來說,如果用戶長期接受這些被推送的內容,他就會處于信息繭房中,會被“固化”。說到底,所有這一切都浸淫了消費社會的“毒”性。法國學者鮑德里亞認為,在消費社會中,消費不再是消極的消耗,而成為具有主導意義的模式,消費者也被消費社會依據消費占據的符號意義而重新定義。據鮑德里亞分析,在消費社會中,依據消費者占據商品的符號意義,消費者被歸屬于不同的階層中。消費文化收編了啟蒙運動以來個人幸福的含義,并使得幸??梢詼y量,換句話說在消費社會中,幸福的指數由購買力測得,所以鮑德里亞感慨,幸福有毒! 而今,大數據技術被消費文化收編,消費者也被測量!

  此外,數據鏡像中的虛擬身份與人的真實自我也是分離的,因為數據鏡像中的虛擬身份缺乏“總體性”和穩定性。大數據沒有能力描述一個復雜的人,用戶的身份數據信息都是不完備的。也就是說大數據只能計算納入算法的數據信息,不能納入算法的信息,大數據無能為力。人性是非常復雜的,人的情感、情緒、幻想、想象、聯想、無意識等,這些非邏輯、非理性的部分無法用數據描述,不能納入算法的框架中。算法是邏輯性的、理性的,不能納入算法框架的信息就不能計算和管理。說到底,計算得清楚的東西未必重要,重要的東西未必計算得清楚。也就是說,人性中無法用數據描述的部分可能是最重要的,但卻只能被放棄。而這些部分構成了真實的自我,也是自我區隔于他者的核心所在。如果人不能警惕虛擬身份與真實自我是分離的,那么后果是很嚴重的。一方面,大數據規避了人性難測的一面,把復雜的人性抽象化為可以測量的指數,這浸染了消費文化的“毒性”;另一方面,年齡、性別、社會地位、財富指數、文化指數、行為偏好、位置關系、個人趣味等數據信息建構了用戶的虛擬身份,但是用戶卻沒有控制身份數據信息的權力。這些標識虛擬身份的數據很容易被別人控制和篡改,這無疑加劇了虛擬身份的不確定性,由此甚至引發倫理危機。最嚴重的莫過于用戶數據泄露導致隱私泄露。對公眾人物來說,身份失控后果更嚴重,尤其是公眾人物一旦牽涉丑聞,他們的虛擬身份會完全失控,他者似乎擁有了書寫、篡改、編造其身份數據的權利,而這一切卻無需經過當事人知情或同意。大數據時代,公眾人物更需小心翼翼維護自己的虛擬身份,維護其在大眾心目中的“人設”,生怕其失控崩塌,畢竟,作為他者,大眾對公眾人物的認同也是通過數據鏡像形成的。一切都是不穩定的,這似乎正應了馬克·扎克伯格的說法,具有多于一重身份的身份是一種“缺乏總體性”的表現。

  四、大數據的倫理悖論——他者的數據,我的隱私

  今天,人們在互聯網上幾乎無處遁形,讓人細思極恐的是我們的信息都在網上,而我們自己卻無法保護自己的信息,因為我們幾乎不知道這些信息的使用權和控制權在誰的手上?;叵肫饋?,最初的互聯網是結構松散的虛擬世界,是一個沒有人知道我是誰的空間,因為那時的用戶無須認證,都是匿名上網,而且用戶的虛擬身份與社會身份幾乎沒有關聯。今天,不知道我是誰的時代已經終結了,大數據讓我們在互聯網上幾乎無處遁形,同時,大數據時代常常發生個人數據信息被泄露,個人隱私被侵犯的情形。大數據引發的倫理危機頻現,大數據時代,保護個人隱私、維護由于隱私泄露導致的名譽、權益受損,已成為重要的倫理難題。這里似乎存在悖論,一方面大數據時代需要個人生產和分享數據,提高數據運算的有效性;另一方面人需要保護自己的隱私,隱私數據不能共享。這看似形成了個人權益與公共利益之間難以彌合的鴻溝,實質隱含著數據資本爭奪引起的倫理沖突和危機。

  大數據時代,數據就是資本,擁有數據就擁有了資本。數據如此重要,以致有人用未來的石油比喻大數據。用戶在社交媒體、網絡平臺、購物平臺、數字地圖等留下的注冊、購物、瀏覽等信息都是數據,企業需要用這些數據計算用戶,實現精準營銷并獲取效益?,F在的高科技公司基本都是數據公司,蘋果公司認為公司的未來就是發展人工智能,阿里的創始人馬云也多次表示未來必然是大數據為基礎的人工智能的世界。前谷歌研究院院長諾威格博士曾經談到他在2001年加入谷歌,那時正是互聯網泡沫破碎后,大家紛紛逃離互聯網行業的時候,諾維格逆勢加盟谷歌,因為他看中了“全世界的數據都在谷歌”[4] 。諾維格一語中的,揭示了大數據的價值所在。大數據需要大體量數據做基礎,數據體量越大,運算誤差越小,運算效率越高。當數據能生產價值,制造數據、販賣數據、控制數據、數據交易之類的暗箱操作就會頻繁發生,這就導致用戶數據信息被交易,用戶隱私被泄露。Facebook因為數據泄露遭遇重大信任危機,而且面臨巨額罰款。就在Facebook 數據泄露危機還沒有解除的時候,百度總裁李彥宏卻說:“我想中國人可以更加開放,對隱私問題沒那么敏感。如果他們愿意用隱私交換便捷性,很多情況下他們是愿意的,那我們就可以用數據做一些事情?!雹倮顝┖甑恼f辭引起了網民的吐槽和聲討。不過,從李彥宏的說法中,能看出百度公司的價值取向和對用戶隱私不負責任的態度。支付寶也曾被質疑通過年度賬單默認勾選、套取用戶數據,其他各種社交平臺、資訊平臺套取用戶數據、竊聽用戶信息以及泄露用戶信息的行為也屢屢發生……李彥宏所說的情況現實中確實存在,部分用戶為了享受價格優惠、獲取資訊……會輕易把標識自己身份的數據信息留給商戶,但是大多數用戶其實并不知道自己的這些信息將被誰利用。當然也不乏這樣的情況,有的醫院、銷售中心、中介公司、快遞公司售賣并泄露用戶的數據。獵豹移動安全專家李鐵軍在接受《中國經營報》采訪時說:“你可以默認自己的信息已經被泄露,包括身份證、銀行卡、手機號、郵箱等信息?!泵绹鴮W者丹·席勒也說:“當自己啟動洗衣機、打開電冰箱,沖澡或上床休息,都會留下信息。我們需要對此進行公開討論,共同探討決定我們的哪些信息可以被收集、被誰收集、作為何用,只有當這些問題弄清楚之后,才能解決大數據的問題?!盵5] 大數據時代,個人隱私權正面臨嚴峻的挑戰,保護個人的隱私不被侵犯,需要個人提高警惕,防止數據信息被竊取,同時,也需要數據公司規范數據的使用權和控制權。當然,這種情況不是提高倫理意識可以完全解決的,還需要相應法律監管。

  此外,網絡暴力事件頻發,也迫切呼喚數據倫理建構。普通大眾也應提高數據倫理意識,確保自我能尊重他者的隱私。建構數據倫理,需要明確隱私數據的范圍,知道哪些信息屬于個人隱私,不能隨意侵犯。此外,還需確保每個人的隱私數據都能享有平等地位,也就是說“數據隱私面前人人平等”。不過,在今天的網絡世界中,似乎存在著一種吊詭的邏輯:他者的數據,我的隱私,而且歷次網絡暴力事件,都存在這樣的倫理悖論。江歌事件、楊美芹事件等都是如此,網友們憤怒的“人肉”搜索,把當事人,甚至當事人的家人曝光在公眾視線中。當事人不僅沒有隱私權,而且還會遭受公眾的輿論圍剿,公眾占據倫理的制高點對其進行倫理審判。更有甚者會找到當事人,并對其圍追堵截,冒犯、騷擾當事人,讓其無法工作和正常生活。在這樣的事件中,網絡審判的喧囂掩蓋了審判者對當事人的隱私倫理侵犯,也就是說,公眾以反倫理的方式對他者進行倫理審判。在這類網絡暴力事件中,公眾顯然置身于“他者的數據,我的隱私”這樣的倫理悖論中?;蛟S正因為公眾沒有隱私平等的意識,才會不自覺地侵犯他人的隱私,導致置身于網絡暴力旋渦中的他者被剝奪了隱私權。而那些參與倫理審判的公眾,集體作為“正義”的化身,共同參與了對他者的“窺視”和侵犯。

  李彥宏說中國大多數用戶愿意用隱私交換便利,這代表了商家對用戶隱私的態度。在商家眼里,數據就是資本,它可以作為交易的對象,商家用“便利”換取用戶的數據,用戶把隱私“賣給”商家,只要二者達成“共識”,似乎不應該被譴責。其實,這里商家與用戶的信息占位是不對等的。在用戶看來,那些換取“便利”的零散信息,如年齡、性別、電話號碼等,不能完整描述自己的身份,因此威脅較小,相對安全。但是,那些看似零散的數據信息,一旦相互關聯起來,成為互信息,它的信息量就變大了。也就是說,個人在社交平臺、購物平臺、資訊平臺、數字地圖等留下的零散數據,一旦共享,信息互聯,就能標識用戶的私密身份了。算法的確有能力呈現這一切,小小購物車就能暴露用戶最私密的那一面。從購物車信息中,能計算出消費者在飲食男女方面的偏好以及其經濟狀況、健康狀況等。在商家眼里,能產生效益的都是商品,即便隱私數據也可以拿來交換,所以商人會回避數據倫理問題,而把一切定義為商品交易。顯然,數據作為商品被“去倫理化”,是基于資本逐利的需求,事實上,隱私數據不能“去倫理化”。那些陷入泄露用戶隱私丑聞的企業,很難再被用戶信任,一次數據倫理危機可能給其帶來滅頂之災。當然,數據隱私泄露直接的受害者是用戶,大數據時代,人人都無法擺脫數據,這關系到每個人的隱私安全,需要每個人理性對待。

  參考文獻

  [1]克里斯汀L·伯格曼著. 大數據、小數據、無數據:網絡世界的數據學術. 孟小峰,張祎,趙爾平譯. 北京:機械工業出版社,2017:5;53.

  [2]尤瓦爾·赫拉利. 未來簡史:從智人到智神. 林俊宏譯. 北京:中信出版集團,2017:334.

  [3]馮啟思. 對“偽大數據”說不:走向大數據分析與解讀的誤區. 曲玉斌譯. 北京:中國人民大學出版社,2015:5.

  [4]吳軍. 智能時代:大數據與智能革命重新定義未來. 北京:中信出版集團,2016:117;115;247;136.

  [5]王建峰:告別信息崇拜解構數字資本主義:訪美國伊利諾伊大學厄巴納—香檳分校教授丹·席勒. 中國社會科學報,2017-01-27.

  [6]尼爾·波斯曼. 技術壟斷:文化向技術投降. 何道寬譯. 北京:北京大學出版社,2007:72.

  [7]史蒂夫·洛爾. 大數據主義. 胡小銳,朱勝超譯. 北京:中信出版集團,2015:103.

  [8]Hunter Whitney. 洞悉數據:用可視化方法發掘數據真義. 劉云濤譯. 北京:人民郵電出版社,2016:21.

 

作者簡介

姓名:鄭二利 王穎吉 工作單位:

轉載請注明來源:中國社會科學網 (責編:張賽)
W020180116412817190956.jpg
用戶昵稱:  (您填寫的昵稱將出現在評論列表中)  匿名
 驗證碼 
所有評論僅代表網友意見
最新發表的評論0條,總共0 查看全部評論

回到頻道首頁
QQ圖片20180105134100.jpg
jrtt.jpg
wxgzh.jpg
777.jpg
內文頁廣告3(手機版).jpg
中國社會科學院概況|中國社會科學雜志社簡介|關于我們|法律顧問|廣告服務|網站聲明|聯系我們
欢乐斗地主免费下载