愛伊米

網際網路集體智慧能比人工智慧更聰明?

如果計算機能理解我們在網上輸入的文字,並將其轉換成一種表達其真實含義的語言,會發生什麼?對來自社交媒體的資料進行分析可以洞悉我們的真實動機和感受此類深層次的問題,而不僅僅是資料統計。

法國哲學家Pierre Lévy從上世紀90年代開始致力於闡述網路空間,目前是渥太華大學的集體智慧加拿大研究主席,他正在研發一種能做到這點的軟體。他用一種他稱之為超語言的語言,為一整本法語詞典做了註釋,之所以稱其為超語言, 因為其形容的詞句本身就組成一種語言 ——資訊經濟元語言( the Information Economy MetaLanguage, IEML)。剩下的工作就是編碼將其變為一個自動系統。

網際網路集體智慧能比人工智慧更聰明?

IEML的原理是,將特定語言中的每個詞語用符號表示,這些符號的排列組合可以在代表幾個象限的含義: 虛空,虛擬,實際,實物,存在和符號( empty, virtual, actual, things, beings, and signs) 。識別並計算這些符號的演算法用IEML文字構建起一個語義網路,並計算出此段文字和其它文字的關係。編寫一種軟體將自然語言轉成這種程式碼,讓計算機透過這種程式碼互動,線上傳播的本質和我們分析它所能得到的結果會徹底改變。

從美國國家保密局到網路廣告主的每個人無疑會喜歡這種能力,因為它使得代理能夠自行搜尋網頁理解意義。但是在人工智慧方面,計算機之間能相互就真實意義進行交流會帶來哪些影響呢?

在第九屆研討會上Lévy介紹了IEML之後,我找到了他以期進一步感受這個理論從而找出答案。

您能稍微和我介紹一下網際網路集體智慧的意指麼?

好的。集體智慧根植於動物,眾所周知蜜蜂和螞蟻的集體智慧。社會性動物也有集體智慧。它們釋放訊號告知彼此危險和食物所在。但是在人類的例子中,我們的集體智慧更加強大,因為我們有語言,我們有技術,我們有複雜的社會機構。這是更高層次的集體智慧,從根本上說,這種智慧基於符號操作。

在人類歷史上,一旦出現增強我們運算子號能力的媒介,集體智慧也會得到增強。現在,我們處在操作演算法符號的階段,但是這一新時期才剛剛開始。我致力於利用這一新媒介來增進集體智慧。

關於集體智慧有很多誤解。首先是集體智慧是創造出來的,但並不是,集體智慧已經存在了。第二個應當避免的觀點是,集體智慧是群體思維。集體智慧和群體思維恰恰相反。在哲學意義上,集體智慧是多樣性和奇異性的整合,而不是Kurzweilian。這不是整齊劃一, 這是一起思考。

最後,最常見的錯誤是「哈,集體智慧?但是網上有這麼多蠢東西。」一個哲學家曾經對我說,你可以想象一下,「更像是集體愚昧!」那麼我要說,群體智慧不是愚蠢的反面,是人工智慧的反面。

有人說:「我們要讓計算機更聰明,」他們得到了所有的資助。但是如何使得人類更聰明呢?集體智慧就是一個讓人類在計算機的幫助下變得更聰明的研究專案,而不是讓計算機變得比人類更聰明。這是集體智慧真正的定義。

你已經注意到,一個問題有個長長的答案,所以好好選擇你的問題 。

有些人擔心有朝一日人工智慧會滅絕人類,對此您怎麼看?

我不同意。就因為許多名人這麼說,不意味著我們應該濫調重提。我強烈反對。計算機或者智慧軟體,或者人工智慧程式永遠不會掌權。絕不。如果沒有人維護它們,它們就會解體。從技術上講這不現實。

而且,用這種方式來拒絕承擔責任真是微妙。這些機器由人制造出來,這些軟體由人類程式設計設計。它們是我們意志、意圖的載體。它們沒有意志和意圖,它們只是延伸了我們的意圖、思想。它們沒有任何責任。

那如果人類知識被編碼入機器呢?

你應該學過哲學吧。

好的。所以柏拉圖的《斐得若》是非常重要的對話篇。他提出了和你一樣的內容,但是不是關於機器,而是寫作。他說:「什麼,你要把我們所知道的全部資訊放進圖書館?」因此,在圖書館裡,假設是亞歷山大圖書館,人類知識全部彙編於此,我們不再需要教授了。所有人都失業了。好怕怕!你要知道,18世紀巴黎有3000人專制運水。然後水管發明了,啊,他們丟了工作,好怕怕!

因此,不,我不覺得我們應當以如此消極的方式看待演算法。我自己,曾經並且依舊在研究人工智慧。我也設計過專家系統。我採訪一組專家,試圖理解他們的專業知識。然後,我以一種創造性的方式將他們的知識加以正式組織,形成層次規則,這樣演算法能夠理解呼叫。他們沒有因此而變得過時。恰恰相反,他們成為這一專家系統的主人。一旦他們在我的幫助下建立起這個系統,他們就自維持了。將他們的實踐知識透過這個組織加以傳播非常有益。

就像印刷或者寫作,它們有利於知識傳播。將知識轉化成軟體的形式是傳播知識的好方法。應當加以鼓勵而不是畏懼。

IEML如何讓人們藉助計算機這個工具變得更聰敏呢?

你有全球資訊網這個巨大的資料庫。它們在物理層面上共享一個地址系統,你可以透過伺服器的地址達到所有資訊,但是沒有通用的分類系統。圖書館之所有有價值是因為它的分類系統,否則你怎麼能找到正確的檔案呢?

我們有許多種不同的分類法,我們有本體論,我們有許多方法給語言分類,不同的自然語言內部分類又不一樣。實際上,當你不知道你在找什麼的時候,資訊蒐集變得相當苦難。當你知道你在找什麼的時候,谷歌很實用。但是當你試圖駕馭知識的時候,就變得有點困難了。

一個很好的解決辦法是求助維基百科,但它和19世紀大英百科全書的組織方式一樣,基於相同的劃分和分類。這些跨學科區分不是真實存在的,自然語言也是個問題。

我的想法是,採用一個通用的分類系統,得像自然語言一樣靈活,當你想描述一份檔案的時候,言無不盡。你不必遵守任何必須這樣或者那樣的規定。但是所有的描述都使用同一種語言,你也無需學習這種語言,因為你可以用自然語言和其交流。這種語言有一個奇妙的屬性,即它是一個演算法程式碼,每個短語都可以顯示其內部語義網路,而且它也會計算某一個文字和其他相關文字之間的語義關係。

如果你用這個系統(所有的資料按照語義關係加以組織)進行資料分類,資料管理,並且在網上描述你在做什麼,就會出現新思想。人們共同創造了這些思想,一起創造了思想組織的方式,透過他們的交流,思想的生態圈就此湧現。這就是關於自反的集體智慧我所宣揚的東西,集體智慧已經存在了,尤其是在網際網路上,但是我們真的不太清楚我們在共同做點什麼。

你熟悉這張著名的網際網路圖片,巨大網路上的連結像神經元,看看這些色彩。節點代表理位置,連結代表節點間的流量,但是你不知道其中的真正含義。我們將要實現的是實現一種地圖,,節點代表思想,而連結代表計算。這意義重大。

許多人混淆計算和數量。不是這樣的。計算在談數量,甚至數學也在談數量。如果我們能將這些結構關係數學化,我們就能計算語義關係。但是我們需要正確的程式碼。

我還有一個問題。你在建立組織資訊的學說,這看上去會從根本上改變網際網路上資訊的蒐集和編碼。這會使得操作這個系統的所有人在一樣層面上就網際網路上的資料獲得前所未有的洞察,你認為這裡存在政治考量嗎?

當然了。目前分析大資料的權力掌握在一些強大的實體手中,這些跨國公司,谷歌,Facebook……我不知道。國家安全域性(NSA),國家通訊總局(GCHQ)……

這些政府和大企業。他們是使用這些大資料演算法的主要人群,他們看上去掌握了很多,但其實沒那多深度見解。我知道這背後是什麼,主要是資料。資料可以為你提供資訊,但真沒有那麼多。

在政治層面上,我的想法是給人民賦權,這種想法和上世紀70年代矽谷的激進分子如出一轍,他們想給每人一臺電腦。他們做到了。現在每個人都有計算能力。每個人都應當有分析理解大資料的能力。這是主要觀點之一。

如何做到呢?有兩種主要工具。首先是語言自身,其次是實現語言的軟體,這個軟體必須是開放的免費的。這將在第三版GPL許可證下發布(著名的自由軟體許可證)。正如Richard Stallman告訴我的,IEML每步行動都是透明的。

不是每個人都能為IEML字典出力的,因為你需要專業知識——語言能力,數學能力等等,但是這一層面上的所有事情都將是透明的而不是隱藏的。新標籤的創立等等將向所有人開放。當然,按照定義,給資料賦予語義標籤的應用將是完全免費而開放的 。

我不知道此外我能做什麼。你不能強迫人們免費,但是你能為他們提供工具。我最多幫到這裡。