- 作者:大衛.溫柏格 (David Weinberger)
- 出版社:天下文化
- 出版日期:2008年04月30日
- 我的推薦指數:★★★★☆
「發現」你想要的東西,其重要性不下於「找到」你知道你想要的東西
※ ※ ※ ※ ※ ※ ※ ※ ※ ※ ※ ※
資料有了新的排列秩序
在資料整理的世界中,可區分為三類型式:
樣式 | 名稱 | 說明 | 備註 |
實體 | 第一類 | 排列物品本身 | 將書籍歸到書架 |
實體 | 第二類 | 利用(紙本卡片)目錄的分類(如字母順序),將資訊與物件本身分離。 | 一般來說,它無法記錄所有資訊;所以如果你想找出所有臺灣的資料,那你可能要從第一張目錄找起,而且還得看運氣才能全部找出來。這類秩序資訊也被稱為Metadata (電腦語:詮釋資料)。 |
數位 | 第三類 | 由位元組成的虛擬國度 | 內容經數位化成位元,內容的資訊也由位元所組成。因此可不受實體的限制。 |
我們可以這樣想,當我們電腦裡放了數萬張數位相片後,如果沒有歸檔整理,那麼「DSC1234.jpg」的全家福照片,其實和丟掉它沒倆樣,因為你再也找不到它了。所以如果電腦能自動分辨照片上的人和物,自動加上標籤。或是由人去標示。
像Corbis數位照片公司,將每張數位照片標上10到30項標籤。這些標籤屬於約有6萬多項中的「偏好條目」,其中又有3萬多筆為同義詞;如查『海灘』則『海邊』也會列入查詢。另外還有50萬筆人名、電影名、藝術品、地名等可用字。像利比亞強人格達費就有17種拼法可讓你找出來。而當我們需要哪張照片時,相片陳列就能自動迎合所有人的需求。例:按分類、按地點、按主題、按人物、按…
這就是「位元新秩序」。
※ ※ ※ ※ ※ ※ ※ ※ ※ ※ ※ ※
亞理斯多德說:「想要了解宇宙的人,就要放膽的合併與分隔知識」
物有其類是真理,但問題在如何分類?
分類如此繁雜如何整理分類,可靠古老的亞理斯多德式樹狀圖,其重點如下:
(1) 樹狀系統類,各物皆有其位
(2) 任何類別不能太大或太小
(3) 類別的定義要清處
只是,現在資訊數位化,超越了實體限制,改變了單純的樹狀結構知識模型。
新的分面式分類系統(Faceted classification system)概念,延伸與改變樹狀圖的基本概念,可以動態建構用於可瀏覽、可層層衍生的樹狀結構圖,可隨你思維方式的不同而排列出不同的樹狀結構。簡單的說,就是物有其類但不應僅被規成唯一一類。
在分面分類法中,一片葉子可以同時棲身於多個樹枝;甚至位置依對事物的看法而異。讓我們可以用更多的角度理解世界。我們可以創造自己喜歡的分類,創造最適合我們的思考方式的分類。專家也還是有些用處,只是在這個亂序的時代,專家和他們所屬的機構不再能主宰我們的想法。不像過去由於整理資料的實體限制,不但會限制我們的眼光,也會讓資訊編排者的權力高於資訊創造者;因為他們可以決定發布或剔除哪些資訊。(小編:像中國歷朝都會編修前朝歷史,或像清朝搞個四庫全書刪除不當言論)。
而更進一步的做法,則是接收並解放分類法,它不在強制分類,而是運用標籤(Tag)。讓資源的使用者為網頁、照片等標出名稱。而 Delicious.com 正是其中的領先運用者。創辦者提到這是「網站記憶的擴充系統」,讓你列出想日後再造訪的網站。標籤的概念不像分類,分類像是要將文件放入一個檔案匣,而標籤就像在文件上貼上很多記下重點的便利貼。使標籤成為個人記憶、搜尋網頁的方法。另外,經由公開個人清單,不僅能找到自己標為「舊金山」的網頁,也能看到別人標的,間接擴大自己的查詢範圍。這些被一群分別貼讓同一個標籤的網頁清單就被稱為「Tag stream」。你還可以在網站上訂閱「Tag feed」,如此一來你感興趣的標籤有新的網頁清單時,就會主動通知你。
Flickr.com這個熱門照片網站。則進一步經由電腦分析標籤(通常一張照片可能不只一個標籤),可正確的分別出相同標籤的不同類照片,例如Capri 這個標籤同時指出是個島,也有人標識為福特的轎跑車。其它進階的技巧包括圖像分析辨識,或是讓倆個人同時標識一張照片,直到出現同一個詞彙。
而為了讓自訂標籤這件事,有可依循與管理的可能。可以引進分面分類法的概念,為各種面向預先建構同義字庫。這樣一來可以利用控制詞彙(Controlled vocabulary) 可以使下標籤時不致採取自由心證。反而阻礙了資料分享與交流。
而巧妙的結合分面分類法、標籤概念的則當推Amazon.com。亞馬遜書店並不重視分類系統的精確和秩序,而是重視抓緊你的注意力,並將你所需要的資訊和商品呈現你眼前。在亞馬遜同一本書不見得只有一組分類,
以本書為例被分在下列:
Books > Business & Investing > Industries & Professions > E-commerce
Books > Business & Investing > Marketing & Sales > Consumer Behavior
Books > Computers & Internet > Business & Culture > Culture
Books > Computers & Internet > Computer Science
Books > Health, Mind & Body > Psychology & Counseling
Books > Nonfiction > Social Sciences
Books > Science > Behavioral Sciences
Books > Science > Technology
以 『The Little House Cookbook』為例被分在下列:
Books > Children's Books > History & Historical Fiction > United States > 1800s
Books > Children's Books > Sports & Activities > Cooking
Books > Cooking, Food & Wine > Regional & International > U.S. Regional
然而亞馬遜最利害的地方不在多分類,而是充份運用你的「計畫的偶然」。你可能本來想買某本書,最後又多買了其它書。這是亞馬遜利用協同篩選技術(collaborative filtering),經由一群人同時買了A和B,則你買了A時,可能對B也會有興趣,所以就會主動推薦告訴你這件事。這是另一種隱性的標籤系統。
另一項特色,就是每本書幾乎都會有評論,這些評論都是買過這本書的素人寫的。可以幫助你了解這本書適不適合你。有維基百科的影子在其中。
至於書單熱(Listmainia)則是另一項好玩的實驗,可以由素人自行訂出自己的書單。你可以訂我最愛的10本書,或是選出最棒的23本圖書資訊學的書。所以你可以看到很多書在不同書單中出現過,也因此可能發現其它更有趣的書。這可以說是外顯標籤的化身。
※ ※ ※ ※ ※ ※ ※ ※ ※ ※ ※ ※
我們正快速的讓世界變的雜亂無章,破除事物的舊組織架構,供人任意編排。
為了面對這種新的知識面貌,我們可以思考下列的策略方針:
(1) 設置出口過濾器,而不是入口過濾器。
讓更多的資訊進來,數位世界不須要思考要用多少紙張的問題。依據長尾理論,大部份的資料都只有一小撮人感興趣,但合計起來的整體價值卻無法計算。(2) 每一片葉子棲身的樹枝數越多越好
讓每個資料同時被分到更多個類別或標籤,越多的分類將有於助於資料更容易被找到。(3) 所有的事物都是詮釋資料,所有的事物都是標籤
在第三類秩序下,所有資料的內容的每個字都可以使用全文檢索的方式,而化身成詮釋資料,另外和該書相關的其它參考資源也都可以做為詮釋資料。因此如果我們想要讓使用者搜尋到資訊,就讓任何東西都可以變成有用的詮釋資料。(4) 放棄控制
你可以藉由樹狀圖去挖掘出原本隱藏的資訊,但你卻很難直接去編排資料關係(當量非常多時)。我們可以事先建立起參考的範本分類,但卻不應限制使用者去增加自己的分類。讓使用者主宰自己的查詢與瀏覽資料的方式。
※ ※ ※ ※ ※ ※ ※ ※ ※ ※ ※ ※
再也沒有一個專家能規定「知識」該長什麼樣子。
我們讓這些資訊完全是一群於此切身利益相關的人一片、一片葉子創造出來的。它只在人有需要時匯集起來,但平時都處於潛伏狀態。透過網路聯結,可以將背景不同、立場相異、但具共同興趣者間拉起對話平台。知識起於公眾和社群思維,也存在於此。顯然內隱和外顯的界線不是憑聰明才智而定,而是取決於目的,也因此會隨著「對我們重要的事物為何」而定。
Andy Clark 在 「Being There」一書中提到,人類一直以來都會將思想延展為世界的一部份。計算機是數學的外部化;書本是記憶的外部化。外部化不僅僅是事物的延伸,有時候也會改變事物本體。如書本將知識切割成分散的主題,再交叉索引到其它書,書本由此成知識的容器。
現在,我們正在將第三類秩序裡把「意義」外部化。透過一個個連結和標籤打造出來。電腦能進行標籤的群集是因為人類的興趣和表達的內容有類可循。只要資訊有適足規模,電腦就可精確建立資訊的正確關係。也就是所謂的「群集技術」(clustering)。標籤的數量越多,可能就越有用、越有意義、也越相關或清楚。
也因此,知識的命運取決於我們已經知道知識會起什麼變化?我們發展知識的方式有何變化?知識扮演的角色? 在第三類秩序下,一批物件的所有排列方式都可以浮上檯面。我們可以改變可見的秩序,以反映私人認定的意義。我們可以分享排列的方式,並以此做為進一步發展的基礎。讓這個世界亂中有序。這就是「新知識工程」。
想在未來創造榮景的人,一定要知道這世界為何「越亂越好」的道理
下世代經濟將屬於那些不怕紛亂雜陳世界的英雄。
讀後心得在哈利波特的魔法世界中,很多物品都有自己的生命或思想。像畫、照片裡的人物會 動,書會像怪獸一樣咬人。魔法棒一揮想要的東西就會自動跳到眼前。但從第一集開始,書本就不會自動依你想要的結果跳出來。得要靠主角一本一本的翻,最後才發現原來寶物是魔法石。所以即使是魔法世界也沒法依你的模糊說明,給你所要的知識。
在真實數位的世界裡也是,Google大師也沒法按「意義」去找出你要的資料,除非你給了很明確的「關鍵字」。但顯然大家跟小編一樣,還是常常會找不到所要的正確答案。
顯然,我們需要另有一套資料整理、找尋與取用的原則。而Tag和Faceted classification 成為其中的顯學。當然也不是全然可行無誤的,還有很多的地方仍要討論與改善,正確性就是其一,也是最為人所詬病的。但我覺得也正是因為這樣,我們還可以繼續研究和思考更多創意與創新。至少,我們看出來了,讓亂成為一種原則,顯然是種可行的道路。起碼Amazon和FaceBook已經帶給我們成功的典範。