2011年10月20日 星期四

書摘:『資訊架構學--網站應用(第三版)』

資訊架構學--網站應用,第三版
  • 作者:Peter Morville & Louis Rosenfeld
  • 譯者:陳建勳
  • 出版社:歐萊禮
  • 出版日期:2007年07月17日


※ ※ ※ ※ ※ ※ ※ ※ ※ ※ ※ ※
引言

    資訊網路時代的資訊系統設計,是希望透過新的科技整合領域,提供統一的方法和思考方式。其中將包含下述議題:
  • 資訊架構
  • 資訊設計
  • 知識管理
  • 互動設計
  • 內容管理
  • 用戶經驗與經驗設計

    所有在資料整理與架構的基礎,將會由用戶 → 情境 → 內容三方架構與交互影響,概念圖如下:

用戶 → 情境 → 內容

※ ※ ※ ※ ※ ※ ※ ※ ※ ※ ※ ※
用戶需求及行為

在內容的面向上,將關注下列重點 
  • 所有權:誰做的,誰擁有 …
  • 格式:word、xml ….
  • 結構:如一般文件或可被電腦解析
  • 中介資料:標記方式 / 控制詞彙
  • 數量: …. 多少..
  • 動態:增加資料速度

一般的想像中,我們【問問題】 → 【系統處理】 → 【得到答案】,
作業的處理感覺很單純。
(例: 台北市有多少人?)

但事實上,問問題者常不見得都知道自己想要什麼!!
所以可能在半滿意或極端失望的狀況下完成工作。
(例:如想查莫拉克災情處理,結果查到災情的說明,卻沒找到處理結果的報告

也有可能在尋找的過程,可能學習到心的資訊,其結果改變最初搜尋的目標。
(例:本來想找災情處理結果做救災參考,但卻發現各縣市的防災計畫)

另外,我們還可能發現太多資料,所以沒法一次讀完;所以想指定「讀我」、「不重要」、「稍後讀」等註記.....

所以找資料這件事的行為,將可被區分成四類模式:
  • 完美的捕捉 (正確東西)
  • 捕龍蝦的陷井 (一些好東西)
  • 亂拋網 (每樣東西)
  • 我以前讀過的 (再次需要)
 
四種常見資訊需求類型


    而實際上最常發生的資訊查詢情境,應該像是採草莓一樣,沿路往下搜尋。也就是說用戶開始有資訊需求,然後想出一種資訊請求(查詢);接著依查出的結果,重新產生資訊請求,再沿路取出資訊 (草莓)。

採草莓模式

※ ※ ※ ※ ※ ※ ※ ※ ※ ※ ※ ※
組織系統

組織資訊的困難如下:
  • 模糊性:番茄可是水果(韋氏字典),也是疏菜(美國法院判定),但植物學上確屬漿果類。而若是抽象的名詞則更難加以分類。
  • 異質性
  • 不同觀點的差異性:即使是同一個人的分類,也會因個人的需求、觀點和行為會隨時間改變。事實上分類系統和組織系統受到建構者觀點影響十分深遠。因為每個人對資訊的理解都有不同的方式。
幾種組織體系模式:
  • 精確性
  • 按字母
  • 按年表
  • 按地理位置
  • 模糊性 (通常更常用且重要)
    • 按主題(銷售商品、公司組織)
    • 按任務
    • 按觀眾(使用者)
    • [以上混用]

結構常為階層式:由上往下的做法。或是現在 Web 2.0常見的標籤系統,然後採用控制詞彙以及彙編詞彙加以關聯。常見的詞彙制定會由用戶代言人或主題專家,從用戶的角度思考。或由用戶的搜尋Log去分析。

※ ※ ※ ※ ※ ※ ※ ※ ※ ※ ※ ※
導覽系統

基本導覽模式:
  • 選單
  • 網站地圖
  • 索引 (黃頁)
  • 指南 (情境)
  • 搜尋

進階導覽模式(Web 2.0常見做法):
  • 個人化 (Portal ):例如 Amazon (I own It / Not interested / Rate ☆)
  • 社群導覽: 用排行版 或 推薦系統
  • 標記群(雲)
※ ※ ※ ※ ※ ※ ※ ※ ※ ※ ※ ※
搜尋系統

有太多資訊要瀏覽而搜尋會有幫助時,才應該建立搜尋系統,幾個常見好處如下:
  • 協助資料分散或成片斷的網站:全文檢索應是權宜之計
  • 搜尋學習的工具:讓系統來分析和學習
  • 因為用戶習慣了
  • 搜尋可以馴服動態性
搜尋系統基本解析如下圖

搜尋系統基本解析

幾種搜尋模式或概念
  • 選擇搜尋什麼
  • 決定搜尋區域:限縮範圍
    ( 內容/主題、觀眾、角色、地理位置、年表法、作者、部門/單位 )
  • 替新進內容做索引

搜尋演算法 (可參考 Modern Information Retrieval)
  • 樣式比對演算法 (pattern match):將用戶查詢的字串和所有文件作全文索引,找到文件中有符合的字串時,即列入擷取集合中。
    檢索 = 取出的相關文件 / 在集合中的所有文件
    精準 = 取出的相關文件 / 在集合中的相關文件
強化搜尋能力的策略
加上幹詞(automatic semming):意指把一個術語擴展,包含其它共享詞幹的術語。(例: computer = computers = computational = computing)
文件相似化 (document similarity):指將文件去除 冠詞(a /an / the ..)、be 動、介詞等;這樣將可留下一組語意豐足的術語,足以代表該文件。然後,這些術語就可以被專換成可被查詢的字串。
協同過濾法(collaborative filtering) / 引用搜尋法(citation searching) :指從單一文件中擴充到相關文件的結果。例如:系統自動找該文件的相關文件。

顯示搜尋結果的策略
  • 排序
  • 字母
  • 分級
  • 文件中含有多少個查詢字串的術語
  • 術語在文件中出現的頻率
  • 術語出現的位置有多近
  • 術語出現在標題或本文中;在標題的相關性通常高
  • 文件被點閱率 …
  • 評比
  • 以用戶 (例: Digg)
  • 以專家  
  • 主題類 群組結果:依照某個共同方面將群組起來。即將符合條件的文件,依其關鍵字再將相同的集合起來。例:查RFID 得到的文件集的關鍵字包括Barcode、Privacy … 那就用這些術語分類資料

其它顯示結果的重點:
  1. 說明用什麼條件找到的:然後讓用戶可以重複使用這些相同 查尋條件
  2. 說明結果來自何處:被分的類別、關鍵字

※ ※ ※ ※ ※ ※ ※ ※ ※ ※ ※ ※
彙編詞彙、控制詞彙、中介資料

中介資料(METADATA)和控制詞彙(CONTROLLED VOCABULARY)是用來看出系統間的關係,利用中介資料描述系統後可以用控制詞彙將系統連在一起。而後端的彙編詞彙(THESAURUS)則是提供使用者好的使用經驗。

中介資料
資料的資料。對資料處理而言,中介資料是一種用於定義的資料,能提供其它被某種應用軟體或環境所管理的資料之相關說明。可能包含了描述性欄位、情境 …。使用手段如 Tag-我要如何用Tag來描述這份文件。
控制詞彙
是一組自然語言,用來定義術語間的階層關係,進而建立分類體系。簡單地說,就是一份對等術語(equivalent term)清單,按同義詞環圈(synonym ring)形式排列。或者是一份優先術語清單(preferred term)清單,儲存在權威檔(authority file)中。
同義詞環圈:把一組定義為對等的字眼連接起來 (即使不是真的同意字。例:土石流潛勢=土石流危險區=水保局=水土保持局;或台北=台北市=臺北市=首都=Taipei=110=總統府)。

術語輪替:當查A時將資料指向B。例:用字母表查水部看到水保局,其旁邊出現 see 土石流潛勢
權威檔案:就是放一份優先術語或可接受值清單。可以讓大家有一致而有效的使用大家認同的術語。
分類體系(classification scheme):指的就是優先術語的階層式排法。例:Yahoo的階層畫面,或圖書館用的杜威十進制分類法
控制詞彙種類
彙編詞彙 (thesaurus)
同義詞之書,通常包含相關字、對照字、反義字。相關標準:ISO 2788 / ANSI Z39.19。語意關系如下:
彙編詞彙的語義關係

  
原始面向式分類法(Facted Classification)(未來的主流):
只要使用五種全方位面向就能組織任何東西??
  • 人格
  • 事物
  • 能量
  • 空間
  • 時間
改良型面向式分類法(商業界常見分法):
  • 主題
  • 產品
  • 文件類型
  • 觀眾
  • 地理位置
  • 價格 


※ ※ ※ ※ ※ ※ ※ ※ ※ ※ ※ ※
相關網站
  1. Doblin Core Metadata Initiative:http://dublincore.org/
  2. Flamenco Search Interface Project:http://flamenco.berkeley.edu
  3. Glossary of Terms Relating to Thesauri:http://www.willpowerinfo.co.uk/glossary.htm
  4. Taxonomy Warehouse:http://www.taxonomywarehouse.com
  5. ThesauriOnline:http://www.asindexing.org/site/thesonet.shtml
  6. CM Pros:www.cmprofessionals.org
  7. IA學會資訊架構圖書館:http://iainstitute.org/en/
  8. IxDA資源圖書館:http://www.ixda.org/resources