2012年6月29日 星期五

電子資源的主題分析


寫在前面

在現今這個Big Data的時代,收集資料可能只是技術的進步程度問題。但如何找出所想要的資料,卻是仍無法有效解決的問題。而想要正確找出資料的前提,就是如何有效的分類與整理資料。相信這也是未來商機的所在。

已發表的相關文章或想法



另整理一本談論圖書館書籍歸類的研究性資料部分感興趣內容的摘錄
圖書館電子資源組織:從書架到網路
  • 作者:張慧銖
  • 出版社:Airiti Press Inc.
  • 出版日期:2011年06月30日


※ ※ ※ ※ ※ ※ ※ ※ ※ ※ ※ ※
第三章 電子資源的主題分析


傳統:分類表、主題詞表、索引典
新的研究方向:資料探勘、文件自動分類/分群(人工智慧)
在網路世界流行的解決方案:層面分類,常用於 網頁資源的組織、管理與檢索。其優點是可透過網頁介面視覺化及彈性、動態的方式呈現。其他還包括索引典與語意網等。


重要國際規格詞彙
  • RDF(Resource Description Framework):資源描述框架
  • OWL(Web Ontology Language):網路本體語言
  • SKDS(Simple Knowledge Organization System):簡單知識組織系統


主題分析工作:(依據「主題詞表」、「分類表」)
  1. 內容的判讀
  2. 主題概念的提煉
  3. 隱含主題概念的分析
  4. 主題的取捨
  5. 主題類型的確認

主題分析的目的:
  1. 以具體且精確的語彙對資料的主題適當描述
  2. 揭示主題的相關性
  3. 提供一般性和專門性詳簡不同分析款目
  4. 提供專家或一般人習慣術語
  5. 將不同國情、不同學科專家的不同標目聚集
  6. 利用參照方式將具關聯性主題做有效的連結


主題法的類型(分析):
# 系統主題法
1. 階層式分類法 (Hierarchical)
  • 杜威分類法 (Dewey Decimal Classification, DDC)
  • 中國圖書分類法
  • 用系統化組織,以直線邏輯方式建立分類表 (類似組職圖)

2. 列舉分類法
  • 美國國家圖書館分類法

3. 分析綜合分類法 (Analytico)
  • 「概念」的可分析性與可綜合性
  • 可解決「階層式」的列舉方式無法容納知識多元化發展
  • 採用的方法是將基本術語列舉出來,供主題分析人員自由地組合。例如:冒點式分類法(Colon Classification)

4. 層面分類法:布里斯分類法


# 字順主題法
  1. 標題法:使主題與概念建立一對一關係。達到依主題集中文獻的目的。
  2. 單元詞法:將每個複合概念分解成若干單元概念,用一個單詞的組配。用來標引文獻以利檢索。
  3. 關鍵詞法:用資料本身的主題詞彙作為檢索用語。執行方法通常是用「非關鍵詞表」如冠詞、助詞、介詞等等,去將文章中相關文字去除,即可得到主要的關鍵詞。
  4. 敘述詞法


過去分類法於數位時代的問題:

  1. Browsing:如何在同一類別內看到鄰近的資源。需有「分類層級」
  2. Movement:配合網站可上、下游走。這是層級的好處。但一般常見的問題在於電腦系統沒有層級架構的問題
  3. 限制與切割:可用來限制或切割檢索表。如用布林檢索來限定檢索資料集合。



※ ※ ※ ※ ※ ※ ※ ※ ※ ※ ※ ※※ ※ ※ ※ ※ ※ ※ ※ ※ ※ ※ ※※ ※ ※ ※ ※ ※ ※ ※ ※ ※ ※ ※
一個加強版全文檢索構想,用於企業內部資料管理