知识服务已成为信息社会信息服务领域的趋势和重要特征,但如何有效地进行信息组织来满足各类知识服务的需要,是信息服务领域需要研究的重要领域。目前,有关信息组织的研究大多处在信息服务这一层面,难以满足知识服务的要求;有关知识组织的研究也是零散的,没有形成一定的体系。《图书情报与档案管理创新丛书:面向知识服务的知识组织理论与方法》撰写的目的,主要从知识服务的角度出发,研究信息组织的理论与方法。即从理论角度阐述面向知识服务的信息组织的基础和依据理论,从知识服务的实现途径研究知识组织的具体结构和组织方法,从而为知识服务的实现提供理论、技术和实现方法。具体内容有:知识服务的类型和形式,面向知识服务的信息组织结构,面向知识服务的信息组织理论基础,实现各类知识服务的信息组织结构,面向知识服务的信息组织应用于实践。
更多科学出版社服务,请扫码获取。
大数据时代,各类数据扑面而来。在数据的海洋中人们往往无所适从,迫切期待信息服务部门能够从繁杂的数据中提取出能够用于解决问题的知识,以服务于大众。作为信息服务部门如何驾驭大数据?如何进一步挖掘其中的巨大价值?这已成为企业界和学术界共同关心的话题。大数据的特点是:多(数据量大)、冗(冗余信息多)、杂(真伪信息混杂)、乱(各种类型、各种结构数据同在)、新(时时刻刻都在产生新的数据)。面对庞大繁杂、急剧膨胀的大数据,如何保证它们在知识服务中发挥的作用,并使其有序化地收敛于高效的知识服务,这对数据处理与知识组织提出了更高的要求。
知识组织就是对知识的整序。不同的知识需求对知识整序的要求不同,不同的知识服务形式的知识整序方法也不相同。当用户希望从复杂的知识关系中寻找出规律、探究隐藏在大量知识中的未知知识时,需要知识组织能够将知识间的相互关系呈现出来,将知识间的语义联系建立起来:当用户想得到某一方面知识或某一类知识时,就希望知识组织能够将知识分门别类聚集起来;当用户希望了解某些领域的知识体系时,就期待具有组织知识体系的工具来架构知识:当用户要求在阅读过程中即时获得知识帮助时,就要求知识组织能够将文本中的知识点与知识库相链接;当用户希望借鉴他人对信息获取的经验时,就需要能够将用户进行信息采集的相关行为知识组织起来。可以说,用户的知识需求对知识组织提出了更高的要求:反过来,知识组织的深入也将会促进知识服务水平的提升。
面向知识服务的知识组织不仅需要传承过去知识组织的理论方法,更需要创造和完善知识组织技术,使之适合于知识服务的需要。因此,本书强调从知识服务的需要出发,以知识服务的形式和要求为依据,从宏观上研究知识组织的架构,从微观上探讨知识组织的逻辑结构和物理结构,并从应用角度上介绍各类知识组织在技术上的实现与应用。
本书综述了知识组织的发展过程,探讨了知识服务的类型及其对知识组织的要求,阐述了知识组织的科学理论支撑,理清了各类用户的知识需求,为知识组织的架构与实现提供了依据。本书具体探讨了主题词表和分类词表的机器组织结构,并通过实例展示了主题词典和分类词表在知识组织中的应用;介绍了语义网和本体技术,并通过对实例的介绍和关键词语义网的构建研究了语义网和本体技术的数据组织与应用价值;针对用户阅读中对知识点的知识需求,研究了动态生成知识链接技术,阐述了文本知识点与知识库链接的知识组织结构和应用:从引文分析的知识需求从发,探讨了引文索引的知识组织;根据用户行为知识推荐服务的需求,阐述了用户行为知识的组织结构和应用服务:还阐述丁关联技术如何应用于知识地图、数据仓库和知识库的技术与方法,介绍了知识地图、数据仓库和知识库的数据组织结构和应用示例。
本书的作者均是我的研究团队成员。为了本书高质量地完成,本团队成员经过多次讨论和交流,在交流中碰撞出火花,对问题产生出更深刻的理解。本书应该是集体智慧的结晶。本书具体分工如下:苏新宁构建本书框架,撰写第1章、第2章、第3章;其他章节的完成者:第4章,谢靖;第5章,徐绪堪;第6章,沈思;第7章,虞为;第8章,王东波;第9章,郑昌兴;第10章,韩普;第11章,吴凯;第12章,朱云霞;第13章,蒋勋;第14章,刘喜文。苏新宁对全书进行了认真的审阅和修改。参加本书讨论的学者有:杨建林、邓三鸿、王吴、钱爱兵、章成志、朱惠、孙立媛等。
本书系国家自然科学基金项目“面向知识服务的知识组织模式与应用研究” (项目编号:71273126)成果之一,研究过程得到国家自然科学基金的资助。本书的出版得到了南京大学“985”三期王程的资助。在此对国家自然科学基金委、南京大学学科建设与发展规划办公室、南京大学信息管理学院表示衷心的感谢。同时,感谢本书的所有作者,你们对本书的完成做出了很大贡献:感谢所有作者的家人们,感谢你们在作者的写作过程中所给予的支持。
苏新宁
2013年12月于南京
目录
总序
前言
第1章 引论 1
1.1 信息组织发展简述 1
1.1.1 传统的信息组织 1
1.1.2 计算机及网络信息组织 5
1.1.3 面向知识服务的知识组织 9
1.2 知识组织的研究内容 12
1.2.1 用户与知识需求 12
1.2.2 知识服务类型 13
1.2.3 信息关联与组织研究 14
1.3 知识组织的工具 16
1.3.1 基础知识与知识架构类工具 16
1.3.2 知识关系建立类工具 17
1.3.3 知识处理与展现类工具 17
1.4 知识组织的未来展望 18
1.4.1 知识词表体系建设 18
1.4.2 技术引导知识组织提升 18
1.4.3 以用户为主导的知识组织 19
第2章 知识组织相关理论与方法 20
2.1 系统科学理论与知识组织的关系 20
2.1.1 系统论与知识组织 20
2.1.2 控制论与知识组织 21
2.1.3 信息论与知识组织 21
2.1.4 耗散结构理论与知识组织 22
2.1.5 协同论与知识组织 23
2.1.6 突变论与知识组织 23
2.2 情报学相关定律与知识组织 24
2.2.1 布拉德福定律与知识组织 24
2.2.2 齐普夫定律与知识组织 25
2.2.3 洛特卡定律与知识组织 25
2.2.4 小世界理论与知识组织 26
2.3 知识组织方法 27
2.3.1 知识关联组织法 27
2.3.2 知识聚类组织法 28
2.3.3 知识语义组织法 28
第3章 用户需求与知识服务 30
3.1 用户类型与知识需求 30
3.1.1 不同文化程度用户的知识需求 30
3.1.2 不同工作特征用户的知识需求 32
3.2 知识服务类型 34
3.2.1 基于词典的知识服务 34
3.2.2 基于语义关联的知识服务 35
3.2.3 基于数据关联的知识服务 36
3.2.4 基于用户行为的知识服务 37
第4章 知识组织工具 39
4.1 基础知识与知识架构类工具 39
4.1.1 领域词典与百科全书 39
4.1.2 主题词表 40
4.1.3 分类法 41
4.1.4 分类主题一体化及电子化 42
4.2 知识关系建立类工具 43
4.2.1 语义网络 44
4.2.2 本体 44
4.2.3 主题图 45
4.2.4 引文索引 46
4.3 知识处理及展现类工具 46
4.3.1 自然语言处理工具 47
4.3.2 分类工具 48
4.3.3 聚类工具 49
4.3.4 本体构建工具 49
4.3.5 引文处理及可视化工具 50
4.3.6 社会网络分析工具 52
第5章 面向知识服务的知识组织体系 54
5.1 知识组织目标与架构 54
5.1.1 知识组织目标 54
5.1.2 知识组织原则 55
5.1.3 知识组织构成要素 58
5.1.4 面向知识服务的知识组织体系结构 59
5.2 知识组织构建准备 61
5.2.1 知识组织的数据准备 62
5.2.2 粒度化分类和聚类准备 63
5.3 面向知识服务的知识组织过程 66
5.3.1 知识组织过程描述 66
5.3.2 欲组织知识资源 67
5.3.3 知识、资源与用户需求的映射 69
5.3.4 知识组织结构设计 71
5.3.5 再生知识的产生 73
5.3.6 知识组织的实现 75
第6章 主题词表与分类表的知识组织 78
6.1 主题词表的组织 78
6.1.1 主题词表与机器组织结构 78
6.1.2 主题词表组织结构 81
6.1.3 主题词表应用 87
6.2 分类法的知识组织 90
6.2.1 分类表与组织结构 91
6.2.2 分类表应用 93
第7章 语义信息的知识组织 96
7.1 语义网中的知识组织 96
7.1.1 语义网概述 96
7.1.2 语义网的层次结构 97
7.1.3 语义网主要知识组织規范及应用 99
7.1.4 语义网搜索引擎中的知识组织 101
7.2 本体知识组织方式 102
7.2.1 本体的定义 103
7.2.2 本体的逻辑组织基础 103
7.2.3 本体知识组织应用实例 105
7.3 关联数据的知识组织 110
7.3.1 关联数据的提出 110
7.3.2 关联数据的实现技术 110
7.3.3 书目数据的关联组织 112
第8章 关键词语义知识的深层组织实践 116
8.1 关键词复杂网络和h指数的研究概况 116
8.2 关键词语义知识深层组织的数据清洗 l17
8.3 关键词语义网络中的小世界现象 119
8.3.1 关键词语义网络的小世界效应 119
8.3.2 关键词语义网络的应用举例 121
8.4 基于h指数的关键词语义知识深层组织探究 122
8.4.1 关键词h指数的计算结果及分析 123
8.4.2 基于h指数关键词语义分布的核心论文确定 l24
第9章 知识地图的组织与展示 128
9.1 知识地图概述 128
9.1.1 知识地图的作用 129
9.1.2 知识地图的分类 130
9.1.3 知识地图的表现形式 131
9.2 知识地图的构建 133
9.2.1 知识地图的构建原则 134
9.2.2 知识地图的构建步骤 134
9.2.3 知识地图的构建举例 136
9.3 知识地图的组织 137
9.3.1 知识地图组织的概念模型 l37
9.3.2 知识地图的数据库表达形式 139
9.3.3 知识地图的组织——以CSSCI为例 140
第10章 文本中知识点的知识组织 144
10.1 启发与思路 144
10.1.1 问题与启示 144
10.1.2 思路与构想 145
10.2 文本中知识点的知识组织架构 146
10.2.1 总体流程设计 147
10.2.2 知识点知识库结构设计 148
10.2.3 知识点与文本关联及应用分析库结构设计 149
10.3 知识点的链接生成与应用服务 151
10.3.1 知识点链接生成及算法设计 151
10.3.2 文本与知识点关联分析 l52
10.3.3 知识点知识库的更新维护 153
第1章 用户行为知识的组织 155
11.1 用户行为信息概述 155
11.1.1 用户行为信息的主体 155
11.1.2 用户行为信息的类型 156
11.1.3 用户行为信息的价值 157
11.2 用户行为信息的知识组织和知识服务 158
11.2.1 用户行为知识组织方法 l58
11.2.2 用户行为知识组织技术 159
11.2.3 基于用户行为信息的知识服务 160
11.3 用户行为信息的知识组织系统 162
11.3.1 用户行为信息知识组织系统概念模型 162
11.3.2 用户行为知识系统设计 164
11.4 用户行为信息数据准备 165
11.4.1 用户行为信息的数据采集 166
11.4.2 用户行为信息的数据预处理 167
11.4.3 用户行为信息的存储方法 168
11.5 模式分析与知识组织 169
11.5.1 模式分析 169
11.5.2 用户行为知识的组织 170
11.6 基于用户行为的知识服务模式 172
1 1.6.1 知识检索 172
1 1.6.2 个性化排序 173
11.6.3 在线推荐 173
11.6.4 知识推送 173
11.6.5 科学评价服务 174
第12章 引用关系的知识组织 175
12.1 引证关系及其作用 175
12.1.1 引用关系的分析 175
12.1.2 引用主体分析 178
12.1.3 引文索引中其他信息的分析 180
12.2 引文索引设计及其组织 18l
12.2.1 新型引文索引的设计思考 181
12.2.2 引文索引数据架构及数据库设计 184
12.3 引文索引中编码的设计 186
12.3.1 国家与地区编码 186
12.3.2 国内地区编码 187
12.3.3 机构类型编码 l88
12.3.4 基金类型编码 189
12.3.5 语种类型编码 189
12.3.6 分类体系对照表 190
12.3.7 引用类型编码 190
第13章 知识库的结构与组织 192
13.1 系统科学理论与知识库简述 192
13.2 知识组织、知识库与知识服务 193
13.2.1 三者的工作关联 l93
13.2.2 三者的关系模型 194
13.2.3 知识库结构的研究内容 195
13.2.4 知识库结构研究的深层影响 195
13.3 微观层面的知识库内在逻辑结构 197
13.3.1 知识点之间的关系 197
13.3.2 知识表示的评价 202
13.3.3 数据清洗 204
13.4 宏观层面的知识库框架结构 207
13.4.1 知识库整体架构 208
13.4.2 双库协同架构 210
13.4.3 启发型协调器与启发协调算法 210
13.4.4 中断型协调器与中断协调算法 211
13.4.5 两个协调器的协同效应 211
13.4.6 基于双库协同的过程模型 212
第14章 数据仓库的组织 214
14.1 数据仓库组织过程与工具 214
14.1.1 数据仓库的数据质量要求 214
14.1.2 数据仓库构建过程 216
14.1.3 数据仓库的构建工具 219
14.2 数据仓库模型 220
14.2.1 数据仓库中的概念模型 221
14.2.2 数据仓库中的逻辑模型 224
14.2.3 数据仓库中的物理模型 225
14.2.4 数据仓库中的元数据模型 226
14.2.5 数据仓库的粒度模型 227
14.3 数据仓库组织与构建实例 228
14.3.1 数据仓库数据组织 228
14.3.2 构建数据仓库的实例 232
参考文献 237
1.4 知识组织的未来展望
知识组织的目的是更好地利用信息资源,将信息资源提升为知识资源,实现知识服务.知识组织的基础工作是知识的体系架构资源建设,也就是说要加强知识词表等基础知识资源建设。其次,技术将在知识组织的实践中发挥更加重要作用,为信息和数据的知识提升提供更加有效的手段。未来的知识组织将更加注重服务,即以知识服务为导向,以用户需求为目标,使知识组织更加方便用户、适应服务。
1.4.1 知识词表体系建设
在网络信息检索中,用户使用的检索词是用户自己所熟识的关键词,系统提供的标引词(或可检索词汇)是信息中拥有的词汇。这种检索词汇与标引词汇相互脱离的检索系统.其查全率往往较低,会遗漏一些很有价值的信息,这与未来知识服务系统要求是不相适应的。因此,未来的知识组织将会注重知识词表建设,以此来减轻用户选择检索词的负担,避免系统为选择标引词而增加人力劳动。知识词表配以一定的算法软件,可以自动为用户转换或扩展检索词,自动为系统标引主题词,从而提高系统的检索效率,达到知识服务的目的要求。
知识词表体系包括:①网络主题词表。该词表记载词汇间各类关系,如同义关系、用代关系、属分关系、所属学科等,可以为检索或标引时的词汇扩展和正确选词进行知识推荐。②分类词表,主要为引导信息分类参考。在分类词表内,将建立词汇与分类号之间的关系.各种分类体系之间的联系等,确保计算机系统能够为信息进行准确分类,检索时可自动进行由主题到分类,及分类体系之间的转换,实现分类知识检索。
未来的知识词表将是一个开放性的知识组织工具。词表可以提供用户共享,不同词表之间可以实现互操作,可以认为未来的知识词表将是一个知识词表组织体系。
1.4.2 技术引导知识组织提升
技术的发展必然带来知识组织革命性的变化。未来的知识组织将是一个在技术引导下的数据间密切关联的数据结构。①本体技术和人工智能技术曰益成熟和实用,使充满语义关系的数据结构在知识检索系统中得到充分运用。②数据挖掘技术和数据仓库技术的发展.促进了数据仓库广泛用于知识服务系统,数据的多维联系结构使得联机分析技术真正运用于竞争情报系统。③云计算技术使数据组织技术发生了彻底的变革。随着信息爆炸日益凸显.数以千万计的数据生产者每天生产出大量信息,集中式的数据组织、生产与管理已不能适应时代的要求。云计算技术使整个信息服务体系中的数据分布式存储形成了一个巨大的虚拟整体,并且能够得到高效的存取。因此,在云计算技术的推动下,未来知识组织将是一个分布式的虚拟整体(云组织)。
……