基于语义关系的二次检索技术在 OPAC 中的应用研究_论文

发布时间:2021-10-16 18:00:46

t h e   A p p l i c a t i o n   o f   C o mp u t e r   T e c h n o l o g y? 计算机技术应用  基于语义关系的二次检 索技术在 O P A C 中的应用研究  文/ 樊 伟 红  【 关键 词】O P A C语义 关系识别 二 次检 索  OP AC, 英 文 全 称 为 O n l i n e   P u b l i c   Ac c e s s   C a t a l o g u e ,中 文名 为 联机 公 共检 索 目录 ,其  是 图书馆为用户提供 的书 目浏览检索的* 台和  窗 口 。 随 着 信 息 技 术 的发 展 ,OP AC 的 结 构 也  愈 发合理,O P AC 己经 成 为 图 书 馆 提 供 电 子 服  图1 :基于语义关 系识别的二次检 索模型  务 的 主 要 渠 道 , 其 功 能 的 好 坏 已 经 在 一 定 程  术 ,通 常采 用的是重新检索或者要求用户对检  系识 别的二次检 索模型,在该模型中通过关键  索词进行进 一步的精炼,再进行二次布尔逻辑  词 匹配 和 关键 词 之 间 的 语 义 关 系 匹 配 来 实 现 的  书 目的 匹 配 。   度 上反应 了一个图书馆服 务的好坏 。0 P A C的  检 索 。   个主 要 的功 能是 为为 用户 提供 图书馆 书 目   一 的 检 索 功 能 ,但 是 现 今 O P AC 所 提 供 的 检 索  2基于语 义关系的二次检索技术  基 于语义关系识别 的二次检索模 型如 图 1   所示 。   服 务还 不成 熟,不 能像人 们常 用的 Go o g l e和  B a i d u等 搜 索 引 擎 进 行 资 料 的检 索 ,O P AC 提  供 的检 索项除了提名 、出版社和 关键词 外还提  供了 I S B N、登录 号等检索 项 。但 用户很 少使  目前 在 搜 索 引擎 中 通 常 根 据 用 户 的 提 供   2 . 2基 于语 义关系的二次检 索模型的工作原理  的关键 词和 书 目的关 键词 信 息来构 建检 索模  本 文 设 计 的 基 于 语 义 关 系 识 别 的 二 次 模  型,来从图书馆大量的书 目信息 中搜寻用户所  个步骤完成检索操作  需的书 目信 息。独立性假设在检索模型 中使用  型具体来 说是通 过 以下 3 用I S B N 和登录 号进行检索 ,同时检索条 件通  的。   常 比较 复杂,而实际用户使用过程 中通 常只希  十 分 广 泛 。通 过独 立 性 假 设 虽 然 可 以使 得 检 索  步骤 1 :模型对用户输入 的关键 词集合在  望用最 简单的方式来完成检索操作 。如在 检索  模型可 以设计 的非常简单,但是实际上这种检  原 本 的 OP AC 系统搜索引擎中进行初步检索,   索模型忽略 了关键 词之间的独立性,进而检索  过 程 中采 用 简 短 的 检 索 词 ,而 不 是 一步 步 按 照  根据 不同图书馆 提供的检索方式不同和书 目不  出不符合用户 需要的书 目信息 。这促使大量 的  复 杂 的检 索语 法 进 行 操 作 。 虽 然 现 在 OP AC 也  提供 了二次检索技术 ,以便用户 进行更为复杂  的操作 ,但是传统的二次检 索技 术通常是在一  次 检 索 的 基 础 上 再 次 用 布 尔 模 型 进 行检 索 , 这  研究者投入大 量的精力来分析检索词所代表概  念之间 的依存关系 。   为 了更 加清 晰 的对文 本 的语义 内容 进行  描述 ,针对于 OP AC的特点,本文从 自然语言  处 理 的角 度 出 发 , 提 出 了一 种 将 关 键 词 之 间 的  同 ,结 果 可 能存 在 一定 差 距 。   步骤 2 :针对用户输入 的关键词 集合,构  建关键词之 间的语 义关 系,将 用户所 需要检索  的 内容标 引成概念 图。该构建 过程较将 所有 书  目信 息 的概 念 图构 建简 便 得 多 , 构 建 概 念 图 的  过 程 可 以相 关 成 熟 的算 法 实 现 ,该 部 分 不 是 本   文 的 研 宄 重 点 , 经 过 标 引所 形 成 的用 户 查 询 ,   通常导致检 索结果僵硬且不符合用户 的实际检  索 需要 。本文拟采用基于语义关 系的二次检索  技术来实 现对 OP AC的二 次检索。进一步提高  OP AC 检 索 结 果 的精 确 性 。   语义关系应用于 OP A C检索中的方法 ,进一步  提 高 了书 目匹 配 的准 确 性 。   即可获得用户查询各关键词之间 的语义关系类  1传统 的二次 检索技术  所 谓 二 次 检 索 技 术 , 就 是 在 当 前 的 检 索  结 果 中 进 行 进 一 步 的检 索 ,达 到 对 检 索 结 果 精  ?   基于语义关系的二次检索模型  本 文在 传统 二次 检索 模 型 的基础 上,根  据语义关系识 别的概念,对其进行改进 ,设计  出了基于语义 关系的二次检索模型。在该模型  别 等信息。   步骤 3 :根据步骤 2中获取 的语义关系信  息 , 在 语 义 关 系 知 识 库 中找 到 与 之 对 应 的语 义  关系模式,然后在利用语义关系模式对关键词  选 的 目的。 当初次检索过程 中检 索结果过多时 ,   之 间的语 义关系进行识别 ,在多个语义关系的  中,引入 了基 于概念 的检 索模型的思想 。在基  用户可 以根据 需要进行二次检索 。现在 已经有  情况 下,对 各个 语义关系识别结果进行加权计  于概念 的检索模 型中,用户检索 内容和书 目信  很多研 究学者 开展了对初始检索结果进 行重组  算

相关文档

猜你喜欢

电脑版