我们以前文介绍的一个场景本体的实例,银行领域客服投诉分析挖掘的场景本体模型,来说明本体树辅助建模。模型包括三部分:本体模型、要素模型、概念模型。本文说明本体树模型的辅助建模。
本体树辅助建模实现的功能是,对输入的客服投诉文本数据,采用智能搜索、分类聚类算法等技术,进行自动分析,以辅助发现本体树节点。对发现的本体树节点提供合并、删除、修改等操作,业务人员可以方便地进行修改。同时,支持对发现的节点进行二次(或多次)分类聚类,以实现多级本体树节点的自动发现。分类体系辅助建模的输出是,经人工确认后的本体树。
以银行领域客服投诉模型中,“贷记卡”相关的本体树建模为例,说明辅助建模流程。
将“种子词"操作,拖拽到建模区。实现的功能是,对选择的客服投诉文本进行搜索,得到与种子词”贷记卡“相关的所有投诉文本(结果区可以展示)。
将”分类聚类“组件,拖拽到建模区,放到”种子词“结果之后。实现的功能是,对种子词搜索结果,进行自动聚类,输出自动聚类结果到结果区。
在结果区,对分类聚类结果进行人工干预,可以选择其中一个或多个节点,进行“合并。
在一级分类聚类结果之后,再次将“分类聚类”组件拖拽,放到其结果之后,以对选择的类,进行二级聚类。在结果中,二级分类聚类结果,显示在相应节点之下。对二级分类聚类结果,同样支持人工干预操作。
这个流程可以不断重复,以拓展贷记卡相关的本体树节点的层级。
将“加入本体”操作拖拽到建模区,将人工调整、确认后的前两级分类聚类结果,加入到本体树。
在DINFO-OEC平台中,分类体系辅助建模的输出结果,就是本体树的节点,在本体模型中可以方便查看。