首页 云计算 服务器 大数据 存储 IT 安全 物联网 软件

人工智能

人工智能频道旗下栏目:
全部案例:

交通银行:基于人工智能技术实现银行工单智能派单

交通银行:基于人工智能技术实现银行工单智能派单 浏览:2次    类型:银行、人工智能    2019-05-09 11:29

项目背景

随着金融科技的快速发展,支撑银行业务的后端信息系统数目日益庞大,系统功能逐渐复杂化,IT运维人员需要处理的各类工单也日益增多。工单的处理效率是银行客服能否迅速准确地解决客户问题的重要因素,直接影响了客户满意度。目前大部分商业银行都建有一套工单处理系统,IT运维人员可在该系统内对已报送的工单进行分析、分配、转派及办结等操作。虽然工单处理系统实现了工单处理的电子化,但定位工单的问题原因,确认其归属业务系统并分派工单仍靠运维人员人工进行。这样的方式主要有以下几个缺陷。

1.分派准确率低。通常工单是根据上报人员所选的解决系统进行自动分派,但由于目前银行IT化程度高,系统数量多,系统间关系复杂,上报人员往往无法正确选择工单对应的解决系统,导致分派准确率较低。工单一旦分派错误,则需要进行再次转派,极大降低其解决效率。目前经统计,首次分派正确的工单平均解决时间大约为6小时,经过再次转派的工单平均解决时间则大约有16小时。

2.分派人力成本高。由于程序缺陷、客户操作等问题,经常会出现不少相似的工单,对于这类工单有经验的人员能参照历史处理方案进行处理。这种依赖于经验的模式需要投入大量有经验的人,同时还需要对没有经验的人员或者新人进行大量培训。另外一定程度的人员流动又会造成历史经验的丢失,不断重复的培训过程将造成较高的人力成本支出。

解决方案

我们可以把工单分派认为是根据工单的已有信息并结合历史工单信息及处理规则,最终确定其归属系统的一种业务场景。这与基于海量数据进行特征分析及经验学习,得到数据内在联系和规律的人工智能技术有着很高的契合度。人工智能技术近几年在语音识别、图像识别、自然语言处理等多个领域发展迅猛,应用场景日益广泛和成熟。利用人工智能技术优化工单分派进而实现工单智能派单是可行且有发展前景的应用。

智能派单系统简介

为实现工单智能派单,我们需要收集大量的历史工单信息作为分析对象,其中非结构化的工单描述是与工单最终解决系统关系最为密切的要素。利用自然语言处理相关技术获取工单描述信息特征与工单解决系统的内在联系是实现智能派单系统的关键,基于获取的内在联系,只需将新工单的工单描述输入智能派单系统,通过智能分析将工单所属系统返回处理人以供参考。随着智能推荐的准确率提高至一定程度,即可完全由智能派单系统自动进行工单分派,无需运维人员人工介入。

在实践中我们需要建设部署一套智能派单系统,因在人工智能领域有着丰富的开源工具包,如tensorflow、jieba、gensim等,我们选用Python作为其开发语言。使用基于Py-thon的Django作为Web应用框架,为现有的工单处理系统提供联机服务以进行智能推荐。此服务独立部署且可开启关闭,对原工单处理系统的架构几乎没有侵入性。应用架构如图1所示。


交通银行:基于人工智能技术实现银行工单智能派单

图1 智能派单系统应用架构图


智能派单系统主要由以下几个模块构成。

1.数据预处理模块。数据预处理包括数据抽取及数据清洗。工单管理系统中的原始工单数据无法直接用来训练,智能派单系统会将工单的描述文本以及该笔工单的正确归属系统抽取出来存入数据库。由于工单描述中并不是所有文本内容和该工单的归属系统存在联系,所以对入库的数据还需要做一次数据清洗来减少无关信息对训练结果的影响。例如描述文本中的标点符号,特殊符号都会在数据清洗中去除。

2.分词模块。中文语义的基本单位是词,所以为了将工单描述文本进行向量化,我们需要将工单描述文本分解为词。在实践中我们选用了jieba分词库来进行文本分词,该分词库采用正向最大匹配原则,通过内置词典及可扩展的外部自定义词典实现分词。由于银行业的工单有较高的专业性,工单描述中存在较多的专业词汇,在实践中我们针对性地将这些专业词汇作为外部自定义词典补充到分词库中以提升分词的准确性。

3.模型训练模块。利用人工智能技术对历史工单进行训练,将获得的规律作为模型保存下来是智能派单系统的核心。这个过程实际是一个文本分类的过程,主要又由以下三个步骤组成。

(1)文本的表示。为了使计算机可以理解预处理以及分词后的文本,我们需要将词语向量化表示。在本实践中我们使用word2vec模型将词表示为一个固定维度的稠密向量,该向量的每一维都包含了词语特征。与传统离散型的one-hot编码方式相比,使用word2vec模型进行词向量化在训练速度上更有优势。

(2)特征提取。中文语句的特征主要体现在词与上下文的局部相关性,我们选用TextCNN来对词向量进行特征提取,该算法是利用卷积神经网络对文本的词向量进行特征抽取的算法。如果分解后的词向量表示为一个D维向量,则一句长度为L的文本可以表示为一个L×D的矩阵。为了从一维卷积中获取不同的特征向量,我们使用可变宽度且大小为N×D的卷积核对该文本进行特征提取,这样每一个卷积核都会输出L-N+1个特征向量。将每一组卷积核提取到的特征向量的最大值级联可以得到该组卷积核的最终特征向量,再将每一组卷积核最终特征向量的最大值级联可以得到该文本的最终特征向量。

(3)分类器。由于工单分类是一种互斥的多类别分类,我们选择将所有文本的特征向量输入基于多项式分布建模的softmax分类器进行分类判定,输出每一个文本对应的类别并与已有的标签进行对比。通过验证分类结果和标注结果,进而不断反馈调整模型的参数,经过大量迭代的训练后保存分类准确率最高的模型及其权重参数。

4.联机服务模块。训练获得的模型以文件形式保存在服务器上,为避免每次进行工单智能推荐时都重新加载模型,智能派单系统部署了一个联机服务模块。该模块启动时会预加载模型并为工单处理系统提供一个基于RESTAPI规范的联机接口。此联机接口的输入为待分派工单的描述文本,输出为智能派单系统所推荐的系统,运维人员在工单处理系统上可根据智能派单系统返回的结果对工单进行及时分派处理。