速卖通发布无忧物流和线上发货禁运品规则升级通知
1307
2023-04-24
本文目录一览:
随着人工智能的飞速发展以及广泛落地应用,越来越多的设备将会被植入智能问答技术,人机交互场景随处可见,智能问答在未来将会成为一个非常重要的入口。
腾讯小知凭借着业界领先的智能AI引擎算法和海量大数据仓库,已将智能问答技术落地实施,并且经过大量的业务考验和优化,知识点匹配度和准确率都已达到90%以上,在2018 年 GITC 全球互联网技术大会上,腾讯小知荣获年度互联网最具价值产品奖。
腾讯小知算法负责人陈松坚也在会场发表了关于智能问答技术原理及其在To B场景下的应用的专题演讲,从自己的角度为我们展现智能问答技术的最新成果。
他首先从智能问答是什么,为什么和怎么做的三个问题出发,阐明了他对当前智能问答技术的定位和价值,首先,现阶段的智能问答是信息检索技术的升级,是量变而未达到质变。但是无论在To B还是To C的场景下,当前的技术都能够切实解决一些用户的痛点,提升用户体验,是亟待推进和充满想象的方向。
在回答怎么做这个问题时,他详细介绍了几种不同的问答机器人的实现路径,包括单轮问答机器人,多轮问答机器人及阅读理解机器人。其中重点阐述了单轮问答机器人的实现原理,包括字面匹配,词向量匹配,深度语义匹配,迁移学习等技术。
此后他还分享了小知团队将上述技术产品化的经验,包括智能客服机器人和电话机器人两大块,主要分享了当前产品的形态,亮点和实际项目中取得的一些成果。
最后,他简单总结了小知目前完成的工作以及就智能问答的发展提出了自己的几点看法。
--------------------------------------------------------------
以下是演讲稿全文:
各位下午好,很高兴今天能在这里给大家做分享报告。先介绍一下,我们腾讯小知是致力于为政府和各行业提供一揽子智能问答解决方案的团队,目前已经落地的包括基于文本的智能客服机器人和基于语音的电话机器人等。
在大多数人的认知里,智能问答很可能是以上的3个印象,2011年打败了人类取得问答竞赛冠军的waston;2017年被沙特授予公民身份的机器人sofia;更为大家熟知的钢铁侠中的机器人管家jarvis。在大家心目中,智能就意味着能够像真人一样交流。然而作为从业者,很遗憾地告诉大家,目前的技术还远没有达到这个目标,我认为本质上目前的智能问答技术是对信息检索技术的一次升级,是量变而未到质变。这个皇冠上的明珠还等待我们去摘取。
既然问答技术还不成熟,那为什么还要投身到这个领域呢。我想从To B和To C两个角度去回答。对企业来讲,当前的问答技术虽然无法解答复杂的咨询,但是大部分的简单的头部问题是可以比较好的解答的。从本轮AI大潮NLP赛道的几名种子选手都从智能客服这个方向切入就可以看出企业是确实存在对智能问答的刚性需求。而对普通用户来讲,一方面siri等语音助手每天都在为用户提供便捷的交互界面,另一方面像amazon echo这一类的智能家居产品也逐步进入千家万户,成为物联网生态的中心入口之一,这便是智能问答的价值所在。
那如何实现智能问答机器人呢?我们先来看最基本的单轮问答机器人的实现原理。
熟悉搜索引擎的朋友会发现这个架构跟搜索引擎的很类似。单轮问答一般来说就是FAQ问答,是基于业务问答对组成的问答库进行检索匹配。其中FAQ问题集包含多个相似问法供用户问题去匹配。预处理阶段一般会进行文本纠错,标准化和底层NLP特征提取;召回阶段会在倒排索引中召回若干个候选问题(粗排),而最后的匹配阶段会基于各种模型进行匹配打分并返回得分最高的结果(精排)。匹配阶段还会引入其他模块,如知识图谱和拒识模型,目的是辅助提升匹配的最终准确率。
retrieval中的匹配可以看做是naive solution,词袋+VSM, 筛选候选够用了,但是精排需要更精致的策略,第一,要利用监督信息做拟合,我们构建基于问题对的训练语料,拟合是否匹配这个二分类目标。第二,特征上抛弃稀疏的词袋模型,而是构造各种相似度来做base scorer,然后利用非线性的抗噪能力强的xgboost来做融合,比如我们用到词bigram, 字bigram, 核心词,名词等特征集合的相似度。这种方法的优缺点是一体的,由于模型只学习字面相似的特征,因此不受领域影响,通用性强,适合用在冷启动阶段;但也因为只考虑字面相似,无法处理更深层的语义匹配。
那如何度量语义的相似呢。词向量技术的兴起是语义匹配的前提,所谓词向量,是将孤立的传统的token表示映射到相互关联的向量空间中,这种关联性,或者说是相似性,是通过词语的上下文的来描述的。也就是说,上下文越相似的词语,他们的语义就越相似,词向量的欧式距离就越近。这是很容易理解的,更妙的是,通过对向量进行简单加减运算,能够呈现出概念的关系,比如king-man+woman的结果非常接近于queen, 因此说明词向量能够一定程度刻画语义。那对句子如何做向量表示呢?一个简单的想法是直接求和平均,WMD是另一个比较有意思且有效的做法,他将计算句子到句子的相似度建模成一个运输的问题,把句子p的各个词,运输到q的各个词上,也可以说是变换;运输成本是词向量的cosine相似度,而要运输的是各个词在句子中的权重,用线性规划求解一个最优解,即为p到q的距离。另外还有个有效的方法是SIF,思路是做词向量加权求和,但是突显出句子中非通用的部分,即权重用词频倒数来计算权重,实验效果也很不错。
上面的方法有一个问题就是没有利用有监督信息,所以效果有明显的天花板。下面介绍这个工作是基于深层网络做有监督学习的匹配的,做法也比较简单,首先把句子文本用one-hot编码,假如词典大小是500K,那编码完长度就是500K维,其实等于是词袋模型,然后输入到一个多层的神经网络去学习,最终得到一个128维的向量作为句子的语义表示,然后用cosine计算两个句子与文档的相似度作为模型输出。这个方法其实是将高维稀疏的token特征映射到低维语义空间,跟词向量的思路很类似,只不过训练目标不同,并且这里使用了深层网络结构。
但是CNN对上下文的处理能力依赖于窗口大小,远距离就没办法处理了,因此要考虑另一种网络单元RNN,这种单元是专门为时序模型量身打造的,简单来说,每一时刻t上的隐藏状态,或者说第t个词上的语义编码,都由两个输入共同决定,即上一时刻的隐藏状态和当前时刻的原始输入,而为了解决远距离传递导致的梯度消失和梯度爆炸等问题,RNN有一些变种结构来应对,比如 LSTM和GRU等。
CNN和RNN都是对原始输入进行语义编码的基本单元,编码后的向量就可以接入多层感知机进行相似度计算,如果是直接计算cosine相似度,那就是dssm的升级版,而更常见的做法是把两个句子的编码向量拼接在一起,再经过一个多层感知机计算相似度,而这种方法统称为表达式建模;
另一种方案考虑到两个句子之间的交互信息对学习他们是否匹配显然更为重要,这一类方案被称为交互式建模,右边是一个典型的例子,他最大的不同是首先对两个句子的所有窗口组合进行拼接和卷积,得到交互信息。然后再进行多次卷积和池化得到表示。其他的交互方式还包括编码之后,进行交互操作,如作差,点乘等,还有计算attention表示,也是常见的交互方式。
下面介绍我们的方案,跟上面介绍的模型相比,我们的方案主要做了两处改动,一个是使用了稠密连接的网络结构,让rnn层的输入和输出拼接在一起做为下一层的输入,第二个是混合注意力机制,即在计算attention向量进行交互式建模的基础上,增加self-attention向量计算,然后把两个attention向量经过门机制进行融合,这样做一方面引入了问句间的交互信息,同时又增强了对自身的表达建模。
上面的模型是比较复杂的模型,参数量有5.8M。在实际中应用中训练语料会严重不足,为了解决这个问题,我们引入了迁移学习的策略。首先第一种是多任务联合学习,比如在拟合两个问句是否匹配的同时,也对问句进行分类预测;另外还可以同时对匹配的问题对做seq2seq的翻译模型训练。这两个策略都证明能有效提升准确率。
而另一个思路更加直观,即引入其他领域的语料,所谓多语料迁移。Fine-tune即参数微调是其中一种做法,即先用通用语料训练网络,固定底层表达层的参数,然后再使用领域语料调整上层参数;另一种思路参考了对抗学习的思想,即引入一个新的任务“混淆分类器”去判别当前样本是来自源语料还是目标语料,通过在损失函数中增加反向的混淆分类损失项,让混淆分类器尽可能地无法区分样本的来源,从而保证共享了参数的表达网络能够学习到两部分语料中共性的部分。
以上的介绍都是为了完成一个基本的单轮对话机器人,而实际应用中,往往存在需要需要交互的场景,比如查询社保余额,就需要用户提供指定信息,如姓名,身份证号,手机号等。这种是所谓任务导向型机器人,而另一种,基于知识图谱的机器人也往往会涉及到多轮交互。这里简单介绍一下多轮对话机器人的架构,整体上是一个对话管理系统,总的来说是管理会话状态,包含4个模块,分别是输入部分:自然语言理解模块NLU,负责意图识别和抽取槽位实体,比如这里匹配到了意图是查询社保余额,抽取到了社保号1234。得到的意图和槽位值会送入到对话状态追踪模块,DST,他负责会话状态的更新,形式化来说是一个函数,输入是当前状态s和当前的query经过NLU处理过得到的意图和槽位值q, 输出新的状态s‘,下一步是把s’送入DPL,对话策略模块,这个模块是根据新的状态s‘输出行动a,通常这个决策选择会依赖于一个外部数据库或知识图谱,最后,由输出部分,自然语言生成模块NLG负责将行动转换为自然语言文本,返回给用户。
前面提到的单轮FAQ机器人,有一个问题是问答准确率依赖于问答库的质量,而问答库的构建耗时费力,所以针对数据较大的非结构化文档,如果可以直接从中抽取答案,是非常理想的做法。比如斯坦佛大学开源的drQA,就是基于wikipedia的语料做的一个开放域上的问答机器人,我们来看看这种阅读理解机器人的架构示意,他也是基于检索重排的思路,首先把可能的文段从语料库中摘取出来,然后送入阅读理解模型进行答案定位,打分,排序和选择得分最高的答案。阅读理解模型与匹配模型是类似的,需要先对问题和候选文段进行编码表示,不同之处在于最终预测的目标是答案的起始和结束位置。我所在的团队在去年,在阅读理解的权威公开测评Squad v1中取得过第一的成绩,同时参加这个测评的包括了google, facebook, 微软,阿里idst, 科大讯飞等国内外同行。说明业界对这种技术还是非常看重的。
下面分享小知在把以上技术落地产品化的经验。首先我们来看看小知的整体架构图,核心引擎有两部分,一块是上面重点阐述的深度语义匹配模型,另一块是本次分享没有展开的知识图谱引擎,在此之上,我们构建了FAQ机器人,多轮会话机器人(任务机器人),闲聊机器人等。以下是我们单轮和多轮机器人的示例。
在我们实际的落地项目中,得益于深度迁移模型的语义匹配能力和行业知识图谱的的精准匹配和辅助追问,小知机器人能够做到95%左右的问答准确率,并且节省了50%以上的服务人力,切实为政府和企业提升效率和降低成本。
在智能客服的基础上,我们又打造了基于语音的电话机器人,力主融合智能客服,人工在线客服,工单系统和电话机器人,为客户打造从售前售中售后的整体解决方案。
以下是电话机器人的整体架构图,核心是自然语言理解NLU模块,负责识别用户提问意图
提取相关实体。根据NLU输出的结果,内置的对话管理引擎会进行流程状态流转和跟踪。
另外,ASR语音识别和TTS语音合成是不可或缺的重要服务,这三个模块相互协作,共同完成与用户的交互。
最后对智能问答的未来发展提几点我的看法。目前学术界比较公认的一个方向是,需要更有机地结合模型和规则,而在问答领域,规则的一大组成部分就是知识图谱,包括开放领域的知识图谱和专业领域知识图谱。而更进一步地,我们需要研究带有推理性质的事理型知识图谱去描述领域内的规则和知识,让机器人能够处理带有复杂条件的问题,提供更智能的回复。在我看来,智能问答的一个突破口就在于解决以上三个问题。以上就是今天分享的内容,谢谢大家。
主讲人介绍:
陈松坚,腾讯数据平台部算法高级研究员,有着8 年的 NLP 研发经验,2017 年加入腾讯 TEG 数据平台部,负责智能客服产品腾讯小知的算法规划和落地。负责过多个智能客服项目,对封闭领域的智能问答有丰富的实战经验。
由于从事智能客服领域,对智能客服的开发也有比较全面的了解,这里从AI技术的角度介绍一下。
智能客服机器人会用到很多人工智能方面的技术,比如自然语言理解、深度神经网络、知识图谱、语音识别、语音合成等方面的技术。为了便于您从总体上了解这些技术,以璞娲智能客服用到的技术为例,请参考下面不同角度的技术全景图。
要理解智能客服中的AI技术,我们可以从技术的应用过程来加以理解。比如电话应对过程中,智能客服会用到下面几种技术。
智能客服中用到的AI技术
上面从客服处理过程的角度介绍了几种技术范畴,
首先你要知道它一定要具备学习能力,接下来就是各种喂数据了。
可以从以下几个步骤着手:
(1)确定任务(智能客服);
(3)任务或问题的明确定义:当做分类任务解决 还是 直接生成回答的问题;针对不同的问题,分别考虑数据收集、收据处理、算法选型、评估方案与指标设计、实验设计、上线方案和运维等问题。
(4)详细分析好任务和待回答的问题后,就需要准备语料库(注重数据质量,好的数据质量,胜过最优秀的算法);
(5)数据预处理,将文本数据转换为词向量(有多种方法,如word2vec等等),考虑输入数据与标签数据组织形式,可以参考智能问答相关的开放数据集;
(6)数据分析,主要包括数据量大小的分析、词向量高维嵌入分析、如果是分类任务还要分析类别的数据平衡性;能想到的统计分析与数据处理方法都可以考虑,目标是数据高质量;值得一提:数据量的大小决定数据处理(如需要数据增广、类别平衡、数据上或下采样等)、方法的选择以及模型训练的方法(如使用预训练模型、考虑小样本学习方法等);
(8)实验与结果评估,注重训练数据与评价数据划分,科学/严谨实验,科学分析;利用设计指标进行评估并充分分析实验结果,寻找模型做得不好的样本案例(badcase);
(9)badcase分析与解决;
(10)上线前实测,逐步扩大用户使用范围;
(11)继续跟进和改进出现的问题,重复(1)~(10)的环节。
智能客服的主要价值在哪里?
在企业的经营中,客服是必不可少的角色,在很大程度上,客服是企业与客户唯一的直接接触通道,客服的价值在于解决用户问题,改善用户体验,提升企业口碑,营销促进交易等等,但传统的客服模式放到如今的互联网时代,短板立现。成本、效率、沟通方式等都有待提升与改进,由此,智能客服的价值得以凸显。
直观来看,智能客服对传统客服行业的主要价值体现如下:
1、智能客服在处理有明确结论的简单重复性问题上,展现了极高的工作效率,人工客服可以节省更多时间与精力去处理更为复杂、关键的客户问题,去服务VIP或是个性化需求更强烈的客户,从而达到提升客户满意度的效果。同时企业的人力、管理、运维成本都得到大幅下降。
2、智能客服在本质上是机器,机器没有生理局限,服务时长远大于人力,同时它也不存在情绪波动,可以实现百分之百的微笑服务,保持标准的服务质量。特别是在客户业务规模达到明显的波峰波谷时,智能客服可以在短期内实现大批量复制解决,以应对业务量的波动,实现弹性运维。
3、智能客服还可以应用在企业的营销活动中,在传统的电销时代,人工外呼作为很多企业的营销主要手段,耗时长,效果差,一个客服一天所能拨打的电话量有限,而电销恰巧又是一个需要“广撒网,多尝试”的营销方式。此时,智能客服交互系统中的呼叫中心功能就可以被很好的利用起来,增加呼出频率,扩大呼叫范围,提升呼叫中心的价值创造力。
智能客服既有这么多优势,那它的出现又是否会对传统的人工客服造成替代性的威胁呢?
其实不然,传统的客服行业就像是一座金字塔,人工智能并不是将它推倒重建,而是在思考如何做到机器辅助人工,部分代替人工,扩大金字塔的基层,稳固上层结构。
由此,智能客服的主要价值可以概括为:在满足企业对客服工作的需求的同时为企业减投增效,帮助企业更好的实现营收。
逻辑推理 知识表示 自动规划 机器学习 自然语言 感知 行动处理 人类情绪 计算创造 综合智能
只要用在合适的地方。无论各行各业,机器人代替人工,能够极大增强企业办公效率,增加收益,降低用人成本,人工智能的发展最大的受益者是人类。人类的创意是无限的,但是自身能力也是有局限性的,也需要机器人来辅助人类。所以各有优势,无所谓谁的业务能力强,都是相互弥补的。这没法比较。
随着电话服务热线的出现,以及企业客户服务的不断提高。在移动互联网时代,客户通信服务也变得多样化。除了申请400或95个号码建立客户服务系统来改善客户服务外,企业还通过网络服务、移动应用、公共***、微博等渠道提供服务。当越来越多的人以这种方式与企业员工接触时,当人工客户服务不能及时处理多个用户和问题时,导致客户体验差,再加上企业的雇佣成本不断增加,智能客户服务机器人顺应时代的到来。目前,智能客户服务机器人已经成为企业与用户之间最重要的通信工具。广泛应用于金融、教育、电子商务等领域。
最近,在微博上,我们总能看到一些客户服务机器人在本地测试市场上并不想象智能,自动回复单句严重,回复内容错误,人们想要有人工的客户服务来与他们沟通。问题是,客户服务机器人什么时候才能真正“理解”?编辑曾体验过腾讯、阿里小米、京东和大银行的在线客服平台。电子商务服务平台具有响应速度快、识别率高、产品促销个性化、信息优惠等增值服务的共同特点。但对这句话的理解却偏低。
在当前的客户服务中,机器人客户服务作为手动客户服务的辅助工具,帮助手动客户服务解决,解决客户的诸多问题,降低手动客户服务的工作压力,提高工作效率手动客户服务,大大提高了解决方***性。效力。然而,在与人类的对话中,客户服务机器人已经成为人类复杂情绪的难点。在接下来的几年里,客户服务机器人不会完全取代人们的工作。深入整合人机的“无人值守客户服务”是打破这一瓶颈的最佳方式。
所谓智能客服机器人实际上是一个人工智能信息系统,它可以用自然语言与用户进行通信。它使用了许多智能人机交互技术,包括自然语言理解和机器学习技术。它能够以文本或语音的形式识别和理解用户的问题,通过语义分析了解用户的意图,与用户进行人性化的沟通,为用户提供信息咨询等相关服务。
在当前人工智能迅猛发展的浪潮中,福山北明信息技术公司负责人表示,优秀的客户服务依靠人工实能和海量数据来深化客户服务场景的应用,不断优化、创新和完善。描述了“可定制”的智能客户服务,它能够准确地适应业务需求并继续学习,并帮助、适应和回答大量的常见问题。它大大提高了人类的效率。它可以广泛应用于网站、应用程序、电话客户服务甚至离线窗口。目前,优秀的客户服务已成为深圳平安公司的合作伙伴。在智能客户服务领域实现了战略合作。全面启动人机对话培训平台,为企业构建基于ai的智能客户服务解决方案。
2018年9月,发布了4.0.0正式版本的优秀客户服务,添加了群集和企业知识管理系统,使用群集解决方案支持多点部署方案,添加了企业知识管理系统组件,并拥有专业知识管理系统。和新的移动智能推荐。深入挖掘各种需求场景,人们对机器人的满意度并不低于人工。
佛山市贝米信息技术有限公司(www.youkefu.cn)成立于2017年3月,是一支年轻而充满活力的团队。公司的主要“优质客户服务”是一个全渠道的综合客户服务系统,集成了多个客户服务渠道,以帮助各个行业。各种规模的企业建立了客户服务体系。通过邮件,短信,电话语音,webim在线客服,***,微博,h5页面,app界面等各种渠道的客户服务请求和对话,集成在管理平台上,统一响应和支持客户服务。
当你打 10086 的电话,语音提示如下:
欢迎致电中国移动,
全心全意为您服务,
普通话服务请安 1,
For English service press pound key
...
我这个手机号用了 5 年了吧,打10086这个电话不下 50 次了,你还不知道我是不是说普通话?
以上只是举了一个最常见的例子。
随着智能技术的发展,越来越多的客服咨询都开始交由对话机器人解决。
就在最近,冠状病毒疫情爆发,大量民众通过手机或电脑咨询政府以了解最新的疫情信息和防控措施。在这特殊情况下,原本的人工客服是无法承接这么多咨询的,而客服客服就尤为重要。
简单来所,智能客服系统 主要基于自然语言处理、大规模机器学习、深度学习技术,使用海量数据建立对话模型,结合多轮对话与实时反馈自主学习,精准识别用户意图,支持文字、语音、图片等富媒体交互,可实现语义解析和多形式的对话。
但是每个行业有自己的业务特点和知识范围,每个呼叫中心公司都应该根据自己的业务,逐步解决最基本的问题。
比如10086,一次次重复问你说普通话还是英语。
智能服务是一个过程,不是结果。
随着AI人工智能赋能客户服务。智能客服系统应运而生。
智能客服在提升企业服务质量和工作效率,降低企业管理和运营成本,提高企业的核心竞争力方面有着重要作用。
比如,我们利用AI技术能够同时实现 智能语音导航、智能话务员、智能工单管理、智能数据分析、智能语音质检、智能外呼 等功能。
并且能够与用户原有的呼叫中心系统有效对接,具有简单操作易上手、功能齐备、实用性强的特点。
如果企业想实现客户服务精细化运营管理,可以考虑试用哦~
一、智能机器人的能力
人工智能客服系统的核心能力主要体现在智能机器人上,企业在选择机器人前,需要了解机器人有哪些功能或能力,可以帮助企业做选择参考。智能客服机器人通常包含以下几项关键能力。
(一)自然语言识别能力
机器人拥有自然语言识别能力,可以帮助机器人更好的理解人类语言。举个例子来说:人类对于一个问题会有多种不同的方式,机器人需要理解问题中的关键点,从而找到对应的问题。这是考察机器人性能时较为重要的指标。
(二)知识库和自主学习
知识库相当于机器人的大脑,企业需要在使用初期为机器人建设一套知识库。这就相当于给新员工一个产品介绍或业务资料。在对接客户时机器人会从已有的知识库中搜索问题的答案。在不断接受问题和解决问题的过程中,智能客服系统机器人会完善知识库,将处理的问题积累下来,就形成了自我学习能力。通过这种方式可以方便以后更好的解决客户问题。
(三)其他能力
有些智能客服机器人会有一些扩展能力,能通过网络/API接口找到一些其他资源,比如:查询快递、查询天气等等。具体来说:电商客服也许可以在与来客交谈时,帮助客户查询快递情况,这类需要由机器人就能完成了,并且速度和准确度都可以保证,无需额外的人力来处理这类问题。
二、人机对话有温度
智能客服机器人不仅能替代人工客服的工作,在拨通用户电话后,还可以像真人一样与用户进行沟通交流。而这些需要大量的人工智能技术支出,比如自然语言处理、语音识别等多个领域。
发表评论
暂时没有评论,来抢沙发吧~