0

我的客户和我的支持人员之间有20,000条消息(电子邮件和实时聊天的组合)。我也有我的产品知识库。建议基于文本内容的how-to文章列表

很多时候,客户提出的问题都很简单,我的支持人员只是将它们指向正确的知识库文章。

为了节省我的支持人员时间,我想要做的是根据初始用户的支持请求向我的员工展示可能相关的文章列表。这样,他们可以将链接复制并粘贴到帮助文章,而不是加载知识库并手动搜索文章。

我想知道我应该调查什么解决方案。

我的想法的当前行是对现有数据运行分析和使用文本分类方法:

  • 对于每封邮件,看看是否有一个链接到一个响应的how-to文章
  • 如果是,提取关键短语(微软认知服务)
  • TF-IDF?
  • 将每个操作都视为属于多组关键短语的“分类”
  • 使用一些有监督的机器学习,支持向量机可能用来预测哪个“分类”,又名“how-to article”属于确定的关键短语从一个新的支持票。
  • 将新的响应反馈回集中以使系统更加智能化。

不知道我是否过于复杂的事情。任何建议如何做到这一点将不胜感激。

PS:将“关键短语”倾倒到我们知识库的搜索查询中的天真方法产生的结果很差,因为帮助文章的内容通常与某人在电子邮件或实时聊天中如何说出他们的问题不同。

+0

这是我刚刚获得的机器学习理论的一个有趣应用! – JackCColeman

回答

0

沿着“垃圾邮件”分类器的简单分类器可能工作,但每个常见问题解答将是一个功能,而不是垃圾邮件的单个功能分类器,而不是垃圾邮件。

大多数垃圾邮件分类器都以单词/短语词典开头。你已经有了一个天真的方法开始。但是,与您的方法不同,垃圾邮件分类器不仅仅是文本搜索。本质上,在垃圾邮件分类器中,客户电子邮件中的每个字都被赋予一个权重,权重总和表示邮件是垃圾邮件还是非垃圾邮件。现在,将其扩展到与FAQ相同的功能。即:FAQ1或不FAQ1,FAQ2等

由于您的支持人员可以轻松识别电子邮件需要哪些常见问题解答,因此使用监督学习算法将是适当的。为了减少任何错误分类错误的影响,请考虑应用程序向支持人员提供客户的电子邮件,然后是计算机生成的响应,并且所有支持人员需要做的是批准响应或修改响应。修改响应应该会在训练集中产生一个新条目。

支持向量机是一种实现机器学习的方法。但是,在使用更复杂的方法之前,您可能会首先提出这种解决方案,以便在首先确定问题的过程中提前解决问题,然后尽可能使用简单的方法进行工作。毕竟,如果一个多功能的垃圾邮件分类器的工作原理为什么投入更多的时间和金钱在别的东西上也行得通?

最后,根据您的系统,这是我想要做的事情。