2017-08-22 87 views
0

我正在用rasa-nlu构建聊天机器人。我阅读了教程,并构建了一个简单的机器人。但是,我需要大量的训练数据来构建能够预订出租车的聊天机器人。所以我需要数据来构建一个特定的机器人。构建聊天机器人的对话数据

是否有预订出租车的资料库或语料库? 或者有没有办法来生成这种数据集?

回答

3

这是来自Rasa创始人之一的博客文章,我认为它有一些非常出色的建议。我想你会以错误的方式寻求预先建立的训练集。自己开始,然后加上朋友等,直到你建立了一个最适合你的机器人的训练集。

Put on your robot costume

除此之外拉沙文档当rasa_nlu服务器运行这个improving model performance

下,它会跟踪所有的 预测它是由它们保存到一个日志文件。默认情况下,日志 文件被放置在日志/中。该目录中的文件每行包含一个 json对象。您可以修复任何不正确的预测,并将它们添加到您的训练集以改善解析器。

我想你会感到惊讶,只要你可以自己想出的训练集可以得到多远。

祝您找到语料库,但希望这些链接和代码片段都有帮助。这样做的

+0

谢谢你把我在正确的方向 – jsphdnl

1

的一种方法,这是,头部到LUIS.AI

使用Office 365的登录,制作自己的出租车预订应用程序,在意图给予和话语象下面这样:

enter image description here

enter image description here

现在培训并发布模型后,下载如下所示的语料库: enter image description here

现在,下载的语料后,它会是这个样子: enter image description here

安装RASA NLU,我的Windows 8.1我的机器上,这样的步骤如下:

这些是配置RASA的步骤:

首次安装: Anaconda 4.3.0用于安装Python 3的64位Windows。6翻译:https://repo.continuum.io/archive/Anaconda3-4.3.0-Windows-x86_64.exe

&

Python的工具为Visual Studio 2015年:https://ptvs.azureedge.net/download/PTVS%202.2.6%20VS%202015.msi

接下来,在命令提示符下安装顺序以管理模式下面的软件包:

  1. Spacy机器学习套餐:pip安装-U spacy
  2. Spacy Englis^h语言模型:蟒蛇-m spacy下载连接
  3. Scikit套餐:PIP安装-U scikit学习
  4. numpy的包数学计算:PIP安装-U numpy的
  5. SciPy的包装:PIP安装-U SciPy的
  6. Sklearn软件包意图识别:PIP安装-U sklearn-crfsuite
  7. NER小鸭的更好的实体识别与Spacy:PIP安装-U小鸭
  8. RASA NLU:PIP安装-U rasa_nlu == 0.10.4

成功安装上述所有包后,做一个spaCy配置文件将由RASA阅读,就像如下:

{ 
    "project": "Travel", 
    "pipeline": "spacy_sklearn", 
    "language": "en", 
    "num_threads": 1, 
    "max_training_processes": 1, 
    "path": "C:\\Users\\Kunal\\Desktop\\RASA\\models", 
    "response_log": "C:\\Users\\Kunal\\Desktop\\RASA\\log", 
    "config": "C:\\Users\\Kunal\\Desktop\\RASA\\config_spacy.json", 
    "log_level": "INFO", 
    "port": 5000, 
    "data": "C:\\Users\\Kunal\\Desktop\\RASA\\data\\FlightBotFinal.json", 
    "emulate": "luis", 
    "spacy_model_name": "en", 
    "token": null, 
    "cors_origins": ["*"], 
    "aws_endpoint_url": null 
    } 

下,作出这样的目录结构:

数据文件夹 - >将包含所有LUIS格式化语​​料库

模式 - >将包含所有训练的模型

日志 - >将包含主动学习日志和RASA框架日志

像这样,

enter image description here

现在,为培训和启动RASA NLU服务器创建批处理文件脚本。

请通过记事本或Visual Studio代码一个TrainRASA.bat和写:

python -m rasa_nlu.train -c config_spacy.json 
pause 

现在,通过记事本或Visual Studio代码进行StartRASA.bat和写:

python -m rasa_nlu.server -c config_spacy.json 
pause 

现在通过点击您刚刚创建的批处理文件脚本来训练并启动RASA Server。

现在,一切准备就绪,只火了铬,并发出HTTP GET请求,你enpoint /解析

像:http://localhost:5000/parse?q= &项目=

你会得到对应于LUISResult类JSON响应Bot Framework C#的。

enter image description here

现在处理你想这样做后执行业务逻辑。

或者,您可以看看RASA Core,它主要是为此目的而构建的。

RASA Core, which uses machine learning to build dialogs instead of simple if-else statements.