2009-08-17 34 views
1

我正在编写一种特殊的聊天/论坛软件,需要模拟对话来源以用于屏幕截图,演示和测试。对话模拟数据 - 从何处获取或如何生成

他们不应该包含真实姓名或其他可能有害的信息,应该是100%正确的英语,并且应该至少在某种程度上相互关联。

例子:

消息#1主题:你好,约翰,怎么 约柠檬水品脱? Text:嗨 约翰,只是想检查你是否有 下周某个晚上的免费晚上。我们 可能会出去喝点柠檬水。 你觉得呢?最好,苏

消息#2文字:嗨苏, 星期二怎么样。

等,但这些数百...

的是否有这样的事情在线来源?我想过要刮自己的电子邮件和删除名字,但这是很多工作。还想过把两个聊天机器人相互对抗,但不知道从哪里开始。任何线索?

回答

1

你想要:

  • 一个游戏,分成(演讲者,单词)元组。它应该很简单,可以使用Gutenberg的(f'rinstance)Macbeth和一些正则表达式将文本转换为这种格式。直接使用场景作为聊天线程,或者...
  • 一个马尔科夫链文本生成器,训练每个角色的语音,这将给你一个无限量的数据来玩。
0

让你的朋友和兄弟姐妹使用你的聊天软件。

+0

最终我希望这样做,但现在它是一个鸡和鸡蛋的问题。我需要这些数据来帮助我开发和测试软件。 – 2009-08-17 20:53:40

1

您也可以下载现成的聊天机器人的一个脚本,并适应他们使用HTTP聊天界面,其中一个例子是Chatbot-Elisa的Perl模块,甚至包括有两个机器人说话的例子:

Sally: Do you think coming here will help you not to be sad? 
Harry: We were discussing you -- not me. 
Sally: Does someone else believe I -- not you? 
Harry: You're not really talking about me -- are you? 
Sally: Do you sometimes wish you were not really talking about you -- are me? 
Harry: Why do you think I -- are you? 
Sally: Oh, I? 
Harry: Do you say you for some special reason? 
Sally: You're not really talking about me -- are you? 
Harry: What makes you think I am not really talking about you -- are me? 

所以你只需要添加将它们粘合到你的聊天引擎上的代码,并看看他们可以想出什么:)(或者,如果你所看到的只是“内容”,那么你可以使用“双人游戏机“example。

相关问题