我拥有数十万份法律文件(主要来自欧盟)的法律文件 - 法律,评论,法庭文件等。我试图通过算法对其进行一些理解。法律文本的NLP?
我已经建模了已知的关系(时间,this-changes-that等)。但是在单文档层面上,我希望我有更好的工具来允许快速理解。我很乐意提供想法,但是这里有一个更具体的问题:
例如:是否有NLP方法来确定与样板文件相关/有争议的部分?最近泄露的TTIP论文有成千上万张带有数据表的页面,但在某处某处可能会摧毁一个行业。
我在过去使用谷歌的新Parsey McParface
和其他NLP解决方案,但虽然它们的工作非常出色,但我不确定它们在隔离意义方面表现如何。