我目前正在尝试编写JAPE规则,可以从原始研究文章中识别评论。 假设我想突出显示一个短语,例如“在本评论中我们将讨论...”,“评论总结..”等。 现在我有:JAPE规则区分文档
Phase: Review
Input: Token
Options: control = appelt
Macro: REVIEWTERM
({Token.string ==~ "[Rr]eview"} |
{Token.string ==~ "[Oo]verview"} |
{Token.string ==~ "[Mm]inireview"} |
{Token.string ==~ "[Ss]tudies"} |
{!Token.string == "trial"} |
{!Token.string == "case", !Token.string == "report"})
Rule: Mainreview
(
({Token.category == "IN"})?
({Token.category == "DT"})?
(REVIEWTERM)
({Token.category == "PRP"})?
{Token.category == "VBZ"}
): review -->
:review.Review = {rule = Mainreview}
但它不能正常工作。你能告诉我哪里出了错?
感谢您的回答! a)POS标记器在JAPE传感器之前执行。 b)大多数单词“review”后面跟着一个单词,这就是为什么我选择了VBZ类别。该规则适用于主题中的短语,但它也突出垃圾,如“IBD是”,“是”,这不是我正在寻找的评论文章的标志 – smirnovalee