porter-stemmer

    0热度

    1回答

    我有词干词语的问题。 当我使用词干,词不被索引,只有数字是 我觉得我的conf是坏的,但我无法找到互联网解决方案,所以我希望你能帮助我 这里是我的conf : PUT /myindex { "settings": { "analysis": { "filter": { "french_stop": { "type": "sto

    0热度

    1回答

    我试图读取文件并使用PorterStemmer来存储文件的文本的标记,我得到了这个错误。 tokens=preprocessTokens(line) File "/home/fl/git/KNN/preprocessDoc.py", line 20, in preprocessTokens line=line+' '+ps.stem(w) File "/usr/local/l

    0热度

    1回答

    我最近正在使用python在nlp中进行项目。我需要预处理一个包含许多行和列的文本的csv文件。我可以变得只能干简单的句子。并不能立即停止整个csv文件。我怎样才能做到这一点?

    0热度

    1回答

    我正在使用Lucene为词干。我在一个Java应用程序(主要)上进行了测试,并且工作完美。但是,在我的android应用程序(在onCreate)它不起作用。有谁知道为什么? 这是我在的onCreate代码,在主要和错误时,它的onCreate旋转: import org.tartarus.snowball.ext.PorterStemmer; import com.veryinteligent

    0热度

    1回答

    我testerfile包含: processes deleting agreed 这在C# PorterStemmer testing = new PorterStemmer(); string temp,stemmed; string[] lines = System.IO.File.ReadAllLines(@"C:\\Users\\PJM\\Documents\\project\

    0热度

    1回答

    当使用Stemmer Override Token Filter与包含所有规则的文件时,我遇到问题。它不工作!当使用内联规则时,它可以正常工作。有没有人知道为什么是这样? 不灵例如: "protwords": { "type": "stemmer_override", "rules_path" : "analysis/protwords.txt" } 工作示例: "protwords": {

    0热度

    1回答

    是否有任何算法执行任何Stemmers算法的逆向算法。也就是说,假设词干“要求”,如何找到词干“要求”的所有单词? 总是我们发现相同单词的变体,例如要求,要求,要求,要求。所有人都有“共同需要”。如果我们可以结合一个特征来识别所有词干“需要”的话,那将是非常好的。 我们试图词干的算法,这使得结果是这样的: 例外 - 除了 没有 - 诺斯 防止 - 防止 临床 - 临床 披露, - 披露 收集, -

    2热度

    1回答

    我有称为“data_stem”一个大熊猫数据帧和有一个名为“TWEET_SENT_1”,其有一个字符串象下面(50行) TWEET_SENT_1 列吻的万人迷交叉 我喜欢这个视频尸体派对 我想为“TWEET_SENT_1”列申请搬运工词干(对于行的所有的话) 我想下面的代码,它给出了一个错误。请你帮我克服这个 from nltk.stem import PorterStemmer, WordNet

    2热度

    1回答

    我目前在我的Java项目中使用Snowball Stemmer(Porter2)来干掉单词等。但是,它的词干或者不一定需要被阻止或者干扰过多?例如,online -> onlin,why -> whi,raise-> rais,appreciate -> appreci。 有什么办法,我可以尝试避免这种不必要的制止,因为我想它给我的话是有意义的,也需要加以遏制制止的话,如treating -> t

    2热度

    1回答

    我想了解雪球干扰算法。 HW90有类似的问题与例子,但不是我的。使用两个区域R1和R2的algorithmus被definied如下: R1是以下一个元音的第一个非元音之后的区域中,或者是 在字的末尾的空区域,如果有没有这样的非元音。 R2是在R1之后的第一个非元音之后的区域,或者 是如果没有这样的非元音 这个词末尾的空区域。 http://snowball.tartarus.org/texts/