h2.each {|k, v|
@count += 1
puts @count
sq.each do |word|
if Wordsdoc.find_by_docid(k).tf.include?(word)
sum += Wordsdoc.find_by_docid(k).tf[word] * @s[word]
end
end
rec_hash[k] = sum
sum = 0
}
H2下面的代码 - >是包含文档ID的散列,散列包含比这些 Wordsdoc 1000更多 - >是我的数据库中的模型/表格... sq - >是一个包含大约10个单词的散列
我在做什么是我要通过每个文档ID然后每个单词sq如果单词存在(Wordsdoc.find_by_docid(k).tf.include?(单词),我在Wordsdoc表中查找,这里tf是{word => value}的散列表
如果确实如此,我得到这个词的价值Wordsdoc并且与词的@s价值倍数它,这也是{字=>值}
这似乎是一个哈希运行非常慢。每秒处理一个文件。有没有办法更快地处理这个问题?
非常感谢您的帮助!