2011-08-01 72 views
3

我正在重新搜索Solr的Whoosh搜索应用程序。我现在从快速入门了解到。但我一直在每一次我不得不处理字符串是否需要所有字符串都是unicode?

>>>writer.add_document(iden=fil, content=F2T.file_to_text(fil_path)) ValueError: 'File Name.doc' is not unicode or sequence

,然后遇到了问题:

>>>query = QueryParser("content", ix.schema).parse("first") 
AssertionError: 'first' is not unicode 

和线从快速启动turorial来直!飞快请求所有字段都在unicode?让我的应用程序能够识别unicode(甚至不值得),这将是一件非常辛苦的工作。至于“不是unicode或序列”,我知道字符串也是一个序列数据类型。

+0

你为什么不邮件列表或论坛上嗖问? –

+0

嗯,这是Whoosh查询的最佳选择吗? – aitchnyu

+0

好吧,如果您对特定软件有疑问,您可以通过询问知道该软件的人而不是将其发布到常规编程问答网站上来获得答案。 –

回答

8

是的,它需要字符串是Unicode。

query = QueryParser("content", ix.schema).parse("first") 

修改成:

query = QueryParser("content", ix.schema).parse(u"first") 
相关问题