2013-12-18 31 views
0

我有一个内容数据库,其中大多数是HTML页面,然后用于显示应用程序。我如何搜索HTML中的内容而不是标签

我们正在寻求建立一个搜索功能,但我对由于包括HTML代码在内的结果而出现的误报有一些担忧。

E.g搜索“标题”将返回具有

目前,我们正在使用NSPredicates执行核心数据数据库查询标题HTML标记的任何内容的网页。

有没有简单/有效的方法来防止返回这些结果?

我在Windows和Android上也有同样的问题!

+0

http://stackoverflow.com/questions/240546/removing-html-from-a-java-string – dymmeh

回答

1

iOS的一个想法是实际存储除HTML版本以外的单独文本版本。然后,您可以用很简单的(即使不是很有效)谓词躺在

[NSPredicate predicateWithFormat:@"text CONTAINS[cd] %@", searchText]; 

更高性能的方法是将剥离出来的话和他们小写存储在另一个实体的索引属性。

在这两种情况下,解析都应事先通过其中一个可用库进行(请参阅,例如,评论中的链接)。

相关问题