2015-05-20 144 views
2

我在配置&测试指标配置Lucene搜索索引与lukeall工具,它搜索的定义模板,但网页上内容的所有字段不被索引组件使用未搜索的其它外部组件,但页面字段中的数据是可搜索的。 有什么方法可以像html搜索那样搜索它,这样就可以对页面上的所有数据进行索引。在Sitecore的Lucene搜索索引

谢谢你们。

回答

3

这是一个常见的要求。

该屏幕截图概述了爬网程序循环浏览页面的每个组件(大约38分钟)的方法。

http://www.techphoria414.com/Blog/2012/May/Sitecore_Page_Editor_Unleashed

上面的例子使用旧的高级数据库抓取,但原则是声音。

另一种常见的方法是在您的索引中创建一个计算字段,这会导致应用程序向页面发出请求,因此它可能会被刮掉。

https://github.com/hermanussen/sitecore-html-crawler

我的选择是第二种选择,因为它更准确的

+0

感谢您的回复我们已经实现了计算字段,该字段对我们来说工作正常,并且在完成发布时重建索引吨。 这也是由sitecore向我们推荐的 –