2011-02-28 90 views
0

我正在使用Java和Cassandra DB构建社交Web应用程序。我希望我的数据库中的一些数据对搜索引擎可见。 由于我的应用程序是完全动态的,&仅包含数据库中的数据而不包含静态页面中的数据,因此抓取工具如何读取此数据?启用搜索引擎从Web应用程序索引数据

1.)如何确保存储在我的服务器上的数据可以被搜索引擎看到?我的应用程序包含用户特定的数据

2.)搜索引擎如何访问该数据?

3.)我怎样才能限制搜索引擎只抓取一些特定的数据?

回答

0

1)您需要将用户特定的信息与公共信息分开,或者您应该有公共和专用页面 - 或者您可以通过基于会话的Ajax调用来修饰您的公共页面。

含义:浏览器只是加载页面的公共版本,而javascript会加载用户的具体信息并将它们注入页面。

2和3可以通过向Google上传站点地图解决。

还是要Google直接与Cassendra交谈......?然后忽略以上所有 - 我想。

+0

“或者你不想Google直接与Cassendra交谈...?然后忽略上述所有内容。”这会是一件好事吗? – 2011-02-28 11:46:44

+0

关于第一点,抓取工具只有在向前端用户显示数据时才读取数据?有没有机制可以让他们只是从后端安全地访问数据 – 2011-02-28 11:50:36

+0

你应该考虑那些不支持cookies或javascript的抓取工具用户。 – Tonny 2011-02-28 12:00:35

1

阅读the explanations from Google

搜索引擎像访问您网站的任何其他用户一样访问您的数据:通过浏览并点击他们找到的所有链接。只能通过AJAX访问的内容将更难以通过搜索引擎访问。

使用robots.txt文件可以限制访问。解释在上面给出的链接中给出。

+0

但如果我的应用程序只允许验证会话?数据如何被引擎访问 – 2011-02-28 11:52:13

+0

对不起您的链接被破坏 – 2011-02-28 11:53:01

+0

我修复了链接。如果您的网站是私人的,那么搜索引擎将无法访问它。但为什么它会有用:无论如何,它们显示的所有搜索结果都将无法访问。 – 2011-02-28 11:57:36