我试图抓取两个独立的农场,但无法让它在任何一个上运行。他们都具有两个WFE,并将其他WFE配置为索引服务器。还有一台专用于查询的服务器和两台用于数据库的集群SQL 2005后端服务器。我没有成功尝试过至少50个不同的网站,我通过搜索引擎找到了解决方案。我已配置(扩展)我的Web App,以将http://servername:12345用作默认区域,将http://abc.companyname.com用作自定义和Intranet区域。当我进入每个那些到内容源,然后再尝试运行爬,我得到的爬网日志几个错误:MOSS 2007爬行
http://servername:12345回报:
“无法连接到服务器请确认网站是可访问的。“
http://abc.companyname.com回报:
“由采集删除(起始地址或包含此项目已被删除,因此该项目被删除的内容源。)。”
不过,我可以单击这两个网址和页面是可访问的。
任何想法?
更多信息:
我两讫,可以这么说,跑到另一抓取提供更新的样本。
我的内容来源是这样:
http://servername:33333
http://sharepoint.portal.fake.com
SPS3://服务器名称:33333
我现在爬网日志错误是:
SPS3://服务器名称:33333
PortalCrawl Web服务中的错误。
http://servername:33333/mysites
内容是由服务器,因为没有一个索引属性排除。
http://servername:33333/mysites
抓取
STS3://服务器:33333/contentdbid = {62a647a ...
抓取
STS3://服务器:33333
爬
http://sharepoint.portal.fake.com
爬取程序无法与服务器通信。检查服务器是否可用并且防火墙访问配置是否正确。
我仔细检查了上面的错别字,我没有看到任何,所以这应该是一个准确的反映。