2009-07-07 53 views
2

我正在与客户端合作将网站从现有生产硬件迁移到新的硬件环境。现在看起来像是一个很好的时间来执行审计并删除任何旧的或过时的内容,而不是盲目复制它。网站内容清理工具?

是否有我可以使用一台服务器上的实际文件的网络访问的内容比较的服务器上看到的内容实际上是被链接什么和使用的任何好的免费工具或脚本?

在此先感谢您的帮助!

回答

0

我敢肯定是有的,但我敢肯定,没有一个是可以做的比你可以自己一个更好的工作,你知道?这个网站有多大,你自己编码?

+0

该网站是非常大的,在2-3000页,再加上所引用的图片和文件的范围内的某处。手工操作不太实际。 我可以写一个脚本来解析每一页,提取链接并检查它们直到完成,记录每个找到的页面。然后与文件系统进行比较,但这需要很长时间。 我不是第一人,要做到这一点,所以我想肯定会有一些免费或开源的工具,可以帮助,我只是不知道的人。 – 2009-07-07 09:06:14

2

嗯,首先你可以使用一个工具,如Xenu's Link Sleuth蜘蛛所有页面发现断开的链接等。我们在我们的Intranet上使用此工具来查找并修复我们断开的链接。它是免费的,并完成工作。

,我们已经使用了系统之间迁移的另一个工具是一个搜索引擎。一个好的搜索引擎会抓住你的所有页面并显示链接之间的双向关系。这可以帮助您找到哪些内容与最多的链接以及哪些内容可能是孤立的。不幸的是,这类的工具不是免费的。