2017-05-04 120 views
-2

如果公司公共网站在网站上添加文档,我想获得通知。我需要为大约400个公共场所做这个。由于每个站点都有不同的文档目录,因此我将在本地服务器上为Mysql中的所有站点目录信息创建数据库。如何在公共网站上找到网站页面添加

例1

http://www.hubpower.com

的文件目录被放置在以下路径

http://www.hubpower.com/wp-content/themes/hubco/pdf/

有进一步两个文件在上述文件夹链接:

http://www.hubpower.com/wp-content/themes/hubco/pdf/3Q2K17%20Result.pdf http://www.hubpower.com/wp-content/themes/hubco/pdf/1910-financial-results-announcements-(dec-2015).pdf

例题

http://www.pk.abbott/investor/investor-information.html

有两个文件目录放在以下路径

http://dam.abbott.com/en-pk/documents/pdf/investors/ http://dam.abbott.com/en-pk/investor-relations/

这里就被文档链接:

http://dam.abbott.com/en-pk/documents/pdf/investors/Q12017.pdf http://dam.abbott.com/en-pk/investor-relations/2016Q3.pdf http://dam.abbott.com/en-pk/investor-relations/Abbott_A_R_2016.pdf http://dam.abbott.com/en-pk/investor-relations/AR2015.pdf

如果网站添加上述路径上的任何更多的PDF文档,我想对电子邮件通知以及进一步从下载网站目录中的新文档到我的本地服务器。

请建议一些解决方案来实现此目标。我喜欢与 平安,PHP,Angularjs,的NodeJS,蟒蛇工作,Javacript

感谢&问候

回答

0

你可以使用任何Website Content Changes toolChrome Plugin Visualping可以向您发送电子邮件。

Form this Answer 一般而言,如果没有其他可能的新闻提要,您将需要轮询网站。你不能强迫他们提供这样的服务。

对于维基百科的详细信息,有实时更新的IRC流,每个项目一个。 Wikistream就是这样一个读取Feed的应用程序,你可以在github上查看它的开源的node.js代码。

+0

通过使用nodejs和请求模块。它需要文件的静态路径。目录是固定的,但文件名将会改变。我想在文件添加目录时有电子邮件,并且还有自动下载此文件的服务 – user1480032

+0

感谢您为网站内容更改工具和Chrome插件视觉平。显然,如果页面发生变化,他们会发送电子邮件。 – user1480032

0

可以使用的NodeJS和request模块获得的HTML你提的每一个400页,那么你cheerio解析它,然后你用mysql模块把所有的数据到数据库中,你也可以检查您所搜索的数据已经存在于您的数据库中,如果是的话,您什么都不做,您可以像每天一次这样做