2011-09-22 38 views
0

互联网机器人如何在网站上随机填写表格?我猜测他们下载HTML源代码并找出表单的存在。但是,他们究竟如何填写并实际提交信息?互联网机器人 - 填写表格

我知道很多表单使用验证码,但一些系统也使用像检测鼠标移动,键盘事件等技术来区分人类和机器人。机器人也可以打败他们。

基本上,我想知道是否有任何方式的机器人可以跟踪代码中的JavaScript更改,即动态更改页面?

P.S:我正在使用这个信息进行一个关于打败机器人的技术的研究项目。

+0

也许,谷歌可以帮助你?因为,对不起,你对主题没有理解,认为这是你的毕业工作。如果你不知道他们是什么,你打算如何阻止机器人? – c69

回答

1

一些测试平台,如Watir实际上执行鼠标和键盘操作,而不仅仅是HTTP请求(所以你可以避免使用Javascript中的任何僵尸预防方法)。这意味着区分机器人和人类基本上是不可能的。像Captcha这样的东西依赖于机器人无法正确识别图像中的单词或单词,但即使这样,在某些情况下,也可能会破坏OCR

基本上有很多措施可以阻止漫游器,但是如果他们勤奋的话,阻止它们几乎是不可能的。

1

您并不特别需要始终下载源代码。你可以手动找到表单字段,然后构建提交的东西(几乎任何东西,例如Python脚本)。

<form action="submit.php" method="post"> 
<input name="url" /> 
<input name="name" /> 
<input type="submit" /> 
</form> 

然后使用任何语言将POST请求发送到site.com/submit.php。一般用数据“url = xxx & name = xxx”。

基于标签虽然不太可能,你可以使用JS或HTML。

1

查看脚本语言的有状态浏览器。 Python有这个模块mechanize