2011-08-12 38 views
1

我对iMacro脚本世界很陌生,因此我很难获得(我相信是)一个非常简单的数据刮擦工作。简单的iMacros循环和提取

我希望抓取的网站包含一个索引页面(每个新行都是产品页面的超链接),然后是产品页面(每次都有相同的格式)。我想宏观做到以下几点....

  1. 单击第一个超链接(表行即POS1
  2. 一旦加载页面,刮去10场(总是会在每个相同的地方页)
  3. 转到BACK(索引页)
  4. 递增到下一个超链接(表格下一行即POS2
  5. 中提取数据,并重复
  6. 将数据导出为一个单一的文件/ C SV每组刮数据是一个新行/列

这是我迄今为止...(链接删除,因为它需要登录)

VERSION BUILD=7401598 
TAB T=1 
TAB CLOSEALLOTHERS 
URL GOTO=https://XXXXXXXXXXXX 
TAG POS={{!loop}} TYPE=TD FORM=ID:form1 ATTR=TXT:* 
TAG POS=8 TYPE=TD FORM=ID:form1 ATTR=TXT:* EXTRACT=TXT 
TAG POS=6 TYPE=TD FORM=ID:form1 ATTR=TXT:* EXTRACT=TXT 
TAG POS=20 TYPE=TD FORM=ID:form1 ATTR=TXT:* EXTRACT=TXT 
TAG POS=24 TYPE=TD FORM=ID:form1 ATTR=TXT:* EXTRACT=TXT 
TAG POS=22 TYPE=TD FORM=ID:form1 ATTR=TXT:* EXTRACT=TXT 
TAG POS=34 TYPE=TD FORM=ID:form1 ATTR=TXT:* EXTRACT=TXT 
TAG POS=38 TYPE=TD FORM=ID:form1 ATTR=TXT:* EXTRACT=TXT 
TAG POS=42 TYPE=TD FORM=ID:form1 ATTR=TXT:* EXTRACT=TXT 
TAG POS=46 TYPE=TD FORM=ID:form1 ATTR=TXT:* EXTRACT=TXT 
TAG POS=66 TYPE=TD FORM=ID:form1 ATTR=CLASS:labelBold EXTRACT=TXT 
SAVEAS TYPE=EXTRACT FOLDER=C:\iMacrosExports\ FILE=Extract_{{!NOW:ddmmyy_hhnnss}}.csv 
WAIT SECONDS=2 
BACK 

上面的脚本只有从第一个产品页面收集数据,并将其导出为多个CSV(但我多次声明它为循环)。

任何帮助将非常感激。如果您需要更多信息,请让我知道。

+0

我相信'{{!LOOP}}'[应该大写(http://wiki.imacros.net/ !LOOP#See_Also)。 –

回答

1

您的宏看起来没问题。我只会在最后删除BACK命令,因为你有在每个循环回到索引页面的URL GOTO。只要你使用“播放(循环)”按钮,它应该工作...

宏是否工作,如果你手动增加POS的价值?我的意思是,你首先运行POS = 1(而不是{{!loop}},然后再用POS = com或张贴在iMacros forum你的问题。

问候,

玛西娅