2012-10-27 168 views
0

我想从网站上刮取一些内容,但必须先登录才能查看特定内容。我想使用用户名登录使用用户名&密码和保持会话cookie在:m.amway.com我尝试使用Jsoup ....但是,使用下面的代码后,我意识到,Jsoup无法阅读JavaScript这是什么网站是基于.... 有没有人有一种方法,我可以使用登录,保持会话cookie,并刮擦内容,使用Jsoup以外的东西?提前致谢。网站登录并保持会话cookie

public String Jlogin(String User, String Pass) throws Exception{ 

    String title = "didnt work"; 

     Response logRes = Jsoup.connect(AmwayURL) 
       .data("userid", User) 
       .data("userpswd", Pass) 
       .method(Method.POST) 
       .execute(); 
     // get all cookies 
     Map<String, String> cookies = logRes.cookies(); 
     Document doc1 = logRes.parse(); 
     String sessionId = logRes.cookie("JSESSIONID"); 
     Document doc2 = Jsoup 
       .connect("https://m.amway.com/business/volume/pvbv/inquiry.ashx") 
       .cookie("jsessionid", sessionId).get(); 
     System.out.println(doc2); 

     title = doc2.toString() + "................." + sessionId; 

    return title; 
} 
+0

有专为刮数据框架。而我没有看到这与Android的相关信息 – onemach

+0

这是一个android应用程序 –

回答

0

您可以使用一个更大的API,称为HttpClient。

具有以下类: - HTTPGET - HttpPost - HttpEntity - 的HttpResponse

的HttpResponse从任何页读取的Javascript,如下所示: EntityUtils.toString(HttpResponse.getEntity());

有关如何使用API​​,检查此链接的详细信息(帮助的极端): http://www.codeblues.in/blog/?p=5