我正在研究通过数据库(特定纽约时报在线数据库http://query.nytimes.com/search/sitesearch/#/McCain/from20061201to20080603/allresults/1/allauthors/oldest/)html代码解析以查找某些关键字的项目,但它从Oracle获取的代码无法获取完整的HTML。我已经能够使用此代码之前的其他项目,所以我不知道为什么它不读取所有的HTML。在Java中获取完整的HTML
谢谢:)
URL oracle = new URL("http://query.nytimes.com/search/sitesearch/#/McCain/from20061201to20080603/allresults/1/allauthors/oldest/");
URLConnection yc = oracle.openConnection();
yc.connect();
BufferedReader in = new BufferedReader(new InputStreamReader(
yc.getInputStream()));
System.out.println(yc.getContentType());
String inputLine;
while ((inputLine = in.readLine()) != null)
System.out.println(inputLine);
in.close();
你什么意思“不工作”和“完整的HTML”呢? – pvg
我的意思是我的项目只打印掉部分HTML,并且缺少我想要的HTML部分,我怀疑这是因为该网页正在加载 –
对不起,太模糊了 –