获取网页内容 - 浏览器不支持框架

我有一个代码片段是这样的：获取网页内容 - 浏览器不支持框架

webUrl = new URL(url); 
reader = new BufferedReader(new InputStreamReader(webUrl.openStream()));

当我试图得到一些网页，我得到响应我的浏览器不支持框架的HTML内容。所以我没有得到页面的真正的HTML。有没有解决方法？也许告诉程序注册为某些浏览器？

对我来说，只有拿到html才是关键，那么我想解析它。

编辑：无法从浏览器中的HTML获取帧的src。它隐藏在js中。

来源

2011-09-27 shake

您必须在HTTP请求中设置用户代理字符串，以便服务器认为您支持框架。我建议像HtmlClient或HttpClient这样的东西。

来源

2011-09-27 12:44:34 michael667

“您不支持框架，我们没有在此放置明智的替代内容”消息将位于<noframes>元素中。您需要访问相应的<frame>元素，访问其src属性，解析其中的URI，然后从中获取数据。

来源

2011-09-27 11:38:57 Quentin

那么我不能罚款iframe标签的src属性。看起来我需要的内容是在框架之外。 ..正如你所看到的，这里。我需要的内容是在这个代码下面。 – <span class="text-secondary"> <small> <a rel="noopener" target="_blank" href="https://stackoverflow.com/users/94424/">shake</a></span> <span></span> </small> </span> </p> </div> </div> </div> <div itemprop="comment" class="post-comment"> <div class="row"> <div class="col-lg-1"><span class="text-secondary">+1</span></div> <div class="col-lg-11"> <p class="commenttext">假设它是由JavaScript设置的，所以你需要对JS进行反向工程，找出它在做什么。 – <span class="text-secondary"> <small> <a rel="noopener" target="_blank" href="https://stackoverflow.com/users/19068/">Quentin</a></span> <span></span> </small> </span> </p> </div> </div> </div> </div> </div> </article> </div> <div class="clearfix"> </div> <div class="relative-box"> <div class="relative">相关问题</div> <ul class="relative_list"> <li> 1. <a href="http://www.uwenku.com/question/p-fhmyhsbv-bko.html" target="_blank" title="流星网络框架支持哪些网页浏览器？"> 流星网络框架支持哪些网页浏览器？ </a> </li> <li> 2. <a href="http://www.uwenku.com/question/p-hgrlwovi-bdz.html" target="_blank" title="浏览器不支持帧"> 浏览器不支持帧 </a> </li> <li> 3. <a href="http://www.uwenku.com/question/p-fpdagjjo-bkz.html" target="_blank" title="支持网页框架"> 支持网页框架 </a> </li> <li> 4. <a href="http://www.uwenku.com/question/p-egcakcpk-yg.html" target="_blank" title="浏览器缓存HTML框架内容"> 浏览器缓存HTML框架内容 </a> </li> <li> 5. <a href="http://www.uwenku.com/question/p-wpagkwhr-bas.html" target="_blank" title="捕获网页内容wpf网页浏览器"> 捕获网页内容wpf网页浏览器 </a> </li> <li> 6. <a href="http://www.uwenku.com/question/p-ngjqpdkd-boa.html" target="_blank" title="浏览器支持“e.target.files”"> 浏览器支持“e.target.files” </a> </li> <li> 7. <a href="http://www.uwenku.com/question/p-vgoexrvk-ha.html" target="_blank" title="C＃WinForm Web浏览器不支持的浏览器"> C＃WinForm Web浏览器不支持的浏览器 </a> </li> <li> 8. <a href="http://www.uwenku.com/question/p-dsiykusg-e.html" target="_blank" title="错误，本页面使用框架，但您的浏览器不支持"> 错误，本页面使用框架，但您的浏览器不支持 </a> </li> <li> 9. <a href="http://www.uwenku.com/question/p-owwdosqk-xs.html" target="_blank" title="浏览器支持"> 浏览器支持 </a> </li> <li> 10. <a href="http://www.uwenku.com/question/p-eudloyqr-dd.html" target="_blank" title="是否有支持IE 5等浏览器的跨浏览器JavaScript框架？"> 是否有支持IE 5等浏览器的跨浏览器JavaScript框架？ </a> </li> <div> <script async src="https://pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <ins class="adsbygoogle" style="display:block; text-align:center;" data-ad-layout="in-article" data-ad-format="fluid" data-ad-client="ca-pub-6208739752673518" data-ad-slot="4606349252"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> <li> 11. <a href="http://www.uwenku.com/question/p-hazxckvp-bbp.html" target="_blank" title="网页浏览器内的网页浏览器"> 网页浏览器内的网页浏览器 </a> </li> <li> 12. <a href="http://www.uwenku.com/question/p-mzomccor-gn.html" target="_blank" title="支持PhoneGap和主流浏览器的HTML | JS | CSS框架/库"> 支持PhoneGap和主流浏览器的HTML | JS | CSS框架/库 </a> </li> <li> 13. <a href="http://www.uwenku.com/question/p-ooguechl-pv.html" target="_blank" title="玩！框架获取整页内容"> 玩！框架获取整页内容 </a> </li> <li> 14. <a href="http://www.uwenku.com/question/p-xdiqyohg-bhe.html" target="_blank" title="Web框架支持桌面和移动Web浏览器？"> Web框架支持桌面和移动Web浏览器？ </a> </li> <li> 15. <a href="http://www.uwenku.com/question/p-snbtcajd-wc.html" target="_blank" title="Linux：Eclipse内部网页浏览器不显示html5内容"> Linux：Eclipse内部网页浏览器不显示html5内容 </a> </li> <li> 16. <a href="http://www.uwenku.com/question/p-wjptaknm-bav.html" target="_blank" title="获取网页浏览器cookies登录"> 获取网页浏览器cookies登录 </a> </li> <li> 17. <a href="http://www.uwenku.com/question/p-syvjnbfu-bcb.html" target="_blank" title="jQuery框架（非移动）和移动浏览器支持"> jQuery框架（非移动）和移动浏览器支持 </a> </li> <li> 18. <a href="http://www.uwenku.com/question/p-xpnzhetb-vu.html" target="_blank" title="如何在windows phone中获取网页浏览器的网站内容？"> 如何在windows phone中获取网页浏览器的网站内容？ </a> </li> <li> 19. <a href="http://www.uwenku.com/question/p-foxxzjzx-bcb.html" target="_blank" title="Chrome浏览器不支持Safari浏览器的CSS动画"> Chrome浏览器不支持Safari浏览器的CSS动画 </a> </li> <li> 20. <a href="http://www.uwenku.com/question/p-masijxdj-xo.html" target="_blank" title="浏览器支持WebDriver还是WebDriver支持浏览器"> 浏览器支持WebDriver还是WebDriver支持浏览器 </a> </li> <li> 21. <a href="http://www.uwenku.com/question/p-ndupobso-bby.html" target="_blank" title="互联网浏览器支持e.preventDefault"> 互联网浏览器支持e.preventDefault </a> </li> <li> 22. <a href="http://www.uwenku.com/question/p-qprbmrax-ty.html" target="_blank" title="document.implementation.createHTMLDocument浏览器支持？"> document.implementation.createHTMLDocument浏览器支持？ </a> </li> <li> 23. <a href="http://www.uwenku.com/question/p-yooforae-bdm.html" target="_blank" title="jsoup返回“浏览器不支持iframes”"> jsoup返回“浏览器不支持iframes” </a> </li> <li> 24. <a href="http://www.uwenku.com/question/p-qingiczw-wa.html" target="_blank" title="如何读取网页浏览器控件的HTML内容？"> 如何读取网页浏览器控件的HTML内容？ </a> </li> <li> 25. <a href="http://www.uwenku.com/question/p-oqehdtwj-we.html" target="_blank" title="内置函数浏览器支持JavaScript"> 内置函数浏览器支持JavaScript </a> </li> <li> 26. <a href="http://www.uwenku.com/question/p-xcqlmipz-b.html" target="_blank" title="跨浏览器支持jQuery"> 跨浏览器支持jQuery </a> </li> <li> 27. <a href="http://www.uwenku.com/question/p-exrvfzoi-xs.html" target="_blank" title="midori js框架支持chrome浏览器吗？"> midori js框架支持chrome浏览器吗？ </a> </li> <li> 28. <a href="http://www.uwenku.com/question/p-qpepwudc-bas.html" target="_blank" title="浏览器历史记录支持的隐藏框架"> 浏览器历史记录支持的隐藏框架 </a> </li> <li> 29. <a href="http://www.uwenku.com/question/p-hwhqopxo-nb.html" target="_blank" title="window.devicePixelRatio浏览器支持"> window.devicePixelRatio浏览器支持 </a> </li> <li> 30. <a href="http://www.uwenku.com/question/p-ybyeekfc-ey.html" target="_blank" title="XMLHttpRequest浏览器支持"> XMLHttpRequest浏览器支持 </a> </li> </ul> </div> <div> <script async src="https://pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <ins class="adsbygoogle" style="display:block" data-ad-format="autorelaxed" data-ad-client="ca-pub-6208739752673518" data-ad-slot="1575177025"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> <div class="padding-top-10"></div> </div> </div> <script type="text/javascript" src="http://img.uwenku.com/uwenku/script/side.js?t=1644592048176"></script> <script type="text/javascript" src="http://img.uwenku.com/uwenku/plugin/highlight/highlight.pack.js"></script> <link href="http://img.uwenku.com/uwenku/plugin/highlight/styles/docco.css" media="screen" rel="stylesheet" type="text/css" /> <script type="text/javascript"> $('pre').each(function(i, e) { hljs.highlightBlock(e, "<span class='indent'> </span>", false) }); </script> <div class="col-lg-3 col-md-4 col-sm-5"> <div id="rightTop"> <div class="row sidebar panel panel-default"> <div class="panel-heading font-bold"> 每日一句 </div> <div class="panel-body m-b-sm m-t-sm clearfix"> 每一个你不满意的现在，都有一个你没有努力的曾经。 </div> </div> <div class="row"> <script async src="https://pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <ins class="adsbygoogle" style="display:block" data-ad-client="ca-pub-6208739752673518" data-ad-slot="5415218910" data-ad-format="auto" data-full-width-responsive="true"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> <div class="row sidebar panel panel-default"> <div class="panel-heading font-bold"> 最新问题 </div> <div class="m-b-sm m-t-sm clearfix"> <ul class="side_article_list"> <li class="side_article_list_item"> 1. <a href="http://www.uwenku.com/question/p-rwbfjbvg-yy.html" target="_blank" title="本地开发期间'TemplateDoesNotExist at /'错误"> 本地开发期间'TemplateDoesNotExist at /'错误 </a> </li> <li class="side_article_list_item"> 2. <a href="http://www.uwenku.com/question/p-tpnzlnzm-wz.html" target="_blank" title="为什么在构建apk时出现这个错误transformClassesWithDexForDebug？"> 为什么在构建apk时出现这个错误transformClassesWithDexForDebug？ </a> </li> <li class="side_article_list_item"> 3. <a href="http://www.uwenku.com/question/p-ynfpwqpo-ys.html" target="_blank" title="如何改变两个按钮颜色在一个StackPanel"> 如何改变两个按钮颜色在一个StackPanel </a> </li> <li class="side_article_list_item"> 4. <a href="http://www.uwenku.com/question/p-tqstmqup-zp.html" target="_blank" title="将列添加到Wordpress"> 将列添加到Wordpress </a> </li> <li class="side_article_list_item"> 5. <a href="http://www.uwenku.com/question/p-hitakrcf-ze.html" target="_blank" title="时间戳问题：Python无法识别时间戳"> 时间戳问题：Python无法识别时间戳 </a> </li> <li class="side_article_list_item"> 6. <a href="http://www.uwenku.com/question/p-eqxjetam-xw.html" target="_blank" title="点击后破坏Tkinter按钮"> 点击后破坏Tkinter按钮 </a> </li> <li class="side_article_list_item"> 7. <a href="http://www.uwenku.com/question/p-syuhknia-ym.html" target="_blank" title="有没有办法用Capybara和Poltergeist进行Ctrl +单击？"> 有没有办法用Capybara和Poltergeist进行Ctrl +单击？ </a> </li> <li class="side_article_list_item"> 8. <a href="http://www.uwenku.com/question/p-zhmncdsq-yc.html" target="_blank" title="要从一个txt文件导入到列表"> 要从一个txt文件导入到列表 </a> </li> <li class="side_article_list_item"> 9. <a href="http://www.uwenku.com/question/p-rjccrwfs-wd.html" target="_blank" title="如何使用PHP从MYSQL插入和检索图像blob？"> 如何使用PHP从MYSQL插入和检索图像blob？ </a> </li> <li class="side_article_list_item"> 10. <a href="http://www.uwenku.com/question/p-xnbzpurp-uu.html" target="_blank" title="离子3机器人生成BuildError.Error"> 离子3机器人生成BuildError.Error </a> </li> </ul> </div> </div> </div> <p class="article-nav-bar"></p> <div class="row sidebar article-nav"> <div class="row box_white visible-sm visible-md visible-lg margin-zero"> <div class="top"> <h3 class="title"><i class="glyphicon glyphicon-th-list"></i> 相关问题</h3> </div> <div class="article-relative-content"> <ul class="side_article_list"> <li class="side_article_list_item"> 1. <a href="http://www.uwenku.com/question/p-fhmyhsbv-bko.html" target="_blank" title="流星网络框架支持哪些网页浏览器？"> 流星网络框架支持哪些网页浏览器？ </a> </li> <li class="side_article_list_item"> 2. <a href="http://www.uwenku.com/question/p-hgrlwovi-bdz.html" target="_blank" title="浏览器不支持帧"> 浏览器不支持帧 </a> </li> <li class="side_article_list_item"> 3. <a href="http://www.uwenku.com/question/p-fpdagjjo-bkz.html" target="_blank" title="支持网页框架"> 支持网页框架 </a> </li> <li class="side_article_list_item"> 4. <a href="http://www.uwenku.com/question/p-egcakcpk-yg.html" target="_blank" title="浏览器缓存HTML框架内容"> 浏览器缓存HTML框架内容 </a> </li> <li class="side_article_list_item"> 5. <a href="http://www.uwenku.com/question/p-wpagkwhr-bas.html" target="_blank" title="捕获网页内容wpf网页浏览器"> 捕获网页内容wpf网页浏览器 </a> </li> <li class="side_article_list_item"> 6. <a href="http://www.uwenku.com/question/p-ngjqpdkd-boa.html" target="_blank" title="浏览器支持“e.target.files”"> 浏览器支持“e.target.files” </a> </li> <li class="side_article_list_item"> 7. <a href="http://www.uwenku.com/question/p-vgoexrvk-ha.html" target="_blank" title="C＃WinForm Web浏览器不支持的浏览器"> C＃WinForm Web浏览器不支持的浏览器 </a> </li> <li class="side_article_list_item"> 8. <a href="http://www.uwenku.com/question/p-dsiykusg-e.html" target="_blank" title="错误，本页面使用框架，但您的浏览器不支持"> 错误，本页面使用框架，但您的浏览器不支持 </a> </li> <li class="side_article_list_item"> 9. <a href="http://www.uwenku.com/question/p-owwdosqk-xs.html" target="_blank" title="浏览器支持"> 浏览器支持 </a> </li> <li class="side_article_list_item"> 10. <a href="http://www.uwenku.com/question/p-eudloyqr-dd.html" target="_blank" title="是否有支持IE 5等浏览器的跨浏览器JavaScript框架？"> 是否有支持IE 5等浏览器的跨浏览器JavaScript框架？ </a> </li> </ul> </div> </div> </div> </div> </div> </div> </div>  <footer id="footer"> <div class="bg-simple lt"> <div class="container"> <div class="row padder-v m-t"> <div class="col-xs-8"> <ul class="list-inline"> <li><a href="http://www.uwenku.com/contact">联系我们</a></li> <li>© 2020 UWENKU.COM</li> <li><a target="_blank" href="https://beian.miit.gov.cn/">沪ICP备13005482号-4</a></li> <li><script type="text/javascript" src="https://v1.cnzz.com/z_stat.php?id=1280101193&web_id=1280101193"></script></li> <li><a href="http://www.uwenku.com/" target="_blank" title="优文库">简体中文</a></li> <li><a href="http://hk.uwenku.com/" target="_blank" title="優文庫">繁體中文</a></li> <li><a href="http://ru.uwenku.com/" target="_blank" title="поле вопросов и ответов">Русский</a></li> <li><a href="http://de.uwenku.com/" target="_blank" title="Frage - und - antwort - Park">Deutsch</a></li> <li><a href="http://es.uwenku.com/" target="_blank" title="Preguntas y respuestas">Español</a></li> <li><a href="http://hi.uwenku.com/" target="_blank" title="कार्यक्रम प्रश्न और उत्तर पार्क">हिन्दी</a></li> <li><a href="http://it.uwenku.com/" target="_blank" title="IL Programma di chiedere Park">Italiano</a></li> <li><a href="http://ja.uwenku.com/" target="_blank" title="プログラム問答園区">日本語</a></li> <li><a href="http://ko.uwenku.com/" target="_blank" title="프로그램 문답 단지">한국어</a></li> <li><a href="http://pl.uwenku.com/" target="_blank" title="program o park">Polski</a></li> <li><a href="http://tr.uwenku.com/" target="_blank" title="Program soru ve cevap parkı">Türkçe</a></li> <li><a href="http://vi.uwenku.com/" target="_blank" title="Đáp ứng viên">Tiếng Việt</a></li> <li><a href="http://fr.uwenku.com/" target="_blank" title="Programme interrogation Park">Française</a></li> </ul> </div> </div> </div> </div> </div> </footer>  <script> var _hmt = _hmt || []; (function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?f78a970f17b19a79fc477a3378096f29"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s); })(); </script> </body> </html>

获取网页内容 - 浏览器不支持框架

回答