2012-02-27 48 views
0

我需要从加载的HTML页面获取URL。这里是把我的网址从html页面获取URL - objective

<a class="top_nav_link" id="logout_link" href="https://login.vk.com/?act=logout&hash=29327318c645d49a48&from_host=vk.com&from_protocol=http" onclick="if (!checkEvent(event)) { ge('logout_form').submit(); return false; }"> 

和URL的HTML标记: “https://login.vk.com/?act=logout &哈希= 29327318c645d49a48 & from_host = vk.com & from_protocol = HTTP”

散列可能不同。 如何获取此URL?

+0

你能否假设HTML格式正确的XHTML?或者,这是否有可能不在格式良好的XML结构中的旧HTML? – 2012-02-27 19:27:32

+0

你把页面加载到UIWebView中了吗? – 2012-02-27 19:29:24

+0

@JimBlackler不,我用NSString中的ASIHTTPRequest加载它 – 2012-02-27 19:31:17

回答

1

既然您说HTML实际上是格式良好的XHTML,那么您可以使用任何XML解析方法来解析文档并找到您要查找的内容。使用的NSXMLParser和有效的解析器的委托,你可能会碰到这样的:

- (void)parser:(NSXMLParser *)parser didStartElement:(NSString *)elementName namespaceURI:(NSString *)namespaceURI qualifiedName:(NSString *)qualifiedName attributes:(NSDictionary *)attributeDict { 

    if ([elementName isEqualToString:@"a"] && [[attributeDict objectForKey:@"id"] isEqualToString:@"logoutLink"]) { 
     // Found the <a> tag with an id of logoutLink 
     NSString *linkURL = [attributeDict objectForKey:@"href"]; 
     // Do what you want with the link URL here 
    } 

这是假设你正在寻找的logoutLink ID的特定<a>元素。如果您正在寻找其他方法来识别哪个<a>标签具有所需的URL,则可以相应地调整此示例代码中的if语句。

+0

我尝试过,但解析器停在标记处(在它成功解析5个标记之前)。也许我说这个页面是XHTML格式正确的时候我错了。 – <span class="text-secondary"> <small> <span>2012-02-27 20:12:01</span> </small> </span> </p> </div> </div> </div> <div itemprop="comment" class="post-comment"> <div class="row"> <div class="col-lg-1"><span class="text-secondary">+0</span></div> <div class="col-lg-11"> <p class="commenttext">要检查它是否为有效的XHTML,请尝试使用http://validator.w3.org/ – <span class="text-secondary"> <small> <span>2012-02-27 20:16:13</span> </small> </span> </p> </div> </div> </div> <div itemprop="comment" class="post-comment"> <div class="row"> <div class="col-lg-1"><span class="text-secondary">+0</span></div> <div class="col-lg-11"> <p class="commenttext">等验证器网站。不幸的是,这不是XHTML 5.错误太多 – <span class="text-secondary"> <small> <span>2012-02-27 20:22:28</span> </small> </span> </p> </div> </div> </div> </div> </div> </article> <div> <script async src="https://pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <ins class="adsbygoogle" style="display:block" data-ad-client="ca-pub-6208739752673518" data-ad-slot="1038284119" data-ad-format="auto" data-full-width-responsive="true"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> </div> <div class="clearfix"> </div> <div class="relative-box"> <div class="relative">相关问题</div> <ul class="relative_list"> <li> 1. <a href="http://www.uwenku.com/question/p-ftyrpfui-py.html" target="_blank" title="Objective C获取html页面的链接"> Objective C获取html页面的链接 </a> </li> <li> 2. <a href="http://www.uwenku.com/question/p-ekthwzow-pa.html" target="_blank" title="从URL获取.NET页面"> 从URL获取.NET页面 </a> </li> <li> 3. <a href="http://www.uwenku.com/question/p-cqrsuoin-beb.html" target="_blank" title="获取html页面"> 获取html页面 </a> </li> <li> 4. <a href="http://www.uwenku.com/question/p-omidvxex-bem.html" target="_blank" title="PHP:如何从HTML页面获取基本URL"> PHP:如何从HTML页面获取基本URL </a> </li> <li> 5. <a href="http://www.uwenku.com/question/p-xvwtvhew-kh.html" target="_blank" title="从html页面的url获取文档对象"> 从html页面的url获取文档对象 </a> </li> <li> 6. <a href="http://www.uwenku.com/question/p-knhknddc-bhs.html" target="_blank" title="从下载的html页面获取href url参数的编号?"> 从下载的html页面获取href url参数的编号? </a> </li> <li> 7. <a href="http://www.uwenku.com/question/p-yrbxrgxr-cy.html" target="_blank" title="从页面URL获取参数"> 从页面URL获取参数 </a> </li> <li> 8. <a href="http://www.uwenku.com/question/p-cogaesvf-bey.html" target="_blank" title="从url获取当前页面"> 从url获取当前页面 </a> </li> <li> 9. <a href="http://www.uwenku.com/question/p-vssrkilg-cv.html" target="_blank" title="从URL获取页面内容?"> 从URL获取页面内容? </a> </li> <li> 10. <a href="http://www.uwenku.com/question/p-bdqthetn-kd.html" target="_blank" title="Struts2 - 从错误页面获取url"> Struts2 - 从错误页面获取url </a> </li> <div> <script async src="https://pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <ins class="adsbygoogle" style="display:block; text-align:center;" data-ad-layout="in-article" data-ad-format="fluid" data-ad-client="ca-pub-6208739752673518" data-ad-slot="4606349252"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> <li> 11. <a href="http://www.uwenku.com/question/p-momzdwdx-bec.html" target="_blank" title="从WebView获取当前页面的URL"> 从WebView获取当前页面的URL </a> </li> <li> 12. <a href="http://www.uwenku.com/question/p-yxqtdbfp-uy.html" target="_blank" title="从ASP获取URL变量页面"> 从ASP获取URL变量页面 </a> </li> <li> 13. <a href="http://www.uwenku.com/question/p-yrdexxvq-baa.html" target="_blank" title="从URL获取页面内容"> 从URL获取页面内容 </a> </li> <li> 14. <a href="http://www.uwenku.com/question/p-zeuwerwd-bbo.html" target="_blank" title="获取从母版页获取信息的子页面的URL"> 获取从母版页获取信息的子页面的URL </a> </li> <li> 15. <a href="http://www.uwenku.com/question/p-fapvfjgx-vs.html" target="_blank" title="从HTML页面获取信息"> 从HTML页面获取信息 </a> </li> <li> 16. <a href="http://www.uwenku.com/question/p-pdtkzgpo-bnq.html" target="_blank" title="从iframe中的页面获取HTML"> 从iframe中的页面获取HTML </a> </li> <li> 17. <a href="http://www.uwenku.com/question/p-nztpnndj-mc.html" target="_blank" title="从html页面获取相对链接"> 从html页面获取相对链接 </a> </li> <li> 18. <a href="http://www.uwenku.com/question/p-nfqbtncq-sv.html" target="_blank" title="php从html页面获取正文"> php从html页面获取正文 </a> </li> <li> 19. <a href="http://www.uwenku.com/question/p-dwtluxls-ov.html" target="_blank" title="如何从HTML页面获取PDF(UIWebView)"> 如何从HTML页面获取PDF(UIWebView) </a> </li> <li> 20. <a href="http://www.uwenku.com/question/p-xmokwyki-sg.html" target="_blank" title="如何从html页面获取xPath(WebView)"> 如何从html页面获取xPath(WebView) </a> </li> <li> 21. <a href="http://www.uwenku.com/question/p-mhezazbw-tc.html" target="_blank" title="从javascript页面获取HTML内容"> 从javascript页面获取HTML内容 </a> </li> <li> 22. <a href="http://www.uwenku.com/question/p-sdfxymzw-gx.html" target="_blank" title="从html页面获取文本shell"> 从html页面获取文本shell </a> </li> <li> 23. <a href="http://www.uwenku.com/question/p-pgrekcpv-wc.html" target="_blank" title="Clojure从网站获取html页面"> Clojure从网站获取html页面 </a> </li> <li> 24. <a href="http://www.uwenku.com/question/p-qdzlkdsg-yo.html" target="_blank" title="从登录后的页面获取HTML"> 从登录后的页面获取HTML </a> </li> <li> 25. <a href="http://www.uwenku.com/question/p-ftoygvnq-bmp.html" target="_blank" title="从另一个HTML页面获取WebBrowser.Document"> 从另一个HTML页面获取WebBrowser.Document </a> </li> <li> 26. <a href="http://www.uwenku.com/question/p-vsgklngg-bod.html" target="_blank" title="从node.js获取数据到HTML页面"> 从node.js获取数据到HTML页面 </a> </li> <li> 27. <a href="http://www.uwenku.com/question/p-guscvept-yt.html" target="_blank" title="获取当前页面url"> 获取当前页面url </a> </li> <li> 28. <a href="http://www.uwenku.com/question/p-pavhcxxu-mt.html" target="_blank" title="如何获取页面URL?"> 如何获取页面URL? </a> </li> <li> 29. <a href="http://www.uwenku.com/question/p-knapfahu-pw.html" target="_blank" title="从子页面获取父页面的URL"> 从子页面获取父页面的URL </a> </li> <li> 30. <a href="http://www.uwenku.com/question/p-ogbjfheg-kh.html" target="_blank" title="Objective C从URL获取字符串"> Objective C从URL获取字符串 </a> </li> </ul> </div> <div> <script async src="https://pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <ins class="adsbygoogle" style="display:block" data-ad-format="autorelaxed" data-ad-client="ca-pub-6208739752673518" data-ad-slot="1575177025"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> <div class="padding-top-10"></div> </div> </div> <script type="text/javascript" src="http://img.uwenku.com/uwenku/script/side.js?t=1644592048176"></script> <script type="text/javascript" src="http://img.uwenku.com/uwenku/plugin/highlight/highlight.pack.js"></script> <link href="http://img.uwenku.com/uwenku/plugin/highlight/styles/docco.css" media="screen" rel="stylesheet" type="text/css" /> <script type="text/javascript"> $('pre').each(function(i, e) { hljs.highlightBlock(e, "<span class='indent'> </span>", false) }); </script> <div class="col-lg-3 col-md-4 col-sm-5"> <div id="rightTop"> <div class="row sidebar panel panel-default"> <div class="panel-heading font-bold"> 每日一句 </div> <div class="panel-body m-b-sm m-t-sm clearfix"> 每一个你不满意的现在,都有一个你没有努力的曾经。 </div> </div> <div class="row"> <script async src="https://pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <ins class="adsbygoogle" style="display:block" data-ad-client="ca-pub-6208739752673518" data-ad-slot="5415218910" data-ad-format="auto" data-full-width-responsive="true"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> <div class="row sidebar panel panel-default"> <div class="panel-heading font-bold"> 最新问题 </div> <div class="m-b-sm m-t-sm clearfix"> <ul class="side_article_list"> <li class="side_article_list_item"> 1. <a href="http://www.uwenku.com/question/p-zhmnllws-bho.html" target="_blank" title="如果语句不适用于循环"> 如果语句不适用于循环 </a> </li> <li class="side_article_list_item"> 2. <a href="http://www.uwenku.com/question/p-bcvpbaqh-bkk.html" target="_blank" title="在正数变化前增加+符号"> 在正数变化前增加+符号 </a> </li> <li class="side_article_list_item"> 3. <a href="http://www.uwenku.com/question/p-zqyfgyzj-bkb.html" target="_blank" title="将OptimisticLockPolicy更改为使用本地时间"> 将OptimisticLockPolicy更改为使用本地时间 </a> </li> <li class="side_article_list_item"> 4. <a href="http://www.uwenku.com/question/p-siuddqkp-bkx.html" target="_blank" title="D3在直线边缘和多个曲线边缘之间切换"> D3在直线边缘和多个曲线边缘之间切换 </a> </li> <li class="side_article_list_item"> 5. <a href="http://www.uwenku.com/question/p-tiaeqzro-zv.html" target="_blank" title="一旦某件事情完成,我该如何完全停止代码?"> 一旦某件事情完成,我该如何完全停止代码? </a> </li> <li class="side_article_list_item"> 6. <a href="http://www.uwenku.com/question/p-bicfiyvf-bab.html" target="_blank" title="用不同尺寸创建img和p标签"> 用不同尺寸创建img和p标签 </a> </li> <li class="side_article_list_item"> 7. <a href="http://www.uwenku.com/question/p-ywufoanf-bak.html" target="_blank" title="使用摩卡运行时,仍然会收到语法错误,导入为babel-plugin-syntax-dynamic-import动态导入"> 使用摩卡运行时,仍然会收到语法错误,导入为babel-plugin-syntax-dynamic-import动态导入 </a> </li> <li class="side_article_list_item"> 8. <a href="http://www.uwenku.com/question/p-bszwbohz-bcq.html" target="_blank" title="UWP视频导入"> UWP视频导入 </a> </li> <li class="side_article_list_item"> 9. <a href="http://www.uwenku.com/question/p-fncxywom-bca.html" target="_blank" title="在paperjs中的圆段上绘制线"> 在paperjs中的圆段上绘制线 </a> </li> <li class="side_article_list_item"> 10. <a href="http://www.uwenku.com/question/p-xtuzxexi-bbu.html" target="_blank" title="优雅的方式,如果else语句的多组"> 优雅的方式,如果else语句的多组 </a> </li> </ul> </div> </div> </div> <p class="article-nav-bar"></p> <div class="row sidebar article-nav"> <div class="row box_white visible-sm visible-md visible-lg margin-zero"> <div class="top"> <h3 class="title"><i class="glyphicon glyphicon-th-list"></i> 相关问题</h3> </div> <div class="article-relative-content"> <ul class="side_article_list"> <li class="side_article_list_item"> 1. <a href="http://www.uwenku.com/question/p-ftyrpfui-py.html" target="_blank" title="Objective C获取html页面的链接"> Objective C获取html页面的链接 </a> </li> <li class="side_article_list_item"> 2. <a href="http://www.uwenku.com/question/p-ekthwzow-pa.html" target="_blank" title="从URL获取.NET页面"> 从URL获取.NET页面 </a> </li> <li class="side_article_list_item"> 3. <a href="http://www.uwenku.com/question/p-cqrsuoin-beb.html" target="_blank" title="获取html页面"> 获取html页面 </a> </li> <li class="side_article_list_item"> 4. <a href="http://www.uwenku.com/question/p-omidvxex-bem.html" target="_blank" title="PHP:如何从HTML页面获取基本URL"> PHP:如何从HTML页面获取基本URL </a> </li> <li class="side_article_list_item"> 5. <a href="http://www.uwenku.com/question/p-xvwtvhew-kh.html" target="_blank" title="从html页面的url获取文档对象"> 从html页面的url获取文档对象 </a> </li> <li class="side_article_list_item"> 6. <a href="http://www.uwenku.com/question/p-knhknddc-bhs.html" target="_blank" title="从下载的html页面获取href url参数的编号?"> 从下载的html页面获取href url参数的编号? </a> </li> <li class="side_article_list_item"> 7. <a href="http://www.uwenku.com/question/p-yrbxrgxr-cy.html" target="_blank" title="从页面URL获取参数"> 从页面URL获取参数 </a> </li> <li class="side_article_list_item"> 8. <a href="http://www.uwenku.com/question/p-cogaesvf-bey.html" target="_blank" title="从url获取当前页面"> 从url获取当前页面 </a> </li> <li class="side_article_list_item"> 9. <a href="http://www.uwenku.com/question/p-vssrkilg-cv.html" target="_blank" title="从URL获取页面内容?"> 从URL获取页面内容? </a> </li> <li class="side_article_list_item"> 10. <a href="http://www.uwenku.com/question/p-bdqthetn-kd.html" target="_blank" title="Struts2 - 从错误页面获取url"> Struts2 - 从错误页面获取url </a> </li> </ul> </div> </div> </div> </div> </div> </div> </div><!-- wrap end--> <!-- footer --> <footer id="footer"> <div class="bg-simple lt"> <div class="container"> <div class="row padder-v m-t"> <div class="col-xs-8"> <ul class="list-inline"> <li><a href="http://www.uwenku.com/contact">联系我们</a></li> <li>© 2020 UWENKU.COM</li> <li><a target="_blank" href="https://beian.miit.gov.cn/">沪ICP备13005482号-4</a></li> <li><script type="text/javascript" src="https://v1.cnzz.com/z_stat.php?id=1280101193&web_id=1280101193"></script></li> <li><a href="http://www.uwenku.com/" target="_blank" title="优文库">简体中文</a></li> <li><a href="http://hk.uwenku.com/" target="_blank" title="優文庫">繁體中文</a></li> <li><a href="http://ru.uwenku.com/" target="_blank" title="поле вопросов и ответов">Русский</a></li> <li><a href="http://de.uwenku.com/" target="_blank" title="Frage - und - antwort - Park">Deutsch</a></li> <li><a href="http://es.uwenku.com/" target="_blank" title="Preguntas y respuestas">Español</a></li> <li><a href="http://hi.uwenku.com/" target="_blank" title="कार्यक्रम प्रश्न और उत्तर पार्क">हिन्दी</a></li> <li><a href="http://it.uwenku.com/" target="_blank" title="IL Programma di chiedere Park">Italiano</a></li> <li><a href="http://ja.uwenku.com/" target="_blank" title="プログラム問答園区">日本語</a></li> <li><a href="http://ko.uwenku.com/" target="_blank" title="프로그램 문답 단지">한국어</a></li> <li><a href="http://pl.uwenku.com/" target="_blank" title="program o park">Polski</a></li> <li><a href="http://tr.uwenku.com/" target="_blank" title="Program soru ve cevap parkı">Türkçe</a></li> <li><a href="http://vi.uwenku.com/" target="_blank" title="Đáp ứng viên">Tiếng Việt</a></li> <li><a href="http://fr.uwenku.com/" target="_blank" title="Programme interrogation Park">Française</a></li> </ul> </div> </div> </div> </div> </div> </footer> <!-- / footer --> <script> var _hmt = _hmt || []; (function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?f78a970f17b19a79fc477a3378096f29"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s); })(); </script> </body> </html>