count_items=`curl -u username:password -L "websitelink" | sed -e 's/<\/title>/<\/title>\n/g' | sed -n -e 's/.*<title>\(.*\)<\/title>.*/\1/p' | wc -l`
上面我有一个Bash脚本,它从XML文件中提取标题,但是如何更改正则表达式以便从div标签中提取标题名称?Bash脚本sed -e
例子:提取出题的:<div id="example""><a href="">title</a></div>
我知道这是愚蠢的,可以通过猛砸做,但我别无选择,任何帮助,将不胜感激。
您是否想过用
不,因为有很多标题,我不知道标题名称是什么,它需要动态地收集标题名称:( – 2010-07-22 10:57:00
你需要给我们一个提示,你如何区分“标题”DIV与其他所有的标题都在链接中,即'href's?你的'href's总是被包含在一行吗? – 2010-07-22 11:40:35