0
我有这样的HTML:Cheerio,标签之间删除值
<strong>delete1</strong> :
16X<br>
<strong>delete2</strong>
: 16X<br>
<strong>delete3</strong>
需要删除的标签和标签之间的所有文本。怎么做? Node.js + cheerio,网页抓取。
我有这样的HTML:Cheerio,标签之间删除值
<strong>delete1</strong> :
16X<br>
<strong>delete2</strong>
: 16X<br>
<strong>delete3</strong>
需要删除的标签和标签之间的所有文本。怎么做? Node.js + cheerio,网页抓取。
在Cheerio的操作特征中有remove方法。 所以你可以删除这个内容中的所有元素,那么你将只获得没有任何子元素和文本的文本。
下面是一个例子,用JQuery来做这件事。
$(document).ready(function(){
var $elm = $('#demo-container');
// Remove all child elements then their contents will be gone.
$elm.find('*').remove();
console.log('Contents without child elements',$elm.html());
// Beyond that you could split text with colon and get each values
console.log('Each line as array',$elm.html().replace(/\s/g, '').split(':'));
});
<script src="https://ajax.googleapis.com/ajax/libs/jquery/2.1.1/jquery.min.js"></script>
<div id="demo-container">
<strong>delete1</strong> :
16X<br>
<strong>delete2</strong>
: 16X<br>
<strong>delete3</strong>
</div>
您可以使用cheerio到得到父的HTML与replace
删除不必要的内容。您可以使用X-ray并使用filters选项。