我想解析HTML代码以提取其中的所有链接。为了避免无法联系我删除注释代码与<!--
开始和-->
。这里结束问题来了:在HTML代码中,我可能会发现一些JavaScript代码,例如:带评论的JavaScript代码的HTML
<html>
<HEAD>
<SCRIPT LANGUAGE="JavaScript">
<!-- Begin
if (document.images) {
var pic2 = new Image(); // for the inactive image
pic2.src = "pic2.jpg";
var title2 = new Image();
title2.src = "title2.jpg";
}
...
-->
而奇怪的是, JS代码被评论,但它仍然有效。所以,如果我删除该代码,结果将不会如预期的那样。我应该怎么做才能确定何时遇到未使用的已评论代码以及何时该已评论代码正常工作?
好的。现在事情很清楚。非常感谢你的回答。我会寻找最好的策略。 –