我很新vb.net,我有一个很大的问题,我正在为我自己创建一个软件。VB.NET下载html代码表
背景:
我有一些代码在我的软件,下载一个网页的源代码转换成txt文件,并过滤掉它寻找信息。对于正常的HTML代码,这工作正常。
2.问题:
问题是,当我不能指定的HTML代码的具体参数,因为他们太含糊。
3例子:
我可以下载这种独特的HTML代码和传递变量(布朗在这种情况下)为字符串在我的软件,因为它是在同一行代码制作其独特之处:
<div class="Performer_DataLabel">Hair Color:</div> Brown</div>
不过,我想知道如何寻找一个特定的表和它的行和单元格(如下面这一个显示1行代码和2个单元我感兴趣的):
1. <tr>
2. <td class="paramname">
3. <b>Hair Color:</b>
4. </td>
5. <td class="paramvalue">
6. Brown
7. </td>
8. </tr>
问题在于,您可以看到,“头发颜色:”可以是任何变量,如“眼睛颜色”或“身高”,“布朗”可以是对该问题的任何答案。这些表格,行或单元格中没有足够的唯一代码来专门定位这些代码行,就像它们写在单行上时一样。
4.我想:
为了能够像上面的例子和搜索在HTML代码表中找出与目标“头发颜色” /目标的答案(布朗在这种情况下)在它的相邻单元格中,并将其传递给一个String变量(我会一直知道我在寻找像“头发颜色”,但我永远不会事先知道头发颜色问题的答案,并且该答案变量是我想要查找的)。
结论:
VB.NET代码,我可以用什么来:包含像 “头发颜色” 或“眼睛的话
1)搜索/目标HTML代码表颜色”。
2)搜索/定位他们的答案变量,不管它们是什么。 (有些问题可以有很长的范围可能的答案,那么IF或SELECT CASE语句来预测/比较他们现在是不是一种选择)
3)答案传递给我的软件的String。
6。注意
无论数百行完整的源代码是什么,问题(头发颜色)总是在表格行(第3行)的同一行上。
答案也总是在表的行中的同一行(第6行)。
然而问题行本身并不总是对在同一个地方的表。
HTML从哪里来?你说它在结构上不统一 - 好吧,这使得不可能提供解决方案。 HTML中的数据不是**统一的,你不能以统一的方式查询它。 – Oded
感谢您的快速回复。是否可以在源代码中使用“头发颜色”作为目标,如果它确实是唯一的(出于参数的缘故),然后基于该目标,总是只需跳下3行即可定位该线上的任何内容? – Auhn
您可以在HTML源代码中查找该字符串,但无法了解在未检查源代码的情况下将采用何种结构。特别是它不会让你直接访问其他数据。 – Oded