我在尝试从网站上刮取药品清单。 我正在使用JSOUP来解析Html。从我从网站上刮下的文本中删除空格
这里是我的代码:
URL url = new URL("http://www.medindia.net/drug-price/index.asp?alpha=a");
Document doc1 = Jsoup.parse(url, 0);
Elements rows = doc1.getElementsByAttributeValue("style", "padding-left:5px;border-right:1px solid #A5A5A5;");
for(Element row : rows){
String htm = row.text();
if(!(htm.equals("View Price")||htm.contains("Show Details"))) {
System.out.println(htm);
System.out.println();
}
}
这里是我得到的输出:
附: 这不是完整的输出但由于我不能完整输出的屏幕截图,我只是显示它。
我需要知道两件事情:
问题1:为什么我会得到一个额外的空间在每个药品名称的前面,为什么我获得额外新线有些药物的名称后?
问题2.如何解决此问题?
使用.trim()从开头和结尾删除不需要的空格。 – specialscope
@specialscope它没有删除空格,IDK为什么! –