Ⅰ 如何不让jsoup.parse过滤标签
//过滤内容中的非法标签
org.jsoup.nodes.Document document = Jsoup.parse(html);
//只过滤body内容
org.jsoup.nodes.Document body = Jsoup.parse(document.body().html());
//自定义的标签白名单
Cleaner cleaner = new Cleaner(WhitelistFactory.createWhitelist(WhitelistFactory.EPUB20));
org.jsoup.nodes.Document bodyCleaned = cleaner.clean(body);
document.body().html(bodyCleaned.html());
String newHtml = document.html();
Ⅱ jsoup 可以获取html的标签和属性吗 要怎么获取...
可以,例如:在aa.html文档中: <input type="text" name="天王" id="小小" />
Document doc = Jsoup.parse(aa.html, "UTF-8", );
1.获取input标签:Element inputElement=doc.getElementById("小小");
2.获取name属性:内inputElement.name
希望对你有所帮容助
Ⅲ 用JSOUP解析HTML,怎样删除掉其中的一段DIV标签及内容
主要是根据id来删除。
Ⅳ java 利用jsoup 如何去除一段代码中的所有html标签,只留纯文本
使用正则表达式去匹配<>这种字符,然后删掉!
Ⅳ jsoup 过滤指定标签问题JAVA
for(Elementlink:links){
//通过link.child(index)或link.getElementsBy<attr>(key,value)获得部分子节点
mArrayList.add(link.text());
}
Ⅵ java 利用jsoup 如何去除一段代码中的所有html标签,只留纯文本
document.text();
Ⅶ jsoup 中取div id标签用#,取class标签用. 那么取style标签用什么
例:document.select("tr[style="BACKGROUND:white"]")
Ⅷ jsoup得到的结果带标签,球打什么赐教怎么去掉这些标签
String str1 = str.text();
Ⅸ 用JSOUP解析HTML,怎样删除掉其中的一段DIV标签及内容
用JSOUP解析HTML删除掉其中的一段DIV标签及内容的方法是根据id删除。
使用核心方法如下:
doc.getElementById("detail_question").remove()
举例如下:
从baseHtml这断代码中删除指定id的标签:
String baseHtml = "<div id='stylized' class='myform'>"
+ "<input id='txt_question' name='preg' type='text' disabled='disabled' style='width:150px;'>"
+ "<div id='detail_question'>Rock</div></div>";
Document doc = Jsoup.parse(baseHtml);
doc.getElementById("detail_question").remove();
Elements elements = doc.select("div");
System.out.println(elements);
输出的结果中没有detail_question这个div节点了:
<div id='stylized' class='myform'>
+ "<input id='txt_question' name='preg' type='text' disabled='disabled' style='width:150px;'>