Ⅰ java 如何利用正则表达式只保留html里面的<p></p>标签里面的内容
正则表达式:<p.*?>(.*?)</p>
group(1)为正文内容。
输出时加上\n就行了
import java.util.regex.*;
public class Test{
public static void main(String[] args){
String str="<p style=\"font-size:1.3em;font-weight:bold\">No page with that title exists.</p> ";
String regex="<p.*?>(.*?)</p> ";
Pattern p =Pattern.compile(regex);
Matcher m=p.matcher(str);
while(m.find()){
System.out.println(m.group(1));
}
}
}
Ⅱ 怎样用正则表达式过滤掉页面中除了<p></p>和<img>以外所有的标签
这个还真不容易实现,单独保留p或者img都可以,但是两个条件放一起就不行了。于专是我换属了一种思路,用了个函数实现了,你看下,代码是python下的:
importre
t='<html>asdfasdf<head>1111111111<body><p>asdfasdfasdf</p><imgherf="fff">'
defreplace_two(m):
"""
#过滤掉页面中除了<p></p>和<img>以外所有的标签
"""
all=re.findall(r'</?.*?>',m)
save=re.findall(r'</?(?:img).*?>|</?[pP]*?>',m)
foreinall:
ifenotinsave:
m1=m.replace(e,'')
m=m1
returnm
printreplace_two(t)
Ⅲ java中如何替换<p>标签
你说的问题不够表达清楚,是在html替换,还是java中字符替换啊,反正因该都一样,要么用正则表达化,要么用String.replace(char oldChar, char newChar);//这样解决,脚本里面好像没有这个方法,只能用正则表达式了
Ⅳ java正则表达式过滤html p标签
用JavaScript方法如下,JAVA语言类似:
'你的HTML文本'.replace(/.+>(.+)<.+/,'$1')
Ⅳ JAVA正则表达式,去掉<p><p class=MsoNorma>内容</p></p> ,把标签都去掉只留内容。
取出>([^<]+)即可,其他都不要
Ⅵ java导出excel会有<p>标签,怎么处理掉
在程序中将这些字符替换掉即可,代码如下:
for(int i=10;i<14;i++)
{
str = str.replaceAll(String.valueOf((char)i), "");
}
Ⅶ java 中把下面的这段字符串中的 <P>标签 , 和后面的那堆字母数字去掉。
正则替换:
s.replaceAll("<.*?>", "");
Ⅷ java 如何替换字符串中的特殊字符<p></p>标签和空格,字符串是这样的:<p><img>abcde</img> </p>
<p><img>abcde</img> </p>你想怎么替换?
是替换所有字符还是只替换<p></p>标签和空格。
public class RegTest {
public static void main(String[] args) {
String str1="<p><img>abcde</img> </p>";
System.out.println(str1.replaceAll("(<(\\/)?p>)|\\s", ""));
}
}
就可以了。
Ⅸ java去除文本内容的标签跟
这个方法是替换内容,最后trim方法是,清除字符串两边的空格
String newStr =str.replaceAll("<p>", "").replaceAll("</p>", "").trim();
Ⅹ java如何用正则去除<p>标签后面的空格
java零宽断言里的正则必须指定最大长度,我就写了个100,匹配p标签内可能含有的其他字符,应该够用了
Stringp="<pid="test"class="para">今天我在图书馆加班。</p>";
p=p.replaceAll("(?<=<p.{0,100}>)[]+(?=\S)","");
System.out.println(p);