⑴ 怎么从内容中过滤掉图片,只要显示部分文字内容
$str='<font size="2" color="#333333">2010-2012 版权所有 <a href="***" target="_blank"> ICP备专xxx号属-1</a>';
ereg("<.*>.*<.*>", $str, $regs);
print_r($regs[0]);
⑵ C# 通过正则表达式进行html过滤 只留文字,图片,<p>,<br>
|请参照以下代码:
public static string FilterHtmlTag(string s)
{
//<...>标记正则表达式
return Regex.Replace(s, @"<[^>]*>", delegate(Match match)
{
string v = match.ToString();
//图片,<p>,<br>正则表达式
Regex rx = new Regex(@"^<(p|内br|img.*)>$",
RegexOptions.Compiled | RegexOptions.IgnoreCase); //
if (rx.IsMatch(v))
{
return v; //保留图容片,<p>,<br>
}
else
{
return ""; //过滤掉
}
});
}
⑶ 如何把图片中的文字过滤出来
只要扫描的来质量还可自以,搞出来没问题。原理就是OCR----一般有扫描仪的电脑上都应该装这种识别软件的。
OFFICE中有一个组件document image,功能一样的强大。不仅扫描的文字图片,连数码相机拍的墙上的宣传告示上的字都能提取出来。
⑷ 如何过滤掉a标签,又保留<a href=“#”>保留文字 </a>
1,过滤所有html标签的正则表达式:]+>2,过滤所有html标签的属性的正则表达式:$html=preg_replace("/]*>/","",$html);3,过回滤部分html标签的正则表达式的排答除式(比如排除,即不过滤):]+>4,过滤部分html标签的正则表达式的枚举式(比如需要过滤等):]*>5,过滤部分html标签的属性的正则表达式的排除式(比如排除alt属性,即不过滤alt属性):\s(?!alt)[a-zA-Z]+=[^\s]*
⑸ 求php 过滤html标签 但不过滤标签里面的文字 的代码
<?php
$str='<ahref="#">href</a>';
//echohtmlspecialchars($str);
echostrip_tags($str);
?>
⑹ 如何使浏览器过滤文字
adk-v1.87网页净化器助手过滤
可以过滤网页上的文字的
⑺ .net 怎么去除网页中的超链接<a href="">文字<a>,过滤后需要“文字”内容<a>标签中内容不要
用这个方法试试
public static string GetStripHTML(string strHtml)
{
string [] aryReg ={
@"<script[^>]*?>.*?</script>",
@"<(\/\s*)?!?((\w+:)?\w+)(\w+(\s*=?\s*(([""'])(\\[""'tbnr]|[^\7])*?\7|\w+)|.{0})|\s)*?(\/\s*)?>",
@"([\r\n])[\s]+",
@"&(quot|#34);",
@"&(amp|#38);",
@"&(lt|#60);",
@"&(gt|#62);",
@"&(nbsp|#160);",
@"&(iexcl|#161);",
@"&(cent|#162);",
@"&(pound|#163);",
@"&(|#169);",
@"(\d+);",
@"-->",
@"<!--.*\n"
};
string [] aryRep = {
"",
"",
"",
"\"",
"&",
"<",
">",
" ",
"\xa1",//chr(161),
"\xa2",//chr(162),
"\xa3",//chr(163),
"\xa9",//chr(169),
"",
"\r\n",
""
};
string newReg =aryReg[0];
string strOutput=strHtml;
for(int i = 0;i<aryReg.Length;i++){
Regex regex = new Regex(aryReg[i],RegexOptions.IgnoreCase);
strOutput = regex.Replace(strOutput,aryRep[i]);
}
strOutput.Replace("<","");
strOutput.Replace(">","");
strOutput.Replace("\r\n","");
return strOutput;
}
⑻ 正则表达式取出文字过滤掉中间的字符比如:我是中国人</span>我爱中国 取出我是中国人我爱中国 过滤字符
varstr='我是中国人</span>我爱中国取出我是中国人我爱中国';
varresult=str.replace(/[<][/]?w+[>]/g,'');//result是替换了标签的字符串
这是使用字符串的replace方法以正则匹配替换掉标签
正则:/[<][/]?w+[>]/g
/内容/:在JavaScript中表示这是一个正则表达式对象,其他语言内不需要//
[<]:表示标签的开头尖括号
[/]?:表示可以有/符号也可以没有,目的是为了匹配开始标签和结束标签
譬如:<span>内容</span>,替换後只要【内容】
w+:表示字符类(包括大小写字母,数字),如果你的标签内会有style="color:red;"的话建议改为.*,即:/[<][/]?.*[>]/g,其中.* 表示任意字符任意长度
[>]:标签的结束尖括号
/内容/g:表达式加上参数g之后,表明可以进行全局匹配,注意这里“可以”的含义:
1)对于表达式对象的exec方法,不加入g,则只返回第一个匹配,无论执行多少次均是如此,如果加入g,则第一次执行也返回第一个匹配,再执行返回第二个匹配,依次类推。例如
var regx=/user/d/;
var str=“user18dsdfuser2dsfsd”;
var rs=regx.exec(str);//此时rs的值为{user1}
var rs2=regx.exec(str);//此时rs的值依然为{user1}
如果regx=/user/d/g;则rs的值为{user1},rs2的值为{user2}
通过这个例子说明:对于exec方法,表达式加入了g,并不是说执行exec方法就可以返回所有的匹配,而是说加入了g之后,我可以通过某种方式得到所有的匹配,这里的“方式”对于exec而言,就是依次执行这个方法即可。
2)对于表达式对象的test方法,加入g于不加上g没有什么区别。
3)对于String对象的match方法,不加入g,也只是返回第一个匹配,一直执行match方法也总是返回第一个匹配,加入g,则一次返回所有的匹 配(注意这与表达式对象的exec方法不同,对于exec而言,表达式即使加上了g,也不会一次返回所有的匹配)。例如:
var regx=/user/d/;
var str=“user1sdfsffuser2dfsdf”;
var rs=str.match(regx);//此时rs的值为{user1}
var rs2=str.match(regx);//此时rs的值依然为{user1}
如果regx=/user/d/g,则rs的值为{user1,user2},rs2的值也为{user1,user2}
4)对于String对象的replace方法,表达式不加入g,则只替换第一个匹配,如果加入g,则替换所有匹配。(开头的三道测试题能很好的说明这一点)
5)对于String对象的split方法,加上g与不加g是一样的,即:
var sep=/user/d/;
var array=“user1dfsfuser2dfsf”.split(sep);
则array的值为{dfsf, dfsf}
此时sep=/user/d/g,返回值是一样的。
6)对于String对象的search方法,加不加g也是一样的。
⑼ ASP中如何过滤指字文字前或指定文字后所有内容呢
可以用正则进行替换,例如以下代码可以替换a及以后的内所有容字符
<%
str="1234agds34.32"
Dim regEx
Set regEx=new RegExp
regEx.pattern="a.*"
regEx.IgnoreCase =false
regEx.Global=True
str=regEx.Replace(str,"00000")
Response.Write "aaa="&str
%>
⑽ 在数据库里面取出的内容,我想把里面的文字过滤出去,只留下里面的img标签,请问应该怎么做
你的意思是类似来于<html><title></title><body><div><img src=“”>。。源。。
这样的html代码 要把img 单独取出来吗
你可以用 substring 这样的函数
微软的mssql 的用法可能和mysql之类的不太一致 你网络一下