⑴ 怎麼從內容中過濾掉圖片,只要顯示部分文字內容
$str='<font size="2" color="#333333">2010-2012 版權所有 <a href="***" target="_blank"> ICP備專xxx號屬-1</a>';
ereg("<.*>.*<.*>", $str, $regs);
print_r($regs[0]);
⑵ C# 通過正則表達式進行html過濾 只留文字,圖片,<p>,<br>
|請參照以下代碼:
public static string FilterHtmlTag(string s)
{
//<...>標記正則表達式
return Regex.Replace(s, @"<[^>]*>", delegate(Match match)
{
string v = match.ToString();
//圖片,<p>,<br>正則表達式
Regex rx = new Regex(@"^<(p|內br|img.*)>$",
RegexOptions.Compiled | RegexOptions.IgnoreCase); //
if (rx.IsMatch(v))
{
return v; //保留圖容片,<p>,<br>
}
else
{
return ""; //過濾掉
}
});
}
⑶ 如何把圖片中的文字過濾出來
只要掃描的來質量還可自以,搞出來沒問題。原理就是OCR----一般有掃描儀的電腦上都應該裝這種識別軟體的。
OFFICE中有一個組件document image,功能一樣的強大。不僅掃描的文字圖片,連數碼相機拍的牆上的宣傳告示上的字都能提取出來。
⑷ 如何過濾掉a標簽,又保留<a href=「#」>保留文字 </a>
1,過濾所有html標簽的正則表達式:]+>2,過濾所有html標簽的屬性的正則表達式:$html=preg_replace("/]*>/","",$html);3,過回濾部分html標簽的正則表達式的排答除式(比如排除,即不過濾):]+>4,過濾部分html標簽的正則表達式的枚舉式(比如需要過濾等):]*>5,過濾部分html標簽的屬性的正則表達式的排除式(比如排除alt屬性,即不過濾alt屬性):\s(?!alt)[a-zA-Z]+=[^\s]*
⑸ 求php 過濾html標簽 但不過濾標簽裡面的文字 的代碼
<?php
$str='<ahref="#">href</a>';
//echohtmlspecialchars($str);
echostrip_tags($str);
?>
⑹ 如何使瀏覽器過濾文字
adk-v1.87網頁凈化器助手過濾
可以過濾網頁上的文字的
⑺ .net 怎麼去除網頁中的超鏈接<a href="">文字<a>,過濾後需要「文字」內容<a>標簽中內容不要
用這個方法試試
public static string GetStripHTML(string strHtml)
{
string [] aryReg ={
@"<script[^>]*?>.*?</script>",
@"<(\/\s*)?!?((\w+:)?\w+)(\w+(\s*=?\s*(([""'])(\\[""'tbnr]|[^\7])*?\7|\w+)|.{0})|\s)*?(\/\s*)?>",
@"([\r\n])[\s]+",
@"&(quot|#34);",
@"&(amp|#38);",
@"&(lt|#60);",
@"&(gt|#62);",
@"&(nbsp|#160);",
@"&(iexcl|#161);",
@"&(cent|#162);",
@"&(pound|#163);",
@"&(|#169);",
@"(\d+);",
@"-->",
@"<!--.*\n"
};
string [] aryRep = {
"",
"",
"",
"\"",
"&",
"<",
">",
" ",
"\xa1",//chr(161),
"\xa2",//chr(162),
"\xa3",//chr(163),
"\xa9",//chr(169),
"",
"\r\n",
""
};
string newReg =aryReg[0];
string strOutput=strHtml;
for(int i = 0;i<aryReg.Length;i++){
Regex regex = new Regex(aryReg[i],RegexOptions.IgnoreCase);
strOutput = regex.Replace(strOutput,aryRep[i]);
}
strOutput.Replace("<","");
strOutput.Replace(">","");
strOutput.Replace("\r\n","");
return strOutput;
}
⑻ 正則表達式取出文字過濾掉中間的字元比如:我是中國人</span>我愛中國 取出我是中國人我愛中國 過濾字元
varstr='我是中國人</span>我愛中國取出我是中國人我愛中國';
varresult=str.replace(/[<][/]?w+[>]/g,'');//result是替換了標簽的字元串
這是使用字元串的replace方法以正則匹配替換掉標簽
正則:/[<][/]?w+[>]/g
/內容/:在JavaScript中表示這是一個正則表達式對象,其他語言內不需要//
[<]:表示標簽的開頭尖括弧
[/]?:表示可以有/符號也可以沒有,目的是為了匹配開始標簽和結束標簽
譬如:<span>內容</span>,替換後只要【內容】
w+:表示字元類(包括大小寫字母,數字),如果你的標簽內會有style="color:red;"的話建議改為.*,即:/[<][/]?.*[>]/g,其中.* 表示任意字元任意長度
[>]:標簽的結束尖括弧
/內容/g:表達式加上參數g之後,表明可以進行全局匹配,注意這里「可以」的含義:
1)對於表達式對象的exec方法,不加入g,則只返回第一個匹配,無論執行多少次均是如此,如果加入g,則第一次執行也返回第一個匹配,再執行返回第二個匹配,依次類推。例如
var regx=/user/d/;
var str=「user18dsdfuser2dsfsd」;
var rs=regx.exec(str);//此時rs的值為{user1}
var rs2=regx.exec(str);//此時rs的值依然為{user1}
如果regx=/user/d/g;則rs的值為{user1},rs2的值為{user2}
通過這個例子說明:對於exec方法,表達式加入了g,並不是說執行exec方法就可以返回所有的匹配,而是說加入了g之後,我可以通過某種方式得到所有的匹配,這里的「方式」對於exec而言,就是依次執行這個方法即可。
2)對於表達式對象的test方法,加入g於不加上g沒有什麼區別。
3)對於String對象的match方法,不加入g,也只是返回第一個匹配,一直執行match方法也總是返回第一個匹配,加入g,則一次返回所有的匹 配(注意這與表達式對象的exec方法不同,對於exec而言,表達式即使加上了g,也不會一次返回所有的匹配)。例如:
var regx=/user/d/;
var str=「user1sdfsffuser2dfsdf」;
var rs=str.match(regx);//此時rs的值為{user1}
var rs2=str.match(regx);//此時rs的值依然為{user1}
如果regx=/user/d/g,則rs的值為{user1,user2},rs2的值也為{user1,user2}
4)對於String對象的replace方法,表達式不加入g,則只替換第一個匹配,如果加入g,則替換所有匹配。(開頭的三道測試題能很好的說明這一點)
5)對於String對象的split方法,加上g與不加g是一樣的,即:
var sep=/user/d/;
var array=「user1dfsfuser2dfsf」.split(sep);
則array的值為{dfsf, dfsf}
此時sep=/user/d/g,返回值是一樣的。
6)對於String對象的search方法,加不加g也是一樣的。
⑼ ASP中如何過濾指字文字前或指定文字後所有內容呢
可以用正則進行替換,例如以下代碼可以替換a及以後的內所有容字元
<%
str="1234agds34.32"
Dim regEx
Set regEx=new RegExp
regEx.pattern="a.*"
regEx.IgnoreCase =false
regEx.Global=True
str=regEx.Replace(str,"00000")
Response.Write "aaa="&str
%>
⑽ 在資料庫裡面取出的內容,我想把裡面的文字過濾出去,只留下裡面的img標簽,請問應該怎麼做
你的意思是類似來於<html><title></title><body><div><img src=「」>。。源。。
這樣的html代碼 要把img 單獨取出來嗎
你可以用 substring 這樣的函數
微軟的mssql 的用法可能和mysql之類的不太一致 你網路一下