對文字中的標簽過濾_如何過濾掉a標簽

⑴ 怎麼從內容中過濾掉圖片，只要顯示部分文字內容

$str='<font size="2" color="#333333">2010-2012 版權所有 <a href="***" target="_blank"> ICP備專xxx號屬-1</a>';
ereg("<.*>.*<.*>", $str, $regs);
print_r($regs[0]);

⑵ C# 通過正則表達式進行html過濾只留文字,圖片,<p>,<br>

|請參照以下代碼：
public static string FilterHtmlTag(string s)
{
//<...>標記正則表達式
return Regex.Replace(s, @"<[^>]*>", delegate(Match match)
{
string v = match.ToString();

//圖片,<p>,<br>正則表達式
Regex rx = new Regex(@"^<(p|內br|img.*)>$",
RegexOptions.Compiled | RegexOptions.IgnoreCase); //
if (rx.IsMatch(v))
{
return v; //保留圖容片,<p>,<br>
}
else
{
return ""; //過濾掉
}
});
}

⑶ 如何把圖片中的文字過濾出來

只要掃描的來質量還可自以，搞出來沒問題。原理就是OCR----一般有掃描儀的電腦上都應該裝這種識別軟體的。
OFFICE中有一個組件document image，功能一樣的強大。不僅掃描的文字圖片，連數碼相機拍的牆上的宣傳告示上的字都能提取出來。

⑷ 如何過濾掉a標簽,又保留<a href=「#」>保留文字 </a>

1，過濾所有html標簽的正則表達式：]+>2，過濾所有html標簽的屬性的正則表達式：$html=preg_replace("/]*>/","",$html);3，過回濾部分html標簽的正則表達式的排答除式（比如排除，即不過濾）：]+>4，過濾部分html標簽的正則表達式的枚舉式（比如需要過濾等）：]*>5，過濾部分html標簽的屬性的正則表達式的排除式（比如排除alt屬性，即不過濾alt屬性）：\s(?!alt)[a-zA-Z]+=[^\s]*

⑸ 求php 過濾html標簽但不過濾標簽裡面的文字的代碼

<?php
$str='<ahref="#">href</a>';
//echohtmlspecialchars($str);
echostrip_tags($str);
?>

⑹ 如何使瀏覽器過濾文字

adk-v1.87網頁凈化器助手過濾
可以過濾網頁上的文字的

⑺ .net 怎麼去除網頁中的超鏈接<a href="">文字<a>，過濾後需要「文字」內容<a>標簽中內容不要

用這個方法試試
public static string GetStripHTML(string strHtml)
{

string [] aryReg ={

@"<script[^>]*?>.*?</script>",

@"<(\/\s*)?!?((\w+:)?\w+)(\w+(\s*=?\s*(([""'])(\\[""'tbnr]|[^\7])*?\7|\w+)|.{0})|\s)*?(\/\s*)?>",

@"([\r\n])[\s]+",

@"&(quot|#34);",

@"&(amp|#38);",

@"&(lt|#60);",

@"&(gt|#62);",

@"&(nbsp|#160);",

@"&(iexcl|#161);",

@"&(cent|#162);",

@"&(pound|#163);",

@"&(|#169);",

@"&#(\d+);",

@"-->",

@"<!--.*\n"

};

string [] aryRep = {

"",

"",

"",

"\"",

"&",

"<",

">",

" ",

"\xa1",//chr(161),

"\xa2",//chr(162),

"\xa3",//chr(163),

"\xa9",//chr(169),

"",

"\r\n",

""

};

string newReg =aryReg[0];

string strOutput=strHtml;

for(int i = 0;i<aryReg.Length;i++){

Regex regex = new Regex(aryReg[i],RegexOptions.IgnoreCase);

strOutput = regex.Replace(strOutput,aryRep[i]);

}

strOutput.Replace("<","");

strOutput.Replace(">","");

strOutput.Replace("\r\n","");

return strOutput;

}

⑻ 正則表達式取出文字過濾掉中間的字元比如：我是中國人</span>我愛中國取出我是中國人我愛中國過濾字元

varstr='我是中國人</span>我愛中國取出我是中國人我愛中國';
varresult=str.replace(/[<][/]?w+[>]/g,'');//result是替換了標簽的字元串

這是使用字元串的replace方法以正則匹配替換掉標簽

正則：/[<][/]?w+[>]/g

/內容/：在JavaScript中表示這是一個正則表達式對象，其他語言內不需要//

[<]:表示標簽的開頭尖括弧

[/]?：表示可以有/符號也可以沒有，目的是為了匹配開始標簽和結束標簽

譬如：<span>內容</span>，替換後只要【內容】

w+:表示字元類(包括大小寫字母,數字)，如果你的標簽內會有style="color:red;"的話建議改為.*,即：/[<][/]?.*[>]/g，其中.* 表示任意字元任意長度

[>]：標簽的結束尖括弧

/內容/g:表達式加上參數g之後，表明可以進行全局匹配，注意這里「可以」的含義：

1）對於表達式對象的exec方法，不加入g，則只返回第一個匹配，無論執行多少次均是如此，如果加入g，則第一次執行也返回第一個匹配，再執行返回第二個匹配，依次類推。例如
var regx=/user/d/;
var str=「user18dsdfuser2dsfsd」;
var rs=regx.exec(str);//此時rs的值為{user1}
var rs2=regx.exec(str);//此時rs的值依然為{user1}
如果regx=/user/d/g；則rs的值為{user1}，rs2的值為{user2}
通過這個例子說明：對於exec方法，表達式加入了g，並不是說執行exec方法就可以返回所有的匹配，而是說加入了g之後，我可以通過某種方式得到所有的匹配，這里的「方式」對於exec而言，就是依次執行這個方法即可。

2）對於表達式對象的test方法，加入g於不加上g沒有什麼區別。

3）對於String對象的match方法，不加入g，也只是返回第一個匹配，一直執行match方法也總是返回第一個匹配，加入g，則一次返回所有的匹配（注意這與表達式對象的exec方法不同，對於exec而言，表達式即使加上了g，也不會一次返回所有的匹配）。例如：
var regx=/user/d/;
var str=「user1sdfsffuser2dfsdf」;
var rs=str.match(regx);//此時rs的值為{user1}
var rs2=str.match(regx);//此時rs的值依然為{user1}
如果regx=/user/d/g，則rs的值為{user1,user2}，rs2的值也為{user1,user2}

4）對於String對象的replace方法，表達式不加入g，則只替換第一個匹配，如果加入g，則替換所有匹配。（開頭的三道測試題能很好的說明這一點）

5）對於String對象的split方法，加上g與不加g是一樣的，即：
var sep=/user/d/;
var array=「user1dfsfuser2dfsf」.split(sep);
則array的值為{dfsf, dfsf}
此時sep=/user/d/g，返回值是一樣的。

6）對於String對象的search方法，加不加g也是一樣的。

⑼ ASP中如何過濾指字文字前或指定文字後所有內容呢

可以用正則進行替換，例如以下代碼可以替換a及以後的內所有容字元
<%
str="1234agds34.32"
Dim regEx
Set regEx=new RegExp
regEx.pattern="a.*"
regEx.IgnoreCase =false
regEx.Global=True
str=regEx.Replace(str,"00000")
Response.Write "aaa="&str
%>

⑽ 在資料庫裡面取出的內容，我想把裡面的文字過濾出去，只留下裡面的img標簽，請問應該怎麼做

你的意思是類似來於<html><title></title><body><div><img src=「」>。。源。。

這樣的html代碼要把img 單獨取出來嗎

你可以用 substring 這樣的函數
微軟的mssql 的用法可能和mysql之類的不太一致你網路一下

導航:首頁 > 凈水問答 > 對文字中的標簽過濾

對文字中的標簽過濾

與對文字中的標簽過濾相關的資料