導航:首頁 > 凈水問答 > 網頁代碼過濾

網頁代碼過濾

發布時間:2021-03-17 14:24:55

① 新聞小偷將一個網頁的HTML代碼拿來後,如何過濾了只剩文字信息

TextForever(FineReader) 版本:1.54 評價:★★★★
http://www.comicer.com/stronghorse/software/exe/TextForever_chn.zip
文件: 中文簡體版 中文簡體版說明 English版(其中說明文件還是中文的)
功能: 提供以下功能:HTML->TXT轉換、文件合並、TXT文件段落合並、TXT文件分行、編碼(GB/GBK/Big5/Shift-JIS/Unicode)轉換(只能用於Win 2k/XP)、文本替換、HTML代碼整理、文件切分、文本提取、正則表達式、TCR批量壓縮/解壓,用於整理從Internet上下載的小說。軟體原名FineReader,後更名為TextForever。
動機: 我初上網時常去「阿拉談書屋」看小說,網主無聊到將每一頁做成一個文件(後來他也為此而後悔不已),看起來很累,所以就想編一個程序能對下載下來的文件進行合並、整理,變成TXT文件以便閱讀、列印。
為了編制這個程序,我專門從Internet下載了一堆HTML文檔,苦讀半月。所以有一次我和一個朋友開玩笑:他通過做主頁練HTML,我則通過讀主頁練,大家殊途同歸。
說起來「阿拉談書屋」對我所起的作用實在不小,不僅將我引進了Internet的大門,還為我學習Internet編程提供了強大的動力,先後產生了CrazyReader和TextForever(FineReader)。
這個程序的段落合並功能則是在我對在網上大肆吹噓的某「智能排版」工具感到極端厭煩的情況下做出來的,保證比它好使。

② 如何用正則表達式提取網頁源碼中內容,一定要過濾html標簽!重酬~

數據採集技術中,用正則最為基本和簡單,然而經常出錯,網路上有很多現成內的採集器,或者採集代碼類容庫,比如我採集的時候,用php+simpleHtmlDom,或者用任何一種語言+xpath,都可以把html載入成DOM樹,然後訪問需要的數據

③ 一套程序提交信息時把html部分代碼過濾了,怎麼寫才不會被過濾了

就看他的過濾是本地過濾還是伺服器過濾了,本地過濾的話一般用的是腳本過濾,只要在本地禁用腳本就可以,如果是伺服器端過濾的話那就沒辦法了,你只有找其他方法將他的伺服器許可權搞到手,將他的伺服器網頁程序改掉才行。

④ 寫一段js代碼過濾一段內容的里html代碼

缺少你的代碼可參照,看不到問題

⑤ 輸出數據時,如何過濾html代碼

這個方法在網上很流行的,你看看
<%
Function RemoveHTML(strHTML)
Dim objRegExp, Match, Matches
Set objRegExp = New Regexp

objRegExp.IgnoreCase = True
objRegExp.Global = True
'取閉合的<>
objRegExp.Pattern = "<.+?>"
'進行匹配
Set Matches = objRegExp.Execute(strHTML)

' 遍歷匹配集合,並替換掉匹配的項目
For Each Match in Matches
strHtml=Replace(strHTML,Match.Value,"")
Next
RemoveHTML=strHTML
Set objRegExp = Nothing
End Function
%>

⑥ 如下代碼,如何將內容中的HTML過濾掉。Content內容

讓我來猜猜看,你是不是需要這個。 Function RemoveHTML(strHTML) Dim objRegExp, Match, Matches Set objRegExp = New Regexp objRegExp.IgnoreCase = True objRegExp.Global = True '取閉合的<> objRegExp.Pattern = "<.+?>" '進行匹配 Set Matches = objRegExp.Execute(strHTML) ' 遍歷匹配集合,並替換掉匹配的項目 For Each Match in Matches strHtml=Replace(strHTML,Match.Value,"") Next RemoveHTML=strHTML Set objRegExp = Nothing End Function

⑦ 怎樣用js方法過濾html等代碼

^<input type="text" id="theOne" value="">
<input type="button" onclick="NoHtml()" value="過濾html標簽">
<script>
function NoHtml(){
var t=document.getElementById("theOne").value;
t=t.replace(/({|})/g,''); //過濾{}
t=t.replace(/</g,'<'); //置換符號<
t=t.replace(/>/g,'>'); //置換符號>
// t=t.replace(/<\/?[^>]*>/g,''); //*<\/?[^>]*>可以匹配<script></style></body>等,並置空。而不是替內換容<和>兩個符號
document.getElementById("theOne").value=t;
}
</script>

⑧ 如何繞過html代碼過濾

一般情況下你都繞不過!

除非是那種很傻的網站,只在前台用js過濾內,伺服器端沒過濾的網站程序,這種你直接通過容地址欄把數據提交出去就行了,不過這種很傻的網站這個年代基本上找不到了。

看樣子你是想到論壇發東西,現在的論壇你沒機會,html過濾和訪注入都做得很到位了。

⑨ 怎樣用js方法過濾html等代碼,如@

關鍵點制:

  1. 正則表達式,把要替換的內容用正則表達式表達出來,如字元串、數字、字母中文、標點符號等。

  2. replace() 方法,用於在字元串中用一些字元替換另一些字元,或替換一個與正則表達式匹配的子串。



上代碼:

<html>
<head>
<title>無標題文檔</title>
<metacharset="UTF-8">
</head>
<body>
<divid="main">文章內容@文章內容,文章內容@文章內容</div>
</body>

<script>
//獲取標簽中文本
vardoj_str=document.getElementById('main').innerText;
//要替換的字元串,最後的g表示全局匹配,例如又多個@
varreg_str=/@/g;
//替換為空
varnew_str=doj_str.replace(reg_str,'');
//輸出新字元串
document.write(new_str);
</script>

</html>

⑩ 過濾除表格以外的所有html代碼,如何實現

public static string NoHTML(string Htmlstring)
{
//刪除腳本
Htmlstring=Htmlstring.Replace("'", "'");
Htmlstring = Regex.Replace(Htmlstring, @" <script[^>]*?>.*? </script>", "",RegexOptions.IgnoreCase);
//刪除HTML 下面一行刪除,涉及到表格裡面的table tr td
//Htmlstring = Regex.Replace(Htmlstring, @" <(.[^(table|tr|td|>)]*)>", "",RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @"([\r\n])[\s]+", "",RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @"-->", "", RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @" <!--.*", "", RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @"&(quot|#34);", "\"",RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @"&(amp|#38);", "&",RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @"&(lt|#60);", " <",RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @"&(gt|#62);", ">",RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @"&(nbsp|#160);", " ",RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @"&(iexcl|#161);", "\xa1",RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @"&(cent|#162);", "\xa2",RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @"&(pound|#163);", "\xa3",RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @"&(|#169);", "\xa9",RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @"&#(\d+);", "",RegexOptions.IgnoreCase);
Htmlstring.Replace(" <", "");
Htmlstring.Replace(">", "");
Htmlstring.Replace("\r\n", "");
Htmlstring = HttpContext.Current.Server.HtmlEncode(Htmlstring).Trim();
return Htmlstring;
}

上面已經修改,只用取消Htmlstring = Regex.Replace(Htmlstring, @" <(.[^(table|tr|td|>)]*)>", "",RegexOptions.IgnoreCase); 這一個就行了。

閱讀全文

與網頁代碼過濾相關的資料

熱點內容
液相用溶劑過濾器 瀏覽:674
納濾水導電率 瀏覽:128
反滲透每小時2噸 瀏覽:162
做一個純凈水工廠需要多少錢 瀏覽:381
最終幻想4回憶技能有什麼用 瀏覽:487
污水提升器采通 瀏覽:397
反滲透和不發滲透凈水器有什麼區別 瀏覽:757
提升泵的揚程 瀏覽:294
澤德提升泵合肥經銷商 瀏覽:929
飲水機後蓋漏水了怎麼辦 瀏覽:953
小型電動提升器 瀏覽:246
半透膜和細胞膜區別 瀏覽:187
廢水拖把池 瀏覽:859
十四五期間城鎮污水處理如何提質增效 瀏覽:915
怎麼測試空氣凈化器的好壞 瀏覽:519
提升泵是幹嘛的 瀏覽:744
布油做蒸餾起沫咋辦 瀏覽:252
廣州工業油煙凈化器一般多少錢 瀏覽:204
喜哆哆空氣凈化器效果怎麼樣 瀏覽:424
油煙凈化器油盒在什麼位置 瀏覽:582