导航:首页 > 净水问答 > 正则表达过滤中文

正则表达过滤中文

发布时间:2020-12-19 19:24:06

⑴ 如何用正则表达式去除字符串的中文

<script>
/***去除中文函数回****/
/***BY TONYLINZHEN****/
function CutChr()
{
var x=document.getElementById("text");
var str=x.value;
while(/[\u4E00-\u9FA5]+/.test(str)){
str=str.replace(/[\u4E00-\u9FA5]+/,"");
x.value=str;
}
}

</script>

<body>
<textarea cols="30" rows="30" id="text"></textarea>
<input type="button" value="提交答" onclick="CutChr()"/>
</body>

⑵ 正则表达式 筛选中文

preg_match("/<\/label>[\s]*(?:<span.*?>)?(.+?)(?:<\/span>)?[\s]*<li>/is", $test, $getcontent);
echo $getcontent[1];
//你试试看

⑶ 正则表达式过滤中文

/^(^([\\u4E00-\\u9FA5]|[\\uFE30-\\uFFA0]))*$/

你是要这个吧? ^在正则表达式中,还有字符串开始的意思....

⑷ 怎么使用正则表达式表示汉字,目的是要在notepad++筛选出所有汉字,编码格式为ANSI

^我刚在在notepad++中试来过了,貌似它的正则表源达式引擎是单字节的。用[\u4e00-\u9fa5]与[^\x00-\xff]都不能正常的匹配中文。实在是郁闷,在java、C#、JS里面编程都可以用“[\u4e00-\u9fa5]”来匹配中文的,于是想\u4e00不就是“一”,\u9fa5不就是“龥”吗?于是使用:
[一-龥]
正常查找到所有的中文字。这时,中文标点符号没有匹配,加上[\uFF01-\uFF5E],即[!-~],完美解决。。。

于是得出,notepad++、UltraEdit中匹配中文的正则表达式为:
[一-龥!-~]

如果没有解决你的问题,请发网络消息给我。

⑸ ORACLE中怎样用正则表达式过滤中文字符

从表里提取汉字, 需要考虑字符集, 不同的字符集汉字的编码有所不同
这里以GB2312为例, 写一函数准确地从表里提取简体汉字.

假设数据库字符集编码是GB2312, 环境变量(注册表或其它)的字符集也是GB2312编码
并且保存到表里的汉字也都是GB2312编码的

那么也就是汉字是双字节的,且简体汉字的编码范围是
B0A1 - F7FE
换算成10进制就是
B0 A1 F7 FE
176,161 - 247,254

我们先看一下asciistr函数的定义
Non-ASCII characters are converted to the form \xxxx, where xxxx represents a UTF-16 code unit.
但是这并不表示以 "\" 开始的字符就是汉字了

举例如下
SQL> select * from test;

NAME
--------------------
,啊OO10哈
你好aa
大家好aa/
☆大海123
★ABC

这里第5条记录有一个实心的五角星
然后用asciistr函数转换一下试试
SQL> select name,asciistr(name) from test;

NAME ASCIISTR(NAME)
-------------------- ----------------------
,啊OO10哈 ,\554AOO10\54C8
你好aa \4F60\597Daa
大家好aa/ \5927\5BB6\597Daa/
☆大海123 \2606\5927\6D77123
★ABC \2605ABC

我们看到最后一条记录的实心五角星也是 "\"开头的
此时我们就不能用asciistr(字段)是否存在 "\" 来判断是否含有汉字了.

我的函数如下,基本思路是判断字符的编码是否在GB2312规定的汉字编码范围之内
[PHP]
create or replace function get_chinese(p_name in varchar2) return varchar2
as
v_code varchar2(30000) := '';
v_chinese varchar2(4000) := '';
v_comma pls_integer;
v_code_q pls_integer;
v_code_w pls_integer;
begin
if p_name is not null then
select replace(substrb(mp(p_name,1010),instrb(mp(p_name,1010),'ZHS16GBK:')),'ZHS16GBK: ','') into v_code from al where rownum=1;
for i in 1..length(p_name) loop
if lengthb(substr(p_name,i,1))=2 then
v_comma := instrb(v_code,',');
v_code_q := to_number(substrb(v_code,1,v_comma-1));
v_code_w := to_number(substrb(v_code,v_comma+1,abs(instrb(v_code,',',1,2)-v_comma-1)));
if v_code_q>=176 and v_code_q<=247 and v_code_w>=161 and v_code_w<=254 then
v_chinese := v_chinese||substr(p_name,i,1);
end if;
v_code := ltrim(v_code,'1234567890');
v_code := ltrim(v_code,',');
end if;
v_code := ltrim(v_code,'1234567890');
v_code := ltrim(v_code,',');
end loop;
return v_chinese;
else
return '';
end if;
end;
/
.
[/PHP]

好,现在来执行一些语句
SQL> select * from test;

NAME
--------------------
,啊OO10哈
你好aa
大家好aa/
☆大海123
★ABC

5 rows selected.

1. 列出有汉字的记录
SQL> select name from test where length(get_chinese(name))>0;

NAME
--------------------
,啊OO10哈
你好aa
大家好aa/
☆大海123

4 rows selected.

2. 列出有汉字的记录,并且只列出汉字

SQL> select get_chinese(name) from test where length(get_chinese(name))>0;

GET_CHINESE(NAME)
---------------------------------------------------------------------------
啊哈
你好
大家好
大海

4 rows selected.

需要说明的是GB2312共有6763个汉字,即72*94-5=6763
我这里是计算72*94,没有减去那5个,那五个是空的。等查到了再减去
============

改写这个函数,可以提取非汉字或者汉字
该函数有两个参数,第一个表示要提取的字符串,第二个是1,表示提取汉字,是非1,表示提取非汉字

[PHP]
create or replace function get_chinese
(
p_name in varchar2,
p_chinese in varchar2
) return varchar2
as
v_code varchar2(30000) := '';
v_chinese varchar2(4000) := '';
v_non_chinese varchar2(4000) := '';
v_comma pls_integer;
v_code_q pls_integer;
v_code_w pls_integer;
begin
if p_name is not null then
select replace(substrb(mp(p_name,1010),instrb(mp(p_name,1010),'ZHS16GBK:')),'ZHS16GBK: ','') into v_code from al where rownum=1;
for i in 1..length(p_name) loop
if lengthb(substr(p_name,i,1))=2 then
v_comma := instrb(v_code,',');
v_code_q := to_number(substrb(v_code,1,v_comma-1));
v_code_w := to_number(substrb(v_code,v_comma+1,abs(instrb(v_code,',',1,2)-v_comma-1)));
if v_code_q>=176 and v_code_q<=247 and v_code_w>=161 and v_code_w<=254 then
v_chinese := v_chinese||substr(p_name,i,1);
else
v_non_chinese := v_non_chinese||substr(p_name,i,1);
end if;
v_code := ltrim(v_code,'1234567890');
v_code := ltrim(v_code,',');
else
v_non_chinese := v_non_chinese||substr(p_name,i,1);
end if;
v_code := ltrim(v_code,'1234567890');
v_code := ltrim(v_code,',');
end loop;
if p_chinese = '1' then
return v_chinese;
else
return v_non_chinese;
end if;
else
return '';
end if;
end;
/

.
[/PHP]
SQL> select * from a;

NAME
--------------------
我们啊、
他(艾呀)是★们
他的\啊@

SQL> select get_chinese(name,1) from a;

GET_CHINESE(NAME,1)
-----------------------------------------
我们啊
他艾呀是们
他的啊

SQL> select get_chinese(name,0) from a;

GET_CHINESE(NAME,0)
-----------------------------------------

()★
\@

SQL>

⑹ java正则表达式 过滤特殊字符 只允许中文、字母和数字, 该怎么写急。。。

^~|||String str = "*(^YUIGHUGU^^&*()*6哈哈89324328uewh~!@#$%^&*()_+,./<>?;':[]\\{}|-=";//要过滤的字符串
str = str.replaceAll("[\\pP|~|$|^|<|>|\\||\\+|=]*", "");
System.out.println(str);
输出内结果容:YUIGHUGU6哈哈89324328uewh

⑺ java字符串里面如何用正则表达式去掉汉字

public static void main(String[] args) {

// TODO Auto-generated method stub

String str = "123abc你好efc";

String reg = "[u4e00-u9fa5]";

Pattern pat = Pattern.compile(reg);

Matcher mat=pat.matcher(str);

String repickStr = mat.replaceAll("");

System.out.println("去中文后:"+repickStr);

}

⑻ python中正则表达式怎么过滤中文日期类型

^

defdouble(matched):
value=int(matched.group('value'))
if(value<10):
return"0"+str(value);
else:
returnstr(value);
s='《2017年制7月3日》';
s=re.sub('(?P<value>d+)',double,s);
s=re.sub(r'D','',s);
prints;

s='《2017年6月5日与6月12日合集》';
s=re.sub('(?P<value>d+)',double,s);
s=re.sub('与','-',s)
s=re.sub(r'[^d-]','',s);
prints;

⑼ 求一个正则表达式可以匹配:中文字符,中文标点符号,英文,数字,下划线。但不能输入@、# 等特殊字符.

\w+|[,。《》()、—]+

\w匹配:中文字符,英文,数字,下划线
至于中文标点符号,看你需要了,如果有另外的就添加在中括号里面。

⑽ 正则表达式能过滤中文特殊字符吗

String s1="我是复正确制测试数据aasdf2342343ASFASDF"; String s2="我是错误测试数据@#!@#"; String reg = "[^0-9a-zA-Z\u4e00-\u9fa5]+"; System.out.println(s1.replaceAll(reg,"")); System.out.println(s2.replaceAll(reg,""));

阅读全文

与正则表达过滤中文相关的资料

热点内容
废水乙二醇可生化性 浏览:104
沸石会和蒸馏原料发生反应吗 浏览:127
江西净水系统多少钱 浏览:653
为什么要洗超滤装置 浏览:170
反渗透教育班会记录 浏览:124
环氧树脂灌胶去除 浏览:817
反渗透式净水机产生的废水 浏览:125
发电厂的脱硫废水 浏览:306
空调过滤网坏了咋办 浏览:386
焦化废水与生活污水的区别 浏览:840
别人用粤语说谢谢怎么回 浏览:970
荏源污水提升泵 浏览:303
如何清洗轿车上的白色水垢 浏览:399
宁河区污水处理厂地址 浏览:314
夏利n5的空调滤芯在哪里更换 浏览:999
污水现场监测调查包括什么 浏览:17
牛废水能浇茶树吗 浏览:141
烤贴面和树脂贴面 浏览:186
实验室制取蒸馏水的目的是什么 浏览:214
污水处理有哪些基本办法 浏览:476