PHP:UTF8中的西里尔字符串不区分大小写的preg_replace

如何解决PHP:UTF8中的西里尔字符串不区分大小写的preg_replace

| 我有一个PHP 5.3脚本显示我的网站用户,并想用它的旧名称替换某个俄罗斯城市(存储在PostgreSQL 8.4.7数据库中的UTF8 + CentOS 5.5 / 64位Linux中)(这是一个内部笑话) :
preg_replace(\'/Волгоград/iu\',\'Сталинград\',$city);
不幸的是,这仅适用于完全匹配:Волгоград。 这不适用于其他情况,例如ВОЛГОГРАД或волгоград。 如果我将源代码修改为
preg_replace(\'/[Вв]олгоград/iu\',$city);
那么它将捕获上述第二种情况。 是否有人知道它发生了什么以及如何解决(假设我不想为每个字母写[Xx])? 谢谢! 亚历克斯 更新:
# rpm -qa|grep php
php53-bcmath-5.3.3-1.el5
php53-gd-5.3.3-1.el5
php53-common-5.3.3-1.el5
php53-pdo-5.3.3-1.el5
php53-mbstring-5.3.3-1.el5
php53-xml-5.3.3-1.el5
php53-5.3.3-1.el5
php53-cli-5.3.3-1.el5
php53-pgsql-5.3.3-1.el5

# rpm -qa|grep pcre
pcre-6.6-2.el5_1.7

解决方法

我无法用PHP 5.3.3(
PHP 5.3.3-1ubuntu9.3 with Suhosin-Patch (cli)
)重现您的问题:
$str1 = \'Волгоград\';
$str2 = \'ВОЛГОГРАД\';
$str3 = \'волгоград\';

var_dump(preg_replace(\'/Волгоград/iu\',\'Сталинград\',$str1));
var_dump(preg_replace(\'/Волгоград/iu\',$str2));
var_dump(preg_replace(\'/Волгоград/iu\',$str3));
输出
string(20) \"Сталинград\"
string(20) \"Сталинград\"
string(20) \"Сталинград\"
您的PHP使用哪个PCRE版本?在
pcre
部分检查
phpinfo()
。那就是我系统上的那个:
...
pcre

PCRE (Perl Compatible Regular Expressions) Support => enabled
PCRE Library Version => 8.02 2010-03-19
...
,您可以跳过正则表达式,它在PHP 5.2.11中对我有用:)
$city = \'Unfortunately this only works for exact matches: Волгоград.

This does not work for other cases,like ВОЛГОГРАД or волгоград.\';

echo str_ireplace(\'Волгоград\',\'[found]\',$city);
输出量
\"Unfortunately this only works for exact matches: [found].

This does not work for other cases,like [found] or [found].\"
这引起了我的兴趣,所以我问了一个问题。,这个解决了这个问题:
setlocale(LC_ALL,\'ru_RU.CP1251\',\'rus_RUS.CP1251\',\'Russian_Russia.1251\');
,我复制并粘贴了您的大笔
В
。确实是
U+D092
,而不是普通的拉丁语
B
。但是,由于它们看起来非常相似:
ВB
,我相信俄语字母会被整理到B16ѭ的拉丁字母B上。 因此,要么是PHP对其进行预格式化,要么PCRE在那里也不精确。测试您的
print PCRE_VERSION;
并查看更新日志。 无论如何,为了避免这个问题,我建议您只使用小写字母。它们更有可能与拉丁字母不同。
preg_replace(\'/волгоград/iu\',$city);
附言:恶作剧!,在我的盒子上就像魅力一样...
<?php
    $city = \'Волгоград\';
    var_dump(preg_match(\'/волгоград/ui\',$city));
    var_dump(preg_match(\'/ВОЛГОГРАД/ui\',$city));
    var_dump(preg_replace(\'/волгоград/ui\',$city));
    var_dump(preg_replace(\'/ВОЛГОГРАД/ui\',$city));
输出:
int 1
int 1
string \'Сталинград\' (length=20)
string \'Сталинград\' (length=20)
您确定输入数据($ city)在UTF8中吗?,也许尝试:mb_eregi_replace http://www.php.net/manual/zh/function.mb-eregi-replace.php mb_eregi_replace —用多字节支持替换正则表达式,忽略大小写,只是猜测,但是将字符串显式编码为unicode可能会有所帮助:
preg_replace(\'/Волгоград/iu\',utf8_encode(\'Сталинград\'),$city);
,实际上,在Windows上使用PHP 5.2.x时,选择的已解决答案对我不起作用。 我必须经历转换为Windows-1251才能使其运行。 这里是示例:
$new_content = preg_replace(iconv(\'UTF-8\',\'Windows-1251\',\"/\\bгъз\\b/i\"),iconv(\'UTF-8\',\"YYYYYY\"),\"ти си gyz gyz гъз ГЪЗ gyzgyz гЪз gyz\"));
$new_content = iconv(\'Windows-1251\',\'UTF-8\',$new_content);
上面的示例将成功(用大小写替代)\'гъз\'替换为YYYYYY,并返回UTF-8版本。 问候!,对于那些支持庞大的旧代码库,在字符集和编码问题上苦苦挣扎,并且无法选择转换代码字符集的用户-这是一个答案:
//for 
setlocale(LC_ALL,\'ru_RU.cp1251\');  
//(or any other locale) to take effect,//you MUST generate system locale,i.e.

sudo su
#view supported locales
#less /usr/share/i18n/SUPPORTED
echo \"ru_RU.cp1251 CP1251\" >> /var/lib/locales/supported.d/local
dpkg-reconfigure locales
exit

#and (for ubuntu/debian)

apt-get install php5-intl
虽然您可以重写regexp以使用一些utf技巧,将代码转换为utf,但是当您使用庞大的代码库/数据库等时,这不是一个选择

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


依赖报错 idea导入项目后依赖报错,解决方案:https://blog.csdn.net/weixin_42420249/article/details/81191861 依赖版本报错:更换其他版本 无法下载依赖可参考:https://blog.csdn.net/weixin_42628809/a
错误1:代码生成器依赖和mybatis依赖冲突 启动项目时报错如下 2021-12-03 13:33:33.927 ERROR 7228 [ main] o.s.b.d.LoggingFailureAnalysisReporter : *************************** APPL
错误1:gradle项目控制台输出为乱码 # 解决方案:https://blog.csdn.net/weixin_43501566/article/details/112482302 # 在gradle-wrapper.properties 添加以下内容 org.gradle.jvmargs=-Df
错误还原:在查询的过程中,传入的workType为0时,该条件不起作用 &lt;select id=&quot;xxx&quot;&gt; SELECT di.id, di.name, di.work_type, di.updated... &lt;where&gt; &lt;if test=&qu
报错如下,gcc版本太低 ^ server.c:5346:31: 错误:‘struct redisServer’没有名为‘server_cpulist’的成员 redisSetCpuAffinity(server.server_cpulist); ^ server.c: 在函数‘hasActiveC
解决方案1 1、改项目中.idea/workspace.xml配置文件,增加dynamic.classpath参数 2、搜索PropertiesComponent,添加如下 &lt;property name=&quot;dynamic.classpath&quot; value=&quot;tru
删除根组件app.vue中的默认代码后报错:Module Error (from ./node_modules/eslint-loader/index.js): 解决方案:关闭ESlint代码检测,在项目根目录创建vue.config.js,在文件中添加 module.exports = { lin
查看spark默认的python版本 [root@master day27]# pyspark /home/software/spark-2.3.4-bin-hadoop2.7/conf/spark-env.sh: line 2: /usr/local/hadoop/bin/hadoop: No s
使用本地python环境可以成功执行 import pandas as pd import matplotlib.pyplot as plt # 设置字体 plt.rcParams[&#39;font.sans-serif&#39;] = [&#39;SimHei&#39;] # 能正确显示负号 p
错误1:Request method ‘DELETE‘ not supported 错误还原:controller层有一个接口,访问该接口时报错:Request method ‘DELETE‘ not supported 错误原因:没有接收到前端传入的参数,修改为如下 参考 错误2:cannot r
错误1:启动docker镜像时报错:Error response from daemon: driver failed programming external connectivity on endpoint quirky_allen 解决方法:重启docker -&gt; systemctl r
错误1:private field ‘xxx‘ is never assigned 按Altʾnter快捷键,选择第2项 参考:https://blog.csdn.net/shi_hong_fei_hei/article/details/88814070 错误2:启动时报错,不能找到主启动类 #
报错如下,通过源不能下载,最后警告pip需升级版本 Requirement already satisfied: pip in c:\users\ychen\appdata\local\programs\python\python310\lib\site-packages (22.0.4) Coll
错误1:maven打包报错 错误还原:使用maven打包项目时报错如下 [ERROR] Failed to execute goal org.apache.maven.plugins:maven-resources-plugin:3.2.0:resources (default-resources)
错误1:服务调用时报错 服务消费者模块assess通过openFeign调用服务提供者模块hires 如下为服务提供者模块hires的控制层接口 @RestController @RequestMapping(&quot;/hires&quot;) public class FeignControl
错误1:运行项目后报如下错误 解决方案 报错2:Failed to execute goal org.apache.maven.plugins:maven-compiler-plugin:3.8.1:compile (default-compile) on project sb 解决方案:在pom.
参考 错误原因 过滤器或拦截器在生效时,redisTemplate还没有注入 解决方案:在注入容器时就生效 @Component //项目运行时就注入Spring容器 public class RedisBean { @Resource private RedisTemplate&lt;String
使用vite构建项目报错 C:\Users\ychen\work&gt;npm init @vitejs/app @vitejs/create-app is deprecated, use npm init vite instead C:\Users\ychen\AppData\Local\npm-