如何解决htmlentities使中文字符不可用
| 我们有一个Web应用程序,允许用户在文本区域中输入自己的html。我们将该数据保存到我们的数据库中。 当然,当我们将html数据加载到文本区域时,我们在将html数据扔到textarea之前使用htmlentities()。否则,用户可以将其保存在文本区域内,并且将其加载到文本区域时,我们的应用程序将损坏。 这很有效,除了输入中文字符(以及其他语言,例如阿拉伯语,日语)时。 htmlentities()使中文文本无法使用,如下所示:ÃÂ�ÃÂÂü¼¼Ã§§Ã 当我在将输入的html加载到文本区域之前删除htmlentities()时,汉字显示得很好,但是然后我们遇到了HTML干扰文本区域的问题,尤其是当用户在文本区域内输入时。 我希望这是有道理的。 有谁知道我们如何安全,正确地允许在文本区域内使用中文,日语,...等语言,同时仍然可以安全地在文本区域内加载任何html?解决方法
您是否尝试过使用htmlspecialchars?
我目前在生产中使用它,还可以。
$foo = \"我的名字叫萨沙\"
echo \'<textarea>\' . htmlspecialchars($foo) . \'</textarea>\';
交替,
$str = “你好”;
echo mb_convert_encoding($str,‘UTF-8′,‘HTML-ENTITIES’);
如http://www.techiecorner.com/129/php-how-to-convert-iso-character-htmlentities-to-utf-8/
, 指定字符集,例如UTF-8,它应该可以工作。
echo htmlentities($data,ENT_COMPAT,\'UTF-8\');
, 就国际范围内对国际字符集的支持而言,PHP令人震惊(尽管它逐渐变得越来越好,尤其是在PHP5中,但是您没有指定要使用的版本)。但是,有一些mb_
(多字节,如多字节字符)功能可以帮助您。
此示例可能会帮助您(从此处开始):
<?php
/**
* Multibyte equivalent for htmlentities() [lite version :)]
*
* @param string $str
* @param string $encoding
* @return string
**/
function mb_htmlentities($str,$encoding = \'utf-8\') {
mb_regex_encoding($encoding);
$pattern = array(\'<\',\'>\',\'\"\',\'\\\'\');
$replacement = array(\'<\',\'>\',\'"\',\''\');
for ($i=0; $i<sizeof($pattern); $i++) {
$str = mb_ereg_replace($pattern[$i],$replacement[$i],$str);
}
return $str;
}
?>
另外,请确保您的页面指定了相同的字符集。您可以使用meta标签执行此操作:
<meta http-equiv=\"Content-Type\" content=\"text/html; charset=utf-8\">
, 您很可能没有使用正确的编码。如果您已经知道输出编码,请使用html_entities
函数的charset
参数。
如果尚未确定内部编码,请看一下iconv函数; iconv_set_encoding(\"internal_encoding\",\"UTF-8\");
可能是一个好的开始。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。