如何解决我正在获取未由$ _GET [tag]解码的编码URL,例如%5Cu003d,它将解码“ =“
我得到一些用户请求带有编码URL的页面,这些URL只是无法通过$ _GET [tag]解码来实现。
我认为最严重的犯罪者是%5Cu003d,但还有其他人。在这个例子中 page.php?tag%5Cu003d44应该是page.php?tag = 44,因为%5C是/ so / u003D是unicode 003D或“ =”
我不知道哪个网站对此URL进行了编码,但是我试图在不手动解码内容的情况下向人们提供他们想要的东西。是否有一些开关或方法可以执行此操作,以便$ _GET工作?大概吧?
我尝试在SO上的每一次讨论中都发送此标头,但这没有帮助。 标头(“内容类型:text / html; charset = utf-8”);
EDIT *****************************
以下是不良网址的更多示例:
page.php?lat=25.79&%3Blon=-80.16
page.php?lat=41.46u0026lon%3D-82.71
page.php?lat%5Cu003d30.31%5Cu0026lon%5Cu003d-89.33
page.php?lat=28.94-89.4&lon
解决方法
如果这是我的项目,即使利益相关者的要求很好,我可能也不会尊敬这些URL。这确实是一团糟,并且很有可能在解码过程中损坏数据。 ...但是如果您想尝试一下,可以从类似以下的内容开始:
代码:(Demo)
// this is hack until you can manage to resolve the encoding issue in a more professional manner
// use $_SERVER['QUERY_STRING'] to extract the query string from the url
$queryStrings = [
'lat=25.79&%3Blon=-80.16','lat=41.46u0026lon%3D-82.71','lat%5Cu003d30.31%5Cu0026lon%5Cu003d-89.33','lat=28.94-89.4&lon','tag%5Cu003d44'
];
foreach ($queryStrings as $queryString) {
// replace unicode-like substrings
$queryString = preg_replace_callback('/u([\da-f]{4})/i',function ($match) {
return mb_convert_encoding(pack('H*',$match[1]),'UTF-8','UCS-2BE');
},urldecode($queryString));
// courtesy of Gumbo: https://stackoverflow.com/a/2934602/2943403
// replace ampersands and remove backslashes
$queryString = strtr($queryString,['&' => '&','\\' => '']);
// parse the decoded query string back into the GET superglobal so that regular processing can resume
parse_str($queryString,$_GET);
var_export($_GET);
echo "\n";
}
输出:
array (
'lat' => '25.79','lon' => '-80.16',)
array (
'lat' => '41.46','lon' => '-82.71',)
array (
'lat' => '30.31','lon' => '-89.33',)
array (
'lat' => '28.94-89.4',// <-- I guess you'll need to massage this into the correct shape too
'lon' => '',)
array (
'tag' => '44',)
,
我决定尝试对错误的URL进行解码,因为同样出于未知的原因,它们也显示为来自我的页面。我担心某些设备正在编码通话,也许是Android,或者是某些新浏览器。我不知道该如何编码它们,但是由于有些似乎来自我的网站,我认为我应该修复它们。为了澄清起见,这是一个嵌入在我的网站中的php图像。到目前为止,这已经涵盖了过去几天中的所有实例。这个想法是获取查询字符串并缓慢地对其进行解码,然后手动获取这两个变量,但前提是两个变量不能使用正常过程成功解码。这样,我只处理本来会拒绝的电话,这样任何意想不到的后果都会很小。
<?
$latitude = trim(strip_tags($_GET['lat']));
$longitude = trim(strip_tags($_GET['lon']));
$request = getenv("QUERY_STRING");
$request = urldecode($request);// get rid of %5C type conversions
$request = unicode_decode($request);// with the %5c stuff removed,convert any unicode
$i = strpos($request,"lon");
$j = strpos($request,"lat");
// only decode things that didn't work with normal $_GET
if ($i != "" && $longitude == "") $longitude = substr($request,$i+4) + 0;
if (($j != "" || $j == 0) && $latitude == "") $latitude = substr($request,$j+4) + 0;
?>
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。