如何解决使用正则表达式来分割CSV文件中的split值
|| 我有一个要解析的CSV文件。 我正在使用split()按逗号分隔列。 问题在于它正在拆分字段中包含逗号的列。 解决方案是在split中使用正则表达式来忽略逗号后跟空格(例如:EG:\“,\”),而仅在逗号后没有尾部空格(例如:EG:\“,\”)。 现在我的拆分看起来像这样:$div = \',\';
split(\'$div\',$line);
我将如何修改split()调用?
解决方法
要使用PHP解析完整有效的CSV文件,您只需要:
$data = array_map(\"str_getcsv\",file($fn));
但是,如果您的文件格式确实不一致,那么您确实需要手动拆分方法和更具体的正则表达式。
preg_split(\'/,(?!\\s)/\',$line)
将是您可以用来匹配不带空格的逗号的正则表达式。请注意,您需要使用PCRE库中的preg_split
,而不是较早的split
调用。
, CSV文件的字段(特别是如果字段中包含逗号)应用引号引起来:
\"A\",\"B1,B2\",\"C\",\"D\"
如果不是,那么模棱两可就是您的第一个问题:
A,B1,B2,C,D
有五个字段,对此您无能为力1。
整理好源数据后,使用ѭ7进行解析。
1如果确实如此:
解决方案是在split中使用正则表达式来忽略逗号后跟空格(例如:EG:\“,\”),而仅在逗号后没有尾部空格(例如:EG:\“,\”)。
如果您所有的“内部”逗号后面都有空格,那么您可以运行一个预处理步骤,用all9替换所有,<space>
。在CSV中转义逗号可以解决歧义:
A,B1\\,D
,
我有一个要解析的CSV文件。
您正在重新发明轮子:PHP具有自行完成此操作的好方法,即fgetcsv:
if (($handle = fopen(\"test.csv\",\"r\")) !== FALSE) {
while (($data = fgetcsv($handle,1000,\",\")) !== FALSE) {
$num = count($data);
echo \"<p> $num fields in line $row: <br /></p>\\n\";
$row++;
for ($c=0; $c < $num; $c++) {
echo $data[$c] . \"<br />\\n\";
}
}
fclose($handle);
}
, 始终将它们用作字符串。像这样
$ outstr。= \'\“ \'。$ line-> linename。\'\”,\';
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。