如何解决是否可以丢弃无法解析的项目并继续使用serde_json进行解析?
我有一个非常大的JSON文件。其中大多数是有效的JSON数据,但部分无效。以下是我的案例的简化:
[
"this is valid: \ud835\udc47","this is invalid: \ud835",]
第一项有效并且将被成功解析,但是当尝试第二项时,反序列化将失败,因为UTF-8根本不允许\ud835
字符,而UTF-16却不允许一个孤独的\ud835
字符,因为它后面必须跟另一个十六进制转义符。
当使用使用Python的内置JSON反序列化程序并将数据保存到数据库的HTTP服务器时,会发生此问题。 Python的反序列化器接受了一个单独的“ \ ud835”字符,该字符无效的UTF-8或UTF-16。现在,当我们要将这个应用程序和数据库迁移到带有Serde的Rust时,它将捕获到这个无效的UTF-8 / 16字符串。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。