使用TProfiler分析并调优项目中的Fastjson序列化代码

摘要 本文介绍了TProfiler性能分析方面的实际应用,可以看到通过TProfiler的分析结果,非常容易发现一些性能问题。而这些问题往往较为隐蔽,你最熟悉的地方很有可能早就被你挖了坑。同时也介绍了Fastjson在过滤对象属性和自定义序列化属性方面的应用。

新项目年后就上线了,现在业务上没什么问题,就用TProfiler做了下性能分析,果然有坑。

一、TProfiler入门

高手请自觉略过本节。

1.简介

TProfiler是阿里巴巴开源的一款性能分析工具。号称可以用于生产环境进行长期的性能分析。测试程序部署后,在低峰期对响应时间影响20%,在高峰期对QPS影响30%。详细介绍请见官方WIKI

2.简要的实现原理

TProfiler的实现基于JAVA的Instrumentation和ASM。Instrumentation可以理解为一种虚拟机级别的AOP实现,无需对项目代码和JDK有任何改动就可以实现AOP功能。TProfiler利用Instrumentation提供的入口,调用ASM将待分析的类的字节码进行修改,加入分析记录方法。在Profiler运行时即可抽样收集到相关类方法的调用信息。使用Instrumentation时也可以通过JVMTI提供的接口实现对类的完全控制。至于为什么TProfiler会选择ASM,我想可能有两方面的考虑:

1)性能上更高效。使用JVMTI在每个类装入时都要执行hook程序,而ASM没有明显的性能代价。

2)使用JVMTI对编程难度要求较高,要求对class文件结构和java字节码有深刻了解,而ASM虽然也有一些难度,但是相对来说还是小一些。

3.配置

TProfiler在使用上比较简单,在待分析的程序启动脚本中加入JVM参数

javaagent:/path/to/tprofiler.jar -Dprofile.properties=/path/to/profile.properties

并将jar包和profile.properties配置文件放置到前面指定位置就可以了。

profile.properties可以根据需要进行配置:

startProfTime = 9:00:00 开始profile的时间点
endProfTime = 11:00 结束profile的时间点
eachProfUseTime = 5 profile时间长度(单位秒)
eachProfIntervalTime = 50 两次profile的时间间隔(单位秒)
samplerIntervalTime = 20 两次采样的时间间隔(单位秒)
debugMode = false 是否进入调试模式
needNanoTime = false 是否需要用纳秒记录时间
ignoreGetSetMethod = true 是否忽略采集get/set方法
logFilePath = /home/admin/logs/tprofiler.log profile log的存放位置
methodFilePath = /home/admin/logs/tmethod.log method log的存放位置
samplerFilePath = /home/admin/logs/tsampler.log sampler log的存放位置
excludeClassLoader = org.eclipse.osgi.internal.baseadaptor.DefaultClassLoader 不注入的类加载器(分号分割)
includePackageStartsWith = com.taobao 进行profile的类包名(分号分割)
excludePackageStartsWith = com.alibaba;com.taobao.forest.domain.dataobject 不进行profile的类包名(分号分割)

4.远程操作

TProfiler支持远程操作:

远程查看状态操作:

java -cp tprofiler.jar com.taobao.profile.client.TProfilerClient 10.232..端口号 status

远程开始操作:

java -cp tprofiler.jar com.taobao.profile.client.TProfilerClient 10.232..端口号 start

远程停止操作:

java -cp tprofiler.jar com.taobao.profile.client.TProfilerClient 10.232..端口号 stop

远程刷出方法数据:

java -cp tprofiler.jar com.taobao.profile.client.TProfilerClient 10.232..端口号 flushmethod

5.日志分析

运行采样后会生成三个文件:tsampler.log、tprofiler.log、tmethod.log。endProfTime时间到了后才会输出tmethod.log。

得到以上三个日志文件后就可以进行分析了。

分析sampler log命令: java -cp tprofiler.jar com.taobao.profile.analysis.SamplerLogAnalysis d:/tsampler.log d:/method.log d:/thread.log,会生成method.log和thread.log

分析profiler log命令: java -cp tprofiler.jar com.taobao.profile.analysis.ProfilerLogAnalysis d:/tprofiler.log d:/tmethod.log d:/topmethod.log d:/topobject.log,会生成topmethod.log和topobject.log

还是那句话,详细介绍请见官方WIKI,:P。

二、开始性能测试

参照第一节配置好我的jetty启动脚本jetty.sh后,使用ab进行压测

ab -n 100000 -c 500 -p post-file http://urlpath    (post-filepost发送内容)

得到日志后分析耗时最长的方法:

java -cp tprofiler.jar com.taobao.profile.analysis.ProfilerLogAnalysis /var/tprofiler/logs/tprofiler.log /var/tprofiler/logs/tmethod.log /var/tprofiler/logs/topmethod.log /var/tprofiler/logs/topobject.log

可以发现耗时最多的竟然是json序列化,抽样分析时共调用52412次,平均每次耗时809毫秒。对于这个结果比较诧异,和TProfiler系出同门的Fastjson的性能一直不错,以前开始用之前也做了不少序列化和反序列化的测试,怎么突然就这么耗时了呢。转念一想,这次的web项目里由于需要支持客户端自定义属性获取和日期格式化,所以需要Fastjson同时进行属性的过滤(通过SerializeFilter)以及日期的自定义格式化(通过SerializeConfig自定义一个把Integer秒转换成指定格式日期的IntegerCodec)。JSON类里没有原生的同时支持这两种操作的方法,所以就在原生的JSON#toJSONString(Object object,SerializeFilter filter,SerializerFeature... features)方法的基础上加了一个参数得到了JSONUtil#toJSONString(Object object,SerializeConfig config,SerializerFeature... features)。难道是这个原因?话不多说,继续测试。

三、Fastjson并发测试

由于怀疑新加的方法在并发下可能导致性能问题,于是比较了几种对Fastjson不同方法的并发调用时间,怎么简单怎么来,就不用什么高大上的报表了,各位看官见笑了哈

第一列是普通的,第二列是带属性过滤的,第三列是自定义的同时支持属性过滤和日期格式化的toJSONString。其中COUNT是每个线程执行序列化的次数。这个并发的对比测试反应的问题有两点:1)并发情况下,性能确实变差;2)同样参数对比下来耗时相差两个数量级,我修改的方法确实有问题。

四、问题代码的review和问题解决

于是带着这两个问题,开始扒拉代码:

public static String toStringWithFieldFilterAndDateFormat(Object object,final String[] fields,SerializerFeature... features ){
    SerializeFilter filter = null;
    // 只过滤第一层属性
    if(fields != null ){
        // 获得需要过滤掉的字段
        final Set<String> tobeRemoved = getTobeRemovedFields(object,fields);
        if(toRemove != null && toRemove.size() > 0){
            // 需要过滤字段
            filter = new PropertyFilter() {
                @Override
                public boolean apply(Object object,String name,Object value) {
                    // 转换日期格式
                    if(toRemove.contains(name)){
                        return false ;
                    }
                    return true;
                }
            };
        }
    }
    SerializeConfig config = new SerializeConfig();
    if(NEED_FORMAT_DATE){
        config.put(Integer.class,CustomIntegerCodec.instance);
    }
    return toJSONString(object,config,filter,features);
}

这里CustomIntegerCodec是基于IntegerCodec的Integer类序列化和反序列化器。而toJSONString(Object object,SerializerFeature... features)只是在new JSONSerializer(out)时使用了另一个构造器new JSONSerializer(out,config)

又看了一下Fastjson的源码,发现在SerializeConfig中对ObjectSerializer做了缓存,如果每次都传入一个新的SerializeConfig,必然每次都会进行不必要的解析和初始化操作,占用大量的时间。问题找出来了,解决方法也很简单,只要使用一个单例或静态变量即可

private static final SerializeConfig customGlobalConfig = new SerializeConfig();
static {
    if(NEED_FORMAT_DATE){
        customGlobalConfig .put(Integer.class,CustomIntegerCodec.instance);
    }
}

Fastjson默认的序列化方法其实也是使用的默认的静态全局实例SerializeConfig

private final static SerializeConfig globalInstance = new SerializeConfig();

修改之后进行测试

O(∩_∩)O

五、总结

本文介绍了TProfiler性能分析方面的实际应用,可以看到通过TProfiler的分析结果,非常容易定位一些性能问题。而这些问题往往较为隐蔽,你最熟悉的地方很有可能早就被你挖了坑。 TProfiler本身也短小精炼,如果对Instrument、ASM感兴趣、性能分析感兴趣,推荐读一读。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


文章浏览阅读2.4k次。最近要优化cesium里的热力图效果,浏览了网络上的各种方法,发现大多是贴在影像上的。这么做好是好,但是会被自生添加的模型或者其他数据给遮盖。其次是网上的方法大多数是截取成一个矩形。不能自定义的截取自己所需要的。经过尝试,决定修改下cesium heatmap,让他达到我们需要的要求。首先先下载 cesium heatmap包。其中我们可以看到也是通过叠加entity达到添加canvas的方法绘制到地图上。我们先把这一段代码注释} else {} };
文章浏览阅读1.2w次,点赞3次,收藏19次。在 Python中读取 json文件也可以使用 sort ()函数,在这里我介绍一个简单的示例程序: (4)如果我们想将字符串转换为列表形式,只需要添加一个变量来存储需要转换的字符串即可。在上面的代码中,我们创建了一个名为` read`的对象,然后在文件的开头使用`./`关键字来命名该对象,并在文件中定义了一个名为` json`的变量,并在其中定义了一个名为` json`的字段。比如,我们可以使用 read方法读取 json文件中的内容,然后使用 send方法将其发送到 json文件中。_python怎么读取json文件
文章浏览阅读1.4k次。首字母缩略词 API 代表应用程序编程接口,它是一种设备,例如用于使用编程代码发送和检索数据的服务器。最常见的是,该技术用于从源检索数据并将其显示给软件应用程序及其用户。当您访问网页时,API 的工作方式与浏览器相同,信息请求会发送到服务器,如何在 Windows PC 中手动创建系统还原点服务器会做出响应。唯一的区别是服务器响应的数据类型,对于 API,数据是 JSON 类型。JSON 代表 JavaScript Object Notation,它是大多数软件语言中 API 的标准数据表示法。_api是什么 python
文章浏览阅读802次,点赞10次,收藏10次。解决一个JSON反序列化问题-空字符串变为空集合_cannot coerce empty string ("") to element of `java.util.arraylist
文章浏览阅读882次。Unity Json和Xml的序列化和反序列化_unity json反序列化存储换行
文章浏览阅读796次。reader.readAsText(data.file)中data.file的数据格式为。使用FileReader对象读取文件内容,最后将文件内容进行处理使用。_a-upload 同时支持文件和文件夹
文章浏览阅读775次,点赞19次,收藏10次。fastjson是由国内的阿里推出的一种json处理器,由java语言编写,无依赖,不需要引用额外的jar包,能直接运行在jdk环境中,它的解析速度是非常之快的,目前超过了所有json库。提示:以下是引用fastjson的方法,数据未涉及到私密信息。_解析器用fastjson还是jackson
文章浏览阅读940次。【Qt之JSON文件】QJsonDocument、QJsonObject、QJsonArray等类介绍及使用_使用什么方法检查qjsondocument是否为空
文章浏览阅读957次,点赞34次,收藏22次。主要内容原生 ajax重点重点JSON熟悉章节目标掌握原生 ajax掌握jQuery ajax掌握JSON第一节 ajax1. 什么是ajaxAJAX 全称为,表示异步的Java脚本和Xml文件,是一种异步刷新技术。2. 为什么要使用ajaxServlet进行网页的变更往往是通过请求转发或者是重定向来完成,这样的操作更新的是整个网页,如果我们只需要更新网页的局部内容,就需要使用到AJAX来处理了。因为只是更新局部内容,因此,Servlet。
文章浏览阅读1.4k次,点赞45次,收藏13次。主要介绍了JsonFormat与@DateTimeFormat注解实例解析,文中通过示例代码介绍的非常详细,对大家的学习 或者工作具有一定的参考学习价值,需要的朋友可以参考下 这篇文章主要介绍了从数据库获取时间传到前端进行展示的时候,我们有时候可能无法得到一个满意的时间格式的时间日期,在数据库中显 示的是正确的时间格式,获取出来却变成了时间戳,@JsonFormat注解很好的解决了这个问题,我们通过使用 @JsonFormat可以很好的解决:后台到前台时间格式保持一致的问题,
文章浏览阅读1k次。JsonDeserialize:json反序列化注解,作用于setter()方法,将json数据反序列化为java对象。可以理解为用在处理接收的数据上。_jsondeserialize
文章浏览阅读2.7k次。labelme标注的json文件是在数据标注时产生,不能直接应用于模型训练。各大目标检测训练平台或项目框架均有自己的数据格式要求,通常为voc、coco或yolo格式。由于yolov8项目比较火热,故此本博文详细介绍将json格式标注转化为yolo格式的过程及其代码。_labelme json 转 yolo
文章浏览阅读790次,点赞26次,收藏6次。GROUP_CONCAT_UNORDERED(): 与GROUP_CONCAT类似,但不保证结果的顺序。COUNT_DISTINCT_AND_ORDERED(): 计算指定列的不同值的数量,并保持结果的顺序。COUNT_ALL_DISTINCT(): 计算指定列的所有不同值的数量(包括NULL)。AVG_RANGE(): 计算指定列的最大值和最小值之间的差异的平均值。JSON_OBJECT(): 将结果集中的行转换为JSON对象。COUNT_DISTINCT(): 计算指定列的不同值的数量。_mysql json 聚合
文章浏览阅读1.2k次。ajax同步与异步,json-serve的安装与使用,node.js的下载_json-serve 与node版本
文章浏览阅读1.7k次。`.net core`提供了Json处理模块,在命名空间`System.Text.Json`中,下面通过顶级语句,对C#的Json功能进行讲解。_c# json
文章浏览阅读2.8k次。主要介绍了python对于json文件的读写操作内容_python读取json文件
文章浏览阅读770次。然而,有时候在处理包含中文字符的Json数据时会出现乱码的情况。本文将介绍一种解决Json中文乱码问题的常见方法,并提供相应的源代码和描述。而某些情况下,中文字符可能会被错误地编码或解码,导致乱码的出现。通过适当地控制编码和解码过程,我们可以有效地处理包含中文字符的Json数据,避免乱码的发生。通过控制编码和解码过程,我们可以确保Json数据中的中文字符能够正确地传输和解析。为了解决这个问题,我们可以使用C#的System.Text.Encoding类提供的方法进行编码和解码的控制。_c# json 中文编码
文章浏览阅读997次。【代码】【工具】XML和JSON互相转换。_xml 转json
文章浏览阅读1.1k次。json path 提取数据_jsonpath数组取值
文章浏览阅读3w次,点赞35次,收藏36次。本文主要介绍了pandas read_json时ValueError: Expected object or value的解决方案,希望能对学习python的同学们有所帮助。文章目录1. 问题描述2. 解决方案_valueerror: expected object or value