Java才是世界上最好的语言,Java在高频交易中替代C++

高频交易

高频交易是指从那些人们无法利用的极为短暂的市场变化中寻求获利的计算机化交易,比如,某种证券买入价和卖出价差价的微小变化,或者某只股票在不同交易所之间的微小价差。在高频交易中,自动化应用程序每天处理几亿个市场信号,在全球各地的交易所发送上千万个订单。为了保持业务竞争力,响应时间必须始终保持在微秒级,尤其是在黑天鹅异常事件等高峰期。

高频交易系统的典型系统结构一般是这样:金融交易信号将转换成内部市场数据格式(交易使用TCP、UDP等各种协议)和多种格式(如二进制、SBE、JSON、FIX等)。然后,这些标准化的消息被发送到算法服务器、统计引擎、UI、Log Server和各种数据库(缓存、文件或分布式数据库)。任何延迟都会带来都会带来高成本的结果。例如,根据根据旧的价格进行决策或下单太迟。为了获得微秒级的优势,大部分交易参与者都会投入高价硬件:一个超频液冷CPU的服务器池(2020年可以买56核、5.6GHz、1TB内存的服务器),组装在主交换数据中心、高端纳秒级网络交换机、专用跨洋线,甚至是微波网络。

常见的高频交易系统使用高度定制的Linux内核,并且带有操作系统旁路,这样数据就可以直接从网卡 "跳转" 到应用程序、基于IPC 进程间通信,甚至使用FPGA(可编程单用途芯片)。至于编程语言,一般首先想到的就是C++,事实上也确实是这个领域的天然选择。C++的最大优势就是运行速度快,最接近机器代码,而且是直接根据目标平台进行编译,具有高效稳定的特点。

使用Java代替C++

我们做了一个不同的选择。在过去14年里,我们在外汇算法交易领域用Java进行开发,并使用廉价的硬件代替昂贵的高端设备。
在一个团队小,资源有限以及熟练开发人员欠缺的工作环境,Java意味着我们可以快速进行软件迭代,因为Java生态系统比C系列具有更快的开发效率。可以在早上讨论改进措施,并在下午在生产中实施、测试和发布。

与需要几周甚至几个月软件更新时间的大型公司相比,这是一个关键优势。在这个领域,一个错误可以在几秒钟内抹去一整年的利润,因此不能在质量上妥协。我们使用了许多开源库和项目,实现了严格的敏捷开发环境,包括使用Jenkins、Maven、单元测试、夜间构建和Jira。通过Java,开发人员可以专注于业务逻辑,而不是像C++那样调试内存Coredump或跟指针打交道。而且,由于Java强大的内存管理,初级程序员也可以立即参与开发代码,并且风险可控。

只要有良好的设计模式和干净的编码习惯,就可以用Java达到C++的延迟。我们都知道,使Java成为软件开发强大和方便语言的原因,同时也是它的缺点的最主要的原因,那就是Java虚拟机(JVM)。

Java即时编译代码(Just in Time 编译器),意味着第一次遇到一些代码时,也可能产生编译延迟。Java管理内存的方式是通过在堆空间中分配内存块。每隔一段时间,它就会清理这个空间,删除旧的对象,为新的对象腾出空间。主要问题是,为了进行准确的统计,应用程序线程需要被瞬间 "冻结"。这个过程被称为垃圾收集(GC)。GC是低延迟应用程序开发人员放弃 Java 的主要原因。

市场上Java 虚拟机最常见和标准的是 Oracle Hotspot JVM,它在 Java 社区中被广泛使用,主要是出于历史原因。对于要求非常高的应用程序,Azul Systems 提供了一个很棒的替代方案,称为 Zing。Zing是Oracle Hotspot JVM一个强大的替代品。Zing解决了GC暂停和JIT编译问题。

让我们来研究使用Java的固有问题和可能的解决方案。

理解Java即时编译器

像C++这样的语言被称为编译语言,因为交付的代码完全是二进制的,可以直接在CPU上执行。PHP或Perl 被称为解释语言,因为解释器(安装在目标机器上)会边运行边编译每一行代码。

Java介于两者之间;它将代码编译成所谓的 Java 字节码,而字节码又可以在它认为合适的时候被编译成二进制。Java之所以不在启动时编译代码,与长期的性能优化有关。通过观察应用程序的运行情况,分析实时的方法调用和类的初始化,Java 会编译经常调用的部分代码。它甚至可能会根据经验做出一些假设(这部分代码永远不会被调用,或者这个对象永远是一个 String)。

因此,实际编译后的代码速度非常快,但依然有3个缺点。

1、一个方法需要被调用一定的次数来达到编译阈值,然后才能被优化和编译(这个限制是可以配置,但通常是10000 次左右的调用)。在此之前,未经优化的代码并没有以 "全速" 运行。Java在更快的编译和高质量的编译之间做了一个取舍(如果假设不对,会有重新编译的代价)。

2、当Java应用程序重启时,又回到了原点,必须等待再次达到这个阈值。

3、有些应用程序(比如我们的场景)有一些不频繁但很关键的方法,这些方法只会被调用少数几次,但当它们被调用时,需要极快的速度(想想看,一个风险或止损函数只有在紧急情况下才会被调用)。

Azul Zing通过让其JVM将编译后的方法和类的状态 "保存" 在它所谓的配置文件中来解决这些问题。这种名为 ReadyNow!® 的独特功能,意味着Java应用程序始终以最佳速度运行,即使在重新启动后也是如此。当使用现有的配置文件重新启动应用程序时,Azul JVM会立即调用其先前的结果并直接编译标注的的方法,从而解决了 Java 预热问题。

此外,可以在开发环境中建立一个配置文件,以模拟生产行为。然后,优化后的配置文件可以部署在生产环境中,因为所有的关键路径都被编译和优化了。Zing的延迟随着时间的推移保持相当稳定。百分位数分布表明,1%的时间里,Hotspot JVM产生的延迟是 Zing JVM的16倍。

解决垃圾收集(GC)暂停的问题

在垃圾收集过程中,整个应用程序可能会冻结几毫秒到几秒不等(延迟随着代码复杂度和堆大小而增加),更糟糕的是,你无法控制这种情况何时发生。虽然暂停一个应用程序几毫秒甚至几秒钟对于许多Java应用程序来说可能是可以接受的,但对于低延迟应用程序来说却是一场灾难,无论是汽车、航空航天、医疗还是金融领域。

GC的影响在Java开发者中是一个很大的话题;一个完整的垃圾收集通常被称为 "stop-the-world",因为它会冻结整个应用程序。
多年来,许多GC算法都试图在吞吐量(多少CPU用于实际的应用逻辑而不是垃圾收集)与 GC暂停之间做一个取舍。

自Java 9以来,G1 收集器一直是默认 GC,其主要思想是根据用户提供的时间目标来划分GC暂停时间。它通常提供较短的暂停时间,但代价是较低的吞吐量。此外,暂停时间会随着堆的大小而增加。Java提供了大量的设置来调整其垃圾收集(以及 JVM),从堆大小到收集算法,以及分配给GC的线程数。所以,看到Java应用程序配置了大量的自定义选项是很常见的。

很多开发者已经转向各种技术来完全避免GC。主要思路是,如果创建的对象少了,需要清除的对象就会变少。一个古老的技术是使用可重用对象的对象池。例如,一个数据库连接池将持有10个已打开的连接的引用,准备在需要时使用。

多线程通常需要锁,这会导致同步延迟和暂停(特别是当它们共享资源时)。一个流行的设计是一个环形缓冲队列系统,在一个无锁的设置中,有许多线程写和读。一些专家甚至选择完全自己实现 Java 内存管理,自己管理内存分配,虽然解决了一个问题,但却带来了更多的复杂性和风险。在这种情况下,显然应该考虑其他 JVM,于是我们决定尝试 Azul Zing JVM。很快,我们就实现了非常高的吞吐量,停顿可以忽略不计。

这是因为Zing使用了一个独特的收集器,叫做C4(Continuurrentously Concurrent Compacting Collector),它允许无暂停地收集垃圾,而不关心Java堆的大小(最高可达8TB)。这是通过在应用程序仍在运行时,并发映射和压缩内存来实现。此外,它不需要修改任何代码,延迟和速度的提升都是开箱即见,无需冗长的配置。在这种情况下,Java程序员可以享受到两全其美的好处,既可以享受到 Java 的简单性(无需偏执于创建新对象),又可以享受到Zing的底层性能,使整个系统的延迟高度可预测。

多亏了GC easy,一个通用的GC日志分析器,我们可以在真实的自动交易应用中(在模拟环境中)快速比较两种JVM。在高频交易的应用中,使用Zing的GC比使用标准的 Oracle Hotspot JVM 小 180 倍左右。更令人印象深刻的是,GC暂停通常与实际应用暂停时间相对应,而Zing智能GC通常是在最小或没有实际暂停的情况下平行发生的。

总结

Java在享受简单性和面向业务的特性同时,仍然可以实现高性能和低延迟。虽然C++ 仍然可用于特定的底层组件,如驱动程序、数据库、编译器和操作系统,但大多数现实中都可以用Java来开发,包括象高频交易这样要求苛刻的应用。

java jdk 下载 来自 嗖嗖下载

原文地址:https://www.cnblogs.com/wanghao72214/p/13934471.html

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


jinfo 命令可以用来查看 Java 进程运行的 JVM 参数,命令如下:[root@admin ~]# jinfo --helpUsage: jinfo [option] <pid> (to connect to running process) jinfo [option] <executable <core> (to connect to a core file) jinfo [option] [serve
原文链接:https://www.cnblogs.com/niejunlei/p/5987611.htmlJava Virtual Machine Stacks,线程私有,生命周期与线程相同,描述的是Java方法执行的内存模型:每一个方法执行的同时都会创建一个栈帧(Stack Frame),由于存储局部变量表、操作数栈、动态链接、方法出口等信息。每一个方法的执行就对应着栈帧在虚拟机栈中的入栈,出栈...
java 语言, 开发者不能直接控制程序运行内存, 对象的创建都是由类加载器一步步解析, 执行与生成与内存区域中的; 并且jvm有自己的垃圾回收器对内存区域管理, 回收; 但是我们已经可以通过一些工具来在程序运行时查看对应的jvm内存使用情况, 帮助更好的分析与优化我们的代码;jps查看系统中有哪些java进程jps 命令类似与 linux 的 ps 命令,但是它只列出系统中所有的 Java 应用程序。 通过 jps 命令可以方便地查看 Java 进程的启动类、传入参数和 Java 虚拟机参数等信息
1.jvm的简单抽象模型:  2.类加载机制     双亲委派模型是为了防止jdk核心类库被篡改,如果需要打破可以重写Classloader.loadClass方法。r 双亲委派模型:一个类加载器收到一个类的加载请求,他会先判断自身是否已存在该类,如果不存在上抛给上一级类加载器ClassLoad
堆外内存JVM启动时分配的内存,称为堆内存,与之相对的,在代码中还可以使用堆外内存,比如Netty,广泛使用了堆外内存,但是这部分的内存并不归JVM管理,GC算法并不会对它们进行回收,所以在使用堆外内存时,要格外小心,防止内存一直得不到释放,造成线上故障。堆外内存的申请和释放JDK的ByteBuffe
1.springboot和tomcat2.springcloud的请求如何通过网关鉴权?3.springmvc启动时组件的加载顺序?4.mybatis如何同时更新三条记录5.hibernate实现级联更新6.一个web程序应用程序启动时的加载流程7.如何向www.baidu.com地址发出请求时,并获取相应?8.???9.谈谈你对tcp/iptelnetudp协
堆设置-Xms256M:初始堆大小256M,默认为物理内存的1/64-Xmx1024M:最大堆大小1024M,默认为物理内存的1/4,等于与-XX:MaxHeapSize=64M-Xmn64M:年轻代大小为64M(JDK1.4后支持),相当于同时设置NewSize和MaxNewSize为64M-XX:NewSize=64M:初始年轻代大小-XX:MaxNewSize=256M:最大年轻代大小(默认
一.概述收集算法(JVM之垃圾回收-垃圾收集算法)是内存回收的抽象策略,垃圾收集器就是内存回收的具体实现。JVM规范对于垃圾收集器的应该如何实现没有任何规定,因此不同的厂商、不同版本的虚拟机所提供的垃圾收集器差别较大,这里只看HotSpot虚拟机。就像没有最好的算法一样,垃圾收集器
Java中的堆是JVM所管理的最大的一块内存空间,主要用于存放各种类的实例对象,如下图所示: 在Java中,堆被划分成两个不同的区域:新生代(Young)、老年代(Old)。新生代(Young)又被划分为三个区域:Eden、S0、S1。 这样划分的目的是为了使JVM能够更好的管理堆内存中的对象,包
JVM深入理解JVM(4)——如何优化JavaGC「译」 PostedbyCrowonAugust21,2017本文翻译自SangminLee发表在Cubrid上的”BecomeaJavaGCExpert”系列文章的第三篇《HowtoTuneJavaGarbageCollection》,本文的作者是韩国人,写在JDK1.8发布之前,虽然有些地
 JVM深入理解JVM(2)——GC算法与内存分配策略 PostedbyCrowonAugust10,2017说起垃圾收集(GarbageCollection,GC),想必大家都不陌生,它是JVM实现里非常重要的一环,JVM成熟的内存动态分配与回收技术使Java(当然还有其他运行在JVM上的语言,如Scala等)程序员在提升开
运行时数据区  线程独有本地方法栈、虚拟机栈、程序计数器这些与线程对应的数据区会随着线程开始和结束创建和销毁  整体公有元数据区(又称方法区)、堆区会随着虚拟机启动而创建,随着虚拟机退出而销毁 
java整个堆大小设置:Xmx和Xms设置为老年代存活对象的3-4倍,即FullGC之后的老年代内存占用的3-4倍。永久代PermSize和MaxPermSize设置为老年代存活对象的1.2-1.5倍年轻代Xmx的设置为老年代存活对象的1-1.5倍老年代的内存大小设置为老年代存活对象的2-3倍BTW: Sun官方建议年轻代
栈顶缓存(Top-of-StackCashing)技术基于栈式架构得虚拟机所使用的零地址指令更加紧凑,但完成一项操作的时候必然使用更多的入栈和出栈指令,这同时也就意味着将需要更多的指令分派次数和内存读写次数 由于操作数是存储在内存重的,因此频繁地执行内存读/写操作必然影响速度。 综上
自用。同样的代码在不同的平台生成的机器码是不一样的,为什么java代码生成的字节码文件,能在不同的平台运行?因为不同版本的jdk里面的虚拟机会屏蔽不同操作系统在底层硬件与指令上的区别。栈:线程栈,局部变量存放栈内存区域。线程(分配一个栈)运行分配栈将局部变量放入内存。怎么放:栈
jconsole监控:1.java启动命令加上参数java-Djava.rmi.server.hostname=172.16.17.247-Dcom.sun.management.jmxremote-Dcom.sun.management.jmxremote.port=2099-Dcom.sun.management.jmxremote.authenticate=false-Dcom.sun.management.jmxremote.ssl=false -XX:+Unlock
类加载器分类publicclassStackStruTest{publicstaticvoidmain(String[]args){//对用户自定义个类来说:默认使用系统类加载器进行加载-----AppClassLoaderClassLoaderclassLoader=StackStruTest.class.getClassLoader();System.out.p
堆体系结构一个JVM实例只存在一个堆内存,堆内存的大小是可调节的。类加载器读取类文件后,需要把类、方法、常量、变量放在堆内存中,保存所有引用类型的真实信息,以方便执行器指向,堆内存分为三个部分:年轻代、老年代、永久代。Java7之前,堆内存在逻辑上分为:年轻代、老年代、永久代。物
JVM深入理解JVM(5)——虚拟机类加载机制 PostedbyCrowonAugust21,2017在Class文件中描述的各种信息,最终都需要加载到虚拟机中之后才能运行和使用。而虚拟机中,而虚拟机如何加载这些Class文件?Class文件中的信息进入到虚拟机中会发生什么变化?本文将逐步解答这
保存(持久化)对象及其状态到内存或者磁盘Java平台允许我们在内存中创建可复用的Java对象,但一般情况下,只有当JVM处于运行时,这些对象才可能存在,即,这些对象的生命周期不会比JVM的生命周期更长。但在现实应用中,就可能要求在JVM停止运行之后能够保存(持久化)指定的对象,并在