提高C++性能的编程技术笔记:标准模板库+测试代码

标准模板库(Standard Template Library,STL)是容器和通用算法的强效组合

渐近复杂度:算法的渐近复杂度是对算法性能的近似估计。它是算法集到特定性能标准集的映射。如果需要对包含N个整数的向量的所有元素求和,那么每个整数必须且仅需检查一次,因此该算法的复杂度约为N,我们将其称为O(N)。另一方面,假设需要创建一个包含N个元素的向量,由于某种原因,你需要将这些元素插入到该向量的前端。然而,在向量的前端每插入一个元素便会迫使所有已存在的元素移动1个位置。这就导致了(1+2+3+…+N)次向量元素的移动,也即(N/2)(N+1)次移动。即使需要移动(N*N/2)+(N/2)次,但我们仍说这个算法的复杂度是O(N*N)。这是因为渐近性能标准集将忽略常量倍数和低阶因子。因而N*N和7N*N的复杂度相同:均为O(N*N)。STL对其算法渐近复杂度的保证是一个良好的开端。它告诉我们,所使用的算法是同类算法中最好的。

插入:在集合大小事先可知的情况下,在尾部进行元素插入操作,速度,数组>向量>双向列表>多重集。数组和向量均为占用连续内存块的顺序容器。当无法事先确定集合大小时,向量将会更有用。向量是可以动态增长的,这样程序员就不用考虑集合的大小。向量的大小是指向量当前拥有元素的数量。向量的容量是指向量能够容纳元素数量的最大值,超过这个值,向量就必须分配更多的内存以适应元素的增长。当往向量中插入第一个元素时,为了使向量的容量超过它的初始大小(值为1),典型的STL实现将会分配一大块内存。后续的插入将会增加向量的大小,而容量保持不变。如果集合持续增长,那么向量大小最终将会达到它的容量。下一次插入操作将会迫使向量的实现扩大自身容量。这必须包含以下几个步骤:(1). 分配更大的内存块,以便为增加的元素留出空间;(2). 将当前集合中现存的所有元素复制到新分配的内存中。在该过程中,会为旧集合的每一个元素调用拷贝构造函数;(3). 销毁旧集合并释放它所占用的空间。在该过程中,会为旧集合中的每一个元素调用析构函数。这些步骤可能会引起巨额开销。因此,我们希望尽可能少地出现向量大小超过其容量的情况。列表容器并未将元素存储在连续的内存空间中,所以也就无须应付容量问题和相关的性能开销问题。向量容器在进行前端插入时的性能极其槽糕。而列表在进行前端插入或后端插入时性能几乎一致。

删除:删除操作的性能情况在很多方面都与插入操作很类似。很多关于插入效率的结论同样适用于删除。例如:(1). 向量擅长于在尾部对元素进行插入(或删除)操作。因为这种操作与集合大小无关,所以它是一种固定时间的操作。(2). 除了尾部操作之外,采用向量进行其它任何位置的插入(或删除)操作都是一种极为糟糕的选择。这种插入(或删除)的代价与插入(或删除)点到向量的最后一个元素之间的距离成正比例。(3). 双向队列在集合的前端和尾部插入(或删除)元素时效率很高(常数时间),在其它任何位置插入(或删除)元素时效率都很低。(4). 列表在集合的任何位置插入(或删除)元素时效率都很高(固定时间)

遍历:对于容器的遍历操作来说,向量和数组的性能是相同的。它们均远胜过列表。容器遍历的关键因素似乎为容器内存布局和系统缓存之间的交互作用。

查找:当进行元素查找时,使用成员find方法,多重容器可以胜过其它的所有竞争对手。而多重集是有序集,这使其在插入和删除操作上遭受了一些性能上的损失。但是,从另一方面来看,有序特性也为多重集容器在查找方面带来了巨大的优势。

函数对象:默认情况下,accumulate()函数将operator+操作应用到容器中所有元素,然后返回这些元素相加的累计结果。对于整数集合来说,如果提供给accumulate()函数的初始值为0,那么该函数返回的结果就是集合中所有元素的和。accumulate()函数不仅可以进行对象相加,而且可以对容器元素进行任何操作(前提是元素支持这种操作),然后返回累计结果。函数指针直到运行时才能被解析,这就使得它们无法被内联。而函数对象是在编译时被确定的,这就使得编译器可以自由地内联operator()函数并显著地提升效率。

STL实现在以下几个方面形成了自己的优势:(1). STL实现使用最好的算法;(2). STL实现的设计者非常有可能是领域内的专家;(3). 这些领域内的专家完全地致力于提供一个灵活、强大并且高效的库。这是他们的首要任务。

STL是抽象、灵活性和效率的一种罕见的结合。对于某种特定的应用模式,一些容器比其它的更加高效,这都要随着实际应用而定。除非了解一些相关领域内STL所忽略的问题,否则你是不可能超过STL实现的。不过,在一些特定的情况下,还是有可能超越STL实现的性能的。

以下是测试代码(standard_template_library.cpp):

#include "standard_template_library.hpp"

#include

#include

#include

#include

#include

#include

#include

#include

#include

#include

#include

#include

namespace standard_template_library_ {

// reference: 《提高C++性能的编程技术》:第十一章:标准模板库

namespace {

template

void arrayInsert(T* a,const T* collection,int size)

{

for (int k = 0; k < size; ++k) {

a[k] = collection[k];

}

}

template

void arrayTraverse(const T* a,int size)

{

T sum = std::accumulate(&a[0],&a[size],0);

}

template

void arrayFind(const T* a,int size)

{

T const value = collection[size/2];

T* tmp = const_cast(a);

T* p = std::find(&tmp[0],&tmp[size],value);

}

template

void vectorInsert(std::vector* v,int size)

{

for (int k = 0; k < size; ++k) {

v->push_back(collection[k]);

}

}

template

void vectorInsertFront(std::vector* v,int size)

{

for (int k = 0; k < size; ++k) {

v->insert(v->begin(),collection[k]);

}

}

template

void vectorDelete(std::vector* v)

{

while (!v->empty()) {

v->pop_back();

}

}

template

void vectorDeleteFront(std::vector* v)

{

while (!v->empty()) {

v->erase(v->begin());

}

}

template

void vectorTraverse(const std::vector* v,int size)

{

T sum = std::accumulate(v->cbegin(),v->cend(),0);

}

template

void vectorFind(const std::vector* v,int size)

{

T const value = collection[size/2];

auto it = std::find(v->cbegin(),value);

}

template

void listInsert(std::list* l,int size)

{

for (int k = 0; k < size; ++k) {

l->push_back(collection[k]);

}

}

template

void listInsertFront(std::list* l,int size)

{

for (int k = 0; k < size; ++k) {

l->push_front(collection[k]);

}

}

template

void listDelete(std::list* l)

{

while (!l->empty()) {

l->pop_back();

}

}

template

void listDeleteFront(std::list* l)

{

while (!l->empty()) {

l->pop_front();

}

}

template

void listTraverse(const std::list* l,int size)

{

T sum = std::accumulate(l->cbegin(),l->cend(),0);

}

template

void listFind(const std::list*l,int size)

{

T const value = collection[size/2];

auto it = std::find(l->cbegin(),value);

}

template

void multisetInsert(std::multiset* s,int size)

{

for (int k = 0; k < size; ++k) {

s->insert(collection[k]);

}

}

template

void multisetFind(const std::multiset* s,int size)

{

T const value = collection[size/2];

// 当查找多重集容器时,使用std::find并不是最佳的选择

//auto it = std::find(s->cbegin(),s->cend(),value);

auto it = s->find(value);

}

int* genIntData(int size)

{

std::srand(std::time(nullptr));

int* data = new int[size];

std::generate(&data[0],&data[size],std::rand);

return data;

}

int mult(int x,int y)

{

return (x*y);

}

class Mult {

public:

int operator()(int x,int y) const { return (x*y); }

};

} // namespace

int test_standard_template_library_1()

{

std::chrono::high_resolution_clock::time_point time_start,time_end;

const int count{400000},count2{10000},count3{200000000};

int* data = genIntData(count);

{ // normal array insert back operation

std::unique_ptr arr(new int[count]);

time_start = std::chrono::high_resolution_clock::now();

arrayInsert(arr.get(),data,count);

time_end = std::chrono::high_resolution_clock::now();

fprintf(stdout,"first value: %d,array insert back time spend: %f secondsn",

arr.get()[0],(std::chrono::duration_cast>(time_end-time_start)).count());

}

{ // vector insert back operation

std::vector vec;

time_start = std::chrono::high_resolution_clock::now();

vectorInsert(&vec,vector insert back time spend: %f secondsn",

vec[0],(std::chrono::duration_cast>(time_end-time_start)).count());

}

{ // list insert back operation

std::list l;

time_start = std::chrono::high_resolution_clock::now();

listInsert(&l,list insert back time spend: %f secondsn",

*(l.cbegin()),(std::chrono::duration_cast>(time_end-time_start)).count());

}

{ // multiset insert back operation

std::multiset s;

time_start = std::chrono::high_resolution_clock::now();

multisetInsert(&s,multiset insert back time spend: %f secondsn",

*(s.cbegin()),(std::chrono::duration_cast>(time_end-time_start)).count());

}

{ // vector insert front operation

std::vector vec;

time_start = std::chrono::high_resolution_clock::now();

vectorInsertFront(&vec,vector insert front time spend: %f secondsn",(std::chrono::duration_cast>(time_end-time_start)).count());

}

{ // list insert front operation

std::list l;

time_start = std::chrono::high_resolution_clock::now();

listInsertFront(&l,list insert front time spend: %f secondsn",(std::chrono::duration_cast>(time_end-time_start)).count());

}

{ // vector delete back operation

std::vector vec(data,data+count);

time_start = std::chrono::high_resolution_clock::now();

vectorDelete(&vec);

time_end = std::chrono::high_resolution_clock::now();

fprintf(stdout,"vector size: %d,vector delete back time spend: %f secondsn",

vec.size(),(std::chrono::duration_cast>(time_end-time_start)).count());

}

{ // list delete back operation

std::list l(data,data+count);

time_start = std::chrono::high_resolution_clock::now();

listDelete(&l);

time_end = std::chrono::high_resolution_clock::now();

fprintf(stdout,"list size: %d,list delete back time spend: %f secondsn",

l.size(),(std::chrono::duration_cast>(time_end-time_start)).count());

}

{ // vector delete front operation

std::vector vec(data,data+count);

time_start = std::chrono::high_resolution_clock::now();

vectorDeleteFront(&vec);

time_end = std::chrono::high_resolution_clock::now();

fprintf(stdout,vector delete front time spend: %f secondsn",(std::chrono::duration_cast>(time_end-time_start)).count());

}

{ // list delete front operation

std::list l(data,data+count);

time_start = std::chrono::high_resolution_clock::now();

listDeleteFront(&l);

time_end = std::chrono::high_resolution_clock::now();

fprintf(stdout,list delete front time spend: %f secondsn",(std::chrono::duration_cast>(time_end-time_start)).count());

}

{ // normal array traverse operation

time_start = std::chrono::high_resolution_clock::now();

for (int i = 0; i < count2; ++i)

arrayTraverse(data,array traverse time spend: %f secondsn",

data[0],(std::chrono::duration_cast>(time_end-time_start)).count());

}

{ // vector traverse operation

std::vector vec(data,data+count);

time_start = std::chrono::high_resolution_clock::now();

for (int i = 0; i < count2; ++i)

vectorTraverse(&vec,vector traverse time spend: %f secondsn",(std::chrono::duration_cast>(time_end-time_start)).count());

}

{ // list traverse operation

std::list l(data,data+count);

time_start = std::chrono::high_resolution_clock::now();

for (int i = 0; i < count2; ++i)

listTraverse(&l,list traverse time spend: %f secondsn",

*l.cbegin(),(std::chrono::duration_cast>(time_end-time_start)).count());

}

{ // normal array find operation

time_start = std::chrono::high_resolution_clock::now();

for (int i = 0; i < count2; ++i)

arrayFind(data,array find time spend: %f secondsn",(std::chrono::duration_cast>(time_end-time_start)).count());

}

{ // vector find operation

std::vector vec(data,data+count);

time_start = std::chrono::high_resolution_clock::now();

for (int i = 0; i < count2; ++i)

vectorFind(&vec,vector find time spend: %f secondsn",(std::chrono::duration_cast>(time_end-time_start)).count());

}

{ // list find operation

std::list l(data,data+count);

time_start = std::chrono::high_resolution_clock::now();

for (int i = 0; i< count2; ++i)

listFind(&l,list find time spend: %f secondsn",(std::chrono::duration_cast>(time_end-time_start)).count());

}

{ // multiset find operation

std::multiset s;

time_start = std::chrono::high_resolution_clock::now();

for (int i = 0; i < count2; ++i)

multisetFind(&s,multiset find time spend: %f secondsn",(std::chrono::duration_cast>(time_end-time_start)).count());

}

int a[10] = {1,2,3,5,7,11,13,17,19,23};

int init = 1,product = 0;

{ // accumulate operation: function pointer

time_start = std::chrono::high_resolution_clock::now();

for (int i = 0; i < count3; ++i)

product = std::accumulate(&a[0],&a[10],init,mult);

time_end = std::chrono::high_resolution_clock::now();

fprintf(stdout,"value: %d,accumulate function pointer time spend: %f secondsn",

product,(std::chrono::duration_cast>(time_end-time_start)).count());

}

{ // accumulate operation: function object

time_start = std::chrono::high_resolution_clock::now();

for (int i = 0; i < count3; ++i)

product = std::accumulate(&a[0],Mult());

time_end = std::chrono::high_resolution_clock::now();

fprintf(stdout,accumulate function object time spend: %f secondsn",(std::chrono::duration_cast>(time_end-time_start)).count());

}

{ // accumulate operation: function object(std)

time_start = std::chrono::high_resolution_clock::now();

for (int i = 0; i < count3; ++i)

product = std::accumulate(&a[0],std::multiplies());

time_end = std::chrono::high_resolution_clock::now();

fprintf(stdout,accumulate function object(std) time spend: %f secondsn",(std::chrono::duration_cast>(time_end-time_start)).count());

}

delete [] data;

return 0;

}

} // namespace standard_template_library_

执行结果如下:

GitHub:https://github.com/fengbingchun/Messy_Test 

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


项目中经常遇到CSV文件的读写需求,其中的难点主要是CSV文件的解析。本文会介绍CsvHelper、TextFieldParser、正则表达式三种解析CSV文件的方法,顺带也会介绍一下CSV文件的写方法。 CSV文件标准 在介绍CSV文件的读写方法前,我们需要了解一下CSV文件的格式。 文件示例 一
简介 本文的初衷是希望帮助那些有其它平台视觉算法开发经验的人能快速转入Halcon平台下,通过文中的示例开发者能快速了解一个Halcon项目开发的基本步骤,让开发者能把精力完全集中到算法的开发上面。 首先,你需要安装Halcon,HALCON 18.11.0.1的安装包会放在文章末尾。安装包分开发和
这篇文章主要简单记录一下C#项目的dll文件管理方法,以便后期使用。 设置dll路径 参考C#开发奇技淫巧三:把dll放在不同的目录让你的程序更整洁中间的 方法一:配置App.config文件的privatePath : &lt;runtime&gt; &lt;assemblyBinding xml
在C#中的使用JSON序列化及反序列化时,推荐使用Json.NET——NET的流行高性能JSON框架,当然也可以使用.NET自带的 System.Text.Json(.NET5)、DataContractJsonSerializer、JavaScriptSerializer(不推荐)。
事件总线是对发布-订阅模式的一种实现,是一种集中式事件处理机制,允许不同的组件之间进行彼此通信而又不需要相互依赖,达到一种解耦的目的。&#xA;EventBus维护一个事件的字典,发布者、订阅者在事件总线中获取事件实例并执行发布、订阅操作,事件实例负责维护、执行事件处理程序。
通用翻译API的HTTPS 地址为https://fanyi-api.baidu.com/api/trans/vip/translate,使用方法参考通用翻译API接入文档 。&#xA;请求方式可使用 GET 或 POST 方式(Content-Type 请指定为:application/x-www-for
词云”由美国西北大学新闻学副教授、新媒体专业主任里奇·戈登(Rich Gordon)于2006年最先使用,是通过形成“关键词云层”或“关键词渲染”,对文本中出现频率较高的“关键词”的视觉上的突出。词云图过滤掉大量的文本信息,使浏览者只要一眼扫过文本就可以领略文本的主旨。&#xA;网上大部分文章介绍的是使用P
微软在.NET中对串口通讯进行了封装,我们可以在.net2.0及以上版本开发时直接使用SerialPort类对串口进行读写操作。&#xA;为操作方便,本文对SerialPort类做了一些封装,暂时取名为**SerialPortClient**。
简介 管道为进程间通信提供了平台, 管道分为两种类型:匿名管道、命名管道,具体内容参考.NET 中的管道操作。简单来说,匿名管道只能用于本机的父子进程或线程之间,命名管道可用于远程主机或本地的任意两个进程,本文主要介绍命名管道的用法。 匿名管道在本地计算机上提供进程间通信。 与命名管道相比,虽然匿名
目录自定义日志类NLog版本的日志类Serilog版本的日志类 上个月换工作,新项目又要重新搭建基础框架,把日志实现部分单独记录下来方便以后参考。 自定义日志类 代码大部分使用ChatGPT生成,人工进行了测试和优化,主要特点: 线程安全,日志异步写入文件不影响业务逻辑 支持过期文件自动清理,也可自
[TOC] # 原理简介 本文参考[C#/WPF/WinForm/程序实现软件开机自动启动的两种常用方法](https://blog.csdn.net/weixin_42288432/article/details/120059296),将里面中的第一种方法做了封装成**AutoStart**类,使
简介 FTP是FileTransferProtocol(文件传输协议)的英文简称,而中文简称为“文传协议”。用于Internet上的控制文件的双向传输。同时,它也是一个应用程序(Application)。基于不同的操作系统有不同的FTP应用程序,而所有这些应用程序都遵守同一种协议以传输文件。 FTP
使用特性,可以有效地将元数据或声明性信息与代码(程序集、类型、方法、属性等)相关联。 将特性与程序实体相关联后,可以在运行时使用反射这项技术查询特性。&#xA;在 C# 中,通过用方括号 ([]) 将特性名称括起来,并置于应用该特性的实体的声明上方以指定特性。
# 简介 主流的识别库主要有ZXing.NET和ZBar,OpenCV 4.0后加入了QR码检测和解码功能。本文使用的是ZBar,同等条件下ZBar识别率更高,图片和部分代码参考[在C#中使用ZBar识别条形码](https://www.cnblogs.com/w2206/p/7755656.htm
C#中Description特性主要用于枚举和属性,方法比较简单,记录一下以便后期使用。 扩展类DescriptionExtension代码如下: using System; using System.ComponentModel; using System.Reflection; /// &lt;
本文实现一个简单的配置类,原理比较简单,适用于一些小型项目。主要实现以下功能:保存配置到json文件、从文件或实例加载配置类的属性值、数据绑定到界面控件。&#xA;一般情况下,项目都会提供配置的设置界面,很少手动更改配置文件,所以选择以json文件保存配置数据。
前几天用SerialPort类写一个串口的测试程序,关闭串口的时候会让界面卡死。网上大多数方法都是定义2个bool类型的标记Listening和Closing,关闭串口和接受数据前先判断一下。我的方法是DataReceived事件处理程序用this.BeginInvoke()更新界面,不等待UI线程
约束告知编译器类型参数必须具备的功能。 在没有任何约束的情况下,类型参数可以是任何类型。 编译器只能假定 System.Object 的成员,它是任何 .NET 类型的最终基类。 如果客户端代码使用不满足约束的类型,编译器将发出错误。 通过使用 where 上下文关键字指定约束。&#xA;最常用的泛型约束为
protobuf-net是用于.NET代码的基于契约的序列化程序,它以Google设计的“protocol buffers”序列化格式写入数据,适用于大多数编写标准类型并可以使用属性的.NET语言。&#xA;protobuf-net可通过NuGet安装程序包,也可直接访问github下载源码:https:/
工作中经常遇到需要实现TCP客户端或服务端的时候,如果每次都自己写会很麻烦且无聊,使用SuperSocket库又太大了。这时候就可以使用SimpleTCP了,当然仅限于C#语言。&#xA;SimpleTCP是一个简单且非常有用的 .NET 库,用于处理启动和使用 TCP 套接字(客户端和服务器)的重复性任务