谈谈 C++ STL 中的迭代器

C++中的迭代器和指针

在前面的内容中我们简单讲过,STL主要是由三部分组成

  1. 容器(container),包括vector,list,set,map等
  2. 泛型算法(generic algorithm),用来操作这些容器,包括find(),sort(),replace()等
  3. 迭代器(iterator),泛型算法操作容器的工具,是连接容器和算法的粘合剂

一、迭代器(iterator)

在介绍STL之前,首先了解一下什么是迭代器。STL中的泛型算法提供了很多可作用于容器类以及数组类上的操作,这些算法与他们想要操作的元素类型无关(int,double,string等)且与容器类独立(vector,list,array等)。很容易想到,泛型算法通过函数模板(function template)技术来达到 “与操作对象的元素类型无关” 的目的,而实现与 “容器无关” 则不直接在容器本身进行操作,而是借助一对 iterator 来标示我们要进行迭代的元素范围。我们通过一个具体的问题来引入 iterator 的设计动机。

问题描述:
给定一个存储整数的vector,如果vector内存在目标值value,就返回指向该值的指针;否则返回0。

首先很容易想到的一种做法是:

int* find(vector<int>& nums,const int& value){
    for(int i=0; i<nums.size(); i++){
        if(nums[i]==value)	return &nums[i];
    }
    return 0;
}

接下来我们使用函数模板技术来扩充这个函数的功能,使其能够处理不同类型的数据类型:

template <typename T>
T* find(vector<T>& nums,const T& value){
    for(int i=0; i<nums.size(); i++){
        if(nums[i]==value)	return &nums[i];
    }
    return 0;
}

紧接着我们会想,函数能不能同时实现对vector和array类型的输入进行查找,一种解决办法是通过函数重载的技术来实现,但是如果要实现很多种类型的容器,那么便需要写很多个重载函数。另一种更好的解决办法是:我们便不将容器本身作为参数传入,而是传入需要处理的数据的开始和结束位置,这样便对任意的输入有了普遍性。

对于 array 数组类型的数据 int array[10]而言,array=&arran[0] 即数组名就代表数组的开始地址,也代表数组第一个元素的地址。由于在传递时,无论是 array[10],array[24],都不会传递 array 的结束地址,因此需要额外传递一个参数 size,或者一个结尾地址,那么程序便可以写成:

方法一:传递数组的大小作为参数来标示结束为止
template <typename T>
T* find(const T* array,int size,const T& value){...}
方法二:传递数组的结尾指针来标示结束为止
template <typename T>
T* find(const T* begin,const T* end,const T& value){...}

上面我们已经完成了 array 类型输入的find 函数的编写,下面我们就来简单看一下调用方式:

int 	in_array[5] = {1,4,5,7,2};
double 	do_array[7] = {1.5,2.7,3.2,2,1.7};
int* f1 = find(array,4);	//采用第一种调用方式,传入开始位置和数组大小
int* f2 = find(do_array,do_array+7,2); //采用第二种调用方式,传入开始位置和结束位置即[开始位置,结束位置)

那么针对 vector 类型的容器,它的存储方式跟 array 相同,都是以一块连续的内存存储所有元素,因此可以采用跟 array 相同的方式来实现 find 函数。但是二者不同的是:vector 容器可以为空而 array 不能为空,因此:

vector<int> nums;	find(&nums[0],&nums[0+n],value);	//正确
int array[];	//无法对 array[0] 取地址

所以为了避免每次在计算 array 的首地址时,array 为空的情况,抽象出一个新的函数 begin(),具体定义如下:

template <typename T>
inline T* begin(const vector<T>& vec){
    return vec.empty() ? 0:&vec[0];
}

我们以同样的方式封装成 end() 函数,返回 vector 的结束地址。因此我们便有了放之四海而皆准的调用方式:

find( begin(vec),end(vec),value ); // 开始地址,结束地址,查找值

再进一步,我们可以尝试将 find 函数应用在所有的容器类型,但是由于大部分容器(比如:list,map,set)并不是顺序存储,因此 vectorarray 的这种指针寻址的方式并不适合其他非连续内存空间存储的容器类型。解决这个问题的方法是,在底层指针的行为之上提供一层抽象,取代程序原本的 “指针直接操作” 方式。我们把底层指针的处理全部放在此抽象层中,将原本的指针操作根据具体的容器类型进行重载,这样我们便可以处理标准库所提供的的所有容器类,这便是 iterator 的创建原因。iterator 的操作方式跟指针一样,但是 iterator 的 ++,!=,* 等运算符是根据具体的容器类型重载过得。对 list 而言,++ 会按照链表的方式前进到下一个元素,对 vector 而言,++ 会直接指向下一个内存位置。

既然知道了迭代器的实现原理,那么下面我们来简单实现一下 `list` 的迭代器:
/*************定义单链表的类************/
template<typename T>
class node {
public:
    T value;
    node *next;
    node() : next(nullptr) {}
    node(T val,node *p = nullptr) : value(val),next(p) {}
};
/*************封装单链表***************/
template<typename T>
class my_list {
private:
    node<T> *head;
    node<T> *tail;
    int size;
private:
    //单链表迭代器的实现
    class list_iterator {
    private:
        node<T> *ptr; //指向list容器中的某个元素的指针
    public:
        list_iterator(node<T> *p = nullptr) : ptr(p) {}     
        //重载++、--、*、->等基本操作
        //返回引用,方便通过*it来修改对象
        T &operator*() const {
            return ptr->value;
        }
        node<T> *operator->() const {
            return ptr;
        }
        list_iterator &operator++() {
            ptr = ptr->next;
            return *this;
        }
        list_iterator operator++(int) {
            node<T> *tmp = ptr;
            // this 是指向list_iterator的常量指针,因此*this就是list_iterator对象,前置++已经被重载过
            ++(*this);
            return list_iterator(tmp);
        }
        bool operator==(const list_iterator &t) const {
            return t.ptr == this->ptr;
        }
        bool operator!=(const list_iterator &t) const {
            return t.ptr != this->ptr;
        }
    };

public:
    typedef list_iterator iterator; //类型别名
    my_list() {
        head = nullptr;
        tail = nullptr;
        size = 0;
    }
    //从链表尾部插入元素
    void push_back(const T &value) {
        if (head == nullptr) {
            head = new node<T>(value);
            tail = head;
        } else {
            tail->next = new node<T>(value);
            tail = tail->next;
        }
        size++;
    }
    //打印链表元素
    void print(std::ostream &os = std::cout) const {
        for (node<T> *ptr = head; ptr != tail->next; ptr = ptr->next)
            os << ptr->value << std::endl;
    }
public:
    //操作迭代器的方法
    //返回链表头部指针
    iterator begin() const {
        return list_iterator(head);
    }
    //返回链表尾部指针
    iterator end() const {
        return list_iterator(tail->next);
    }
    //其它成员函数 insert/erase/emplace
};

二、容器(container):物之所置也

2.1 顺序性容器

  1. vector 以一块连续的内存来存放元素,对 vector 进行随机访问很有效率,但是由于 vector 的每个元素都被存储在距离起始点的固定偏移位置,如果将元素插在任意位置,那么效率很低。同理,删除任意位置的元素也缺乏效率;
  2. list 以双向链接而非连续内存来存储内容,因此实现 list 内部任意位置的插入和删除操作效率很高,但是如果要对 list 进行随机访问,则效率很低;
  3. deque 与 vector 一样都是使用连续内存来存放元素,deque 在最前端插入元素,最后端删除元素。

2.2 关联容器

map:被定义为一对(key-value)数值,其中的 key 通常是个字符串,扮演索引的角色,另一个数值是 valuevaluekey 通过映射函数 f 得到的值,可以记录 key 出现的次数等。map 对象中 keyfirst 对象来表示,valuesecond 对象来表示,即:

map<string,int>::iterator it = words.begin();
while(it != words.end()){
	cout << "key:" << it->first << "\nvalue:" << it->second << endl;
}

查询map是否存在 key 有三种方法:

/**********************方法一**********************/
string target="a";
int count = words[target]; // 查询words中是否存在 "a"
/**********************方法二**********************/
string target="a";
map<string,int>::iterator it = words.find(target);
/**********************方法三**********************/
string target="a";
int count = words.count(target);

其中:

  1. 方法一:如果 words 中存在 "a",count 中就记录了 "a" 的个数。**但是,当 words 中本来就不含有 "a" 时,该方法会通过 words[target] 自动添加进 words,此时 words[target]=0 **,因此该方法不建议用在查询中;
  2. 方法二:类似于上一节中写的 find 函数,当找到该元素时,返回指向该元素的迭代器,否则返回指向最有一个元素的后一个位置的迭代器 words.end()。所以通过判断函数返回值是否为 words.end() 便可以知道结果;
  3. 方法三:count 会返回某个特定项在 map 内的个数。

set:set的操作方式跟map差不多,set中相当于只记录了 key 值。

无论是 map 还是 set,在进行插入元素后会对其中的元素进行排序,因此当不需要排序时,需要定义:

unordered_map<pair<type1,type2>>my_map;
unordered_set<pair<type1,type2>>my_set;

2.3 所有容器的共通操作

  1. ==,!= :返回 true 或者 false, 判断是否相等;
  2. empty():在容器为空时返回 true,否则返回 false
  3. size():返回容器内的元素个数;
  4. clear():清空容器内的元素,但是保留容器的长度;
  5. begin():返回容器第一个元素的 iterator
  6. end():返回容器最后一个元素的后一个位置的 iterator
  7. insert():在容器的指定位置插入元素;
  8. erase():在容器的指定位置删除元素;
  9. push_back():在容器的末端插入元素;
  10. pop_back():在容器的首端取出元素.......

上面列举的都是比较常见的一部分,由于精力有限难免有错误和疏漏,欢迎大家在阅读的同时对文中的不当之处进行指正、补充,不胜感激 !

三、参考内容

  1. 《Essential C++》中文版,侯捷译
  2. https://www.cnblogs.com/wengle520/p/12492708.html

原文地址:https://www.cnblogs.com/zhaozhibo

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


一.C语言中的static关键字 在C语言中,static可以用来修饰局部变量,全局变量以及函数。在不同的情况下static的作用不尽相同。 (1)修饰局部变量 一般情况下,对于局部变量是存放在栈区的,并且局部变量的生命周期在该语句块执行结束时便结束了。但是如果用static进行修饰的话,该变量便存
浅谈C/C++中的指针和数组(二) 前面已经讨论了指针和数组的一些区别,然而在某些情况下,指针和数组是等同的,下面讨论一下什么时候指针和数组是相同的。C语言标准对此作了说明:规则1:表达式中的数组名被编译器当做一个指向该数组第一个元素的指针; 注:下面几种情况例外 1)数组名作为sizeof的操作数
浅谈C/C++中的指针和数组(一)指针是C/C++的精华,而指针和数组又是一对欢喜冤家,很多时候我们并不能很好的区分指针和数组,对于刚毕业的计算机系的本科生很少有人能够熟练掌握指针以及数组的用法和区别。造成这种原因可能跟现在大学教学以及现在市面上流行的很多C或者C++教程有关,这些教程虽然通俗易懂,
从两个例子分析C语言的声明 在读《C专家编程》一书的第三章时,书中谈到C语言的声明问题,《C专家编程》这本书只有两百多页,却花了一章的内容去阐述这个问题,足以看出这个问题的重要性,要想透彻理解C语言的声明问题仅仅看书是远远不够的,需要平时多实践并大量阅读别人写的代码。下面借鉴《C专家编程》书中的两个
C语言文件操作解析(一)在讨论C语言文件操作之前,先了解一下与文件相关的东西。一.文本文件和二进制文件 文本文件的定义:由若干行字符构成的计算机文件,存在于计算机系统中。文本文件只能存储文件中的有效字符信息,不能存储图像、声音等信息。狭义上的二进制文件则指除开文本文件之外的文件,如图片、DOC文档。
C语言文件操作解析(三) 在前面已经讨论了文件打开操作,下面说一下文件的读写操作。文件的读写操作主要有4种,字符读写、字符串读写、块读写以及格式化读写。一.字符读写 字符读写主要使用两个函数fputc和fgetc,两个函数的原型是: int fputc(int ch,FILE *fp);若写入成功则
浅谈C语言中的位段 位段(bit-field)是以位为单位来定义结构体(或联合体)中的成员变量所占的空间。含有位段的结构体(联合体)称为位段结构。采用位段结构既能够节省空间,又方便于操作。 位段的定义格式为: type [var]:digits 其中type只能为int,unsigned int,s
C语言文件操作解析(五)之EOF解析 在C语言中,有个符号大家都应该很熟悉,那就是EOF(End of File),即文件结束符。但是很多时候对这个理解并不是很清楚,导致在写代码的时候经常出错,特别是在判断文件是否到达文件末尾时,常常出错。1.EOF是什么? 在VC中查看EOF的定义可知: #def
关于VC+ʶ.0中getline函数的一个bug 最近在调试程序时,发现getline函数在VC+ʶ.0和其他编译器上运行结果不一样,比如有如下这段程序:#include &lt;iostream&gt;#include &lt;string&gt;using namespace std;int
C/C++浮点数在内存中的存储方式 任何数据在内存中都是以二进制的形式存储的,例如一个short型数据1156,其二进制表示形式为00000100 10000100。则在Intel CPU架构的系统中,存放方式为 10000100(低地址单元) 00000100(高地址单元),因为Intel CPU
浅析C/C++中的switch/case陷阱 先看下面一段代码: 文件main.cpp#includeusing namespace std;int main(int argc, char *argv[]){ int a =0; switch(a) { case ...
浅谈C/C++中的typedef和#define 在C/C++中,我们平时写程序可能经常会用到typedef关键字和#define宏定义命令,在某些情况下使用它们会达到相同的效果,但是它们是有实质性的区别,一个是C/C++的关键字,一个是C/C++的宏定义命令,typedef用来为一个已有的数据类型
看下面一道面试题:#include&lt;stdio.h&gt;#include&lt;stdlib.h&gt;int main(void) { int a[5]={1,2,3,4,5}; int *ptr=(int *)(&amp;aʱ); printf(&quot;%d,%d&quot;,*(
联合体union 当多个数据需要共享内存或者多个数据每次只取其一时,可以利用联合体(union)。在C Programming Language 一书中对于联合体是这么描述的: 1)联合体是一个结构; 2)它的所有成员相对于基地址的偏移量都为0; 3)此结构空间要大到足够容纳最&quot;宽&quo
从一个程序的Bug解析C语言的类型转换 先看下面一段程序,这段程序摘自《C 专家编程》:#include&lt;stdio.h&gt;int array[]={23,34,12,17,204,99,16};#define TOTAL_ELEMENTS (sizeof(array)/sizeof(ar
大端和小端 嵌入式开发者应该对大端和小端很熟悉。在内存单元中数据是以字节为存储单位的,对于多字节数据,在小端模式中,低字节数据存放在低地址单元,而在大端模式中,低字节数据存放在高地址单元。比如一个定义一个short型的变量a,赋值为1,由于short型数据占2字节。在小端模式中,其存放方式为0X40
位运算和sizeof运算符 C语言中提供了一些运算符可以直接操作整数的位,称为位运算,因此位运算中的操作数都必须是整型的。位运算的效率是比较高的,而且位运算运用好的话会达到意想不到的效果。位运算主要有6种:与(&amp;),或(|),取反(~),异或(^),左移(&gt;)。1.位运算中的类型转换位
C语言文件操作解析(四)在文件操作中除了打开操作以及读写操作,还有几种比较常见的操作。下面介绍一下这些操作中涉及到的函数。一.移动位置指针的函数 rewind函数和fseek函数,这两个函数的原型是:void rewind(FILE *fp); 将位置指针移动到文件首 int fseek(FILE
结构体字节对齐 在用sizeof运算符求算某结构体所占空间时,并不是简单地将结构体中所有元素各自占的空间相加,这里涉及到内存字节对齐的问题。从理论上讲,对于任何变量的访问都可以从任何地址开始访问,但是事实上不是如此,实际上访问特定类型的变量只能在特定的地址访问,这就需要各个变量在空间上按一定的规则排
C语言文件操作解析(二)C语言中对文件进行操作必须首先打开文件,打开文件主要涉及到fopen函数。fopen函数的原型为 FILE* fopen(const char *path,const char *mode) 其中path为文件路径,mode为打开方式 1)对于文件路径,只需注意若未明确给出绝