由编程珠玑字符串倒置问题拓展到split之C\C++实现

一道字符串倒置的题目，不是全部倒置，而是每个单词倒置，单词之间顺序不变。

这道题目应该是很经典的，好多次看到，包含编程珠玑的案例，还有某博客写的百度一面面试题，典型的O(n)算法，每个word倒置，再整个string倒置。

这次要上战场了，却发现C C++的字符串函数不熟练了，最近写的都是Java，一个Split函数爽到爆，于是决定要吧C C++的常用字符串函数过一遍，
并对各种方法实现，此处总结下Split。另外发现leetcode里面居然只支持new node(data),不支持常用的new node();因为之前习惯后者，可能leetcode都是写成类，而且头文件基本包括，总之提交的代码不能直接运用，后台会自动扩充成完整的，而且是面向对象的思想，我还用malloc去弄。

IT面试C C++ 是永恒的王道，尤其是字符串处理，必须信手拈来，函数的参数，返回值，功能，是否指针可写，C C++字符串转换必须熟记在心。

自己写的reverseWord，虽然AC掉了，但是代码极其丑陋，C C++字符串操作混乱，完全不统一。。。

void reverseWords(string &s) {
        
    string s_result="";
	char *s_dup=strdup(s.c_str());


	// first split,outside loop
	char *splitpoint=strtok(s_dup," ");

	while(splitpoint!=NULL)
	{
		//reverse each split word in place,int splitlength=strlen(splitpoint);
		for(int i=0;i<splitlength/2;i++)
		{
			char tmp=splitpoint[i];
			splitpoint[i]=splitpoint[splitlength-i-1];
			splitpoint[splitlength-i-1]=tmp;
		}

		//change char* to string,then each time concatenate to new string
		string reversesplitword=splitpoint;

		splitpoint=strtok(NULL," ");
		if(splitpoint!=NULL)
			s_result+=reversesplitword+" ";
		else
			s_result+=reversesplitword;
		
	}

	//reverse s_result;
	string tmp="";
	for(int i=0;i<s_result.length();i++)
		tmp=s_result[i]+tmp;
	s=tmp;
        
}

这里对Split功能的几种实现做一个总结,当时处理MCluster输入参数路径的时候，也用了这个函数，但是C C++字符串转换感觉很不爽。。。因为strtok源串必须为可修改的指针，string.c_str()是一个只读的char* 类型
之前习惯的都是C的那个函数strtok()

char *splitpoint=strtok(s_dup," ");
while(splitpoint!=NULL)
{
	splitpoint=strtok(NULL," ");
}

strtok函数有个非常奇怪的地方，就是源串居然会被修改，
" zhang rui chang "
执行一次，源串变为" zhang",splitpoint变为"zhang"，因为他把zhang 后面分隔符自动填了\0,所以源字符串被截断了
但是他可以自动实现多个连续的分隔符split时全部都被删掉，恰好符合题目要求

这是C的split函数，由于string还是比较方便，直接转的时候c_str()不行，因此需要拷贝一个char* 出来很麻烦，也慢，于是考虑直接split string字符串
前几天和好基友伟哥聊了会儿，伟哥突然提到一个stringstream,我都差点忘了，当年C++教材里有一个这例子，专门处理那种ACM题目里一行的数据的个数是未知的情况，
但是我到后面一直没怎么用，没体会到他的好处。于是有了下面的代码，但是这个方法有个最大的局限，就是只能处理他设置好的delim,也即space \t 和\n这三种,

#include<stringstream>
...
str="  zhang rui   chang ";
istringstream istr(str);
while(istr>>splitstr)
{
	//process for each splitted str,splitstr;
}

如果修改delim的话，用getline函数改下就好了

www.haogongju.net/art/1554996

std::string token,text("Here,is,some:text"); //声明两个string token为空， text初始化为 "Here,some:text" 
std::stringstream iss(text); //声明一个stringstream类型 对象iss,并将其赋值给 text
while ( getline(iss,token,',') ) //从iss 读取字符串，并写入给字符串 token， 截断符使用 ',' 代替默认的截断符 '\n',直到读到iss的结尾位置为止 
{ 
	std::cout << token << std::endl; //输出每次截断的新内容 ...即 token的值 11 
}

String的实现,也可以考虑迭代器实现
blog.csdn.net/butterfly_dreaming/article/details/10142443
//注意：当字符串为空时，也会返回一个空字符串

void split(std::string& s,std::string& delim,std::vector< std::string >* ret)  
{  
    size_t last = 0;  
    size_t index=s.find_first_of(delim,last);  
    while (index!=std::string::npos)  
    {  
        ret->push_back(s.substr(last,index-last));  
        last=index+1;  
        index=s.find_first_of(delim,last);  
    }  
    if (index-last>0)  
    {  
        ret->push_back(s.substr(last,index-last));  
    }  
}

char* 也可以实现，但是和上面没本质区别

另外还有一种方法，就是用boost，但是这个感觉对我比较冷门，虽然有了这个，库就估计可以和Java比了，boost里面有专门的token处理

blog.diveinedu.net/%E4%B8%89%E7%A7%8D%E5%AD%97%E7%AC%A6%E4%B8%B2%E5%88%86%E5%89%B2%E6%96%B9%E6%B3%95cc/
正如上面这位仁兄总结的三条主线差不多了。所以对于多数情况用string，就用stringstream吧，如果输入的char*,也可以先转string，或者直接用strtok哈~

指针传递的笔记：
指针传递是传值，不是引用，因此创建一个链表最好返回一个指针值,而不要期待传递一个类似于引用传递的指针参数，因为穿进去的是一个拷贝了原指针指的指针变量

另外还有一个细节就是char string[ ]=”C++ programming language”;

用strlen 是24，但是sizeof 25,原因是strlen是基于字符串本身的长度，当然不算结束符了，而sizeof是占得内存字节数，\0是占内存，切腹属于该字符串

char *a="C++ programming language";
cout<<strlen(a)<<endl<<sizeof(a)<<endl;

结果是：24和4，所以大家可以体会给char a[] 和char*a赋一个字符串的巨大区别了吧

但是如果 cout<<a<<endl<<(void*)a<<endl 前面输出的居然是字符串值，而不是一个地址值，而后面要转换成泛型指针才能输出地址值，小伙伴们都惊呆了，想起了C++书当时提到的C++智能处理。

再次感谢博主帮我回忆了C++字符串处理

www.weixueyuan.net/view/5851.html

由编程珠玑字符串倒置问题拓展到split之C\C++实现

相关推荐