如何解决差异算法C ++
| 我正在尝试用C ++创建一个程序,该程序可以区分两个.txt文件。struct line
{
string text;
size_t num;
int status;
};
void compareFiles(vector<line> &buffer_1,vector<line> &buffer_2,size_t index_1,size_t index_2)
{
while(index_1 < buffer_1.size())
{
while(index_2 < buffer_2.size())
{
X = buffer_1[index_1].text;
Y = buffer_2[index_2].text;
if(X == Y)
{
++index_1;
++index_2;
}
else
{
LCS();
string lcs = printLCS(X.length(),Y.length());
/*
* Here\'s my problem
*/
}
}
}
}
如您所见,我之前有两个装有文件content的缓冲区(行向量)。我还具有功能齐全的LCS算法(经过测试)。 LCS对全局定义的字符串X和Y起作用。
因此,我真正需要做的是将缓冲区与LCS逐行比较,但是我没有设法做到这一点。
请你帮助我好吗?
解决方法
如有疑问,我通常会请以前做过的人来做。古老的diff程序已经存在了很长时间,并且可以完成您想做的事情。此外,它是开源的,因此请转至ftp://mirrors.kernel.org/gnu/diffutils/diffutils-3.0.tar.gz并进行检查。
解压缩存档文件后,打开src / analyze.c。
diff_2_files
函数从第472行开始。进行实际比较的代码从第512-537行开始。它们的再现如下:
for (;; cmp->file[0].buffered = cmp->file[1].buffered = 0)
{
/* Read a buffer\'s worth from both files. */
for (f = 0; f < 2; f++)
if (0 <= cmp->file[f].desc)
file_block_read (&cmp->file[f],buffer_size - cmp->file[f].buffered);
/* If the buffers differ,the files differ. */
if (cmp->file[0].buffered != cmp->file[1].buffered
|| memcmp (cmp->file[0].buffer,cmp->file[1].buffer,cmp->file[0].buffered))
{
changes = 1;
break;
}
/* If we reach end of file,the files are the same. */
if (cmp->file[0].buffered != buffer_size)
{
changes = 0;
break;
}
}
这样做的想法是加载两个大小相同的缓冲区,然后将每个文件加载到缓冲区中。使用memcmp
一次比较两个文件的两个缓冲区,看看是否有任何缓冲区与另一个缓冲区不同。如果任何缓冲区比较不返回相等,则两个文件不同。同样重要的是要注意,您一次不必读取两个以上的缓冲区数据,因此这种方法也适用于大型文件。
, 首先,我将重写LCS()
,以两行作为参数并返回最长的公共序列-我想象一个函数签名,如std::string LCS(const line& lhs,const line& rhs)
。然后,我将如下修改您的while
循环。
for(int i = 0; i < buffer_1.size(); ++i)
{
for(int j = 0; j < buffer_2.size(); ++j)
{
std::string lcs = LCS(buffer_1[i].text,buffer_2[j].text);
std::cout << \"LCS[\" << i << \"][\" << j << \"]: \" << lcs << std::endl;
}
}
这将为and8ѭ和buffer_2
中的每行组合找到并打印最长的公共序列。这是您想做的吗?我是否正确理解您的问题?
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。