如何解决C - strlen() 似乎返回最小值 6
以下是 CS50 课程练习的一部分。这里描述了完整的问题: https://cs50.harvard.edu/x/2021/psets/2/substitution/
简而言之:在命令行上,您提供一个 26 长的字母数组作为参数,这些字母将用于“加密”在运行时被提示输入的名为纯文本的字符串。
然后循环遍历纯文本数组,并使用它们的 ascii 整数值(有些简化)来索引作为命令行参数提供的“26 个字母键”,从而“加密”初始纯文本字符串 (ptxt)并将其存储在一个新的密文字符串 (ctxt) 中。
问题我遇到的问题是,对于纯文本短比 6 的输入 - 我用来将 ptxt 的长度存储在 'n 中的 strlen() 函数' 似乎返回 6。所以如果我在纯文本提示符下只输入字母 'a' - n 似乎被设置为 6。
以下示例:
$ ./substitution YTNSHKVEFXRBAUQZCLWDMIPGJO
明文:a
密文:y.G[
密文长度为6
预期的输出只是 'y' ,但显然有些东西越界了——长度不应该是 6 而应该是 1。 令我抓狂的是 - 如果您在初始化“n”后取消注释 printf 语句,那么代码会突然起作用,您会得到以下内容:
$ ./substitution YTNSHKVEFXRBAUQZCLWDMIPGJO
明文:a
明文长度为 1
密文:y
密文长度为1
我在这里遗漏了什么? printf 调用如何以某种方式解决这个问题?
快把我逼疯了:)
#include <cs50.h>
#include <ctype.h>
#include <stdio.h>
#include <string.h>
bool is_letter(string array);
char encrypt(string key,char c);
//Command Line input a key to 'encrypt' some plaintext inputted at runtime
int main(int argc,string argv[])
{
// if there are NOT 2 arguments OR the first argument is NOT just letters OR is not 26 letters
if (argc != 2 || !is_letter(argv[1]) || strlen(argv[1]) != 26)
{
printf("Usage: ./caesar key (where key must be 26 letters)\n");
return 1;
}
// prompt user for a plaintext string,store the length in n and initialize a ciphertext string with same length
string ptxt = get_string("plaintext: ");
int n = strlen(ptxt);
//printf("plaintext is %i long\n",n); //this is here to correct n (try commenting out this line and see what happens for ptxt < 6)
char ctxt[n];
for (int i = 0; i < n; i++)
{
ctxt[i] = encrypt(argv[1],ptxt[i]);
}
printf("ciphertext: %s\n",ctxt);
printf("ciphertext is %i long\n",(int) strlen(ctxt));
return 0;
}
// function that checks whether command line argument is all letters
bool is_letter(string array)
{
int n = strlen(array);
for (int i = 0; i < n; i++)
{
if (!isalpha(array[i])) //loop over string - if any char is not a letter - return false
{
return false;
}
}
return true; //reaching this means all chars in the string are a letter - return true
}
//function that takes a key and a char and returns the "encrypted" char
char encrypt(string key,char c)
{
if (isalpha(c))
{
int n = 0;
char letter = 0;
if (isupper(c))
{
n = c - 65;
letter = key[n];
return toupper(letter);
}
else
{
n = c - 97;
letter = key[n];
return tolower(letter);
}
}
else
{
return c;
}
}
解决方法
C 中没有“字符串”这样的东西。C 中的“字符串”实际上是字节数组,char *
。 C 中的数组不知道它们有多长,没有内置的 bounds checks。您要么需要知道它们的大小,要么需要一个终结器。 “字符串”以 0 结尾,称为“空字节”,通常表示为 \0
。
strlen
读取字节直到它看到一个空字节。如果没有空字节,strlen
会很高兴地离开数组的末尾进入垃圾内存,直到它碰巧看到一个空字节或操作系统阻止程序超出其内存范围,segmentation fault .
// A basic strlen() implementation.
size_t my_strlen(const char *string) {
size_t len;
// no body,just counting until it sees a null byte.
for( len = 0; string[len] != '\0'; len++ );
return len;
}
(IMO CS50 在你学习 C 时试图隐藏这一点,这是一种损害。长期以来,试图将 C 视为不是 C。C 的裸机、热棒、没有护栏的性质不能被零散地隐藏起来。你要么一团糟,要么一门新语言。如果你想要字符串,请使用 C++ 或像 GLib 这样的完全实现的库。)
逐字节生成新字符串时,必须终止它。并且它必须有一个额外的字节来存储 0。
// Allocate an extra byte for the terminating null.
// At this point ctxt contains garbage.
char ctxt[n+1];
for (int i = 0; i < n; i++)
{
ctxt[i] = encrypt(argv[1],ptxt[i]);
}
// Terminate the string.
ctxt[n] = '\0';
printf 调用如何以某种方式解决这个问题?
当您像 char ctxt[n+1]
这样分配内存时,它未初始化。它不会自动归零。它包含该内存中的任何垃圾。你可能会走运并得到全零。它可以包含其他字符串。它可能包含看起来像随机垃圾的东西。
在分配 printf
之前添加 ctxt
会稍微改变分配给 ctxt
的内存块。 printf
还必须分配内存,因此 ctxt
可能会得到一个稍微不同的内存块,它恰好以零开头。 ctxt
可能会获得 printf 分配、归零和释放的内存块。由于内存是一种全局资源,程序某一部分的更改可以揭示或隐藏程序另一部分的内存错误。
valgrind 和 AddressSanitizer 等工具可以帮助发现这些细微的错误。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。