如何解决错误:在寻找词法分析器规则元素时{''令我完全惊讶
我尝试匹配STRING_LITERAL进行以下任务
串
字符串文字包含零个或多个用双精度号括起来的字符
引号(“)。使用转义序列(下面列出)表示特殊字符
字符串中的字符。请记住,引号不属于
字符串。这是换行或EOF字符的编译时错误
在开头(“)之后和结尾匹配(”)之前出现。
支持的所有转义序列如下:
\ b退格键
\ f表单供稿
\ r回车符
\ n换行符
\ t水平制表符
\’单引号
\反斜杠
对于字符串中的双引号(“),必须在其前写一个单引号('):’”双引号
例如:
“这是一个包含制表符\ t的字符串”
”他问我:“约翰在哪里?””
一开始我的代码就是这样:
// Every char that isn't ESC_ILLEGAL or is ESC_SEQ
STRING_LITERAL: '"' STR_CHAR* '"';
fragment STR_CHAR: ~ESC_ILLEGAL| ESC_SEQ;
fragment ESC_SEQ: ([\\] [btnfr'\\]) | [{'"}];
fragment ESC_ILLEGAL: (([\\] ~[btnfr'\\]) | ['] ~["]);
但是由于ANTLR语法问题,我不得不编写内联ESC_ILLEGAL,我的最终代码如下:
STRING_LITERAL: '"' STR_CHAR* '"';
fragment STR_CHAR: ~(([\\] ~[btnfr'\\]) | ['] ~["]) | ESC_SEQ;
fragment ESC_SEQ: ([\\] [btnfr'\\]) | [{'"}];
现在ANTLR抛出错误:'(' came as a complete surprise to me while looking for lexer rule element
我试图搜索此错误,甚至使用De Morgan更改我的STR_CHAR来取悦ANTLR(但这无法正常工作,并且ANTLR不支持)。顺便说一句,我不太确定我的STRING_LITERAL是否正确,如果您可以为此提供一些建议,那将很好。我是ANTLR的新手,所以也许很多我确实做错的事,但如果可以的话,请帮助我。
谢谢。
解决方法
此任务由两部分组成:
- 收集组成字符串的所有部分。
- 将语义应用于其某些内容。
第一部分可以通过以下简单规则完成:
String:
DOUBLE_QUOTE InnerString* DOUBLE_QUOTE
;
fragment InnerString:
SINGLE_QUOTE DOUBLE_QUOTE InnerString SINGLE_QUOTE DOUBLE_QUOTE
| .
;
DOUBLE_QUOTE: '"';
SINGLE_QUOTE: '\'';
与您的解决方案相比,该解决方案似乎没有专门处理转义序列。这是因为,如果您要在语法中定义序列,则处理错误(即错误的序列)会更加困难。处理转义序列意味着将含义(语义)应用于字符串的一部分。解析运行后,语义处理最好在单独的步骤中完成。
在语义步骤中,您将扫描令牌文本中的任何\<letter>
序列并将其转换为实际目标值。如果遇到无效的序列,则可以打印一条不错的错误消息,如果允许的转义代码出现在词法分析器语法中,则这是不可能的。解析过程将以诸如“没有可行的替代项”之类的神秘消息停止。
仅当否定字符集中有单个字符时,才能在词法分析器内部取反字符集。所以这是有效的:
FOO : ~(('a' | 'b') | 'c');
但这不是:
FOO : ~(('ab') | 'c'); // 'ab' cannot be negated
您的问题是这个
~(([\\] ~[btnfr'\\]) | ['] ~["])
您不能否定(([\\] ~[btnfr'\\]) | ['] ~["])
所匹配的任何内容。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。