如何解决用于“惰性中缀或”的通用 Lisp 读取宏,用于解构关键字
我有一个 Common Lisp 阅读器宏来解析“或”关系的惰性/延迟声明,使用由管道符(“|”)分隔的中缀语法以及标准列表括号和关键字文字。考虑形式 (:a :b|:c) - 它表示一个由 2 部分组成的元组,其中第一个元素肯定是 :a,第二个元素是 :b 或 :c。例如,可以推断整个元组的有效形式是 (:a :b) 或 (:a :c)。
我已经有函数封装的逻辑来解构 read 宏之后的这些元组列表形式。但是在阅读时,我需要解析像 :a|:b|:c 这样的形式,并用删除的管道标记它,例如 (:lazy-or :a :b :c)。中缀语法的使用纯粹是为了面向读者的形式;中缀形式是短暂的,会在读取阶段立即被丢弃,取而代之的是带有 :lazy-or 标记的等效合法 lisp 形式。
所以我制作了一个几乎可以正常工作的读取宏,但目前需要在第一个 or-form 关键字元素之前使用一个额外的管道作为一种阅读器符号(我希望这样根本没有必要),并且它目前无法使用嵌套括号或拼接符号推断类似形式作为等效(如在算术中,2+(3*4)
是相同的操作顺序,等效形式,如2+3*4
)。
宏(源自此处的“斜线阅读器”:http://www.lispworks.com/documentation/HyperSpec/Body/f_rd_rd.htm):
(defun pipe-reader (stream char)
(declare (ignore char))
`(:lazy-or .,(loop for dir = (read stream t nil t)
then (progn (read-char stream t nil t)
(read stream t nil t))
collect dir
while (eql (peek-char nil stream nil nil t) #\|))))
(set-macro-character #\| #'pipe-reader)
预期目标是在读取时应用/替换此重写规则: (macroexpand '(:a (:b | :c))) -> (:a (:lazy-or :b :c)) 或者,对于未包含在括号中的变体形式也是如此(一种默认的操作顺序;空格不会产生影响): (宏展开 '(:a :b|:c)) -> (:a (:lazy-or :b :c)) (宏展开 '(:a :b | :c)) -> (:a (:lazy-or :b :c)) 嵌套表单应该直观地、递归地呈现: (macroexpand '(:a (:b | (:c | :d)))) -> (:a (:lazy-or :b (:lazy-or :c :d)))
请注意,在基本形式的预期重写规则中 -- (macroexpand '(:a (:b | :c))) -> (:a (:lazy-or :b :c)) -- : a 不会以 or 形式加入,因为它没有中缀管道运算符来加入它;它以一种元组形式与 or 形式的结果一起存在。如前所述,这是这样的,在进一步评估惰性形式时,元组可能会产生 (:a :b) 或 (:a :c) - 以上意味着两者都是稍后解构的有效形式。
我很亲近。
问题是我不能完全理解,只有以下(使用上面的宏): (宏展开 '(:a |:b|:c )) -> (:A (:LAZY-OR :B :C)) (宏展开 '(:a :b |:d|:e|:f|:g)) -> (:A :B '(:LAZY-OR :D :E :F :G)) 它实际上完成了我打算做的大部分事情,这是一个功能性的基本解决方案:稍微修改执行规则以允许在读取时在中缀或表单的开头添加额外的管道,而无需将表单加入那个管道,因此它可以使 :b 到 :c(第一种形式)或 :d 到 :g(第二种形式)成为为 :lazy-or 形式列出的有效案例,并使该内部列表本身成为外部列表/元组与非变体值 :a 和 :b。 它接近我想要的: (macroexpand '(:a :b :d|:e|:f|:g)) -> 应该,不 -> (:A :B '(:LAZY-OR :D :E :F :G) )
有 3 个错误,按重要性排序:
-
需要额外的“前缀”管道
额外的开启管道,在每个被读取的 or-form 开始时,我想没有。我想切割管道以保持清洁和我自己的可读性偏好,并且仅在此读取宏的完全中缀位置使用管道。
-
在递归解析的嵌套表单中添加了额外的括号
它为嵌套表单添加了额外的括号,尽管它可以很好地递归处理嵌套表单。
-
不接受任意空格
它不接受管道之间的空格。我尝试使用 read-preserving-whitespace 而不是 read,但在这里无济于事。它应该接受管道和关键字形式之间的空格,就好像它们不存在一样,因为形式
:a|:b
和:a | :b
是等效的。
read 宏主要封装了工作逻辑,擅长递归和嵌套形式:
(macroexpand '(:a |(|:b|:c)|(|:e|:f))) -> 收益率 -> (:A (:LAZY-OR ((:LAZY-OR :B :C) ) ((:LAZY-OR :E :F))))
;(几乎完美,完全按照预期递归扩展,除了需要打开管道之外,这种形式的唯一问题是在最终 :lazy-or 形式周围生成的双括号)。
这样就可以从这种形式中生成相同的内容(目前是“不平衡”读取括号错误):
(macroexpand '(:a (:b | :c) | (:e | :f))) -> 应该,不会产生 -> (:A (:LAZY-OR (:LAZY-OR :B :C) (:LAZY-OR :E :F)))
除了 read 宏添加的额外括号,以及它无法在中缀形式中允许空格之外,真正关键的错误是无法将 or 形式写为中缀管道形式而不包括第一个,非-中缀管道(顺便说一下前缀)。我真的遇到了试图匹配流的砖墙,而无需使用第一个管道字符作为读取解析器的一种符号。也许对其中一个“窥视”函数进行一两次额外调用会给我一个更专业的形式来匹配,但我一直无法弄清楚如何解析它。
我考虑围绕现有的综合解决方案构建它,例如 NKF(“definfix”宏,https://www.cliki.net/infix)和 CMU 中缀(https://github.com/rigetti/cmu-infix/blob/master/src/cmu-infix.lisp),但由于这些是更通用和更大的代码库,我不要认为我需要为更多种类的表单/操作符重用中缀逻辑,只是这个。从我对一个相当小的宏的了解程度来看,我肯定更喜欢用一个小而简洁的解决方案来解决它,前提是它仍然是递归的并且不容易出错。
任何有关为此目的更有效地使用读取宏的观点将不胜感激。
解决方法
我会尝试不同的方法,并为备选列表使用不同的字符,例如 [a|b]
,这样您就不需要前缀栏了。
例如:
;; a bar is now the symbol 'or
(set-macro-character #\| (constantly 'or))
;; read a list of forms for alternative forms
(set-macro-character #\[
(lambda (stream char)
(declare (ignore char))
`(lazy-or-parse,@(read-delimited-list #\] stream t))))
;; this one is required too so that e.g. `a]` is not read as a single symbol.
(set-macro-character #\]
(lambda (stream char)
(declare (ignore char))
(error "Unmatched closing bracket")))
根据上面的定义,形式如下:
[:a|:b|:c]
读作:
(LAZY-OR-PARSE :A OR :B OR :C)
预计 lazy-or-parse
是一个宏。它的作用是解释一个标记列表,就像一个普通的解析器;您应该能够将它们分组为表达式(例如,具有定义的关联性/优先级的 Pratt 解析器)。
或者,您仍然可以在阅读器宏中进行解析,但我个人更喜欢在此阶段做最少的工作。
注意。您需要调整 Emacs 以使其理解此语法,对于我使用的测试 read-from-string
:
(read-from-string "[a b (c|d)]")
(LAZY-OR-PARSE A B (C OR D))
11
我looked a bit,这是我在语法表中更改的内容(这是 emacs-lisp 代码):
(modify-syntax-entry ?\[ "(]" lisp-mode-syntax-table)
(modify-syntax-entry ?\] ")[" lisp-mode-syntax-table)
(modify-syntax-entry ?| "_" lisp-mode-syntax-table)
通过这些修改,编辑器似乎可以识别语法,我什至可以这样写,将光标放在右括号之后,评估 last-sexp 并正确找到表达式的开头:
'[ a | (c | d)]
=> (LAZY-OR-PARSE A OR (C OR D))
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。