我试图从头开始编写终端解析器(用于解析器组合器)。我的方法是在输入字符串上使用regexp-match-positions*
,如果在第一个位置找到模式,那么我们输出拆分字符串。从字符串开头的正则表达式匹配和拆分
这是我得到了什么,至今:
#lang racket/base
(require racket/match)
(define (make-terminal-parser pattern)
(define (regexp-match-from-start pattern input)
(match (regexp-match-positions* pattern input)
[(list (cons 0 x) ...)
(let ([index (car x)])
(values (substring input 0 index)
(substring input index)))]
[_ (error "Not found!")]))
(lambda (input)
(regexp-match-from-start pattern input)))
(define ALPHA (make-terminal-parser #rx"[a-zA-Z]"))
(ALPHA "hello")
我ALPHA
似乎不工作,我想这是因为匹配不与任何等同的格局。在REPL中,(regexp-match-positions* #rx"[a-zA-Z]" "hello")
输出我期望的('((0 . 1) (1 . 2) etc.)
),所以我不太明白为什么这与(list (cons 0 x) ...)
不匹配。如果我将正则表达式更改为#rx"h"
,那么它会正确拆分字符串;但显然这太具体了。
(相关提示:我不明白为什么我需要(car x)
获得实际的指标值进行匹配的利弊。)