Python:YACC 的问题-6ren

Python:YACC 的问题

In lại Tác giả: Walker 123 更新时间：2023-11-28 18:55:27

hai mươi bốn

4

我正在使用 PLY 来解析如下句子:

"CS 2310 or equivalent experience"

期望的输出:

[[("CS", 2310)], ["equivalent experience"]]

YACC 分词器符号:

tokens = [
    'DEPT_CODE',
    'COURSE_NUMBER',
    'OR_CONJ',
    'MISC_TEXT',
]

t_DEPT_CODE = r'[A-Z]{2,}'
t_COURSE_NUMBER = r'[0-9]{4}'

t_OR_CONJ = r'or'

t_ignore = ' \t'

terms = {'DEPT_CODE': t_DEPT_CODE,
         'COURSE_NUMBER': t_COURSE_NUMBER,
         'OR_CONJ': t_OR_CONJ}

for name, regex in terms.items():
    terms[name] = "^%s$" % regex

def t_MISC_TEXT(t):
    r'\S+'
    for name, regex in terms.items():
        # print "trying to match %s with regex %s" % (t.value, regex)
        if re.match(regex, t.value):
            t.type = name
            return t

    return t

(MISC_TEXT 用于匹配其他术语未捕获的任何内容。)

解析器的一些相关规则:

precedence = (
    ('left', 'MISC_TEXT'),
)


def p_statement_course_data(p):
    'statement : course_data'
    p[0] = p[1]

def p_course_data(p):
    'course_data : course'
    p[0] = p[1]


def p_course(p):
    'course : DEPT_CODE COURSE_NUMBER'
    p[0] = make_course(p[1], int(p[2]))


def p_or_phrase(p):
    'or_phrase : statement OR_CONJ statement'
    p[0] = [[p[1]], [p[3]]] 


def p_misc_text(p):
    '''text_aggregate : MISC_TEXT MISC_TEXT
                      | MISC_TEXT text_aggregate
                      | text_aggregate MISC_TEXT '''
    p[0] = "%s %s" % (p[0], [1])

def p_text_aggregate_statement(p):
    'statement : text_aggregate'
    p[0] = p[1]

不幸的是，这失败了:

# works as it should
>>> token_list("CS 2110 or equivalent experience")
[LexToken(DEPT_CODE,'CS',1,0), LexToken(COURSE_NUMBER,'2110',1,3), LexToken(OR_CONJ,'or',1,8), LexToken(MISC_TEXT,'equivalent',1,11), LexToken(MISC_TEXT,'experience',1,22)]

# fails. bummer.
>>> parser.parse("CS 2110 or equivalent experience")
Syntax error in input: LexToken(MISC_TEXT,'equivalent',1,11)

我做错了什么？我不完全明白如何设置优先规则。

此外，这是我的错误函数:

def p_error(p):
    print "Syntax error in input: %s" % p

有没有办法查看解析器在失败时尝试的规则？或者其他一些让解析器打印规则其尝试的方法？

gia hạn token_list() 只是一个辅助函数:

def token_list(string):
    lexer.input(string)
    result = []
    for tok in lexer:
        result.append(tok)
    return result

更新 2:这是我想要进行的解析:

Symbol Stack Input Tokens Action
                                            DEPT_CODE COURSE_NUMBER OR_CONJ MISC_TEXT MISC_TEXT
DEPT_CODE COURSE_NUMBER OR_CONJ MISC_TEXT MISC_TEXT Shift DEPT_CODE
DEPT_CODE COURSE_NUMBER OR_CONJ MISC_TEXT MISC_TEXT Shift COURSE_NUMBER
course OR_CONJ MISC_TEXT MISC_TEXT Reduce course : DEPT_CODE COURSE_NUMBER
course_data OR_CONJ MISC_TEXT MISC_TEXT Reduce course_data : course
statement OR_CONJ MISC_TEXT MISC_TEXT Reduce statement : course_data
statement OR_CONJ MISC_TEXT MISC_TEXT Shift OR_CONJ

statement OR_CONJ MISC_TEXT MISC_TEXT Shift MISC_TEXT
statement OR_CONJ text_aggregate MISC_TEXT Reduce text_aggregate : MISC_TEXT
statement OR_CONJ text_aggregate MISC_TEXT Shift MISC_TEXT
statement OR_CONJ text_aggergate Reduce text_aggregate : text_aggregate MISC_TEXT

statement OR_CONJ statement Reduce statement : TEXT_AGGREGATE
or_phrase Reduce or_phrase : statement OR_CONJ statement
statement Reduce statement : or_phrase

我添加了这个解析 Action :

def p_misc_text_singleton(p):
    'text_aggregate : MISC_TEXT'
    p[0] = p[1]

当我尝试构建解析器时，我得到了这个输出:

Generating LALR tables
WARNING: 2 shift/reduce conflicts
WARNING: 3 reduce/reduce conflicts
WARNING: reduce/reduce conflict in state 8 resolved using rule (text_aggregate -> MISC_TEXT MISC_TEXT)
WARNING: rejected rule (text_aggregate -> MISC_TEXT) in state 8

如上所述，解析仍然因语法错误而失败。

câu trả lời hay nhất

我无法重现您的错误，而是在“或”上出现语法错误。您没有包含使用 or_phrase 的规则。当我包含一个时，我不会出错。

我认为这不是优先级问题。如果您应该设置日志记录，这样您就可以看到 PLY 正在采取的步骤并将其与您想要发生的事情进行比较，这将有所帮助。为此，将 debug=1 传递给解析函数(您可能还必须将其传递给 yacc)。如果无法进行调试，请查看 PLY 的 yacc.py.

reduce/reduce 冲突的发生是因为它不明确是应该将 MISC_TEXT MISC_TEXT 减少到 text_aggregate MISC_TEXT 还是应该减少 MISC_TEXT MISC_TEXTđến text_aggregate.

在无法重现问题的情况下，我最好的猜测是将 p_misc_text 规则更改为:

'''text_aggregate : MISC_TEXT | text_aggregate MISC_TEXT'''

我想你也可以删除 precedence 元组。

关于Python:YACC 的问题，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/2936130/

hai mươi bốn

4

0

Đề xuất bài viết: ios - 为 iOS 交叉编译 libsodium

Đề xuất bài viết: css - 尊重相对 url 引用的构建时 CSS 组合器？

Đề xuất bài viết: jquery - CSS/jQuery - 将图像标签(p 标签)定位在图像的底部中间

Đề xuất bài viết: python sqlite3 不会执行连接，但单独的 sqlite3 会

yacc - 一个程序中的多个 YACC 语法
如何使用 yyparse() 编译、链接和调用不同的 YACC 语法在一个程序中？最佳答案对每个单独的 yacc 语法生成使用 -p 选项 -p prefix Use pr
yacc - 在 yacc 中为非终端分配多种数据类型
我正在为类项目工作，我们必须在其中构建解析器。我们目前正处于在 yacc 中构建解析器的阶段。目前让我感到困惑的是，我读到您需要为每个非终结符分配一个类型。在某些情况下，虽然我会有类似的东西: ...
yacc - 简单的 yacc 语法报错
我有一个关于 yacc 编译器的问题。我不编译简单的 yacc 语法。这是代码部分: /*anbn_0.y */ %token A B %% start: anbn '\n' {printf(" is
yacc - yyin 与 yacc 文件一起使用的问题
我正在使用 Yacc 和 lex 来解析 C 类型语言，我已经使用 C++ 构建了数据结构。一切正常，但我无法在 main.cpp 中使用 yyin 读取输入文件。以下是代码: 请帮忙 ! #i
yacc - lex 和 yacc 有什么区别
每当找到一些正则表达式时，我都会使用 lex 来执行一些代码， Yacc 还能做更多的事情吗？如果是，那是什么？最佳答案 lex 和 yacc 通常一起使用。这就是您通常使用以下两种方式构建应用程序
yacc - lex 和 yacc(符号表生成)
我是 lex 和 yacc 以及编译器设计的新手。我想知道符号表是在哪个阶段(词汇、句法或任何其他阶段)以及如何生成的？我可以简单描述一下 y.output 文件，该文件是通过向 yacc 提供 -
yacc - 无法弄清楚是什么导致了 yacc 中的移位/减少错误
我正在 yacc 中处理一个项目并且遇到了 shift/reduce 错误，但我不知道为什么我会得到它。我一直在查看 y.output 文件，但不太确定如何阅读它。我的 y.output 文件超出了
yacc - 忽略 yacc/lex 中的错误
我是 yacc/lex 的新手，我正在开发一个由其他人编写的解析器。我注意到，当找到未定义的标记时，解析器返回错误并停止。有没有一种简单的方法可以让它完全忽略它无法解析的行并继续进行下一个？最佳答案
yacc - 是否有任何活跃的 Lex 和 Yacc IRC？
Như hiện tại, câu hỏi này không phù hợp với định dạng Hỏi & Đáp của chúng tôi. Chúng tôi mong đợi câu trả lời sẽ được hỗ trợ bởi các sự kiện, trích dẫn hoặc kiến thức chuyên môn, nhưng câu hỏi có thể gây ra tranh luận, tranh luận, bỏ phiếu hoặc thảo luận mở rộng. Nếu bạn cảm thấy vấn đề này có thể được cải thiện và có thể mở lại, hãy truy cập trang
yacc - Flex 和 Yacc - 找不到 - lfl？
嗨，我正在学习 Lex 和 yacc。我创建了以下 lex 程序。 %{ #include %} %% [0123456789]+ printf("NUMBER\n"); [a-
yacc - $$ = $1 + $3 在 yacc 中是什么意思？
莱克斯部分: %% [0-9]+ { yyval = atoi (yytext); return num; } %% 雅克部分: %token num %% exp:num '+' num ; {$$
yacc - Python Lex-Yacc (PLY) 输入结束时的错误恢复
问题我正在尝试使用 Python Lex-Yacc (PLY) 实现容错解析器，但在输入字符串末尾使用错误恢复规则时遇到问题。如何从意外的输入结束中恢复？示例此示例语法生成以下形式的字符串 A
c - lex 和 yacc — 组合两个词法分析器和一个 yacc
我有两个带有函数 xxlex() 和 yylex() 的 lex 文件，还有一个 yacc语法文件。我希望语法规则始终调用 xxlex()。但是 xlex() 只被调用一次，我希望它总是被调用。我该怎
python - yacc 无法归约 (Python Lex-Yacc)
我正在尝试使用 PLY (python implementation of yacc) 编写一个相当简单的语法，并且在我想要的时候让 yacc 减少标记字符串时遇到困难。我想解释一系列采用不同类型参
yacc - %prec '.' 在 yacc 中是什么意思？
notype_declarator: notype_declarator '(' parmlist_or_identifiers %prec '.' { $$ = bui
yacc - 如何在 Ubuntu 中安装 Lex 和 Yacc？
Đã đóng cửa. Câu hỏi này lạc đề. Câu trả lời không được chấp nhận vào thời điểm này. Bạn muốn cải thiện câu hỏi này? Đã cập nhật câu hỏi để nó phù hợp với chủ đề về Stack Overflow. Đóng cửa 12 năm trước Cải thiện điều đó
yacc - 如何将 lex 文件中的 yytext 传递给 yacc？
拜托，我面临一个简单的问题..这就是问题所在，在我的 lex 文件中，我有类似的内容: char *ptr_String; "name = " { BEGIN sName; } .+ {
yacc - 用于 LOGO(或 Turtle)编程语言的 Lex/Yacc 语法文件
关闭。这个问题是off-topic .它目前不接受答案。想改善这个问题吗？ Update the question所以它是 on-topic对于堆栈溢出。 9年前关闭。 Improve this q
c - 在 lex 和 yacc 代码中 printf 在 yacc 文件中不起作用
嗨，我正在尝试运行 R. Levine 所著的 lex 和 yacc 书中的 John 代码，我已经使用命令在 Linux 中编译了 lex 和 yacc 程序 lex example.l yacc
yacc - 如何在yacc中对字符串使用yylval
我想传递 token 的实际字符串。如果我有一个名为ID的 token ，那么我希望我的yacc文件实际知道称为什么ID。我必须将使用yylval的字符串从flex文件传递到yacc文件。我怎么做？

trang đầu

đã học

6Ren·AI

Trung tâm mua sắm

Python:YACC 的问题