convert lexer and parser into classes

2011-08-30 16:03:13 -04:00 · 2011-08-30 16:03:13 -04:00 · 9fe95aa7f2
commit 9fe95aa7f2
parent 002aa69d03
5 changed files with 124 additions and 107 deletions
--- a/parser/Lexer.py
+++ b/parser/Lexer.py
@ -0,0 +1,76 @@
 import ply.lex as lex
 class Lexer(object):
    def __init__(self):
        self.reserved = {
                'C': 'C',
                }
        self.tokens = [
                'LPAREN',
                'RPAREN',
                'SEMICOLON',
                'STRING',
                'ID',
                ] + list(self.reserved.values())
        self.states = (
                ('string', 'exclusive'),
                )
        self.t_LPAREN = r'\('
        self.t_RPAREN = r'\)'
        self.t_SEMICOLON = r';'
        self.t_ignore = ' \t\r'
        self.lexer = lex.lex(module = self)
    def t_ID(self, t):
        r'[a-zA-Z_][a-zA-Z_0-9]*'
        t.type = self.reserved.get(t.value, 'ID')
        return t
    def t_STRING(self, t):
        r'\"'
        self.str_buildup = ''
        t.lexer.begin('string')
    def t_string_1(self, t):
        r'[^\\\n\"]'
        self.str_buildup += t.value
    def t_string_2(self, t):
        r'\\[^\n]'
        c = {
                't': '\t',
                'r': '\r',
                'n': '\n',
                'f': '\f',
                'b': '\b',
                'v': '\v',
            }.get(t.value[1], t.value[1])
        self.str_buildup += c
    def t_string_3(self, t):
        r'\"'
        t.type = 'STRING'
        t.value = self.str_buildup
        t.lexer.begin('INITIAL')
        return t
    def t_newline(self, t):
        r'\n+'
        t.lexer.lineno += len(t.value)
        return None
    def t_error(self, t):
        print 'Illegal character "%s"' % t.value[0]
        t.lexer.skip(1)
    def input(self, *args):
        self.lexer.input(*args)
    def token(self, *args):
        return self.lexer.token(*args)
--- a/parser/Parser.py
+++ b/parser/Parser.py
@ -0,0 +1,46 @@
 import ply.yacc as yacc
 from Lexer import Lexer
 from nodes import *
 class Parser(object):
    def __init__(self, input):
        self.input = input
        self.lexer = Lexer()
        self.tokens = self.lexer.tokens
        self.parser = yacc.yacc(module = self, outputdir = 'parser')
    def p_unit(self, p):
        'unit : unit_items'
        p[0] = UnitNode([p[1]])
    def p_unit_items(self, p):
        'unit_items : unit_item unit_items'
        p[0] = Node([p[1]] + p[2].children)
    def p_unit_items_empty(self, p):
        'unit_items : empty'
        p[0] = p[1]
    def p_unit_item_c_stmt(self, p):
        'unit_item : c_expr SEMICOLON'
        p[0] = p[1]
    def p_statement(self, p):
        'statement : expr SEMICOLON'
        p[0] = StatementNode([p[1]])
    def p_expr(self, p):
        'expr : c_expr'
        p[0] = p[1]
    def p_c_expr(self, p):
        'c_expr : C LPAREN STRING RPAREN'
        p[0] = CExprNode(p[3])
    def p_empty(self, p):
        'empty :'
        p[0] = Node()
    def parse(self):
        return self.parser.parse(self.input, lexer = self.lexer)
--- a/parser/init.py
+++ b/parser/init.py
@ -1,11 +1,5 @@
-import ply.lex as lex
+from Parser import Parser
 import ply.yacc as yacc
 import lexrules
 import parserules
 def parse(input):
-    lexer = lex.lex(module = lexrules)
+    return Parser(input).parse()
    parser = yacc.yacc(module = parserules, outputdir = 'parser')
    result = parser.parse(input)
    return result
--- a/parser/lexrules.py
+++ b/parser/lexrules.py
@ -1,64 +0,0 @@
 reserved = {
        'C': 'C',
        }
 tokens = [
        'LPAREN',
        'RPAREN',
        'SEMICOLON',
        'STRING',
        'ID',
        ] + list(reserved.values())
 states = (
        ('string', 'exclusive'),
        )
 t_LPAREN = r'\('
 t_RPAREN = r'\)'
 t_SEMICOLON = r';'
 t_ignore = ' \t\r'
 def t_ID(t):
    r'[a-zA-Z_][a-zA-Z_0-9]*'
    t.type = reserved.get(t.value, 'ID')
    return t
 def t_STRING(t):
    r'\"'
    t.lexer.str_buildup = ''
    t.lexer.begin('string')
 def t_string_1(t):
    r'[^\\\n\"]'
    t.lexer.str_buildup += t.value
 def t_string_2(t):
    r'\\[^\n]'
    c = {
            't': '\t',
            'r': '\r',
            'n': '\n',
            'f': '\f',
            'b': '\b',
            'v': '\v',
        }.get(t.value[1], t.value[1])
    t.lexer.str_buildup += c
 def t_string_3(t):
    r'\"'
    t.type = 'STRING'
    t.value = t.lexer.str_buildup
    t.lexer.begin('INITIAL')
    return t
 def t_newline(t):
    r'\n+'
    t.lexer.lineno += len(t.value)
    return None
 def t_error(t):
    print 'Illegal character "%s"' % t.value[0]
    t.lexer.skip(1)
--- a/parser/parserules.py
+++ b/parser/parserules.py
@ -1,35 +0,0 @@
 from lexrules import tokens
 from nodes import *
 def p_unit(p):
    'unit : unit_items'
    p[0] = UnitNode([p[1]])
 def p_unit_items(p):
    'unit_items : unit_item unit_items'
    p[0] = Node([p[1]] + p[2].children)
 def p_unit_items_empty(p):
    'unit_items : empty'
    p[0] = p[1]
 def p_unit_item_c_stmt(p):
    'unit_item : c_expr SEMICOLON'
    p[0] = p[1]
 def p_statement(p):
    'statement : expr SEMICOLON'
    p[0] = StatementNode([p[1]])
 def p_expr(p):
    'expr : c_expr'
    p[0] = p[1]
 def p_c_expr(p):
    'c_expr : C LPAREN STRING RPAREN'
    p[0] = CExprNode(p[3])
 def p_empty(p):
    'empty :'
    p[0] = Node()