feat(charka): charka-ir — representación intermedia con statements tipados
Tercera etapa del transpilador: Program -> Ir. El PROCEDURE division pasa de sentencias con tokens crudos a un árbol de instrucciones tipadas. - lower(&Program) -> Ir: total y tolerante, nunca falla. La DATA division pasa tal cual y sirve de tabla de símbolos. - Stmt cubre MOVE, DISPLAY, ACCEPT, COMPUTE, ADD, SUBTRACT, MULTIPLY, DIVIDE, IF/ELSE/END-IF, PERFORM (fuera de línea, en línea, TIMES, UNTIL), GO TO, STOP RUN, GOBACK, EXIT, CONTINUE. - Expresiones de COMPUTE con precedencia y paréntesis (Pratt). Condiciones con comparadores símbolo/palabra, AND/OR/NOT y nombres de condición (nivel 88). - Delimita statements por palabras frontera (COBOL no los separa con un símbolo). Verbo no soportado -> Stmt::Unknown con tokens crudos. - Módulos: ast / kw / cursor / expr / stmt. 17 tests; fmt + clippy limpios. Co-Authored-By: Claude Opus 4.7 <noreply@anthropic.com>
This commit is contained in:
@@ -13,6 +13,7 @@ embebido, dialectos IBM Enterprise) es un esfuerzo multi-mes.
|
||||
| `charka-bcd` | lib | Aritmética decimal de punto fijo con semántica COBOL: `Picture`, `Decimal`, redondeo, `ON SIZE ERROR` |
|
||||
| `charka-lexer` | lib | Tokenizador COBOL: formato fijo (tarjeta de 80 columnas) y libre |
|
||||
| `charka-parser` | lib | Parser COBOL'85 (subconjunto): tokens → AST (`Program`) |
|
||||
| `charka-ir` | lib | Representación intermedia: el AST con los statements del PROCEDURE ya tipados |
|
||||
|
||||
## charka-bcd
|
||||
|
||||
@@ -64,15 +65,38 @@ Segunda etapa: tokens → AST. Alcance v1 — el **esqueleto del programa**.
|
||||
- Limitación v1: no parsea statements, ni la ENVIRONMENT division, ni
|
||||
CICS / SQL embebido / dialectos IBM.
|
||||
|
||||
## charka-ir
|
||||
|
||||
Tercera etapa: `Program` → `Ir`. Aquí se parsea cada `Sentence` cruda
|
||||
(tokens) a statements tipados — el PROCEDURE division pasa de tokens a
|
||||
árbol de instrucciones.
|
||||
|
||||
- `lower(&Program) -> Ir` — **total y tolerante**, nunca falla.
|
||||
- `Ir { program_id, data: Vec<DataItem>, procedures: Vec<Procedure> }`.
|
||||
El modelo de datos pasa tal cual (sirve de tabla de símbolos).
|
||||
- `Procedure { name, body: Vec<Stmt> }`. `Stmt` cubre `Move`,
|
||||
`Display`, `Accept`, `Compute`, `Add`/`Subtract`/`Multiply`/`Divide`,
|
||||
`If`, `Perform`, `GoTo`, `StopRun`, `Goback`, `Exit`, `Continue`.
|
||||
- `Expr` — expresiones aritméticas con precedencia y paréntesis (Pratt:
|
||||
`+ -` < `* /` < `**` der.). `Cond` — comparaciones (símbolo o forma
|
||||
palabra) unidas por `AND`/`OR`/`NOT`, más nombres de condición (88).
|
||||
- Un verbo no soportado se conserva como `Stmt::Unknown { verb,
|
||||
tokens }` — el lowering jamás aborta.
|
||||
- COBOL no separa statements con un símbolo: cada uno corta donde
|
||||
empieza el verbo del siguiente. El parser usa palabras "frontera"
|
||||
(verbos + terminadores `END-*`/`ELSE` + conectores `TO`/`GIVING`...)
|
||||
para delimitar listas de operandos.
|
||||
- Fuera de alcance v1: `EVALUATE`, `STRING`/`UNSTRING`, E/S de
|
||||
ficheros, `PERFORM VARYING`, CICS, SQL embebido.
|
||||
|
||||
## Estado
|
||||
|
||||
`charka-bcd` (22 tests), `charka-lexer` (17 tests) y `charka-parser`
|
||||
(15 tests) implementados y verdes. **Pendiente** — el resto del
|
||||
transpilador (Fase D del plan macro):
|
||||
`charka-bcd` (22 tests), `charka-lexer` (17 tests), `charka-parser`
|
||||
(15 tests) y `charka-ir` (17 tests) implementados y verdes.
|
||||
**Pendiente** — el resto del transpilador (Fase D del plan macro):
|
||||
|
||||
| crate pendiente | rol |
|
||||
| ----------------- | ---------------------------------------------------- |
|
||||
| `charka-ir` | representación intermedia (parseo de statements) |
|
||||
| `charka-codegen` | emisión de Rust |
|
||||
| `charka-shadow` | validador en sombra (original vs transpilado) |
|
||||
| `charka-runtime` | runtime determinista (sobre `charka-bcd`) |
|
||||
|
||||
Reference in New Issue
Block a user