Files
brahman/crates/modules/charka/corpus/README.md
T
sergio 47c49acd47 feat(charka): STRING y UNSTRING — manejo de cadenas
Dos verbos comunes de COBOL para construir y partir cadenas.

- IR: Stmt::StringConcat { sources, into } y
  Stmt::Unstring { source, delimiter, into }.
- Parser: STRING a b DELIMITED BY SIZE INTO t END-STRING y
  UNSTRING s DELIMITED BY d INTO a b c END-UNSTRING.
- Codegen: STRING -> format! concatenado; UNSTRING -> un bloque que
  parte con str::split y reparte los trozos a los destinos.
- Shadow: el intérprete concatena / parte el texto y lo reparte.
- Corpus: programa nuevo 12-cadenas. Verificado: el intérprete sombra
  y el crate compilado por scaffold dan la misma salida.

Alcance v1: STRING con DELIMITED BY SIZE (otros delimitadores se
ignoran); sin WITH POINTER ni ON OVERFLOW.

Tests: charka-ir 25, charka-codegen 19, charka-shadow 17. fmt +
clippy limpios.

Co-Authored-By: Claude Opus 4.7 <noreply@anthropic.com>
2026-05-21 22:09:10 +00:00

2.1 KiB

Corpus COBOL de charka

Programas COBOL de prueba, de complejidad graduada, para ejercitar el pipeline completo del transpilador (lexer → parser → IR → codegen) y el validador en sombra charka-shadow.

Cada programa NN-nombre.cob viene con su NN-nombre.expected: la salida correcta, una línea por DISPLAY.

programa nivel qué ejercita
01-hola 1 el programa mínimo — un DISPLAY de literal
02-aritmetica 2 datos, ADD/SUBTRACT/MULTIPLY con GIVING
03-condicional 3 IF / ELSE / END-IF
04-bucle 4 PERFORM n TIMES, un párrafo aparte, ADD in situ
05-factorial 4 PERFORM UNTIL en línea, MULTIPLY in situ
06-nomina 5 grupos, COMPUTE con paréntesis, ROUNDED, V99
07-clasificar 5 IF anidado, condiciones con AND
08-varying 4 PERFORM VARYING — el bucle con variable de control
09-evaluar 5 EVALUATE — el case de COBOL, WHEN / OTHER
10-condicion 5 nombres de condición (nivel 88) en IF
11-tabla 6 tablas (OCCURS) y referencias con subíndice
12-cadenas 6 STRING (concatenar) y UNSTRING (partir)

Formato

Los fuentes están en formato libre de COBOL (la línea entera es código; * al inicio es comentario). El comparador del validador ignora los espacios finales de cada línea — un campo PIC X(n) se muestra con su relleno de espacios, que aquí se omite por legibilidad.

La salida esperada

Las .expected se derivaron a mano de la semántica de COBOL'85. Cuando GnuCOBOL esté disponible, charka-shadow podrá regenerarlas desde el compilador de referencia y diferenciar contra él — el modo «sombra» pleno (original vs transpilado).