凹语言™项目目标

本项目的发起人(柴树杉、丁尔男、史斌)均是Gopher,在开发实践中,因为不同的原因,先后萌生了发展一门新语言的想法,Go 语言克制的风格是我们对于编程语言审美的最大公约数,因此选择它作为初始的蓝本。不必讳言:本项目启动时大量借鉴了 Go 的设计思想和具体实现——这是在有限投入下不得不作出的折衷,我们希望随着项目的发展,积累更多原创的设计,为自主创新的大潮贡献一点力量。

纵观编程界,没有哪门被广泛使用的通用语言诞生于KPI制度之下。本项目作为个人业余项目,不存在明确的指标,从成果分类的角度,我们希望在第一阶段完成以下目标:

  • 确定凹语言™语法规则
  • 实现可用的凹语言™编译器
  • 使用凹语言™创建一个网页应用

凹语言™特性——预期

凹语言™包含两套相互等价的语法:凹语法与 WaGo 语法,这里“等价”的含义是:二者可生成相同的AST并无损的互相转换。使用凹语法编写的源文件后缀为 .wa,使用 WaGo 语法编写的源文件后缀为 .wa.go。WaGo 语法是 Go 语法的真子集,换句话说:一个合法的 WaGo 包必然是合法的 Go 包。

网页应用是我们很重视的目标场景,这与 Go 语言把服务端作为主战场截然不同,WaGo 裁减掉的部分多半与此相关:

  • WaGo 没有 go 关键字,不支持goroutine/并发
  • WaGo 没有 chan 关键字,不支持与之相关的管道操作
  • WaGo 没有全局GC——但可能会提供自动RC以尽可能简化内存管理
  • WaGo 没有内置标准库——即使有,规模也极其有限

WaGo 的数据类型如下表:

字符串(string)数组(array)切片(slice)复数(complex)哈希表(map)结构体(struct)
可能有可能有

WaGo 的其他特性如下表:

多返回值方法方法值接口闭包反射
可能无可能有可能有

各特性的实现可能性从高到底排列为:有 > 可能无 > 可能有 > 无

通过以上描述,大致可以勾勒出 WaGo 的轮廓。凹语法在AST层面与 WaGo 等价的同时,最显著的变化是增加了中文关键字。对于凹语法将来的发展,我们持开放态度。


凹编译器实现——路线

凹编译器的工作过程如下图所示:

凹编译器支持 C/C++、LLVM IR、WASM 等多种输出以满足不同的目标场景。当前阶段的主要任务:

  • 创建编译器框架
  • 确定前中后端模块间的接口
  • 设计能满足语法特性基线的运行时模型

每种后端的进度互相独立,但显然目标代码越底层,需要考虑的细节也越多,因此在落地语法特性时,采用先高级目标后低级目标的顺序有利于问题的逐步降解。

各后端可能的应用场景:

  • C/C++:凹语言™与 C/C++ 混合开发
  • LLVM IR:直接编译为Native Code
  • WASM:直接编译为WebAssembly模块

当任一后端模块覆盖“可用最小集”,我们将尝试开发一些简单的网页示例,待选的方向有交互式图形图像、在线编译等。


2022.7.23