Skip to content
On this page

凹语言RISC-V汇编器支持中文指令集


RISC-V是当前流行的开源CPU架构,然而当前主流的RISC-V工具链依然基于GCC/LLVM等国外的架构。因此,中文编程语言和英文编程语言之争,从RISC-V指令集层面就开始处于不利地位。为了改变中文编程语言长期被歧视的现状,凹语言开发组希望从CPU指令集层面实现中文汇编器、在高级语言层面彻底实现中英文编程语言的技术平权。而凹语言RISC-V汇编器也是在此背景下诞生的,目前已经完成对RISC-V中文指令集的定义和支持。

1. 中文RISC-V汇编器例子

以下是RISC-V裸机输出中文字符串的一个例子:

需要说明的是,这并不是GNU As汇编语法,而是凹语言开发组从头设计实现的汇编语言。其中关键字有:常量全局函数变量等,同时配套了对应的英文关键字的翻译以方便国际友人学习。特别是RISC-V的寄存器和指令也全部有完整定义的中文名字。

2. 中文RISC-V指令集名字

只有从寄存器和指令集彻底中文化,才能从根源上实现中英文编程语言的平权。以下是RV32I基础指令部分的中文名字:

完整的中文指令列表:https://gitcode.com/wa-lang/wa/blob/master/internal/native/riscv/anames.go#L527

3. 本地化和本土化并不矛盾

如果从中文编程语言角度看,中文编程语言的lexer和英文的有很大差别。但是因为国内对此探索太少,没多少有价值的沉淀。其实在词法解析这一步就已经被英文思维带歪了,类似要从汇编语言层平权一样,编译器也需要从词法分析阶段就开始深入匹配中文的特点。

本土化的编程语言发展之路虽然充满荆棘和曲折,但是同样也充满乐趣,我们会继续探索下去。