内容简介

本书介绍编写编译器和解释器。重点在于编写,因此本书编写了大量代码。

如果你想学习如何编写解释器、编译器、交互式源代码级调试器以及带有图形用户界面(GUI)的集成开发环境(IDE),本书就是你的首选。所有代码都使用 Java,我将对此进行详细讲解。

本书不涉及编译器编写背后的理论。我把这个问题留给了教科书。如果你现在就想学习理论,那么这本书就不适合你。不过,我希望你在学习完本书的程序后,能受到激励,去了解这些程序的理论基础。

本书第一版使用 C 作为实现语言,第二版使用 C++,第三版使用 Java。虽然我保留了前几版的基本组织、理念和方法,但这一版是完全重写的。

本书内容

你在本书中学会编写的解释器和编译器可以处理用高级语言编写的程序。你将编写一个可以执行程序的解释器。添加调试器后,你就能在解释器执行程序时与解释器进行交互,包括设置断点、显示调用堆栈、查看和修改变量值,以及单步逐条执行程序语句。增加集成开发环境后,你只需点击鼠标,就能在屏幕上看到程序执行的动态效果。您将学会编写编译器为 Java 虚拟机(JVM)生成目标代码,这样就能够在多个平台上运行编译好的程序。当然,由于解释器、编译器、调试器和集成开发环境都是用 Java 编写的,您也可以在多个平台上运行它们。

源程序(解释器和编译器将处理的程序)的编程语言是 Pascal。我选择 Pascal 有几个原因。它是一种真实的语言,而不是为本书编造的语言。Pascal 是一种面向过程的高级编程语言,在 20 世纪 70 年代中期到 80 年代非常流行。该语言的语法相对简单,但它包含了许多使编译器编写变得有趣的语言特性,如结构化、用户定义的数据类型、嵌套作用域、通过值和引用传递参数、完整的控制语句等。今天,Pascal 仍在继续活跃。你可以从网上下载免费的 Pascal 解释器和编译器,与你要编写的进行比较,例如

http://www.freepascal.org/

软件工程方法

编译器和解释器是复杂的程序,要成功编写它们是一项艰巨的工作。为了应对这种复杂性,我在本书中采用了强大的软件工程方法。设计模式、统一建模语言(UML)图和其他现代面向对象设计实践使代码易于理解和管理。

在整个章节中,尤其是在早期章节中,DESIGN NOTE 侧边栏指出了设计问题,如设计模式的使用,或者解释了我为什么选择以特定方式设计代码架构。

我坚信的方法是:增量式开发软件。在每一步中,都要达到既定目标。每一步都建立在前一步的工作代码之上。本书几乎每一章都包含一个主要的工作程序,通常还有其他较短的程序。每一章的程序都建立在前几章程序的基础上。

本书的编排

第 1 章是导言。第 2 章介绍了编译器和解释器的框架。 在这一章预先设计并测试了这一架构基础,以便其余章节中的所有代码都能在此基础上成功构建。接下来的两章将介绍一些基本的翻译任务,即扫描(第 3 章)和建立符号表(第 4 章)。
接下来的几章将构建一个可用的 Pascal 解释器。为了采用增量开发方法,这些章节多次对解析和解释进行迭代,每次迭代中都会引入更多的 Pascal 语言特性。第 5 章解析表达式和赋值语句,第 6 章对其进行解释。第 7 章解析控制语句,第 8 章对其进行解释。第 9 章解析声明,第 10 章进行类型检查,第 11 章解析过程、函数和整个 Pascal 程序。第 12 章完成解释器并执行整个 Pascal 程序。

接下来的两章建立在这个可用的解释器基础上。第 13 章添加了一个交互式源代码级调试器,你可以通过在命令行上键入命令与之进行通讯 。第 14 章使用图形用户界面封装命令行调试器,创建一个集成开发环境。在第一次阅读本书时,你可以跳过这两章,而不会失去连续性。但一定要回头看这两章,因为它们描述了一些非常强大的软件开发工具。

本书最后一部分通过复用前几部分的大量代码来开发编译器。第 15 章介绍了 Java 虚拟机的架构和 Jasmin(编译器将为 JVM 生成的汇编语言)。

这也是一种增量方法: 第 16 章编译程序、赋值语句和表达式。第 17 章编译过程、函数调用和字符串操作。第 18 章通过编译控制语句、数组和记录来完成编译器。

最后的第 19 章简要介绍了其他章节未涉及的各种编译器编写主题,如代码优化和表格驱动的扫描器和解析器。

Logo

旨在为数千万中国开发者提供一个无缝且高效的云端环境,以支持学习、使用和贡献开源项目。

更多推荐