22_Julia编译器(一):如何让动态语言性能很高?
文章目录
你好,我是宫文学。
Julia 这门语言,其实是最近几年才逐渐获得人们越来越多的关注的。有些人会拿它跟 Python 进行比较,认为 Julia 已经成为了 Python 的劲敌,甚至还有人觉得它在未来可能会取代 Python 的地位。虽然这样的说法可能是有点夸张了,不过 Julia 确实是有它的可取之处的。
为什么这么说呢?前面我们已经研究了 Java、Python 和 JavaScript 这几门主流语言的编译器,这几门语言都是很有代表性的:Java 语言是静态类型的、编译型的语言;Python 语言是动态类型的、解释型的语言;JavaScript 是动态类型的语言,但可以即时编译成本地代码来执行。
而 Julia 语言却声称同时兼具了静态编译型和动态解释型语言的优点:**一方面它的性能很高,可以跟 Java 和 C 语言媲美;而另一方面,它又是动态类型的,编写程序时不需要指定类型。**一般来说,我们很难能期望一门语言同时具有动态类型和静态类型语言的优点的,那么 Julia 又是如何实现这一切的呢?
原来它是充分利用了 LLVM 来实现即时编译的功能。因为 LLVM 是 Clang、Rust、Swift 等很多语言所采用的后端工具,所以我们可以借助 Julia 语言的编译器,来研究如何恰当地利用 LLVM。不过,Julia 使用 LLVM 的方法很有创造性,使得它可以同时具备这两类语言的优点。我将在这一讲中给你揭秘。
此外,Julia 编译器的类型系统的设计也很独特,它体现了函数式编程的一些设计哲学,能够帮助你启迪思维。
还有一点,Julia 来自 MIT,这里也曾经是 Lisp 的摇篮,所以 Julia 有一种学术风和极客风相结合的品味,也值得你去仔细体会一下。
所以,接下来的两讲,我会带你来好好探究一下 Julia 的编译器。你从中能够学习到 Julia 编译器的处理过程,如何创造性地使用 LLVM 的即时编译功能、如何使用 LLVM 的优化功能,以及它的独特的类型系统和方法分派。
那今天这一讲,我会先带你来了解 Julia 的编译过程,以及它高性能背后的原因。
初步认识 Julia
**Julia 的性能有多高呢?**你可以去它的网站上看看与其他编程语言的性能对比:
图 1:Julia 和各种语言的性能对比
可以看出,它的性能是在 C、Rust 这一个级别的,很多指标甚至比 Java 还要好,比起那些动态语言(如 Python、R 和 Octave),那更是高了一到两个数量级。
所以,Julia 的编译器声称它具备了静态类型语言的性能,确实是不虚此言的。
你可以从Julia 的官网下载 Julia 的二进制版本和源代码。如果你下载的是源代码,那你可以用 make debug 编译成 debug 版本,这样比较方便用 GDB 或 LLDB 调试。
Julia 的设计目的主要是用于科学计算。过去,这一领域的用户主要是使用 R 语言和 Python,但麻省理工(MIT)的研究者们对它们的性能不够满意,同时又想要保留 R 和 Python 的友好性,于是就设计出了这门新的语言。目前这门语言受到了很多用户的欢迎,使用者也在持续地上升中。
我个人对它感兴趣的点,正是因为它打破了静态编译和动态编译语言的边界,我认为这体现了未来语言的趋势:编译和优化的过程是全生命周期的,而不局限在某个特定阶段。
好了,让我们先通过一个例子来认识 Juia,直观了解一下这门语言的特点:
julia> function countdown(n)
if n <= 0
println(“end”)
else
print(n, " “)
countdown(n-1)
end
end
countdown (generic function with 1 method)
julia> countdown(10)
10 9 8 7 6 5 4 3 2 1 end
所以从这段示例代码中,可以看出,Julia 主要有这样几个特点:
- 用 function 关键字来声明一个函数;
- 用 end 关键字作为块(函数声明、if 语句、for 语句等)的结尾;
- 函数的参数可以不用指定类型(变量声明也不需要),因为它是动态类型的;
- Julia 支持递归函数。
**那么 Julia 的编译器是用什么语言实现的呢?又是如何支持它的这些独特的特性的呢?**带着这些好奇,让我们来看一看 Julia 编译器的源代码。
图 2:Julia 的源代码目录
其实 Julia 的实现会让人有点困扰,因为它使用了 4 种语言:C、C++、Lisp 和 Julia 自身。相比而言,CPython 的实现只用了两种语言:C 语言和 Python。这种情况,就对社区的其他技术人员理解这个编译器和参与开发,带来了不小的困难。
Julia 的作者用 C 语言实现了一些运行时的核心功能,包括垃圾收集器。他们是比较偏爱 C 语言的。C++ 主要是用来实现跟 LLVM 衔接的功能,因为 LLVM 是用 C++ 实现的。
但是,为什么又冒出了一个 Lisp 语言呢?而且前端部分的主要功能都是用 Lisp 实现的。
原来,Julia 中用到 Lisp 叫做femtolisp(简称 flisp),这是杰夫·贝赞松(Jeff Bezanson)做的一个开源 Lisp 实现,当时的目标是做一个最小的、编译速度又最快的 Lisp 版本。后来 Jeff Bezanson 作为 Julia 的核心开发人员,又把 flisp 带进了 Julia。
实际上,Julia 语言本身也宣称是继承了 Lisp 语言的精髓。在其核心的设计思想里,在函数式编程风格和元编程功能方面,也确实是如此。Lisp 在研究界一直有很多的追随者,Julia 这个项目诞生于 MIT,同时又主要服务于各种科研工作者,所以它也就带上了这种科学家的味道。它还有其他特性,也能看出这种科研工作者的倾向,比如说:
- 对于类型系统,Julia 的开发者们进行了很好的形式化,是我在所有语言中看到的最像数学家做的类型系统。
- 在它的语法和语义设计上,带有 Metalab 和 Mathematics 这些数学软件的痕迹,科研工作者们应该很熟悉这种感觉。
- 在很多特性的实现上,都带有很强的前沿探索的特征,锋芒突出,不像我们平常使用的那些商业公司设计的计算机语言一样,追求四平八稳。
以上就是我对 Julia 的感觉,一种结合了数据家风格的自由不羁的极客风。实际上,Lisp 最早的设计者约翰·麦卡锡(John McCarthy)就是一位数学博士,所以数学上的美感是 Lisp 给人的感受之一。而且,Lisp 语言本身也是在 MIT 发源的,所以 Julia 可以说是继承了这个传统、这种风格。
Julia 的编译过程
刚刚说了,Julia 的前端主要是用 Lisp 来实现的。你在启动 Julia 的时候,通过“–lisp”参数就可以进入 flisp 的 REPL:
./julia –lisp
在这个 REPL 界面中调用一个 julia-parse 函数,就可以把一个 Julia 语句编译成 AST。
(julia-parse “a = 2+3*5”)
(= a (call + 2
(call * 3 5)))
(julia-parse “function countdown(n)
if n <= 0
println("end")
else
print(n, " ")
countdown(n-1)
end
end”)
(function (call countdown n) (block (line 2 none)
(if (call <= n 0)
(block (line 3 none)
(call println “end”))
(block (line 5 none)
(call print n " “)
(line 6 none)
(call countdown (call - n 1))))))
编译后的 AST,采用的也是 Lisp 那种括号嵌套括号的方式。
Julia 的编译器中,主要用到了几个“.scm
”结尾的代码,来完成词法和语法分析的功能:julia-parser.scm、julia-syntax.scm 和 ast.scm。(.scm
文件是 Scheme 的缩写,而 Scheme 是 Lisp 的一种实现,特点是设计精简、语法简单。著名的计算机教科书SICP就是用Scheme作为教学语言,而 SICP 和 Scheme 也都是源自 MIT。)它的词法分析和语法分析的过程,主要是在 parser.scm 文件里实现的,我们刚才调用的“julia-parse”函数就是在这个文件中声明的。
Julia 的语法分析过程仍然是你非常熟悉的递归下降算法。因为 Lisp 语言处理符号的能力很强,又有很好的元编程功能(宏),所以 Lisp 在实现词法分析和语法分析的任务的时候,代码会比其他语言更短。但是不熟悉 Lisp 语言的人,可能会看得一头雾水,因为这种括号嵌套括号的语言对于人类的阅读不那么友好,不像 Java、JavaScript 这样的语言一样,更像自然语言。
julia-parser.scm 输出的成果是比较经典的 AST,Julia 的文档里叫做“表面语法 AST”(surface syntax AST)。所谓表面语法 AST,它是跟另一种 IR 对应的,叫做Lowered Form。
“Lowered”这个词你应该已经很熟悉了,它的意思是更靠近计算机的物理实现机制。比如,LLVM 的 IR 跟 AST 相比,就更靠近底层实现,也更加不适合人类阅读。
julia-syntax.scm 输出的结果就是 Lowered Form,这是一种内部 IR。它比 AST 的节点类型更少,所有的宏都被展开了,控制流也简化成了无条件和有条件跳转的节点(“goto”格式)。这种 IR 后面被用来做类型推断和代码生成。
你查看 julia-syntax.scm 的代码,会发现 Julia 编译器的处理过程是由多个 Pass 构成的,包括了去除语法糖、识别和重命名本地变量、分析变量的作用域和闭包、把闭包函数做转换、转换成线性 IR、记录 Slot 和标签(label)等。
这里,我根据 Jeff Bezanson 在 JuliaCon 上讲座的内容,把 Julia 编译器的工作过程、每个阶段涉及的源代码和主要的函数给你概要地梳理了一下,你可以只看这张图,就能大致把握 Julia 的编译过程,并且可以把它跟你学过的其他几个编译器做一下对比:
图 3:Julia 的编译过程
Julia 有很好的反射 (Reflection) 和自省 (Introspection)的能力,你可以调用一些函数或者宏来观察各个阶段的成果。
比如,采用 @code_lowered 宏,来看 countdown(10) 产生的代码,你会看到 if…else…的结构被转换成了“goto”语句,这个 IR 看上去已经有点像 LLVM 的 IR 格式了。
进一步,你还可以用 @code_typed 宏,来查看它做完类型推断以后的结果,每条语句都标注了类型:
接下来,你可以用 @code_llvm 和 @code_native 宏,来查看生成的 LLVM IR 和汇编代码。这次,我们用一个更简单的函数 foo(),让生成的代码更容易看懂:
julia> function foo(x,y) #一个简单的函数,把两个参数相加
x+y #最后一句的结果就是返回值,这里可以省略 return
end
通过 @code_llvm 宏生成的 LLVM IR,如下图所示:
通过 @code_native 宏输出的汇编代码是这样的:
最后生成的汇编代码,可以通过汇编器迅速生成机器码并运行。
通过上面的梳理,你应该已经了解了 Julia 的编译过程脉络:通过 Lisp 的程序,把程序变成 AST,然后再变成更低级一点的 IR,在这个过程中编译器要进行类型推断等语义层面的处理;最后,翻译成 LLVM 的 IR,并生成可执行的本地代码。
对于静态类型的语言来说,我们根据准确的类型信息,就可以生成高效的本地代码,这也是 C 语言性能高的原因。比如,我们用 C 语言来写一下 foo 函数:
long foo(long x, long y){
return x+y;
}
Clang 的 LLVM IR 跟 Julia 生成的基本一样:
生成的汇编代码也差不多:
所以,对于这样的程序,Julia 的编译后的本地代码,跟 C 语言的比起来可以说是完全一样。那性能高也就不足为奇了。
你可能由此就会下结论:因为 Julia 能够借助 LLVM 生成本地代码,这就是它性能高的原因。
**且慢!事情没有这么简单。**为什么这么说?因为在基于前面生成的机器码的这个例子中,当参数是整型的时候,运行效率自然是会比较快。但是,你别忘了 Julia 是动态类型的语言。我们在 Julia 中声明 foo 函数的时候,并没有指定参数的数据类型。如果参数类型变了,会怎样呢?
Julia 的最大突破:生成多个版本的目标代码
实际上,我们可以给它传递不同的参数,比如可以传递两个浮点数给它,甚至传递两个向量或者矩阵给它,都能得到正确的结果:
julia> foo(2.1, 3.2)
5.300000000000001
julia> foo([1,2,3], [3,4,5])
3-element Array{Int64,1}:
4
6
8
显然,如果上面两次对 foo() 函数的调用,我们也是用之前生成的汇编代码,那是行不通的。因为之前的汇编代码只能用于处理 64 位的整数。
实际上,如果我们观察调用 foo(2.1, 3.2) 时,Julia 生成的 LLVM IR 和汇编代码,就会发现,它智能地适应了新的数据类型,生成了用于处理浮点数的代码,使用了不同的指令和寄存器。
你可以用同样的方法,来试一下 foo([1,2,3], [3,4,5])
对应的 LLVM IR 和汇编代码。这个就要复杂一点了,因为它要处理数组的存储。但不管怎样,Julia 生成的代码确实是适应了它的参数类型的。
数学中的很多算法,其实是概念层面的,它不关心涉及的数字是 32 位整数、64 位整数,还是一个浮点数。但同样是实现一个加法操作,对于计算机内部实现来说,不同的数据类型对应的指令则是完全不同的,那么编译器就要弥合抽象的算法和计算机的具体实现之间的差别。
对于 C 语言这样的静态语言来说,它需要针对 x、y 的各种不同的数据类型,分别编写不同的函数。这些函数的逻辑是一样的,但就是因为数据类型不同,我们就要写很多遍。这是不太合理的,太啰嗦了。
对于 Python 这样的动态类型语言来说呢,倒是简洁地写一遍就可以了。但在运行时,对于每一次运算,我们都要根据数据类型来选择合适的操作。这样就大大拉低了整体的运行效率。
所以,这才是 Julia 真正的突破:**它能针对同一个算法,根据运行时获得的数据,进行类型推断,并编译生成最优化的本地代码。**在每种参数类型组合的情况下,只要编译一次,就可以被缓存下来,可以使用很多次,从而使得程序运行的总体性能很高。
你对比一下 JavaScript 编译器基于类型推断的编译优化,就会发现它们之间的明显的不同。JavaScript 编译器一般只会针对类型推断生成一个版本的目标代码,而 Julia 则会针对每种参数类型组合,都生成一个版本。
不过,既然 Julia 编译器存在多个版本的目标代码,那么在运行期,就要有一个程序来确定到底采用哪个版本的目标代码,这就是 Julia 的一个非常重要的功能:函数分派算法。
函数分派,就是指让编译器在编译时或运行时来确定采用函数的哪个实现版本。针对函数分派,我再给你讲一下 Julia 的一个特色功能,多重分派。这个知识点有助于你加深对于函数分派的理解,也有助于你理解函数式编程的特点。
Julia 的多重分派功能
我们在编程的时候,经常会涉及同一个函数名称的多个实现。比如在做面向对象编程的时候,同一个类里可以有多个相同名称的方法,但参数不同,这种现象有时被叫做重载(Overload);同时,在这个类的子类里,也可以定义跟父类完全相同的方法,这种现象叫做覆盖(Override)。
而程序在调用一个方法的时候,到底调用的是哪个实现,有时候我们在编译期就能确定下来,有时候却必须到运行期才能确定(就像多态的情形),这两种情形就分别叫做静态分派(Static Dispatch)和动态分派(Dynamic Dispatch)。
方法的分派还有另一个分类:单一分派(Single Dispatch)和多重分派(Multiple Dispatch)。传统的面向对象的语言使用的都是单一分派。比如,在面向对象语言里面,实现加法的运算:
a.add(b)
这里我们假设 a 和 b 都有多个 add 方法的版本,但实际上,无论怎样分派,程序的调用都是分派到 a 对象的方法上。这是因为,对于 add 方法,实质上它的第一个参数是对象 a(编译成目标代码时,a 会成为第一个参数,以便访问封装在 a 里面的数据),也就是相当于这样一个函数:
add(a, b)
所以,面向对象的方法分派相当于是由第一个参数决定的。这种就是单一分派。
实际上,采用面向对象的编程方式,在方法分派时经常会让人觉得很别扭。你回顾一下,我在讲Python 编译器的时候,讲到加法操作采用的实现是第一个操作数对象的类型里,定义的与加法有关的函数。但为什么它是用第一个对象的方法,而不是第二个对象的呢?如果第一个对象和第二个对象的类型不同怎么办呢?(这就是我在那讲中留给你的问题)
还有一个很不方便的地方。如果你增加了一种新的数据类型,比如矩阵(Matrix),它要能够跟整数、浮点数等进行加减乘除运算,但你没有办法给 Integer 和 Float 这些已有的类增加方法。
所以,针对这些很别扭的情况,Julia 和 Lisp 等函数式语言,就支持多重分派的方式。
你只需要定义几个相同名称的函数(在 Julia 里,这被叫做同一个函数的多个方法),编译器在运行时会根据参数,决定分派给哪个方法。
我们来看下面这个例子,foo 函数有两个方法,根据调用参数的不同,分别分派给不同的方法。
julia> foo(x::Int64, y::Int64) = x + y #第一个方法
foo (generic function with 1 method)
julia> foo(x, y) = x - y #第二个方法
foo (generic function with 2 methods)
julia> methods(foo) #显示 foo 函数的所有方法
2 methods for generic function “foo”:
[1] foo(x::Int64, y::Int64) in Main at REPL[38]:1
[2] foo(x, y) in Main at REPL[39]:1
julia> foo(2, 3) #分派到第一个方法
5
julia> foo(2.0, 3) #分派到第二个方法
-1.0
你可以发现,这种分派方法会公平对待函数的所有参数,而不是由一个特殊的参数来决定。这种分派方法就叫做多重分派。
在 Julia 中,其实“+”操作符(以及其他操作符)也是函数,它有上百个不同的方法,分别处理不同数据类型的加法操作。
julia> methods(+)
166 methods for generic function “+”:
[1] +(x::Bool, z::Complex{Bool}) in Base at complex.jl:282
[2] +(x::Bool, y::Bool) in Base at bool.jl:96
[3] +(x::Bool) in Base at bool.jl:93
[4] +(x::Bool, y::T) where T<:AbstractFloat in Base at bool.jl:104
[5] +(x::Bool, z::Complex) in Base at complex.jl:289
[6] +(a::Float16, b::Float16) in Base at float.jl:398
[7] +(x::Float32, y::Float32) in Base at float.jl:400
[8] +(x::Float64, y::Float64) in Base at float.jl:401
[9] +(z::Complex{Bool}, x::Bool) in Base at complex.jl:283
…
[165] +(J::LinearAlgebra.UniformScaling, F::LinearAlgebra.Hessenberg) in LinearAlgebra … at hessenberg.jl:518
[166] +(a, b, c, xs…) in Base at operators.jl:529
最重要的是,当你引入新的数据类型,想要支持加法运算的时候,你只需要为加法函数定义一系列新的方法,那么编译器就可以正确地分派了。这种实现方式就方便多了。这也是某些函数式编程语言的一个优势,你可以体会一下。
而且在 Julia 中,因为方法分派是动态实现的,所以分派算法的性能就很重要。你看,不同的语言特性的设计,它的运行时就要完成不同的任务。这就是真实世界中,各种编译器的魅力所在。
课程小结
这一讲我给你介绍了一门并不是那么大众的语言,Julia。介绍它的原因,就是因为这门语言有自己非常独特的特点,非常值得我们学习。我希望你能记住以下几点核心的知识:
- 编译器的实现语言:编译器在选择采用什么实现的语言上,拥有很大的自由度。Julia 很别具一格地采用了 Lisp 作为主要的前端语言。不过,我个人猜测,既然 Julia 本身也算是一种 Lisp 实现,未来可能就可以用 Julia 取代 flisp,来实现前端的功能,实现更大程度的自举(Bootstraping)了。当然,这仅仅是我自己的猜测。
- 又是递归下降算法:一如既往地,递归下降算法仍然是最常被用来实现语法分析的方法,Julia 也不例外。
- 多种 IR:Julia 在 AST 之外,采用了“goto”格式的 IR,还用到了 LLVM 的 IR(实际上,LLVM 内部在转换成本地代码之前,还有一个中间格式的 IR)。
- 多版本的目标代码:Julia 创造性地利用了 LLVM 的即时编译功能。它可以在运行期通过类型推断确定变量的类型,进行即时编译,根据不同的参数类型生成多个版本的目标代码,让程序员写一个程序就能适应多种数据类型,既降低了程序员的工作量,同时又保证了程序的高性能。这使得 Julia 同时拥有了动态类型语言的灵活性和静态类型语言的高性能。
- 多重分派功能:多重分派能够根据方法参数的类型,确定其分派到哪个实现。它的优点是容易让同一个操作,扩展到支持不同的数据类型。
你学了这讲有什么体会呢?深入探究 Julia 这样的语言的实现过程,真的有助于我们大开脑洞,突破思维的限制,更好地融合编译原理的各方面的知识,从而为你的实际工作带来更加创新的思路。
这一讲的思维导图我也给你整理出来了,供你参考和复习回顾:
一课一思
一个很有意思的问题:为什么 Julia 会为一个函数,根据不同的参数类型组合,生成多个版本的目标代码,而 JavaScript 的引擎一般只会保存一个版本的目标代码?这个问题你可以从多个角度进行思考,欢迎在留言区分享你的观点。
感谢你的阅读,如果你觉得有收获,欢迎把今天的内容分享给更多的朋友。
文章作者
上次更新 10100-01-10