流程控制

Julia 提供了大量的流程控制构件:

前五个流程控制机制是高级编程语言的标准。Task 不是那么的标准:它提供了非局部的流程控制,这使得在暂时挂起的计算任务之间进行切换成为可能。这是一个功能强大的构件:Julia 中的异常处理和协同多任务都是通过 Task 实现的。虽然日常编程并不需要直接使用 Task,但某些问题用 Task 处理会更加简单。

复合表达式

Sometimes it is convenient to have a single expression which evaluates several subexpressions in order, returning the value of the last subexpression as its value. There are two Julia constructs that accomplish this: begin blocks and ; chains. The value of both compound expression constructs is that of the last subexpression. Here’s an example of a begin block:

  1. julia> z = begin
  2. x = 1
  3. y = 2
  4. x + y
  5. end
  6. 3

Since these are fairly small, simple expressions, they could easily be placed onto a single line, which is where the ; chain syntax comes in handy:

  1. julia> z = (x = 1; y = 2; x + y)
  2. 3

This syntax is particularly useful with the terse single-line function definition form introduced in Functions. Although it is typical, there is no requirement that begin blocks be multiline or that ; chains be single-line:

  1. julia> begin x = 1; y = 2; x + y end
  2. 3
  3. julia> (x = 1;
  4. y = 2;
  5. x + y)
  6. 3

条件表达式

条件表达式(Conditional evaluation)可以根据布尔表达式的值,让部分代码被执行或者不被执行。下面是对 if-elseif-else 条件语法的分析:

  1. if x < y
  2. println("x is less than y")
  3. elseif x > y
  4. println("x is greater than y")
  5. else
  6. println("x is equal to y")
  7. end

如果表达式 x < ytrue,那么对应的代码块会被执行;否则判断条件表达式 x > y,如果它是 true,则执行对应的代码块;如果没有表达式是 true,则执行 else 代码块。下面是一个例子:

  1. julia> function test(x, y)
  2. if x < y
  3. println("x is less than y")
  4. elseif x > y
  5. println("x is greater than y")
  6. else
  7. println("x is equal to y")
  8. end
  9. end
  10. test (generic function with 1 method)
  11. julia> test(1, 2)
  12. x is less than y
  13. julia> test(2, 1)
  14. x is greater than y
  15. julia> test(1, 1)
  16. x is equal to y

elseifelse 代码块是可选的,并且可以使用任意多个 elseif 代码块。 if-elseif-else 组件中的第一个条件表达式为 true 时,其他条件表达式才会被执行,当对应的代码块被执行后,其余的表达式或者代码块将不会被执行。

if 代码块是”有渗漏的”,也就是说它们不会引入局部作用域。这意味着在 if 语句中新定义的变量依然可以在 if 代码块之后使用,尽管这些变量没有在 if 语句之前定义过。所以,我们可以将上面的 test 函数定义为

  1. julia> function test(x,y)
  2. if x < y
  3. relation = "less than"
  4. elseif x == y
  5. relation = "equal to"
  6. else
  7. relation = "greater than"
  8. end
  9. println("x is ", relation, " y.")
  10. end
  11. test (generic function with 1 method)
  12. julia> test(2, 1)
  13. x is greater than y.

变量 relation 是在 if 代码块内部声明的,但可以在外部使用。然而,在利用这种行为的时候,要保证变量在所有的分支下都进行了定义。对上述函数做如下修改会导致运行时错误

  1. julia> function test(x,y)
  2. if x < y
  3. relation = "less than"
  4. elseif x == y
  5. relation = "equal to"
  6. end
  7. println("x is ", relation, " y.")
  8. end
  9. test (generic function with 1 method)
  10. julia> test(1,2)
  11. x is less than y.
  12. julia> test(2,1)
  13. ERROR: UndefVarError: relation not defined
  14. Stacktrace:
  15. [1] test(::Int64, ::Int64) at ./none:7

if 代码块也会返回一个值,这可能对于一些从其他语言转过来的用户来说不是很直观。 这个返回值就是被执行的分支中最后一个被执行的语句的返回值。 所以

  1. julia> x = 3
  2. 3
  3. julia> if x > 0
  4. "positive!"
  5. else
  6. "negative..."
  7. end
  8. "positive!"

需要注意的是,在 Julia 中,经常会用短路求值来表示非常短的条件表达式(单行),这会在下一节中介绍。

与 C, MATLAB, Perl, Python,以及 Ruby 不同,但跟 Java,还有一些别的严谨的类型语言类似:一个条件表达式的值如果不是 true 或者 false 的话,会返回错误:

  1. julia> if 1
  2. println("true")
  3. end
  4. ERROR: TypeError: non-boolean (Int64) used in boolean context

这个错误是说,条件判断结果的类型:Int64 是错的,而不是期望的 Bool

所谓的 “三元运算符”, ?:,很类似 if-elseif-else 语法,它用于选择性获取单个表达式的值,而不是选择性执行大段的代码块。它因在很多语言中是唯一一个有三个操作数的运算符而得名:

  1. a ? b : c

? 之前的表达式 a, 是一个条件表达式,如果条件 atrue,三元运算符计算在 : 之前的表达式 b;如果条件 afalse,则执行 : 后面的表达式 c。注意,?: 旁边的空格是强制的,像 a?b:c 这种表达式不是一个有效的三元表达式(但在?: 之后的换行是允许的)。

理解这种行为的最简单方式是看一个实际的例子。在前一个例子中,虽然在三个分支中都有调用 println,但实质上是选择打印哪一个字符串。在这种情况下,我们可以用三元运算符更紧凑地改写。为了简明,我们先尝试只有两个分支的版本:

  1. julia> x = 1; y = 2;
  2. julia> println(x < y ? "less than" : "not less than")
  3. less than
  4. julia> x = 1; y = 0;
  5. julia> println(x < y ? "less than" : "not less than")
  6. not less than

如果表达式 x < y 为真,整个三元运算符会执行字符串 "less than",否则执行字符串 "not less than"。原本的三个分支的例子需要链式嵌套使用三元运算符:

  1. julia> test(x, y) = println(x < y ? "x is less than y" :
  2. x > y ? "x is greater than y" : "x is equal to y")
  3. test (generic function with 1 method)
  4. julia> test(1, 2)
  5. x is less than y
  6. julia> test(2, 1)
  7. x is greater than y
  8. julia> test(1, 1)
  9. x is equal to y

为了方便链式传值,运算符从右到左连接到一起。

重要地是,与 if-elseif-else 类似,: 之前和之后的表达式只有在条件表达式为 true 或者 false 时才会被相应地执行:

  1. julia> v(x) = (println(x); x)
  2. v (generic function with 1 method)
  3. julia> 1 < 2 ? v("yes") : v("no")
  4. yes
  5. "yes"
  6. julia> 1 > 2 ? v("yes") : v("no")
  7. no
  8. "no"

短路求值

短路求值非常类似条件求值。这种行为在多数有 &&|| 布尔运算符地命令式编程语言里都可以找到:在一系列由这些运算符连接的布尔表达式中,为了得到整个链的最终布尔值,仅仅只有最小数量的表达式被计算。更明确的说,这意味着:

  • 在表达式 a && b 中,子表达式 b 仅当 atrue 的时候才会被执行。
  • 在表达式 a || b 中,子表达式 b 仅在 afalse 的时候才会被执行。

这里的原因是:如果 afalse,那么无论 b 的值是多少,a && b 一定是 false。同理,如果 atrue,那么无论 b 的值是多少,a || b 的值一定是 true。&&|| 都依赖于右边,但是 &&|| 有更高的优先级。我们可以简单地测试一下这个行为:

  1. julia> t(x) = (println(x); true)
  2. t (generic function with 1 method)
  3. julia> f(x) = (println(x); false)
  4. f (generic function with 1 method)
  5. julia> t(1) && t(2)
  6. 1
  7. 2
  8. true
  9. julia> t(1) && f(2)
  10. 1
  11. 2
  12. false
  13. julia> f(1) && t(2)
  14. 1
  15. false
  16. julia> f(1) && f(2)
  17. 1
  18. false
  19. julia> t(1) || t(2)
  20. 1
  21. true
  22. julia> t(1) || f(2)
  23. 1
  24. true
  25. julia> f(1) || t(2)
  26. 1
  27. 2
  28. true
  29. julia> f(1) || f(2)
  30. 1
  31. 2
  32. false

你可以用同样的方式测试不同 &&|| 运算符的组合条件下的关联和优先级。

这种行为在 Julia 中经常被用来作为简短 if 语句的替代。 可以用 <cond> && <statement> (可读为: and then )来替换 if <cond> <statement> end。 类似的, 可以用 <cond> || <statement> (可读为: or else )来替换 if ! <cond> <statement> end.

例如,可以像这样定义递归阶乘:

  1. julia> function fact(n::Int)
  2. n >= 0 || error("n must be non-negative")
  3. n == 0 && return 1
  4. n * fact(n-1)
  5. end
  6. fact (generic function with 1 method)
  7. julia> fact(5)
  8. 120
  9. julia> fact(0)
  10. 1
  11. julia> fact(-1)
  12. ERROR: n must be non-negative
  13. Stacktrace:
  14. [1] error at ./error.jl:33 [inlined]
  15. [2] fact(::Int64) at ./none:2
  16. [3] top-level scope

短路求值的布尔运算可以用位布尔运算符来完成,见数学运算和初等函数&|。这些是普通的函数,同时也刚好支持中缀运算符语法,但总是会计算它们的所有参数:

  1. julia> f(1) & t(2)
  2. 1
  3. 2
  4. false
  5. julia> t(1) | t(2)
  6. 1
  7. 2
  8. true

if, elseif 或者三元运算符中的条件表达式相同,&& 或者 || 的操作数必须是布尔值(true 或者 false)。在链式嵌套的条件表达式中, 除最后一项外,使用非布尔值会导致错误:

  1. julia> 1 && true
  2. ERROR: TypeError: non-boolean (Int64) used in boolean context

但在链的末尾允许使用任意类型的表达式,此表达式会根据前面的条件被执行并返回:

  1. julia> true && (x = (1, 2, 3))
  2. (1, 2, 3)
  3. julia> false && (x = (1, 2, 3))
  4. false

重复执行:循环

有两个用于重复执行表达式的组件:while 循环和 for 循环。下面是一个 while 循环的例子:

  1. julia> i = 1;
  2. julia> while i <= 5
  3. println(i)
  4. global i += 1
  5. end
  6. 1
  7. 2
  8. 3
  9. 4
  10. 5

while 循环会执行条件表达式(例子中为 i <= 5),只要它为 true,就一直执行while 循环的主体部分。当 while 循环第一次执行时,如果条件表达式为 false,那么主体代码就一次也不会被执行。

for 循环使得常见的重复执行代码写起来更容易。 像之前 while 循环中用到的向上和向下计数是可以用 for 循环更简明地表达:

  1. julia> for i = 1:5
  2. println(i)
  3. end
  4. 1
  5. 2
  6. 3
  7. 4
  8. 5

这里的 1:5 是一个范围对象,代表数字 1, 2, 3, 4, 5 的序列。for 循环在这些值之中迭代,对每一个变量 i 进行赋值。for 循环与之前 while 循环的一个非常重要区别是作用域,即变量的可见性。如果变量 i 没有在另一个作用域里引入,在 for 循环内,它就只在 for 循环内部可见,在外部和后面均不可见。你需要一个新的交互式会话实例或者一个新的变量名来测试这个特性:

  1. julia> for j = 1:5
  2. println(j)
  3. end
  4. 1
  5. 2
  6. 3
  7. 4
  8. 5
  9. julia> j
  10. ERROR: UndefVarError: j not defined

参见变量作用域中对变量作用域的详细解释以及它在 Julia 中是如何工作的。

一般来说,for 循环组件可以用于迭代任一个容器。在这种情况下,相比 =,另外的(但完全相同)关键字 in 或者 则更常用,因为它使得代码更清晰:

  1. julia> for i in [1,4,0]
  2. println(i)
  3. end
  4. 1
  5. 4
  6. 0
  7. julia> for s ["foo","bar","baz"]
  8. println(s)
  9. end
  10. foo
  11. bar
  12. baz

在手册后面的章节中会介绍和讨论各种不同的迭代容器(比如,多维数组)。

为了方便,我们可能会在测试条件不成立之前终止一个 while 循环,或者在访问到迭代对象的结尾之前停止一个 for 循环,这可以用关键字 break 来完成:

  1. julia> i = 1;
  2. julia> while true
  3. println(i)
  4. if i >= 5
  5. break
  6. end
  7. global i += 1
  8. end
  9. 1
  10. 2
  11. 3
  12. 4
  13. 5
  14. julia> for j = 1:1000
  15. println(j)
  16. if j >= 5
  17. break
  18. end
  19. end
  20. 1
  21. 2
  22. 3
  23. 4
  24. 5

没有关键字 break 的话,上面的 while 循环永远不会自己结束,而 for 循环会迭代到 1000,这些循环都可以使用 break 来提前结束。

在某些场景下,需要直接结束此次迭代,并立刻进入下次迭代,continue 关键字可以用来完成此功能:

  1. julia> for i = 1:10
  2. if i % 3 != 0
  3. continue
  4. end
  5. println(i)
  6. end
  7. 3
  8. 6
  9. 9

这是一个有点做作的例子,因为我们可以通过否定这个条件,把 println 调用放到 if 代码块里来更简洁的实现同样的功能。在实际应用中,在 continue 后面还会有更多的代码要运行,并且调用 continue 的地方可能会有多个。

多个嵌套的 for 循环可以合并到一个外部循环,可以用来创建其迭代对象的笛卡尔积:

  1. julia> for i = 1:2, j = 3:4
  2. println((i, j))
  3. end
  4. (1, 3)
  5. (1, 4)
  6. (2, 3)
  7. (2, 4)

有了这个语法,迭代变量依然可以正常使用循环变量来进行索引,例如 for i = 1:n, j = 1:i 是合法的,但是在一个循环里面使用 break 语句则会跳出整个嵌套循环,不仅仅是内层循环。每次内层循环运行的时候,变量(ij)会被赋值为他们当前的迭代变量值。所以对 i 的赋值对于接下来的迭代是不可见的:

  1. julia> for i = 1:2, j = 3:4
  2. println((i, j))
  3. i = 0
  4. end
  5. (1, 3)
  6. (1, 4)
  7. (2, 3)
  8. (2, 4)

如果这个例子给每个变量一个关键字 for 来重写,那么输出会不一样:第二个和第四个变量包含 0

异常处理

当一个意外条件发生时,一个函数可能无法向调用者返回一个合理的值。在这种情况下,最好让意外条件终止程序并打印出调试的错误信息,或者根据程序员预先提供的异常处理代码来采取恰当的措施。

内置的 Exception

当一个意外的情况发生时,会抛出 Exception。下面列出的内置 Exception 都会中断正常的控制流程。

Exception
ArgumentError
BoundsError
CompositeException
DimensionMismatch
DivideError
DomainError
EOFError
ErrorException
InexactError
InitError
InterruptException
InvalidStateException
KeyError
LoadError
OutOfMemoryError
ReadOnlyMemoryError
RemoteException
MethodError
OverflowError
Meta.ParseError
SystemError
TypeError
UndefRefError
UndefVarError
StringIndexError

例如,当输入参数为负实数时,sqrt 函数会抛出一个 DomainError

  1. julia> sqrt(-1)
  2. ERROR: DomainError with -1.0:
  3. sqrt will only return a complex result if called with a complex argument. Try sqrt(Complex(x)).
  4. Stacktrace:
  5. [...]

你可能需要根据下面的方式来定义你自己的异常:

  1. julia> struct MyCustomException <: Exception end

throw 函数

我们可以用 throw 显式地创建异常。例如,若一个函数只对非负数有定义,当输入参数是负数的时候,可以用 throw 抛出一个 DomainError

  1. julia> f(x) = x>=0 ? exp(-x) : throw(DomainError(x, "argument must be nonnegative"))
  2. f (generic function with 1 method)
  3. julia> f(1)
  4. 0.36787944117144233
  5. julia> f(-1)
  6. ERROR: DomainError with -1:
  7. argument must be nonnegative
  8. Stacktrace:
  9. [1] f(::Int64) at ./none:1

注意 DomainError 后面不接括号的话不是一个异常,而是一个异常类型。我们需要调用它来获得一个 Exception 对象:

  1. julia> typeof(DomainError(nothing)) <: Exception
  2. true
  3. julia> typeof(DomainError) <: Exception
  4. false

另外,一些异常类型会接受一个或多个参数来进行错误报告:

  1. julia> throw(UndefVarError(:x))
  2. ERROR: UndefVarError: x not defined

我们可以仿照 UndefVarError 的写法,用自定义异常类型来轻松实现这个机制:

  1. julia> struct MyUndefVarError <: Exception
  2. var::Symbol
  3. end
  4. julia> Base.showerror(io::IO, e::MyUndefVarError) = print(io, e.var, " not defined")

Note

错误信息的第一个单词最好用小写. 例如, size(A) == size(B) || throw(DimensionMismatch("size of A not equal to size of B"))

优于

size(A) == size(B) || throw(DimensionMismatch("Size of A not equal to size of B")).

但是,有时第一个字母大写更合理,例如如果函数的一个参数是一个大写字母:size(A,1) == size(B,2) || throw(DimensionMismatch("A has first dimension..."))

错误

我们可以用 error 函数生成一个 ErrorException 来中断正常的控制流程。

假设我们希望在计算负数的平方根时让程序立即停止执行。为了实现它,我们可以定义一个挑剔的 sqrt 函数,当它的参数是负数时,产生一个错误:

  1. julia> fussy_sqrt(x) = x >= 0 ? sqrt(x) : error("negative x not allowed")
  2. fussy_sqrt (generic function with 1 method)
  3. julia> fussy_sqrt(2)
  4. 1.4142135623730951
  5. julia> fussy_sqrt(-1)
  6. ERROR: negative x not allowed
  7. Stacktrace:
  8. [1] error at ./error.jl:33 [inlined]
  9. [2] fussy_sqrt(::Int64) at ./none:1
  10. [3] top-level scope

如果另一个函数调用 fussy_sqrt 和一个负数, 它会立马返回, 在交互会话中显示错误信息,而不会继续执行调用的函数:

  1. julia> function verbose_fussy_sqrt(x)
  2. println("before fussy_sqrt")
  3. r = fussy_sqrt(x)
  4. println("after fussy_sqrt")
  5. return r
  6. end
  7. verbose_fussy_sqrt (generic function with 1 method)
  8. julia> verbose_fussy_sqrt(2)
  9. before fussy_sqrt
  10. after fussy_sqrt
  11. 1.4142135623730951
  12. julia> verbose_fussy_sqrt(-1)
  13. before fussy_sqrt
  14. ERROR: negative x not allowed
  15. Stacktrace:
  16. [1] error at ./error.jl:33 [inlined]
  17. [2] fussy_sqrt at ./none:1 [inlined]
  18. [3] verbose_fussy_sqrt(::Int64) at ./none:3
  19. [4] top-level scope

try/catch 语句

通过 try / catch 语句,可以测试 Exception 并 优雅处理可能会破坏应用程序的事情。 例如, 在下面的代码中,平方根函数会引发异常。 通过 在其周围放置 try / catch 块可以缓解。 您可以选择如何 处理此异常,无论是记录它,返回占位符值还是 就像下面仅打印一句话。 要注意的是 在决定如何处理异常时,使用try / catch 块 比使用条件分支处理要慢得多。 以下是使用try / catch 块处理异常的更多示例:

  1. julia> try
  2. sqrt("ten")
  3. catch e
  4. println("You should have entered a numeric value")
  5. end
  6. You should have entered a numeric value

try/catch 语句允许保存 Exception 到一个变量中。在下面这个做作的例子中,如果 x 是可索引的,则计算 x 的第二项的平方根,否则就假设 x 是一个实数,并返回它的平方根:

  1. julia> sqrt_second(x) = try
  2. sqrt(x[2])
  3. catch y
  4. if isa(y, DomainError)
  5. sqrt(complex(x[2], 0))
  6. elseif isa(y, BoundsError)
  7. sqrt(x)
  8. end
  9. end
  10. sqrt_second (generic function with 1 method)
  11. julia> sqrt_second([1 4])
  12. 2.0
  13. julia> sqrt_second([1 -4])
  14. 0.0 + 2.0im
  15. julia> sqrt_second(9)
  16. 3.0
  17. julia> sqrt_second(-9)
  18. ERROR: DomainError with -9.0:
  19. sqrt will only return a complex result if called with a complex argument. Try sqrt(Complex(x)).
  20. Stacktrace:
  21. [...]

注意 catch 后面的字符会被一直认为是异常的名字,所以在写 try/catch 单行表达式时,需要特别小心。下面的代码不会在错误的情况下返回 x 的值:

  1. try bad() catch x end

正确的做法是在 catch 后添加一个分号或者直接换行:

  1. try bad() catch; x end
  2. try bad()
  3. catch
  4. x
  5. end

try/catch 组件的强大之处在于能够将高度嵌套的计算立刻解耦成更高层次地调用函数。有时没有错误产生,但需要能够解耦堆栈,并传值到上层。Julia 提供了 rethrowbacktracecatch_backtraceBase.catch_stack 函数进行更高级的错误处理。

finally 子句

在进行状态改变或者使用类似文件的资源的编程时,经常需要在代码结束的时候进行必要的清理工作(比如关闭文件)。由于异常会使得部分代码块在正常结束之前退出,所以可能会让上述工作变得复杂。finally 关键字提供了一种方式,无论代码块是如何退出的,都能够让代码块在退出时运行某段代码。

这里是一个确保一个打开的文件被关闭的例子:

  1. f = open("file")
  2. try
  3. # operate on file f
  4. finally
  5. close(f)
  6. end

当控制流离开 try 代码块(例如,遇到 return,或者正常结束),close(f) 就会被执行。如果 try 代码块由于异常退出,这个异常会继续传递。catch 代码块可以和 try 还有 finally 配合使用。这时 finally 代码块会在 catch 处理错误之后才运行。

Task(协程)

Task 是一种允许计算以更灵活的方式被中断或者恢复的流程控制特性。这个特性有时被叫做其它名字,例如,对称协程(symmetric coroutines),轻量级线程(lightweight threads),合作多任务处理(cooperative multitasking),或者单次续延(one-shot continuations)。

当一部分计算任务(在实际中,执行一个特定的函数)可以被设计成一个 Task 时,就可以中断它,并切换到另一个 Task。原本的 Task 可以恢复到它上次中断的地方,并继续执行。第一眼感觉,这个跟函数调用很类似。但是有两个关键的区别。首先,是切换 Task 并不使用任何空间,所以任意数量的 Task 切换都不会使用调用栈(call stack)。其次,Task 可以以任意次序切换,而不像函数调用那样,被调用函数必须在返回主调用函数之前结束执行。

这种流程控制的方式使得解决一个特定问题更简便。在一些问题中,多个需求并不是有函数调用来自然连接的;在需要完成的工作之间并没有明确的“调用者”或者“被调用者”。一个例子是生产-消费问题,一个复杂的流程产生数据,另一个复杂的流程消费他们。消费者不能简单的调用生产函数来获得一个值,因为生产者可能有更多的值需要创建,还没有准备好返回。用 Task 的话,生产者和消费者能同时运行他们所需要的任意时间,根据需要传递值回来或者过去。

Julia 提供了 Channel 机制来解决这个问题。一个 Channel 是一个先进先出的队列,允许多个 Task 对它可以进行读和写。

让我们定义一个生产者任务,调用 put! 来生产数值。为了消费数值,我们需要对生产者开始新任务进行排班。可以使用一个特殊的 Channel 组件来运行一个与其绑定的 Task,它能接受单参数函数作为其参数,然后可以用 take!Channel 对象里不断地提取值:

  1. julia> function producer(c::Channel)
  2. put!(c, "start")
  3. for n=1:4
  4. put!(c, 2n)
  5. end
  6. put!(c, "stop")
  7. end;
  8. julia> chnl = Channel(producer);
  9. julia> take!(chnl)
  10. "start"
  11. julia> take!(chnl)
  12. 2
  13. julia> take!(chnl)
  14. 4
  15. julia> take!(chnl)
  16. 6
  17. julia> take!(chnl)
  18. 8
  19. julia> take!(chnl)
  20. "stop"

一种思考这种行为的方式是,“生产者”能够多次返回。在两次调用 put! 之间,生产者的执行是挂起的,此时由消费者接管控制。

返回的 Channel 可以被用作一个 for 循环的迭代对象,此时循环变量会依次取到所有产生的值。当 Channel 关闭时,循环就会终止。

  1. julia> for x in Channel(producer)
  2. println(x)
  3. end
  4. start
  5. 2
  6. 4
  7. 6
  8. 8
  9. stop

注意我们并不需要显式地在生产者中关闭 Channel。这是因为 ChannelTask 的绑定同时也意味着 Channel 的生命周期与绑定的 Task 一致。当 Task 结束时,Channel 对象会自动关闭。多个 Channel 可以绑定到一个 Task,反之亦然。

尽管 Task 的构造函数只能接受一个“无参函数”,但 Channel 方法会创建一个与 Channel 绑定的 Task,并令其可以接受 Channel 类型的单参数函数。一个通用模式是对生产者参数化,此时需要一个部分函数应用来创建一个无参,或者单参的匿名函数

对于 Task 对象,可以直接用,也可以为了方便用宏。

  1. function mytask(myarg)
  2. ...
  3. end
  4. taskHdl = Task(() -> mytask(7))
  5. # or, equivalently
  6. taskHdl = @task mytask(7)

为了安排更高级的工作分配模式,bindschedule 可以与 TaskChannel 构造函数配合使用,显式地连接一些 Channel 和生产者或消费者 Task

注意目前 Julia 的 Task 并不分配到或者运行在不同的 CPU 核心上。真正的内核进程将在并行计算进行讨论。

Task 相关的核心操作

让我们来学习底层构造函数 yieldto 来理解 Task 是如何切换工作的。yieldto(task,value) 会中断当前的 Task,并切换到特定的 Task,并且 Task 的最后一次 yieldto 调用会有特定的返回值。注意 yieldto 是唯一一个需要用任务类型的流程控制的操作,仅需要切换到不同的 Task,而不需要调用或者返回。这也就是为什么这个特性会被叫做“对称协程(symmetric coroutines)”;每一个 Task 以相同的机制进行切换或者被切换。

yieldto 功能强大,但大多数 Task 的使用都不会直接调用它。思考为什么会这样。如果你切换当前 Task,你很可能会在某个时候想切换回来。但知道什么时候切换回来和那个 Task 负责切换回来需要大量的协调。例如,put!take! 是阻塞操作,当在渠道环境中使用时,维持状态以记住消费者是谁。不需要人为地记录消费 Task,正是使得 put! 比底层 yieldto 易用的原因。

除了 yieldto 之外,也需要一些其它的基本函数来更高效地使用 Task

Task 和事件

多数 Task 切换是在等待如 I/O 请求的事件,由 Julia Base 里的调度器执行。调度器维持一个可运行 Task 的队列,并执行一个事件循环,来根据例如收到消息等外部事件来重启 Task

等待一个事件的基本函数是 wait。很多对象都实现了 wait 函数;例如,给定一个 Process 对象,wait 将等待它退出。wait 通常是隐式的,例如,wait 可能发生在调用 read 时等待数据可用。

在所有这些情况下,wait 最终会操作一个 Condition 对象,由它负责排队和重启 Task。当 Task 在一个 Condition 上调用 wait 时,该 Task 就被标记为不可执行,加到条件的队列中,并切回调度器。调度器将选择另一个 Task 来运行,或者阻止外部事件的等待。如果所有运行良好,最终一个事件处理器将在这个条件下调用 notify,使得等待该条件的 Task 又变成可运行。

调用 Task 显式创建的 Task 对于调度器时来说一开始时不知道的。如果你希望的话,你可以使用 yieldto 来人为管理 Task。但是当这种 Task 等待一个事件时,正如期待的那样,当事件发生时,它将自动重启。也能由调度器在任何可能的时候运行一个 Task,而无需等待任何事件。这可以调用 schedule,或者使用 @async 宏(见并行计算中的详细说明)。

Task 的状态

Taskstate 属性来描述他们的执行状态。Task state 有:

符号含义
:runnable正在运行,或者可以被切换到
:done成功结束执行
:failed以一个没被捕获的异常结束