变量的作用域

TODO FIXME 需要调整,不够明确

变量的作用域是变量的一个作用范围,在这个范围内变量为可见的,即可以访问该变量的代码区域,相反,如果不在这个范围内,变量是不可见的,无法被访问到。

如下面的例子:(会输出什么样的结果呢?)

  1. <?php
  2. $foo = 'tipi';
  3. function variable_scope(){
  4. $foo = 'foo';
  5. print $foo ;
  6. print $bar ;
  7. }

全局变量与局部变量

变量按作用域类型分为:全局变量和局部变量。全局变量是在整个程序中任何地方随意调用的变量,在PHP中,除了声明在函数体内的普通变量均为全局变量,在函数体内则可以通过global语句来声明。相对于全局变量,局部变量的作用域是程序中的部分代码(如函数中),而不是程序的全部。

变量的作用域与变量的生命周期有一定的联系,如在一个函数中定义的变量,这个变量的作用域从变量声明的时候开始到这个函数结束的时候。这种变量我们称之为局部变量。它的生命周期开始于函数开始,结束于函数的调用完成之时。

变量的作用域决定其生命周期吗?程序运行到变量作用域范围之外,就会将变量进行销毁吗?

对于不同作用域的变量,如果存在冲突情况,就像上面的例子中,全局变量中有一个名为$bar的变量,在局部变量中也存在一个名为$bar的变量,此时如何区分呢?

对于全局变量,Zend引擎有一个_zend_executor_globals结构,该结构中的symbol_table就是全局符号表,其中保存了在顶层作用域中的变量。同样,函数或者对象的方法在被调用时会创建active_symbol_table来保存局部变量。当程序在顶层中使用某个变量时,ZE就会在symbol_table中进行遍历,同理,如果程序运行于某个函数中,Zend引擎会遍历查询与其对应的active_symbol_table,而每个函数的active_symbol_table是相对独立的,由此而实现的作用域的独立。

展开来看,如果我们调用的一个函数中的变量,ZE使用_zend_execute_data来存储某个单独的op_array(每个函数都会生成单独的op_array)执行过程中所需要的信息,它的结构如下:

  1. struct _zend_execute_data {
  2. struct _zend_op *opline;
  3. zend_function_state function_state;
  4. zend_function *fbc; /* Function Being Called */
  5. zend_class_entry *called_scope;
  6. zend_op_array *op_array;
  7. zval *object;
  8. union _temp_variable *Ts;
  9. zval ***CVs;
  10. HashTable *symbol_table;
  11. struct _zend_execute_data *prev_execute_data;
  12. zval *old_error_reporting;
  13. zend_bool nested;
  14. zval **original_return_value;
  15. zend_class_entry *current_scope;
  16. zend_class_entry *current_called_scope;
  17. zval *current_this;
  18. zval *current_object;
  19. struct _zend_op *call_opline;
  20. };

函数中的局部变量就存储在_zend_execute_data的symbol_table中,在执行当前函数的op_array时,全局zend_executor_globals中的active_symbol_table会指向当前_zend_execute_data中的symbol_table。因为每个函数调用开始时都会重新初始化EG(active_symbol_table)为NULL,在这个函数的所有opcode的执行过程中这个全局变量会一直存在,并且所有的局部变量修改都是在它上面操作完成的,如前面的赋值操作等。而此时,其他函数中的symbol_table会存放在栈中,将当前函数执行完并返回时,程序会将之前保存的zend_execute_data恢复,从而其他函数中的变量也就不会被找到,局部变量的作用域就是以这种方式来实现的。相关操作在 Zend/zend_vm_execute.h 文件中定义的execute函数中一目了然,如下所示代码:

  1. zend_vm_enter:
  2. /* Initialize execute_data */
  3. execute_data = (zend_execute_data *)zend_vm_stack_alloc(
  4. sizeof(zend_execute_data) +
  5. sizeof(zval**) * op_array->last_var * (EG(active_symbol_table) ? 1 : 2) +
  6. sizeof(temp_variable) * op_array->T TSRMLS_CC);
  7.  
  8. EX(symbol_table) = EG(active_symbol_table);
  9. EX(prev_execute_data) = EG(current_execute_data);
  10. EG(current_execute_data) = execute_data;

所以,变量的作用域是使用不同的符号表来实现的,于是顶层的全局变量在函数内部使用时,需要先使用global语句来将变量“挪”到函数独立的*active_symbol_table中,即变量的跨域操作。(关于global的详细解释,见下一小节)

在PHP的源码中,EX宏经常出现,它的作用是获取结构体zend_execute_data的字段值,它的实现是: #define EX(element) execute_data->element

原文: http://www.php-internals.com/book?p=chapt03/03-06-02-var-scope