在PHP中,函数有自己的作用域,同时在其内部可以实现各种语句的执行,最后返回最终结果值。 在PHP的源码中可以发现,PHP内核将函数分为以下类型:
#define ZEND_INTERNAL_FUNCTION 1 #define ZEND_USER_FUNCTION 2 #define ZEND_OVERLOADED_FUNCTION 3 #define ZEND_EVAL_CODE 4 #define ZEND_OVERLOADED_FUNCTION_TEMPORARY 5
其中的ZEND_USER_FUNCTION是用户函数,ZEND_INTERNAL_FUNCTION是内置的函数。也就是说PHP将内置的函数和 用户定义的函数分别保存。
用户自定义函数是非常常用的函数种类,如下面的代码,定义了一个用户自定义的函数:
<?php function tipi( $name ){ $return = "Hi! " . $name; echo $return; return $return; } ?>
这个示例中,对自定义函数传入了一个参数,并将其与Hi! 一起输出并做为返回值返回。 从这个例子可以看出函数的基本特点:运行时声明、可以传参数、有值返回。 当然,有些函数只是进行一些操作,并不一定显式的有返回值,在PHP的实现中,即使没有显式的返回, PHP内核也会“帮你“返回NULL。
通过 <<第六节 变量的作用域>> 可知,ZE在执行过程中,会将运行时信息存储于_zend_execute_data中:
struct _zend_execute_data { //...省略部分代码 zend_function_state function_state; zend_function *fbc; /* Function Being Called */ //...省略部分代码 };
在程序初始化的过程中,function_state也会进行初始化,function_state由两个部分组成:
typedef struct _zend_function_state { zend_function *function; void **arguments; } zend_function_state;
**arguments是一个指向函数参数的指针,而函数体本身则存储于*function中, *function是一个zend_function结构体, 它最终存储了用户自定义函数的一切信息,它的具体结构是这样的:
typedef union _zend_function { zend_uchar type; /* 如用户自定义则为 #define ZEND_USER_FUNCTION 2 MUST be the first element of this struct! */ struct { zend_uchar type; /* never used */ char *function_name; //函数名称 zend_class_entry *scope; //函数所在的类作用域 zend_uint fn_flags; // 作为方法时的访问类型等,如ZEND_ACC_STATIC等 union _zend_function *prototype; //函数原型 zend_uint num_args; //参数数目 zend_uint required_num_args; //需要的参数数目 zend_arg_info *arg_info; //参数信息指针 zend_bool pass_rest_by_reference; unsigned char return_reference; //返回值 } common; zend_op_array op_array; //函数中的操作 zend_internal_function internal_function; } zend_function;
zend_function的结构中的op_array存储了该函数中所有的操作,当函数被调用时,ZE就会将这个op_array中的opline一条条顺次执行, 并将最后的返回值返回。 从VLD扩展中查看的关于函数的信息可以看出,函数的定义和执行是分开的,一个函数可以作为一个独立的运行单元而存在。
ZEND_INTERNAL_FUNCTION函数是由扩展或者Zend/PHP内核提供的,用“C/C++”编写的,可以直接执行的函数。如下为内部函数的结构:
typedef struct _zend_internal_function { /* Common elements */ zend_uchar type; char * function_name; zend_class_entry *scope; zend_uint fn_flags; union _zend_function *prototype; zend_uint num_args; zend_uint required_num_args; zend_arg_info *arg_info; zend_bool pass_rest_by_reference; unsigned char return_reference; /* END of common elements */ void (*handler)(INTERNAL_FUNCTION_PARAMETERS); struct _zend_module_entry *module; } zend_internal_function;
最常见的操作是在模块初始化时,ZE会遍历每个载入的扩展模块,然后将模块中function_entry中指明的每一个函数(module->functions), 创建一个zend_internal_function结构, 并将其type设置为ZEND_INTERNAL_FUNCTION,将这个结构填入全局的函数表(HashTable结构); 函数设置及注册过程见 Zend/zend_API.c文件中的 zend_register_functions函数。这个函数除了处理函数,也处理类的方法,包括那些魔术方法。
内部函数的结构与用户自定义的函数结构基本类似,有一些不同,
PHP 支持变量函数的概念。这意味着如果一个变量名后有圆括号,PHP 将寻找与变量的值同名的函数,并且将尝试执行它。 除此之外,这个可以被用于实现回调函数,函数表等。 对比使用变量函数和内部函数的调用:
变量函数$func
$func = 'print_r'; $func('i am print_r function.');
通过VLD来查看这段代码编译后的中间代码:
function name: (null) number of ops: 9 compiled vars: !0 = $func line # * op fetch ext return operands -------------------------------------------------------------------------------- - 2 0 > EXT_STMT 1 ASSIGN !0, 'print_r' 3 2 EXT_STMT 3 INIT_FCALL_BY_NAME !0 4 EXT_FCALL_BEGIN 5 SEND_VAL 'i+am+print_r+function.' 6 DO_FCALL_BY_NAME 1 7 EXT_FCALL_END 8 > RETURN 1
内部函数print_r
print_r('i am print_r function.');
通过VLD来查看这段代码编译后的中间代码:
function name: (null) number of ops: 6 compiled vars: none line # * op fetch ext return operands -------------------------------------------------------------------------------- - 2 0 > EXT_STMT 1 EXT_FCALL_BEGIN 2 SEND_VAL 'i+am+print_r+function.' 3 DO_FCALL 1 'print_r' 4 EXT_FCALL_END 5 > RETURN 1
对比发现,二者在调用的中间代码上存在一些区别。变量函数是DO_FCALL_BY_NAME,而内部函数是DO_FCALL。 这在语法解析时就已经决定了, 见Zend/zend_complie.c文件的zend_do_end_function_call函数中部分代码:
if (!is_method && !is_dynamic_fcall && function_name->op_type==IS_CONST) { opline->opcode = ZEND_DO_FCALL; opline->op1 = *function_name; ZVAL_LONG(&opline->op2.u.constant, zend_hash_func(Z_STRVAL(function_name->u.constant), Z_STRLEN(function_name->u.constant) + 1)); } else { opline->opcode = ZEND_DO_FCALL_BY_NAME; SET_UNUSED(opline->op1); }
如果不是方法,并且不是动态调用,并且函数名为字符串常量,则其生成的中间代码为ZEND_DO_FCALL。其它情况则为ZEND_DO_FCALL_BY_NAME。 另外将变量函数作为回调函数,其处理过程在Zend/zend_complie.c文件的zend_do_pass_param函数中。 最终会体现在中间代码执行过程中的 ZEND_SEND_VAL_SPEC_CONST_HANDLER 等函数中。
匿名函数是一类不需要指定表示符,而又可以被调用的函数或子例程,匿名函数可以方便的作为参数传递给其他函数, 关于匿名函数的详细信息请阅读 <<第四节 匿名函数及闭包>>