分类目录归档：PHP

PHP源码，PHP扩展，PHP程序

PHP源码阅读笔记七：nl2br, ltrim, rtrim, trim函数

PHP源码阅读笔记：nl2br, ltrim, rtrim, trim函数

string nl2br ( string string )

Returns string with ‘
‘ inserted before all newlines.

在代码中有注释如下：

/* it is really faster to scan twice and allocate mem once insted scanning once
and constantly reallocing */

程序先计算需要替换的个数，然后一次性计算需要分配的内存大小。从而减少了每次替换都重新分配内存的开销。

由此可见PHP源码的作者的程序优化上下了不少功夫。

源码摘抄如下：

 
    str = Z_STRVAL_PP(zstr);    //    字符串开始位置
    end = str + Z_STRLEN_PP(zstr);     //    字符串结束地址
 
    /* it is really faster to scan twice and allocate mem once insted scanning once
       and constantly reallocing */
    while (str < end) {       //    计算需要替换的位置个数
        if (*str == '\r') {
            if (*(str+1) == '\n') {
                str++;
            }
            repl_cnt++;
        } else if (*str == '\n') {
            if (*(str+1) == '\r') {
                str++;
            }
            repl_cnt++;
        }
 
        str++;
    }
 
    if (repl_cnt == 0) {    //    如果没有可替换的字符串，直接返回
        RETURN_STRINGL(Z_STRVAL_PP(zstr), Z_STRLEN_PP(zstr), 1);
    }
 
 
    //    给新生成的字符串分配内存
    new_length = Z_STRLEN_PP(zstr) + repl_cnt * (sizeof("<br />") - 1);
    tmp = target = emalloc(new_length + 1);
 
    str = Z_STRVAL_PP(zstr);
 
    while (str < end) {
        switch (*str) {
            case '\r':    //    没有break,直接转下个case
            case '\n':
                *target++ = '<';
                *target++ = 'b';
                *target++ = 'r';
                *target++ = ' ';
                *target++ = '/';
                *target++ = '>';
 
                if ((*str == '\r' && *(str+1) == '\n') || (*str == '\n' && *(str+1) == '\r')) {
                    *target++ = *str++;
                }
                /* lack of a break; is intentional */
            default:
                *target++ = *str;
        }
 
        str++;
    }
 
    *target = '\0';    //    添加最后的结束字符
 
    RETURN_STRINGL(tmp, new_length, 0);    //    返回结果

ltrim — Strip whitespace (or other characters) from the beginning of a string

rtrim — Strip whitespace (or other characters) from the end of a string

trim — Strip whitespace (or other characters) from the beginning and end of a string

这三个函数都是调用static void php_do_trim(INTERNAL_FUNCTION_PARAMETERS, int mode)

===》PHPAPI char *php_trim(char *c, int len, char *what, int what_len, zval *return_value, int mode TSRMLS_DC)

实现，依据不同的mode(ltrim => 1, rtrim => 2, trim => 3)实现。

对于第二个参数，指过滤的字符，在默认情况下是空格 \n\r\t\v\0

在程序中可以看到过滤用的字符仅有char mask[256];即ASCII 码的256个值

在使用php_charmask(unsigned char *input, int len, char *mask TSRMLS_DC)函数创建过滤用的字符HASH数组

如果是1或3（程序实现使用的是 mode & 1)，则过滤源字符串前面的字符，从头开始遍历每个字符串，直接hash判断是否是需要过滤的字符，直到第一个不是过滤字符的位置结束

如果是2或 3（程序实现使用的是 mode & 2)，则过滤源字符串后面的字符，过程与前面类似。

PHP源码阅读笔记六：stream_get_wrappers函数

PHP源码阅读笔记stream_get_wrappers函数
stream_get_wrappers

(PHP 5)
stream_get_wrappers — 返回注册的数据流列表
Description

array stream_get_wrappers ( void )

Returns an indexed array containing the name of all stream wrappers available on the running system.

在某次其他函数的实现过程中需要知道url_stream_wrappers_hash变量的来源，
从而发现此函数也是从url_stream_wrappers_hash变量直接读取数据，
于是有了对于此函数和url_stream_wrappers_hash变量的跟踪过程。
首先在standard文件夹下的streamsfuncs.c文件中包含了此扩展的实现
其路径如下：

==>PHP_FUNCTION(stream_get_wrappers)        //    streamsfuncs.c 548行
==>#define php_stream_get_url_stream_wrappers_hash() _php_stream_get_url_stream_wrappers_hash(TSRMLS_C)    //    php_stream.h    552行
==>PHPAPI HashTable *_php_stream_get_url_stream_wrappers_hash(TSRMLS_D)        //    streams/streams.c    58行
==>static HashTable url_stream_wrappers_hash;    //    全局静态变量，

从此函数的代码中我们可以看出它是直接遍历php_stream_get_url_stream_wrappers_hash()函数的返回值，生成一个字符串数组
php_stream_get_url_stream_wrappers_hash()函数

而函数直接调用全局变量中的数据，此变量初始化和注册过程跟踪如下：

url_stream_wrappers_hash初始化位置：
==>int php_init_stream_wrappers(int module_number TSRMLS_DC)    //    streams.c     1395行  初始化数据流
引用位置：
==> if (php_init_stream_wrappers(module_number TSRMLS_CC) == FAILURE)     //    main.c 1765行，初始化，注册数据流
 
添加默认注册的流程如下：
==> zend_startup_modules(TSRMLS_C);    //    main.c 1843行，添加注册数据流
==>zend_hash_apply(&module_registry, (apply_func_t)zend_startup_module_ex TSRMLS_CC);    //    zend_API.c    1519行
==>ZEND_API int zend_startup_module_ex(zend_module_entry *module TSRMLS_DC)    //    zend_API.c 1424行    
==>if (module->module_startup_func) {    //    zend_API.c    1470行
==>PHP_MINIT_FUNCTION(basic)    //    basic_functions.c     3973行
==> php_register_url_stream_wrapper("php", &php_stream_php_wrapper TSRMLS_CC);
 php_register_url_stream_wrapper("file", &php_plain_files_wrapper TSRMLS_CC);
 php_register_url_stream_wrapper("data", &php_stream_rfc2397_wrapper TSRMLS_CC);
#ifndef PHP_CURL_URL_WRAPPERS
 php_register_url_stream_wrapper("http", &php_stream_http_wrapper TSRMLS_CC);
 php_register_url_stream_wrapper("ftp", &php_stream_ftp_wrapper TSRMLS_CC);
#endif 
     //     basic_functions.c    4073行，添加过程
==>php_register_url_stream_wrapper    //    main/streams/streams.c    1450行

此次跟踪的时间跨度为一周，也算是经历几多磨难。但是最后总算是弄清楚其来源。

PHP源码阅读笔记五：array 数组的创建

在PHP的调试环境中使用cli执行PHP文件
一步一步跟踪代码，由于对C和词法分析不熟悉
所使用PHP文件如下：

1
2
3

 <?PHP
$a = array(1, 2, 3);
var_dump($a);

代码简单跟踪如下：

 
 
===>php_execute_script(&file_handle TSRMLS_CC);     //php_cli.c line1130
==> retval = (zend_execute_scripts(ZEND_REQUIRE TSRMLS_CC, NULL, 3, prepend_file_p, primary_file, append_file_p) == SUCCESS);    //    main.c 2023行
==> EG(active_op_array) = zend_compile_file(file_handle, type TSRMLS_CC);      //    zend.c 1126行
==> compiler_result = zendparse(TSRMLS_C);   //    zend_language_scanner.c  3420行
==> zend-language_parse.c     2773行
==>case 382:     { zend_do_init_array(&(yyval), &(yyvsp[(1) - (1)]), NULL, 0 TSRMLS_CC); }    //    zend_language_parser.c  4689行
    ==>void zend_do_init_array(znode *result, znode *expr, znode *offset, zend_bool is_ref TSRMLS_DC)    //    zend_compile.c 3348行
 
 
 
==>case 380:    { zend_do_add_array_element(&(yyval), &(yyvsp[(3) - (3)]), NULL, 0 TSRMLS_CC); }//    zend_language_parser.c  4684行
    ==>void zend_do_add_array_element(znode *result, znode *expr, znode *offset, zend_bool is_ref TSRMLS_DC)    //    zend_compile.c 3371行

在代码跟踪过程中，发现当PHP的源码生成语法树时，遇到array和第一个数字时是没有任何有关数组的操作的，当解析到1后面的逗号时才会调用zend_do_init_array函数，创建数组

以上只是一个跟踪的过程，对于代码没有解释，由于自身水平有限，对于词法分析和语法分析了解不多，
另：如果PHP程序的最后一行代码后面没有回车换行，在读取源码文件时会看到一堆乱码

待续…

潘锦的空间

SaaS SaaS架构团队管理技术管理技术架构 PHP 内核扩展项目管理

分类目录归档：PHP

PHP源码阅读笔记七：nl2br, ltrim, rtrim, trim函数

PHP源码阅读笔记六：stream_get_wrappers函数

PHP源码阅读笔记五：array 数组的创建