月度归档:2010年10月

PHP中的urlencode,rawurlencode和JS中的encodeURI,encodeURIComponent

PHP中的urlencode,rawurlencode和JS中的encodeURI,encodeURIComponent

【PHP中的urlencode和rawurlencode】
urlencode之前有看过其源码实现PHP 源码阅读笔记二十三 :urlencode函数
二都的区别仅在” “空格上,rawurlencode()会把空格编码为%20,而urlencode会把空格编码为+

【JS中的encodeURI和encodeURIComponent】
encodeURI 方法不会对下列字符进行编码:”:”、”/”、”;” 和 “?”,而encodeURIComponent会编码这些字符

【urlencode与encodeURI】
首先,我们看下这4种编码方式针对ASCII的127个字符编码后的差别,显示代码如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
<?php
/**
 * 生成urlencode,rawurlencode,encodeURI,encodeURIComponent的编码结果 2010-10-29 sz
 * @author phppan.p#gmail.com  http://www.phppan.com
 * 哥学社成员(http://www.blog-brother.com/)
 * @package test
 */
header("Content-type:text/html;charset=utf-8");
 
echo <<<STYLE
<style type="text/css">
    table {
cursor:default;
font-family:Verdana,Helvetica,sans-serif;
font-size:8pt;
}
td {
background:none repeat scroll 0 0 #EFEFEF;
text-align:center;
width:100px;
}
</style>
STYLE;
echo '<table >';
echo _tr(_td("ASCII") . _td("urlenocde") . _td("rawurlencode") . _td("encodeURI") . _td("encodeURIComponent"));
for ($i = 0; $i < 128; $i++) {
    $ch = chr($i);
    $td = _td($ch) . _td(urlencode($ch)) . _td(rawurlencode($ch));
    $td .= _td(_encodeURI($ch)) . _td(_encodeURIComponent($ch));
 
    echo _tr($td);
}
echo "</table>";

对比urlencode和encodeURI的不同,可以看到#$&+,/:;=?@这些符号编码结果不同,
于是对于需要在PHP中编码后,给js的encodeURI使用的操作可以使用如下函数:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
<?php
/**
 * urlencode适用于js版本 2010-10-29 sz
 * @author phppan.p#gmail.com  http://www.phppan.com
 * 哥学社成员(http://www.blog-brother.com/)
 * @package test
 */
header("Content-type:text/html;charset=utf-8");
 
function urlencode_js($str) {
    $str_len = strlen($str);
 
    $new = array();
    for ($i = 0; $i < $str_len; $i++) {
        $ch = $str[$i];
        if (strpos("#$&+,/:;=?@", $ch) !== FALSE) {
            $new[] = $ch;
        } else {
            $new[] = urlencode($ch);
        }
    }
 
    return implode("", $new);
}
 
$encode_str = urlencode_js("a汉bc中文 章+aa#$&+,/:;=?@a汉bc中文 章+aa");
 
echo <<<HTML
<script type="text/javascript">
    document.write(decodeURI("$encode_str") + "<br />");
 </script>
HTML;
die();

【urlencode和urldecode的PHP实现】(折腾一个重复轮子玩)
以下代码纯属折腾,如有雷同,不胜荣幸

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
 
<?php
/**
 * urlencode和urldecode的PHP版本 2010-10-29 sz
 * @author phppan.p#gmail.com  http://www.phppan.com
 * 哥学社成员(http://www.blog-brother.com/)
 * @package test
 */
header("Content-type:text/html;charset=utf-8");
 
$str = "a汉bc中文 章+aa:/;?()'!-.*_~";
 
/**
 * urlencode的PHP实现
 * 纯属折腾 其C实现请参照PHP源码  url.c文件中php_url_encode函数
 * @param <type> $str
 * @return <type>
 */
function myurlencode($str) {
    $len = strlen($str);
 
    $rs = array();
    for ($i = 0; $i < $len; $i++) {
        $ch = $str[$i];
        if ($ch == ' ') {
            $rs[] = '+';
        } else if (!encodecheck($ch)) {
            $rs[] = strtoupper('%' . dechex(ord($ch) >> 4) . dechex(ord($ch) & 15));
        } else {
            $rs[] = $ch;
        }
    }
 
    return implode("", $rs);
}
 
/**
 * 判断是否为字符和字线以及_-.
 * 相当于c中的!isalnum(c) && strchr("_-.", c) == NULL(PHP源码)
 * @param <type> $ch
 * @return <type>
 */
function encodecheck($ch) {
    $pattern = "/[a-zA-Z0-9_\-\.]/";
    return preg_match($pattern, strval($ch));
}
 
/**
 * 判断是否为16进制数
 * @param <type> $ch
 * @return <type>
 */
function checkhex($ch) {
    $hexstr = "0123456789ABCDEF";
    return strpos($hexstr, strval($ch)) === FALSE ? FALSE : TRUE;
}
 
/**
 * urldecode的PHP实现
 * 纯属折腾
 * @param <type> $str
 * @return <type>
 */
function myurldecode($str) {
    $len = strlen($str);
 
    $rs = array();
    for ($i = 0; $i < $len; $i++) {
        $ch = $str[$i];
        if ($ch == '+') {
            $rs[] = ' ';
        } else if ($ch == '%' && isset($str[$i + 1]) && checkhex($str[$i + 1]) && isset($str[$i + 2]) && checkhex($str[$i + 2])) {
            $rs[] = chr(hexdec($str[$i + 1] . $str[$i + 2]));
            $i += 2;
        } else {
            $rs[] = $ch;
        }
    }
 
    return implode("", $rs);
}
 
/* 测试 */
echo $str, '<br />';
echo urldecode(myurlencode($str)), '<br />';
echo myurldecode(urlencode($str)), '<br />';
die();

以上算是对urlencode和urldecode实现的一次复习吧。

–EOF–

PHP手册拾遗四:变量函数

PHP手册拾遗:变量函数
1、isset()函数
若使用 isset() 测试一个被设置成 NULL 的变量,将返回 FALSE。
对于一个数组的元素,如果该元素的值为NULL,使用isset()函数将返回FALSE,此时需要使用array_key_exists函数。如下所示代码:

1
2
3
4
5
6
7
8
9
10
11
12
13
$array = array('t1' => NULL);
if (isset($array['t1'])) {                                                               
    echo 'Yes';
}else{
    echo 'No';
}
echo '<br />';
 
if (array_key_exists('t1', $array)) {
    echo 'Yes';
}else{
    echo 'No';
}

2、empty()函数
这是一个语言结构而非函数
empty() 只检测变量,检测任何非变量的东西都将导致解析错误。换句话说,后边的语句将不会起作用: empty(addslashes($name))。
如下示例:

1
2
3
$str = "phppan";
if (empty(1));  //Parse error: syntax error, unexpected T_LNUMBER
if (empty(addslashes($str)));   //  Fatal error: Can't use function return value in write context

3、floatval()函数
float floatval ( mixed var )
var 可以是任何标量类型。你不能将 floatval() 用于数组或对象。

4、import_request_variables函数
将 GET/POST/Cookie 变量导入到全局作用域中。如果你禁止了 register_globals,但又想用到一些全局变量,那么此函数就很有用。
很少用到此函数,一般都是直接使用$_GET/$_POST/$_COOKIE
如果要将其它变量导入到全局变量中,可以考虑使用extract()。

5、serialize()与unserialize()
serialize会存储数组/对象中的引用。因此可以通过序列化和反序列化实现深拷贝。
当序列化对象时,PHP 将试图在序列动作之前调用该对象的成员函数 __sleep()。这样就允许对象在被序列化之前做任何清除操作。类似的,当使用 unserialize() 恢复对象时, 将调用 __wakeup() 成员函数。

6、unset — 释放给定的变量
如果在函数中 unset() 一个全局变量,则只是局部变量被销毁,而在调用环境中的变量将保持调用 unset() 之前一样的值。
如下所示代码:

1
2
3
4
5
6
7
8
9
$a = 10;
function unset_global_var() {
    global $a;
    unset($a);
    echo $a, '<br />';
}
unset_global_var();
echo $a, '<br />';
die();

如果在函数中 unset() 一个通过引用传递的变量,则只是局部变量被销毁,而在调用环境中的变量将保持调用 unset() 之前一样的值。
如果在函数中 unset() 一个静态变量,则 unset() 将销毁此变量及其所有的引用。
新版本的手册中的示例很能说明上面的这个问题:

1
2
3
4
5
6
7
8
9
10
11
12
function foo() {
    static $bar;
    $bar++;
    echo "Before unset: $bar, ";
    unset($bar);
    $bar = 23;
    echo "after unset: $bar<br />";
}
 
foo();
foo();
foo();

输出:
Before unset: 1, after unset: 23
Before unset: 2, after unset: 23
Before unset: 3, after unset: 23

如果在函数中 unset() 一个全局变量,可使用 $GLOBALS 数组来实现:

WIN7下VS2008下编译PHP扩展的6个细节

1、编译生成的dll文件无法加载的问题
此时apache启动时可能会报如下错误:
PHP Warning: PHP Startup: Invalid library (maybe not a PHP library) ‘php_martin.dll’ in Unknown on line 0
原因:get_module在动态链接库中不对外开放
修改:在vs2008的项目属性,选择【Configuration Properties】-> 【C/C++】-> 【Preprocessor】-> 【Preprocessor Definitions】增加(COMPILE_DL_MARTIN)宏定义
查看方式:进入vs2008的命令行模式,进入dll所在文件夹,输入命令:dumpbin /exports php_martin.dll
查看是否提供了get_module函数
以上的martin需换成你自己的扩展名

2、LNK2001: unresolved external symbol _ZVAL_ADDREF问题
在之前的文章PHP5.3版本编译扩展时出现:LNK2001: unresolved external symbol _ZVAL_ADDREF
有提到解决方案,只是这样是将新的接口转换成旧的接口,这对于无法修改的旧代码可以适用,但是对于新的代码,我们建议在旧版本的时候使用Z_ADDREF_P将ZVAL_ADDREF替换,如下所示代码:

1
2
3
#ifndef Z_ADDREF_P
#define Z_ADDREF_P(x) ZVAL_ADDREF(x)
#endif

感谢鸟哥的指导

3、对于在被其它c文件include的c文件,在进行编译操作时需要将其从项目中排除掉。

4、Runtime Library
在编译时如遇到显示如下错误时:

1
2
3
4
5
Error	229	error LNK2019: unresolved external symbol __imp___free_dbg referenced in function
 
Error	230	error LNK2019: unresolved external symbol __imp___malloc_dbg referenced in function 
 
Error	231	error LNK2019: unresolved external symbol __imp___strdup_dbg referenced in function

LNK2019: unresolved external symbol __imp___free_dbg referenced
在vs2008的项目属性,选择【Configuration Properties】-> 【C/C++】-> 【Code Generation】-> 【Runtime Library】,将其改为/MDd,而不是/MD

5、32位,64位问题
如有报错:Error 137 error C2466: cannot allocate an array of constant size 0
这可能是VS2008 默认使用 64 位的 time_t 结构
建议在命令中添加:/D “_USE_32BIT_TIME_T=1″

6、对于不同版本的dll编译,除了对应版本的源码外,所需要的php5ts.lib文件也要使用其相对应版本
否则会在链接时报LNK2019错误,如:
error LNK2019: unresolved external symbol __imp__zend_str_tolower_dup referenced in function
error LNK2019: unresolved external symbol __imp__gc_remove_zval_from_buffer referenced in function

–EOF–