PHP遍历文件的4种方法

【常规遍历方法】
常规遍历方法是指从PHP4开始就可以使用的方法,它是结合使用opendir()函数和readdir()函数,通过打开目录,读取目录和关闭目录,逐一判断列出所有的文件。简单实现代码如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
/**
 * 获取当前目录及子目录下的所有文件
 * @param string $dir 路径名
 * @return array 所有文件的路径数组
 */
function get_files1($dir) {
    $files = array();
 
    if(!is_dir($dir)) {
        return $files;
    }
 
    $handle = opendir($dir);
    if($handle) {
        while(false !== ($file = readdir($handle))) {
            if ($file != '.' && $file != '..') {
                $filename = $dir . "/"  . $file;
                if(is_file($filename)) {
                    $files[] = $filename;
                }else {
                    $files = array_merge($files, get_files($filename));
                }
            }
        }   //  end while
        closedir($handle);
    }
    return $files;
}   //  end function

【使用glob】
glob() 函数依照 libc glob() 函数使用的规则寻找所有与 pattern 匹配的文件路径,类似于一般 shells 所用的规则一样。不进行缩写扩展或参数替代。
返回一个包含有匹配文件/目录的数组。如果出错返回 FALSE。
此函数不能作用于远程文件,被检查的文件必须通过服务器的文件系统访问。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
<?PHP
/**
 * 获取当前目录下的所有文件
 * @param string $dir 路径名
 * @return array 所有文件的路径数组
 */
function get_files($dir) {
    $dir = realpath($dir) . "/";
    $files  = array();
 
    if (!is_dir($dir)) {
        return $files;
    }
 
    $pattern =  $dir . "*";
    $file_arr = glob($pattern);
 
    foreach ($file_arr as $file) {
        if (is_dir($file)) {
            $temp = get_files($file);
 
            if (is_array($temp)) {
                $files = array_merge($files, $temp);
            }
        }else {
            $files[] = $file;
        }   //  end if
    }
    return $files;
}   //  end function
?>

【使用directory 类】
这是个仿冒面向对象的机制来读取一个目录。
dir() 函数打开一个目录句柄,并返回一个对象。这个对象包含三个方法:read() , rewind() 以及 close()。并且有两个属性可用。handle 属性可以用在其它目录函数例如 readdir(),rewinddir() 和 closedir() 中。path 属性被设为被打开的目录路径。
若成功,则该函数返回一个目录流,否则返回 false 以及一个 error。可以通过在函数名前加上 “@” 来隐藏 error 的输出。

注意: read 方法返回的目录项的顺序依赖于系统。
注意: 本函数定义了内部类 Directory,意味着不能再用同样的名字定义用户自己的类。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
/**
 * 递归显示当前指定目录下所有文件
 * 使用dir函数
 * @param string $dir 目录地址
 * @return array $files 文件列表
 */
function get_files($dir) {
    $files = array();
 
    if (!is_dir($dir)) {
        return $files;
    }
 
    $d = dir($dir);
    while (false !== ($file = $d->read())) {
        if ($file != '.' && $file != '..') {
            $filename = $dir . "/"  . $file;
 
            if(is_file($filename)) {
                $files[] = $filename;
            }else {
                $files = array_merge($files, get_files($filename));
            }
        }
    }
    $d->close();
    return $files;
}

【RecursiveDirectoryIterator类】
此方法自PHP 5.0有效

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
/**
 * 使用RecursiveDirectoryIterator遍历文件,列出所有文件路径
 * @param RecursiveDirectoryIterator $dir 指定了目录的RecursiveDirectoryIterator实例
 * @return array $files 文件列表
 */
function get_files($dir) {
    $files = array();
 
    for (; $dir->valid(); $dir->next()) {
        if ($dir->isDir() && !$dir->isDot()) {
            if ($dir->haschildren()) {
                $files = array_merge($files, get_files($dir->getChildren()));
            };
        }else if($dir->isFile()){
            $files[] = $dir->getPathName();
        }
    }
    return $files;
}
 
$path = "/var/www";
$dir = new RecursiveDirectoryIterator($path);
print_r(get_files($dir));

需要了解此类的其它信息请移步 http://www.php.net/~helly/php/ext/spl/

使用PHP取远程文件的大小的3种方法

1、【最傻最天真的方法】
将文件使用file_get_contents取回后,strlen
或者存为文件后使用filesize 嘿嘿

2、【使用get_headers】
如果没有打开allow_url_fopen
会显示waring
Warning: get_headers() [function.get-headers]: URL file-access is disabled in the server configuration
示例代码如下:

1
2
3
4
5
<?PHP
$a_array = get_headers($url, true);
$size = $a_array['Content-Length'];
Echo $size;
?>

3、【使用fsockopen,然后正则匹配出文件大小】
使用fsockopen向目标地址发送http request,然后根据服务器的response使用正则匹配

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
<?PHP
function get_file_size($url) {
    $url = parse_url($url);
 
    if (empty($url['host'])) {
        return false;
    }
 
    $url['port'] = empty($url['post']) ? 80 : $url['post'];
    $url['path'] = empty($url['path']) ? '/' : $url['path'];
 
    $fp = fsockopen($url['host'], $url['port'], $error);
 
    if($fp) {
        fputs($fp, "GET " . $url['path'] . " HTTP/1.1\r\n");
        fputs($fp, "Host:" . $url['host']. "\r\n\r\n");
 
        while (!feof($fp)) {
            $str = fgets($fp);
            if (trim($str) == '') {
                break;
            }elseif(preg_match('/Content-Length:(.*)/si', $str, $arr)) {
                return trim($arr[1]);
            }
        }
        fclose ( $fp);
        return false;
    }else {
        return false;
    }
}
 
?>

通过IP定位经纬度

由于需要给客户端提交数据接口并且数据中包括经纬度,然而数据库中只存储了IP,于是需要通过IP定位经纬度。

一开始查找是否存在Google API直接将IP转化成经纬度,没有,只有将地址转化成经纬度,开始其它查找,得到方案一和方案二:
【方案一】
使用闭关纪要21.地图人站点的IP查询经纬度和经纬度查询行政区划的服务
地址为:
http://dituren-service.appspot.com/services/ip_lookup?c=onIpLookupLoaded&ip=24.24.24.24
其实现思路为:采用IP库实现了通过IP得到一个地址的文字描述之后,再通过Google的地址解析服务去匹配经纬度,调用代码如下:

1
2
3
4
5
6
7
8
9
10
11
<?PHP
$url = "http://dituren-service.appspot.com/services/ip_lookup?c=onIpLookupLoaded&ip=24.24.24.24";
$content = @file_get_contents($url);
$result = array();
if (!empty($content)) {
    preg_match("/\((.*)\)/i", $content, $matches);
    $result = json_decode($matches[1], true);
}
print_r($result);
 
?>

【方案二】
使用http://www.blueforge.net/map/ 提供的IP地址查询服务
取数据代码如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
<?PHP
$arr = explode(" ", microtime());
$rst = $arr[1] . substr($arr[0], strpos($arr[0], '.') + 1, 3);
 
$url = "http://www.blueforge.net/map/?rs=get_ip_info&rst=&rsrnd=" . $rst . "&rsargs[]=" . $ip;
$rs = @file_get_contents($url);
preg_match("/{(.*)}/", $rs, $matches);
 
$str = '$arr=array(' . str_replace(':', '=>', $matches[1]) . ');';
$str = str_replace('parseFloat', 'floatVal', $str);
eval($str);
print_r($arr);
 
?>

由于作者是直接给JS用的,所以源地址返回的数据是JS代码,我在这里做了一个替换,将其变为PHP代码。
以上两种方法都是基于Google API,并且在速度和稳定性方面存在极大的隐患

【方案三】
比较好的方案是在本地有一个数据库存储了相关信息,直接取出来,
http://www.maxmind.com/ 这个网站提供了这样一个数据库,在其城市级的数据中,我们可以找到经纬度信息,网站提供了各种语言的程序实现,这里就不再多说了。
数据库下载地址:
http://geolite.maxmind.com/download/geoip/database/GeoLiteCity.dat.gz
PHP程序下载地址:
http://geolite.maxmind.com/download/geoip/api/php/

方案三存在两个问题:

1、一些数据不全
2、存在一些乱码,特别是城市相关信息