什么是PHP高级工程师

众观各大公司在PHP高级工程师的招聘要求，以个人的理解，将共同点抽象出来，得此文，如有与君意见之不同，请留言讨论。

关键词

PHP、高级、系统架构设计、OOP、网络协议、沟通、Linux

定义

以前或现在以PHP为主要开发语言，具有若干年以上工作经验，对OOP有深入认知，掌握各种网络通讯协议，熟练掌握数据库及WEB其它相关知识能够独立完成可扩展系统架构设计的工程师

具体来说，需要具备以下技能：

精通PHP 是精通哦
深入了解面向对象的思想，熟悉常见设计模式
熟悉*nix系统，最好对其内核有一些研究
对某一数据库有十分深入的认识，熟练掌握关系数据库理论
熟悉HTTP、TCP/IP等网络通讯协议
精通构架设计的理论、实践和工具，并掌握多种参考构架、主要的可重用构架机制和模式
良好的代码风格，清晰的编程思路

其它说明

学历学历在各大公司都有明确要求，一般都是本科及其以上，也许有其它相当牛的不在此要求限制之列，但是毕竟这只是少数，要过HR那关，可能得特批。
C/C++ 在招聘高级工程师时，一般都会有对这块的要求，但是都是以具有相关经验者优先出现
文档包括项目中的设计文档，在编码期间的注释能力等，这个属于基本要求
英文读写能力至少要熟练的文档阅读能力，至于英语的口头表述，只有极个别公司或外企需要
算法和数据结构强烈建议具备，这属于基本功之一;不是每个公司都会要求，如果公司不要求，也算是亮点之一
软件工程有些公司要求有相应的软件工程思想，或者有项目管理经验，这与招聘的公司岗位相关
沟通能力具备良好的沟通能力和理解能力，有良好的团队合作能力，这个应该属于基本要求之一
分布式系统这个一般属于附加分项，但至少有使用分布式缓存或数据库的经验。
网络编程部分公司有要求，但是在面试的时候应该都是会问的，所以这个也属于必备技能之一
优化数据库优化，代码优化等，这个应该属于面试必备知识点，但这与经验有较大关系
业内的名气 blog/出书/演讲/开源项目/…

个人感想

思考所有的能力和要求，发现PHP高级工程师与PHP其实没有多大关系，关键在于程序员(programmer)整个知识体系的构建。无论是从操作系统、协议、数据库等硬性要求，还是从文档、英文、沟通等软件要求来看，这不仅仅是一个PHP程序员，它所要表达的是后面五个字：高级工程师。当达到一定的层次，做技术需要追求广度和深度，有自己的特长，有一个完善的知识体系。

语言只是一门工具，不应该局限于一门语言，但必须精通一门语言。没有万能的语言，每种语言都有其存在的意义，或者说都有其适用场景，选择最合适的语言，这也是项目开始时需要规划的内容之一。

以上的内容纯属个人想法，如有雷同，不胜荣幸！

PHP内核中的对象管理机制

在PHP中，变量存储在一个名叫ZVAL的容器中。它也是PHP实现弱语言的关键因素之一。这个容器是一个标记类型和记录所有PHP实现的类型的集合体。而对象作为其存储类型的一种，以type=IS_OBJECT为标记，以zend_object_value结构体为值。但是zend_object_value的结构体仅有两个字段handle和handlers。而这两个字段就是今天我们所要说的对象管理机制的关键点。

handle字段是zend_object_handle类型，而zend_object_handle仅仅是unsigned int的一个别名。这个字段是干嘛用的呢？它是一个索引，是一个对象存储列表的索引。这个对象存储列表是PHP内核中对象的存储地，或者我们可以称其为“对象池”。

在PHP的请求初始化阶段，PHP会初始化这个对象池，预先分配 1024 个存储对象的空间。当我们使用　new 关键字创建一个对象时，PHP会将这个对象放入到对象池中，handle字段作为其索引返回。如果总的对象个数小于1024（或现有列表长度的最大值），则handle会返回最后的一个值，如果总的对象个数大于1024（或现有列表长度的最大值），则将列表的长度左移一位,将之前的top值作为handle字段返回。当我们将对象的引用计数减小时，PHP最终会调用对象操作API中的引用计数减少操作函数，当对象的引用计数小于1时会执行垃圾回收机制。

PHP的这个对象存储机制，有点类似于在表设计时将一对多关系中的多的一边独立成一个表存储，这样的设计不仅仅是低耦合的，而且在对象利用，节省内存等方面有一定的优化。

handlers字段是zend_object_handlers类型，这个类型是一个结构体，包括对象的所有处理函数。默认情况下，对象创建时使用标准处理函数。对象的变量调用，引用计数处理，克隆，函数调用等等操作都包括在这个结构体中，这相当于是对象处理的统一接口。对于不同的需求，也可以定制这些处理函数的实现，这又相当于是一个默认值，你可以选择非默认的自定义的处理函数。如果从面向对象的角度思考这个设计，这应该是一个类似于门面模式，或者说是面向接口的编程原则。

对象池的相关操作的实现在 Zend/zend_object_API.c文件，对象的操作的标准实现基本上都在 Zend/zend_object_handlers.c文件。

关于对象的前前后后在即将发布的 TIPI 第五章类和面向对象中有详细说明。

XML解析中DOM和SAX的比较和选择

在前面的文章 <<PHP中的XML解析的5种方法>> 中以功能实现为维度实现了XML的解析。今天我们从另外的维度说说XML解析的两种方式。一般来说，在PHP中，XML的解析包括DOM，SAX，正则表达式等常规方式。特别是前面的两种，不管是在PHP中还是在Java等语言中都有使用。

DOM解析器

DOM 是具有平台和语言无关性。它是表示 XML 文档的官方 W3C 标准。 DOM解析器在实现方式是预加载整个文档，并把XML文档转化为一个包含其内容的树。这个树结构方便开发人员在其中寻找特定信息，并可以调用树的一些操作很容易的添加和修改树中的元素。

在PHP中，它在形式上是基于对象的存储，然而在本质上是存储在一堆结构体中，在对象与对象的之间是以一种类似于父子的概念关系存在，从而在整体上构成了一个树的结构。

由于DOM解析器是预加载的，所以整个文档的结构在内存中是持久存在的。因此可以在其生命周期中随时修改它，以便应用程序能对数据和结构作出更改。它还可以在任何时候在整个树结构中上下导航，并且DOM解析器使用起来比较简单。但是，同样因为是预加载的方式，需要处理整个 XML 文档，所以对性能和内存的要求比较高。当遇到特别大的文档时，解析和加载整个文档可能会很慢且很耗资源，此时我们就需要另外一种方式，比如一边读取一边处理，又或者类似于SAX基于事件的模型。

在PHP中使用DOM解析器是基于DOMDocument类来实现。具体的实现请移步之前的文章： <<PHP中的XML解析的5种方法>>

SAX解析器

SAX是simple API for XML的简写，与DOM不同，它并不进行预加载操作，而是一边扫描文档，一边解析。 SAX解析器采用了基于事件的模型，它在解析 XML 文档的时候可以触发一系列的事件，当发现给定的tag的时候，它可以激活一个回调函数，告诉该函数指定的标签已经找到。 SAX解析器对内存的要求通常会比较低，因为它让开发人员自己来决定所要处理的tag。特别是当开发人员只需要处理文档中所包含的部分数据时，SAX解析器这种扩展能力得到了更好的体现。但用 SAX 解析器的时候编码工作会比较困难，而且很难同时访问同一个文档中的多处不同数据。　　看一个PHP中使用SAX解析器的例子。我们使用Google天气API的XML文档。

API地址：http://www.google.com/ig/api?weather=shenzhen

<?php
/**
 * 简单的Google天气SAX解析器
 * 解析http://www.google.com/ig/api?weather=shenzhen中将来几天的天所情况
 */
class weatherSaxParser {

    private $_parser;
    private $_xmlData;
    /**
     * 当前的Tag
     * @var <type>
     */
    private $_tag;
    private $_weather;
    /**
     * 保存天气的数组的key
     * @var <type>
     */
    private $_key;
    private $_attributes;
    /**
     *需要解析的标签集合
     * @var <type>
     */
    private $_parseTags = array('low', 'day_of_week', 'high', 'condition');

    public function __construct() {
        $this->_key = 0;
        $this->_parser = xml_parser_create();

        xml_set_object($this->_parser, $this);
        xml_set_element_handler($this->_parser, 'tagStart', 'tagEnd');
        xml_set_character_data_handler($this->_parser, 'tagContent');
    }

    public function setXmlData($xml) {
        $this->_xmlData = $xml;
    }

    /**
     * 执行解析操作
     */
    public function run() {
        xml_parse($this->_parser, $this->_xmlData);
    }

    /**
     * 标签开始回调函数
     * @param <type> $parser
     * @param <type> $tagName
     * @param <type> $attributes
     */
    public function tagStart($parser, $tagName, $attributes = NULL ) {
        $this->_tag = strtolower($tagName);
        $this->_attributes = $attributes;

        if ($this->_tag == 'forecast_conditions') {
            $item = array();
            $this->_weather[$this->_key] = $item;
            $this->_key++;
        }

        if ($this->checkTag()) {
            if (empty($this->_weather[$this->_key - 1][$this->_tag])) {
                $this->_weather[$this->_key - 1][$this->_tag] = $this->_attributes['DATA'];
            }
        }
    }

    public function tagEnd($parser, $tagName ) {

        $this->_tag = NULL;
        $htis->_attributes = NULL;
    }

    public function tagContent($parser, $content ) {

        if ($this->checkTag()) {
            $this->_weather[$this->_key - 1][$this->_tag] = $content;
        }
    }

    public function __destruct() {
        xml_parser_free($this->_parser);
    }

    public function checkTag() {
        return in_array($this->_tag, $this->_parseTags) && $this->_key > 0;
    }

    public function getWeather() {
        return $this->_weather;
    }

}

$fp = fopen('weather.xml', 'r');

$saxParser = new weatherSaxParser();

while ($data = fread($fp, 4096)) {
    $saxParser->setXmlData($data);
    $saxParser->run();
}

print_r($saxParser->getWeather());

unset($saxParser);

以上针对XML文档中’low’, ‘day_of_week’, ‘high’, ‘condition’, ‘forecast_conditions’等标签进行处理。在SAX解析器中，对于文档的遍历也是依赖于文件的行读取操作。

从上面的例子我们也可以看出SAX解析器的一些缺点：

SAX解释器不允许对XML文件随机存取，只能顺序读取
SAX解释器中元素之间的遍历困难，在多个标签间移动比较困难
SAX是解析一个节点后回调一个方法，把该节点相关信息传送个调用者，然后丢弃这些信息，继续解析下一个节点。它不会预存储整个XML文档，也不会在解析后保存任何解析结果。
SAX的修改XML能力差

结论

DOM 采用建立树形结构的方式访问 XML 文档，它体现了预处理的编程优化思想。这对于一次获取多次查询或修改的情况较适用，并且DOM具有良好的接口定义，编程较方便，一般来说，选择DOM会舒服很多。但是SAX也有其存在的理由，SAX 采用的事件模型，它体现了只取所需的优化思想。这对于只处理一次或数据量巨大导致无法预加载时有更好的性能。

DOM与SAX有点类似于PHP中读取文件操作file_get_contents和fopen/fread/feof的组合。 file_get_contents的使用比较方便，并且可以一次性将所有数据取出来，仅以后调用。 fopen/fread/feof组合操作则是打开文件可以一段一段的处理。而在SAX中可能也会调用fopen/fread/feof组合。

正所谓有得有失，重点在一个平衡和取舍，根据实际情况使用合适的技术。

参考资料

http://www.ibm.com/developerworks/cn/opensource/os-xmldomphp/ http://hannoi2009.blog.163.com/blog/static/12282842820097157152651/

潘锦的空间

SaaS SaaS架构团队管理技术管理技术架构 PHP 内核扩展项目管理