PHP 垃圾回收(GC)机制

/ 0评 / 0

在通常的应用场景中,PHP开发者并不需要关心底层的垃圾回收机制。因为在一个完成请求周期之后,PHP进程将被释放,所有内存里的变量也将被清空。但当以CLI的方式长时间运行PHP脚本,PHP的垃圾回收将变得重要。

PHP的垃圾回收机制经理过3个不同的时期:5.2及之前版本、5.3-5.6、7.0之后。下面分别详细讲讲。

5.2及之前版本

首先我们看一下PHP是怎么储存变量的:

typedef struct _zval_struct {
    zvalue_value value;
    zend_uint refcount__gc;
    zend_uchar type;
    zend_uchar is_ref__gc;
} zval;

上面是PHP储存变量信息的源码,是一个C的结构体。我们可以看到有两个有__gc后缀的字段:refcount__gc,is_ref__gc。其中refcount是引用计数,is_ref是“是否是引用变量”的标识。引用计数会在有变量指向它的时候加1,变量被unset的时候减1。

这个时期PHP并没有专门的垃圾回收器 ,要判断一个变量容器的是否可以被释放,就是判断refcount是否为0,为0的时候就立即释放。

但这样的方式无法判断变量循环引用,于是无法释放变量容器,导致PHP存在内存泄漏,因此在5.3引入了新的垃圾回收机制。

5.3-5.6版本

在这些版本中,PHP把那些可能是垃圾的变量容器放入根缓冲区,当根缓冲区满了之后就会启动新的垃圾回收机制。

首先要清楚一点,什么是可能的垃圾。如果变量容器的refount增加,那么显然有新的变量指向它,它就不可能是垃圾。而如果一个变量容器的refcount减到0,那么它自然会被释放。只有像上面所说的,当一个变量容器的refcount减少,但不为0的时候,它才可能是一个垃圾,才会进入垃圾回收周期。

在垃圾回收中,判断一个容器是否是真的垃圾,其思路并不复杂:如果一个变量容器的refcount的值全部来自其引用自身,那么它是一个垃圾。具体操作是对变量及其成员的refcount进行模拟删除,即减1的操作,如果像我们上面说的,如果它的refcount值都来自其成员引用自身,那么模拟删除后,它的refcount值就会变成0,因此我们可以断定它是一个垃圾,要进行回收。

7.0之后

PHP7对比PHP5在性能上是一个很大的提升,内存消耗也要少不少。这是得益于PHP变量容器zval的全新设计。

struct _zval_struct {
    zend_value value;
    union {
        struct {
            ZEND_ENDIAN_LOHI_4(
                zend_uchar type,
                zend_uchar type_flags,
                zend_uchar const_flags,
                zend_uchar reserved)
        } v;
        uint32_t type_info;
    } u1;
    union {
        uint32_t var_flags;
        uint32_t next;                 // hash collision chain
        uint32_t cache_slot;           // literal cache slot
        uint32_t lineno;               // line number (for ast nodes)
        uint32_t num_args;             // arguments number for EX(This)
        uint32_t fe_pos;               // foreach position
        uint32_t fe_iter_idx;          // foreach iterator index
    } u2;
};

在PHP7中不同类型的变量储存及销毁的方式并不相同。

对于简单变量,如整数、浮点数、布尔值等,PHP不再是写时复制,而是即时分配,因此不需要refcount。当unset掉一个变量的时候,对应的zval容器会被标记为IS_UNDEF,等待释放。

对于复杂变量如数组、对象等,PHP还是共享一个zval, 写时复制。当发生变量引用时,PHP会分配一个zend_reference结构。变量指向这个zend_reference结构,里面保存着refcount计数,这个结构再指向实际zval容器。因此当发生循环引用,进入回收周期之后,PHP会对这个zend_reference结构进行模拟删除操作,如同PHP5一样。

typedef struct _zend_refcounted_h {
    uint32_t         refcount; // 记录 zend_value 的引用数
    union {
        struct {
            zend_uchar    type,  // zend_value的类型, 与zval.u1.type一致
            zend_uchar    flags, 
            uint16_t      gc_info // GC信息,记录在 gc 池中的位置和颜色,垃圾回收的过程会用到
        } v;
        uint32_t type_info;
    } u;
} zend_refcounted_h;

参考文章:

https://nikic.github.io/2015/05/05/Internal-value-representation-in-PHP-7-part-1.html

https://learnku.com/articles/33451

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注