对编程来说,技术是招式,基础是内功,对自己有要求的程序员,就不能对自己使用的技术只是知其然而不知其所以然。
- 知道怎么做,是一位合格开发者;知道为什么做,是一位优秀的程序员。
- 基础不稳,面对技术复杂的系统,如同盲人摸象、管中窥豹,只得其门不得其法。(@rango)
下面总结的是使用 PHP 开发过程中,在实现相应功能之后,多的那么一些思考和研究。
鉴于本文的话题较广,因此本文会肯定会随着我研究的继续而定期更新。
内核/底层
SAPI
In other words, SAPI is an application programming interface (API) provided by the web server to help other developers in extending the web server capabilities.
PHP 常见的两种 SAPI
- Web/CGI SAPI
浏览器 => Web 服务器(Apache/Nginx)=> Web/CGI SAPI => PHP => Zend。
- CLI SAPI
CLI SAPI => PHP => Zend。
CLI PHP 和 CGI PHP
CLI PHP 曾(3.0+)基于 CGI PHP ,但是直到 PHP 4.2.0 才从 CGI PHP 中独立出来。
两者功能非常类似,主要的区别在于:
- CLI 是 PHP 功能的基础部分
- CLI 没有只是 CGI 需要的和 Web 服务器相关的接口,不会导入
$_GET
/$_POST
等变量,也不会输出 MIME 头信息 - CLI PHP 的运行机制和 Linux Shell 基本一样
- CLI PHP 有着和 CGI PHP 不同的默认值和 php.ini 设置
内存泄漏
内存泄漏(Memory Leak)
,我个人简单的理解是:
内存中的一块空间 A,在程序的所有作用域中已经没有任何变量指向 A(理应被标记为垃圾),但是却存在作用域外的另一个内存空间 B 对它保持着引用状态,B 会阻止垃圾回收机制(GC)回收 A,这种现象是内存泄漏。
1 | $a = ['v']; // 产生一个变量容器 |
如果此时 unset 掉 $a,则会发生内存泄漏。
尽管不再有某个作用域中的任何符号指向这个结构(就是变量容器),由于数组元素“1”仍然指向数组本身,所以这个容器不能被清除 。因为没有另外的符号指向它,用户没有办法清除这个结构,结果就会导致内存泄漏。
庆幸的是,php将在脚本执行结束时清除这个数据结构,但是在php清除之前,将耗费不少内存。
如果你要实现分析算法,或者要做其他像一个子元素指向它的父元素这样的事情,这种情况就会经常发生。
当然,同样的情况也会发生在对象上,实际上对象更有可能出现这种情况,因为对象总是隐式的被引用。
扩展
Swoole/PHP-X/EasySwoole
扩展开发
如果你有如下的应用需求,那么你可能会开始接触 PHP 扩展开发。
- 封装当前 PHP 尚不支持而有需要让 PHP 用到的 C/C++ 库
- 通过扩展重写一些性能较差的 PHP 代码
- 改善现有扩展
- 与其他语言编写的库交互
鉴于 PHP 扩展开发涉及到的东西较多,我会在其他的文章中再详细讨论,这里不详细讨论。
https://stackoverflow.com/questions/645814/reading-a-git-repository-without-git
语法
可变函数参数
在 PHP 5.6 及以上的版本中,由 … 语法实现;在 PHP 5.5 及更早版本中,使用函数
func_num_args()
,func_get_arg()
,和func_get_args()
。
- 使用
…
运算符定义变长参数函数
1 | function f($req, $opt = null, ...$params) { |
- 使用
…
运算符进行参数展开
1 | function add($a, $b, $c) { |
在其他编程语言,比如 Ruby中,这被称为连接运算符。
前期静态绑定与后期静态绑定
1 | class A |
nowdoc 和 heredoc
nowdoc: PHP 5.3.0
两者用途都是为了给变量插入大段的字符串,语法基本相似,区别主要有两点:
- nowdoc 只是会单纯地输出大段字符串,而不会转换和解析字符串段中的任何变量。
- nowdoc 的字符串段区分符需要用单引号包裹起来。
举例说明:
1 | $var = 1024; |
??
和 ?:
??
是从 PHP 7.0 开始引入的语法糖,而 ?:
是从 PHP 5.3 开始就有的。两者的区别是:
??
:如果变量存在且值不为NULL, 它就会返回自身的值,否则返回它的第二个操作数。?:
:表达式 expr1 ?: expr3 在 expr1 求值为 TRUE 时返回 expr1,否则返回 expr3。
PDOStatement bindValue
VS bindParam
1 | // bindParam() |
构造函数
PHP 无默认构造函数
PHP 没有默认构造函数。因此,如果调用类似 parent::__construct()
出现致命错误,可以先检查父类有无构造函数。
exit/die
如果在构造函数中使用了 exit
或die
,析构函数仍然会执行。
返回值
除非构造对象后显式地再调用一次构造函数可以拿到其返回值外(不推荐,属性可能丢失),一般情况下,直接使用 new
创建一个对象时,构造函数则会表现出“没有返回值”的现象
抛异常来产生错误
鉴于构造函数不能有返回值,因此如果在创建对象的时候如果因为一些初始化属性不合法想要产生错误,则最好使用抛异常的方式。
析构函数
无参数
析构函数不能有参数。
执行时机
- 对象被注销: 不再有任何变量引用该对象。
- 请求结束: PHP 执行引擎会在一个请求结束后调用析构函数。
用途
- 当对象被注销时记录一些日志信息。
- 链式调用时,为了保证链式调用的连贯性,可以在析构函数中执行一些默认行为。
举例说明:
1 | class View |
注意事项
- PHP 不能准确给出对象析构函数被调用时的准确时间。对象被注销后,析构函数可能回延迟一段时间才被执行。
- 不要在析构函数中引用其他对象,因为其他对象的可用性不能保证,可能之前就被注销了。
浮点数精度问题
1 | // 问题示例: |
生成器
判断命名空间是否存在
可使用 class_exists()
来检查命名空间是否存在.但是,但如果某些情况下报错 :undefined costant
,可以检测命名空间开头是否有反斜线 \,若有则去掉。
Trait
- 概念&特点
- Trait 是为了单继承语言而准备的一种代码复用机制。
- Trait 和 Class 相似,它为传统的继承增加了水平的特性的组合,多个无关的 Class 之间不需要互相继承
- Trait 使得无关的 Class 可以使用相同的属性和方法。
- Trait 本身就是一个类的子集,不具备事先了解类成员是否冲突的能力。
PHP 5.4 以上便可以使用 Trait 特性。
- 优先级:当前类的成员高于 Trait 中的成员,而 Trait 则高于被继承的成员。
- Trait 间冲突
如果某个类引入的多个 trait 都包含了同名的方法,则会产生致命错误:
1 |
|
Trait 定义了一个属性后,类就不能定义同样名称的属性,否则会产生 fatal error
。 有种情况例外:属性是兼容的(同样的访问可见度、初始默认值)。(在 PHP 7.0 之前,属性是兼容的,则会有 E_STRICT 的提醒)
方法冲突解决办法示例:
1 |
|
- 修改 trait 内方法的访问修饰符
1 |
|
- trait with trait
1 |
|
- trait 中使用抽象方法约束类行为
1 |
|
#应用
防止重复提交表单
- PRG:https://stackoverflow.com/questions/10827242/understanding-post-redirect-get
- 时间戳判断 过滤同一用户高频率的同一请求
- 执行非幂等操作前先判断数据是否已存在、已更新
- 客户端:点击提交表单后禁用按钮。
模版
PHP 本身就是一门模版语言,因此可以这么使用:
1 | <p> |
其中标签 <?= ?>
之中的 PHP 代码可以没有分号结尾,里面的所有变量默认会被当作字符串输出(<?php echo)
,因此,如果不是标量类型的变量使用这种标签则会错误提示。
相反,<?php ?>
标签就是标准的 PHP
开始结束标签了,里面的 PHP
代码要完全符合正常 PHP 语法。
此外,PHP
还具有一个 short_tag 配置项,当它被设置为 On
时,可以使用更短的起始标签 ?> 来包裹 PHP 代码。不过不推荐,因为这种标签会和 XML 冲突。
时间日期
- 计算两个日期之间的天数
1 | $start = new Datetime('2017-01-01'); |
计算时间日期等最好使用可靠的库,手动计算容易出错。
设计/思想
探索技术背后的原理,学习技术背后的设计思想,才是偷不走的不可替代性。
DDD
Domain driven deign。
领域驱动设计。
微服务
- PHP-MSF开发手册
环境
CGI/FastCGI/PHP-FPM
PHP-FPM(FastCGI Process Manager:FastCGI进程管理器)是一个PHPFastCGI管理器
PHP
解释器实际上只有 php-cgi
,即只是一个单纯的 CGI
程序,php-cgi
的工作原理很纯粹,能且只能干:
- 解析 php.ini 文件,初始化执行环境
- 解析请求
- 返回结果
其中,第一步中的“初始化执行环境”是 PHP 早期产生性能问题的主要原因,为了解决这个问题,fastcgi 协议改善了上述工作流程:
“首先,Fastcgi会先启一个master,解析配置文件,初始化执行环境,然后再启动多个worker。当请求过来时,master会传递给一个worker,然后立即可以接受下一个请求。这样就避免了重复的劳动,效率自然是高。而且当worker不够用时,master可以根据配置预先启动几个worker等着;当然空闲worker太多时,也会停掉一些,这样就提高了性能,也节约了资源。这就是fastcgi的对进程的管理”。
修改 php.ini 之后,php-cgi 进程是没办法平滑重启的。php-fpm 能够实现“平滑重启”的原理也很简单:新的 php-cgi worker
用新的配置,已经存在的 php-cgi worker 处理完本次请求后就退出。
nginx+php-fpm 自定义 HTTP Header
添加到 HTTP 请求中的自定义 Header
格式必须为 A-B-C
(-/英文横线),而 PHP $_SERVER
变量得到的就会是:HTTP_A_B_C
。
其他格式则不会被正确获取到,除非修改 nginx
配置 underscores_in_headers
为 On
,See:Module ngx_http_core_module#underscores_in_headers。
生产环境常用配置
zend opcache(不能同时使用 zend guard loader)
Zend OPcache 通过 opcode 缓存和优化提供更快的 PHP 执行过程。它将预编译的脚本文件存储在共享内存中供以后使用,从而避免了从磁盘读取代码并进行编译的时间消耗。同时,它还应用了一些代码优化模式,使得代码执行更快。
当解释器完成对脚本代码的分析后,便将它们生成可以直接运行的中间代码,也称为操作码(Operate Code,opcode)。Opcode cache 的目地是避免重复编译,减少 CPU 和内存开销。如果动态内容的性能瓶颈不在于 CPU 和内存,而在于 I/O 操作,比如数据库查询带来的磁盘 I/O 开销,那么 opcode cache 的性能提升是非常有限的。但是既然 opcode cache 能带来 CPU 和内存开销的降低,这总归是好事。
现代操作码缓存器(Optimizer+,APC2.0+,其他)使用共享内存进行存储,并且可以直接从中执行文件,而不用在执行前“反序列化”代码。这将带来显着的性能加速,通常降低了整体服务器的内存消耗,而且很少有缺点。
1 | opcache.enable=1 |
php-fpm
- 工作进程分配模式
在 fasgcgi 模式下,php-fpm 会启动多个子进程,来处理 nginx 发来的请求。
1 | pm = static | dynamic | ondemand |
static 模式: 表示启动时创建的 php-fpm 子进程数量是固定的,此时只有 pm.max_children 这个参数生效。
dynamic 模式: 表示启动的子进程数是有请求量动态变化的,受 pm.max_children/pm.start_servers
/pm.min_spare_servers
/pm.max_spare_servers
共同决定。
工作模式选择原则:小内存机选动态,省内存;大内存机选静态。
不过,动态模式下,进程的动态创建和回收本身也需要占用服务器资源。
如果你的内存很大,有8-20G,按照一个php-fpm进程20M算,100个就2G内存了,那就可以开启static模式。如果你的内存很小,比如才256M,那就要小心设置了,因为你的机器里面的其他的进程也算需要占用内存的,所以设置成
dynamic
是最好的,比如:pm.max_chindren = 8
, 占用内存160M
左右,而且可以随时变化,对于一般访问量的网站足够了。
- 慢日志
1 | slowlog = var/log/php-fpm.log.slow # 必须在 request_slowlog_timeout 前定义 |
性能
TODO…
FAQ
use \\\\
instead of \\
。(Regex Tester)
- headers already set
https://stackoverflow.com/questions/8028957/how-to-fix-headers-already-sent-error-in-php.
- curl 工作不正常?
curl URI 中含有空格会请求失败。
参考
Book
Link
- What is SAPI and when would you use it?
- Where can I learn about PHP internals? [closed]
- Zend API: Hacking the Core of PHP
- PHP7扩展开发教程[1] – 怎样导出一个模块?
- motecshine/php-ext-design-patterns
- PHP The Right Way
- PHP Best Practices-A short, practical guide for common and confusing PHP tasks
- when using self, parent, static and how?
- php exec() is not executing the command
- Post/Redirect/Get-Wikipedia
- 腾讯PHP工程师面试题两份
- PHP interfaces IteratorAggregate vs Iterator?
- PHP’s nowdoc strings
- What is the difference between bindParam and bindValue?
- Implementing Domain-Driven Design in Laravel
- php高并发知识栈
- php-fpm参数优化
- php-fpm.conf & php.ini 安全优化实践
- php-fpm的配置和优化
- 分析 PHP 应用程序以查找、诊断和加速运行缓慢的代码
- PHP高效率写法(详解原因)