提取 URL 中的根域名部分,找了一大圈,很多都是通过域名后缀进行匹配,虽说能实现,但是这样的做法过于繁琐,而且众所周知,域名后缀这种东西,动不动就在更新。
以下案例通过正则方式进行匹配,亲测适用于绝大多数场景。
/**
* $url 要进行提取的 URL
* $tld 是否返回顶级域名后缀
*/
function getBaseDomainByUrl($url, $tld = false)
{
$pieces = parse_url($url);
$domain = isset($pieces['host']) ? $pieces['host'] : '';
if (preg_match('/(?P<domain>[a-z0-9][a-z0-9\-]{1,63}\.[a-z\.]{2,6})$/i', $domain, $m)) {
return ($tld === true) ? substr($m['domain'],($pos = strpos($m['domain'], '.')) !== false ? $pos + 1 : 0) : $m['domain'];
}
return false;
}
// 结果:iddahe.com
echo getBaseDomainByUrl('https://www.iddahe.com/zblog/66.html');(完)
