php获取网站内容
随着Web(万维网)技术的发展,获取网站内容,是越来越普及的网站程序开发中的必备技术。今天,让我们来看看使用PHP技术如何获取网站内容的简单方法。
首先,无论获取什么网页,都是先获取网页内容,这里使用PHP的函数 file_get_contents()函数。它可以以字符串的形式将远程服务器上的文件内容获取到本地,简化了网络编程的复杂过程。
比如要获取网页页面的标题,只需要使用 file_get_contents() 将网页内容获取到本地后,再进行正则表达式匹配即可获取要查询的标题,下面给出一个实例:
$url="http://www.example.com";
$html=file_get_contents($url);
preg_match("/
print_r($title[1]);
此外,使用PHP的preg_match_all()函数可以批量搜索网页指定标签内的值,比如以下例子从网页搜索所有img标签的src地址:
$html = file_get_contents('http://www.example.com/');
$img_srcs = array();
preg_match_all("/]*src\s*=\s*[']?([^'\s]*)[']?\s*[^>]*>/ims",$html,$img_srcs);
$img_srcs = $img_srcs[1];
print_r($img_srcs);
以上就是使用PHP获取网站内容带标题的简单方法。不同的网站内容抓取需要更多的正则表达式应用,除此之外,PHP还有curl等网络编程开发技术。通过合理组合,大大方便开发者从网络上获得需要的信息。