php curl 模拟搜索引擎爬虫实例 360Spider

来源: 老季博客
日期: 2016-10-17
作者: 腾讯云/服务器VPS推荐评测/Vultr
阅读数: 54

PHP 使用Curl函数模拟搜索引擎蜘蛛爬虫,我们这里以so.com (360Spider)为例:

<?php	
    print_r(_GetContent('http://www.laoji.org'));
    /**
     * cURL获取网页内容
     */
    function _GetContent( $url )    {
        $curl = curl_init();//初始化一个curl会话;
        curl_setopt($curl,CURLOPT_URL,$url);//指定访问的url
        curl_setopt($curl,CURLOPT_USERAGENT,"Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; Trident/5.0); 360Spider");
        curl_setopt($curl,CURLOPT_POST,$data);//post请求的参数,
        curl_setopt($curl,CURLOPT_RETURNTRANSFER,1);//获取的信息以文件流的方式返回

        $data = curl_exec($curl);//执行curl;
        curl_close($curl); // 关闭CURL会话
        return $data;
    }

 

链接到文章: https://jiloc.com/42923.html

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注