最新消息: 新版网站上线了!!!

php获取百度搜索url真实网址

具体生成的算法肯定不知道,但是可能明确 每个url参数的值都对应该一个地址。根据长度来看的话像是可逆的,其实不考虑他用啥散列算法了,生成这么一个字符串我想它的主要还是想统计用,如果百度搜索结果被程序抓取,那么直接匹配出搜索结果的链接就可以自己伪装一个搜索引擎了,那么对于结果的点击百度也统计不到了。原理就是通过这个参数解析成目的网站,然后进行跳转。那么这样就必须得经过百度了。

根据这个原理,就请求一次,获取响应的location就找对对应的网址了。php代码如:

$url = "http://www.baidu.com/link?url=NG5rRHoP_U6OF55nvq5Ok_6P7FQFTeKtJ1S0kVK8l68gFfeeOauHg-xNhIjWHYNs";

 

$info = parse_url($url);

 

$fp = fsockopen($info['host'], 80,$errno, $errstr, 30);

fputs($fp,"GET {$info['path']}?{$info['query']} HTTP/1.1\r\n");

fputs($fp, "Host: {$info['host']}\r\n");

fputs($fp, "Connection: close\r\n\r\n");

$rewrite = '';

while(!feof($fp)) {

   $line = fgets($fp);

   if($line != "\r\n" ) {

       if(strpos($line,'Location:') !== false) {

           $rewrite = str_replace(array("\r","\n","Location: "),'',$line);

       }

   }else {

       break;

   }

}

echo $rewrite;//输出http://tieba.baidu.com/p/1668410830

转载请注明:谷谷点程序 » php获取百度搜索url真实网址