QueryList removeHead()


移除页面头部head区域,乱码终极解决方案,采集出现不可解决的乱码问题的时候,可以尝试调用这个方法来解决乱码问题。

{danger} 当调用这个方法后,无法选择页面中head区域里面的内容。

用法


  1. $html = file_get_contents('http://www.baidu.com/s?wd=QueryList');
  2. $ql = QueryList::rules([
  3. 'title'=>array('h3','text'),
  4. 'link'=>array('h3>a','href')
  5. ]);
  6. $data = $ql->setHtml($html)->removeHead()->query()->getData();
  7. print_r($data);