新手完全按照手冊來的,自己嘗試用后臺的中國農業網新聞做測試,把原來的規則匹配改為chrome提取的xpath卻一直抓不到數據,反倒是用chrome或xpathhelper插件匹配都是可以的,是規則寫的不對么?
比如抓標題"https://www.zgny.com/news/nongyeyaowen/201805/60978.html",寫xpath規則為"/html/body/div[@class='qhbg']/div[@class='m'][2]/div[@class='hnw_xwzx_left']/div[@class='chy_contents_c1']/h1" 在chrome中調試就有數據,在系統測試就抓不到標題
測試了下可以抓取到xpath
你的運行環境發下
admin 發表于 2018-5-12 21:54
測試了下可以抓取到xpath
操作系統 Linux 3.10.0-514.26.2.el7.x86_64
運行環境 Apache
數據庫 mysql 5.5.57-log
PHP版本 5.6.34
上傳限制 50M
我試了下屬性選無可以采集到

- 1藍天采集器循環入庫的數據不到數據庫
- 2狂雨小說CMS-狂雨小說下載-采集規則-導入方法
- 3163K網站系統公眾號模板消息配置教程
- 4藍天采集器請教一下,如何采集js里的數據?
- 5163K網站系統登錄滑動驗證-阿里人機驗證配置教程
- 7藍天采集器如何倒序采集
- 8pbootcms藍天采集器發布插件制作參數教程
- 9藍天采集器采集器時間問題
- 10藍天采集器安裝出現問題了,安裝不了
- 11藍天采集器WORDPRESS采集數據后不入庫
- 12藍天采集器能不能在或者內容頁的時候也能用XPATH
- 13Xpath不固定元素列表規則寫法
- 14藍天采集器發布數據庫
- 15藍天采集器采集今日頭條
- 16藍天采集器關于自動采集 多個任務
- 17PbootCMS獲取結果頁面的搜索keyword值和tag值
- 18藍天采集器自動采集不定時停止運行
- 19藍天采集器求教內容頁網址采集規則設置
- 20藍天采集器關于列表頁當作內容頁采集的疑問
-
搜索引擎SEO優化需要了解它的運算邏···
很多站長都會以為把文章提交后,蜘蛛進來抓取,就會收錄。于是每天大量更新文章, 等待收錄,久而久之,網站就會出現很多垃圾文章。文章的收錄都有固定的流程,并不像一 些站長認為的那樣輕而易舉。 蜘蛛抓取的流程主要分為四個步驟:抓 、過濾···
-
網頁HTTP狀態代碼404/503/···
學習SEO首先需要對HTTP協議(超文本傳輸協議)有一個詳細的了解,他能為我們以后的SEO應用解決很多問題。如果向您的服務器發出了某項請求要求顯示您網站上的某個網頁(例如,當用戶通過瀏覽器訪問您的網頁或在抓取該網頁時),那么您的服務器會返回···
-
藍天采集器自動采集不定時停止運行
自動采集不定時的停止運行怎么辦,有的時候是采集完就停止了,有的時候每天停2次 操作系統 Linux 3.10.0-514.26.2.el7.x86_64 運行環境 Apache 數據庫 mysql 5.5.57-log P···
-
PbootCMS如何修改上傳格式和支···
廢話不多說,PbootCMS碰到需要修改文件上傳格式的時候,首先去/config/config.php里修改upload配置信息,一般情況下,這里修改后就ok了。這邊以一個圖片格式為例來介紹,本文栗子上場→webp格式圖片。什么是WebP格···
-
PbootCMS文章通過keywor···
有時客戶想根據keywords關鍵字來做匹配在文章詳情頁里顯示相關內容,同樣帶有一樣的關鍵字的。解決辦法通過翻看手冊發現有個通過tags來做匹配的方法,然而此次網站不用tags,那么直接二開下程序代碼關鍵位置即可實現。打開ppshomec···