上一篇內容里面我們講解了PbootCMS藍天采集器安裝的教程,如有不明白的可以好好看下,話不多說我們繼續。
第一步:登錄我們藍天采集器:地址為:你的網址/(子目錄或是欄目名稱)/index.php?s=/Admin/Index/index
輸入我們創建的用戶名和密碼登錄進去。我們的后臺是一個響應式的,匹配所有的終端,不用擔心兼容性或者瀏覽不好的效果。
點擊:設置---進入采集設置(站點設置和郵件設置這里后期可以自行去研究,一般是用不到的)
這里都沒有什么需要注意的;多樹就默認就好,選擇好了就保存吧。
圖片本地化設置:圖片路徑建議設置為我們網站默認的,地址也是一樣,后期我們一旦不使用這個采集插件了可以直接刪除掉不會影響我們的圖片路徑。設置完成記得選擇保存。
頁面渲染和代理、翻譯這里講一下:
頁面渲染意思就是采集的時候的頁面和我們打開瀏覽是一樣的,我們的這個采集規則是利用的爬蟲原理,去采集的時候是看不到樣子的是從html里面去抓取的。這個渲染一般都是采集比較復雜或是困難的網站才需要用到,藍天采集器里面默認是谷歌瀏覽器。
代理:這個是IP,有些復雜的網站我們頻繁去采集是會封禁IP的,這時候我們就可以選擇使用這個代理IP,現在這個版本是可以批量添加的非常方便。
翻譯:默認是集成了有道,百度和騰訊翻譯,這個可以隨便選擇,我們只需要去他們的官網注冊一個開發著賬號把APPID和密鑰填寫進來就好了,后期我們采集回來的內容就可以實現自動翻譯并發布(這里就會用到我們的函數插件)。
以上的設置就沒有了,接下來就是添加任務。
點擊任務列表----添加任務:設置好以后點擊保存。
以上呢就是我們PbootCMS藍天采集器采集使用教程采集任務設置,接下來我們進入采集規則設置請點擊這里:PbootCMS藍天采集器采集使用教程二采集規則發布設置
相關知識點: PbootCMS藍天采集器采集規則 PbootCMS藍天采集器設置 藍天采集器- 1PbootCMS列表內容ajax無刷新加載數據
- 2藍天采集器米拓安裝藍天采集器詳細教程哪位高人有啊
- 3網站的外鏈資源圈如何來建立
- 4藍天采集器藍天采集器安裝好后仍提示安裝
- 5藍天采集器請問怎么采集新浪的這段網址
- 6163K網站系統安裝微信商戶api證書教程
- 7PbootCMS藍天采集器采集使用教程二采集規則發布設置
- 8藍天采集器可以在任務列表做一個復制的功能嗎?
- 9藍天采集器登錄密碼忘記了找回密碼的2種方法
- 10藍天采集器只能翻譯一個字段。
- 11如何獲取當前頁面cookie填寫在藍天采集器里面
- 12藍天采集器有沒有附件同步到OSS服務器這么一說?
- 13藍天采集器開啟循環入庫后,將以第一個循環字段的數量為準
- 14藍天采集器請教58同城采集規則設置
- 15藍天采集器工具里面能否增加一項,把采集到的數據轉換為時間戳
- 16藍天采集器群主希望能支持destoon7.0
- 17藍天采集器請問有時候自動采集會停止時我配置參數不對嗎
- 18PbootCMS縮略圖上傳圖片變模糊為什么?
- 19json采集功能點說明
- 20藍天采集器百度知道問題列表頁測試抓取獲取不到問題列表?
-
藍天采集器發布設置里綁定本地cms程···
發布錯誤:無法加載數據庫驅動: ThinkDbDriverPdo_mysql 不支持Pdo_mysql嗎 已經是pdo驅動直接用mysql或mysqli就可以
-
藍天采集器請問像問答這種模塊怎么采集···
主要看怎么入庫,直接作為整篇文章,字段規則 勾選 允許匹配多個元素》拼接為文本 即可 如果提問者的內容先入庫,回答者的內容再循環入庫,還是自定義插件寫個發布方法好操作
-
藍天采集器怎么才能循環采集某個頁面的···
前提:把列表頁當作內容頁采集 這個列表頁中有10條我想要采集的數據 但是程序現在只采集第一條,后面的怎么循環采集? 你設置了幾個源網址 如果是一個網址里面匹配多個同類型數據,直接編輯字段 勾選 允許匹配多個元素 就可以 如果想把一個網址里···
-
藍天采集器藍天采集器應該添加可以保存···
藍天采集器應該添加可以保存在本地txt格式 可以設置指定保存路徑目錄 admin 發表于 2018-6-6 20:46 哦,用分隔符?可以考慮考慮 不用分隔符, 就是直接保存一行一篇文章 你怎么不設置個贊助支付鏈接呀, txt不支持多個···
-
藍天采集器采集騰訊企鵝號自媒體內容教···
騰訊企鵝號自媒體內容每天的閱讀量是非常高的,它可以實時的吧我們發布的內容推送到騰訊自家的客戶端上面;比如:天天快報、騰訊新聞客戶端、微信新聞插件、手機QQ新聞插件、手機騰訊網、QQ瀏覽器等網絡媒體中傳播,曝光轉化率不會遜色于微博頭條等。今天···