藍天采集器采集器取消了自動補全網址,還是會自動補全

2018-08-30 163 19 編輯:簡單就好 來源:藍天采集社區

之前設置了補全網址,然后改了不補全網址了,但是還是自動補全了,用內容替換頁去不掉網址,有人知道怎么回事嗎?
嗯,這是個bug
暫時解決》內容替換:

  1. <a href="([^"]+)"
復制代碼
  1. <a href="填寫域名$1"
復制代碼
我也遇到了,弄得我死去活來,各種檢查也沒搞定。原來真是bug啊
admin 發表于 2018-8-31 21:33
嗯,這是個bug
暫時解決》內容替換:

我為了這個弄了兩個小時,死去活來啊,不懂正則表達式,所以內容替換弄不好。
我采集到的是a標簽內容磁力鏈接,補全網址之后就不能用了,應該怎么替換呢? 鏈接不在a標簽中就不會自動補齊
你直接提取鏈接即可,比如規則寫
  1. <a href="[內容1]">
復制代碼
admin 發表于 2018-9-9 21:38
鏈接不在a標簽中就不會自動補齊
你直接提取鏈接即可,比如規則寫

謝謝建議,只是因為鏈接有很多,而且分段標題,單獨采集很難后期組合。
所以我整段采集然后整體做處理比較現實。
最后唯一的問題就是磁力鏈接在 a標簽內被強制補齊。

我現在是采集后,在數據庫中批量替換關鍵詞來處理的。如果后續能修復網址補全這個問題就太好了。
admin 發表于 2018-9-9 21:38
鏈接不在a標簽中就不會自動補齊
你直接提取鏈接即可,比如規則寫

這個我知道,因為數據特點,這樣會造成后面數據處理的麻煩,所以只能整體采集。
不過,數據庫替換也還好,采集完成后一鍵批量處理。 暫時解決不了,后期修復 我的好像沒遇到過這樣的問題呢、取消了就取消了
qijianchuan 發表于 2018-9-21 23:32
我的好像沒遇到過這樣的問題呢、取消了就取消了

已經修復了

相關知識點: 鏈接 內容 發表于
本站文章均為蜀戎網絡摘自權威資料,書籍,或網絡原創文章,如有版權糾紛或者違規問題,請即刻聯系我們刪除,未經允許禁止復制轉載!感謝...

在線
客服

在線客服服務時間:9:00-21:00

客服
熱線

13227777380
7*24小時客服服務熱線

客服
微信

掃一掃微信咨詢
頂部
最近2019年免费中文字幕电影,最近更新2018中文国语字幕,最近中文字幕2018高清一页,一二三四免费观看视频中文版在线