簡數(shù)采集器列表頁提取器的默認配置規(guī)則:獲取a標簽的href屬性值作為采集的鏈接網(wǎng)址,對于大部分網(wǎng)站都是適用的;
但有些網(wǎng)站不使用a標簽作為鏈接跳轉(zhuǎn),而用javascript的onclick事件替代,那列表頁提取器的默認規(guī)則將無法獲取到鏈接網(wǎng)址。
先按常規(guī)配置,獲取鏈接跳轉(zhuǎn)的元素內(nèi)容,再點擊url字段的設(shè)置進入字段數(shù)據(jù)處理界面;
選擇 “高級配置” 選項卡 ==》把 “只獲取網(wǎng)址” 勾去不選擇 ==》提取值類型選擇 “節(jié)點屬性” ==》屬性名填寫 onclick ==》保存
選擇 “日期等正則提取” 選項卡 ==》正則捕獲組處填寫 openW\('(.*)'\) ==》測試 ==》沒問題,保存。
如果是另一種 javascript:location.href 的常見方式,正則捕獲組處填寫href='(.+?)'