如果需要采集的內(nèi)容不都在詳情頁(yè),部分在詳情頁(yè)的分頁(yè)或下級(jí)頁(yè)面(跳轉(zhuǎn)子頁(yè)面)中,例如內(nèi)容分頁(yè),下載頁(yè),多選項(xiàng)卡頁(yè)等,可使用簡(jiǎn)數(shù)采集器的分頁(yè)采集功能來(lái)解決,具體使用方法如下:
簡(jiǎn)數(shù)采集器實(shí)現(xiàn)內(nèi)容分頁(yè)采集,只需簡(jiǎn)單幾步配置采集分頁(yè)區(qū)域即可,操作步驟如下:
1)在詳情頁(yè)提取器,先完成正文內(nèi)容(content字段)的基礎(chǔ)采集配置;
2)勾選content字段的【該字段內(nèi)容有多分頁(yè)】選項(xiàng);
3)啟用【分頁(yè)點(diǎn)選開(kāi)關(guān)】 (顯示 √ 標(biāo)志),然后點(diǎn)選分頁(yè)所在區(qū)域,保存完成配置;
當(dāng)采集內(nèi)容在詳情頁(yè)內(nèi)的鏈接指向頁(yè)面時(shí)(即下級(jí)頁(yè)面,例如下載頁(yè)、多選項(xiàng)卡頁(yè)等),可按以下操作獲?。?br>
在詳情頁(yè)提取器中,勾選對(duì)應(yīng)字段的【該字段內(nèi)容有多分頁(yè)】選項(xiàng) -》啟用【分頁(yè)點(diǎn)選開(kāi)關(guān)】 (顯示 √ 標(biāo)志),然后選擇包含下級(jí)頁(yè)面跳轉(zhuǎn)鏈接的區(qū)域。
比如下圖,課程介紹是詳情頁(yè),還需要采集章節(jié)目錄頁(yè)里的內(nèi)容,對(duì)應(yīng)字段分頁(yè)區(qū)域則應(yīng)選擇包含章節(jié)目錄跳轉(zhuǎn)鏈接的區(qū)域。
在瀏覽器訪問(wèn)跳轉(zhuǎn)頁(yè)面鏈接(如章節(jié)目錄頁(yè)面),獲取要采集的目錄內(nèi)容區(qū)域的xpath值:
//*[@class="chapter-ul"]
備注:如何獲取xpath值可查看《Xpath常見(jiàn)語(yǔ)法使用詳細(xì)教程》。
在簡(jiǎn)數(shù)采集器詳情頁(yè)提取器對(duì)應(yīng)字段的當(dāng)前字段Xpath處,填寫(xiě)下級(jí)頁(yè)面內(nèi)容的xpath值://*[@class="chapter-ul"],保存后測(cè)試采集,檢查效果。