簡數(shù)采集器支持采集網(wǎng)頁中的下載地址、網(wǎng)盤地址或資源地址。
獲取下載地址的詳細(xì)操作方法:
先在網(wǎng)頁源代碼中確認(rèn)是否有下載地址,在Html標(biāo)簽的哪個屬性。
在瀏覽器訪問要采集的網(wǎng)頁,鼠標(biāo)右鍵點擊【查看網(wǎng)頁源代碼】選項。
注意:如果下載地址是需登錄后才顯示,請先登錄再查看網(wǎng)頁源代碼。
在網(wǎng)頁源碼頁面,點擊瀏覽器右上角控制菜單的查找功能(快捷鍵為Ctrl+F),搜索下載地址是否存在,沒有則不支持采集。
下載地址一般是在a標(biāo)簽的href或data-url等屬性,示例圖為data-url屬性。
在簡數(shù)采集器的詳情頁提取器,按照以下步驟獲取下載地址:
2-1)使用已有字段或新添加一個字段(字段命名不能用標(biāo)點符號)來專門獲取下載地址;
2-2)先點選到要采集的下載按鈕 ,一般是a標(biāo)簽或button標(biāo)簽,如果無法精確點選到請使用【手寫Xpath方法】;
2-3)如果獲取的下載地址是在a標(biāo)簽的href屬性,直接勾上【獲取網(wǎng)址】選項,接著點擊右上角保存按鈕完成配置,測試采集看看結(jié)果;
2-3)如果下載地址是在其他屬性,請打開該字段的字段數(shù)據(jù)處理,點擊【高級提取】選項;
2-4)【提取值類型】選擇節(jié)點屬性,然后在【屬性名】填寫對應(yīng)的屬性名稱,接上圖例子下載地址是在data-url屬性,此處填寫data-url
2-5)保存完成下載地址獲取配置,再測試采集看看結(jié)果;
注意:如果下載地址是在登錄后才顯示,請先【獲取登錄的cookie信息填寫到簡數(shù)采集器】。