代理加盟 2019全新代理計劃 賺錢+省錢雙管齊下,獨立平臺,豐厚利潤!

您現在的位置: 秀站網 > 織夢大學 > 織夢采集 >

織夢后臺自帶采集工具使用教程

來源:未知 發布時間:2019-04-13熱度:我要評論
織夢后臺自帶一個采集工具,但是大家貌似都很陌生,可能因為不實用吧,也可能市場上有更好的工具來替代,上一篇教程 最詳細火車頭數據采集系統DedeCMS發布文章攻略 ,我們也介紹了今天我們來介紹下織夢后臺自帶采集功能使用方法,dedecms自帶了文章和圖片采集功能,對...

織夢模板免費下載,無需注冊無需充值

織夢后臺自帶一個采集工具,但是大家貌似都很陌生,可能因為不實用吧,也可能市場上有更好的工具來替代,上一篇教程最詳細火車頭數據采集系統DedeCMS發布文章攻略,我們也介紹了今天我們來介紹下織夢后臺自帶采集功能使用方法,dedecms自帶了文章和圖片采集功能,對于不熟悉的新手建站,采集規則配置起來很麻煩,經常在采集時出錯,或者亂碼,現在就向朋友介紹dedecms的采集功能。

一、進入采集節點管理界面,在后臺管理界面的主菜單中單擊“采集”,然后單擊“采集節點管理”,即可進入采集節點管理界面。

二、在采集節點管理界面中,單擊左下角的“增加新節點”或者右上角的“添加新節點”如圖,都可進入“選擇內容模型”界面,如圖所示,

織夢后臺自帶采集工具使用教程
 
 

三、設置節點基本信息

織夢采集,采集工具,織夢后臺采集功能使用

 

四、目標頁面編碼:設定被采集目標頁的編碼格式,有GB2312、UTF8和BIG5三種。可通過在被采集目標頁面上,單擊右鍵后選擇“查看源文件”來獲取。

 
操作步驟:
 
(a)打開被采集的目標頁:http://網站域名/knowledge/web-based/dreamweaver/;
 
單擊右鍵后選擇“查看源文件”,找到“charset
 
織夢后臺自帶采集工具使用教程
 

五、其等號后面的代碼就是所需的“編碼格式”,這里是“gb2312”。

“區域匹配模式”:設定如何匹配所需采集的內容部分,可采用字符串或者正則表達式。系統默認的模式是字符串。如果比較了解正則表達式的朋友,可以在這里選擇正則表達式的模式。

“內容導入順序”:指定文章列表導入時候的順序,可以選擇“與目標站一致”或“與目標站相反”。

“防盜鏈模式”:針對被采集的目標站點有無刷新限制。一開始很難判斷出來,需要測試后才能知道。如果有的話,這里需要設置一下“資源下載超時時間”。

“引用網址”:填入任何一個即將被采集的文章內容頁面的網址。

在已打開的文章列表頁中,單擊第一篇文章的

織夢采集工具,織夢采集使用教程

六、此時在瀏覽器的URL地址欄中顯示的網址,即為需要填寫在“引用網址”處的網址,如(圖)所示

織夢采集工具,織夢采集教程

七、到這里,“節點基本信息”就設置完成了。最后結果,如(圖)所示,

織夢采集工具,織夢采集插件,采集教程

八、檢查無誤后,進入下一步設置。設置列表網址獲取規則

采集工具,采集插件,織夢采集使用

這里是設置被采集的文章列表頁的匹配規則。如果被采集的文章列表頁有一定的規律,可選擇“批量生成列表網址”;如果被采集的文章列表頁完全沒有規律可循,那么可選擇“手工指定列表網址”;如果被采集的站點提供了RSS,則可以選擇“從RSS中獲取”。對于特殊情況,例如:部分列表頁有規律,而其余的又沒有規律,則可在“匹配網址”中填上有規律的部分,然后把沒有規律的部分填寫在“手動指定網址”。

 

本文地址:http://www.yxrxyy.live/dedecms_cj/1633.html

責任編輯:秀站網

    發表評論

    評論列表(條)

      北京28是什么彩票