熱點(diǎn)聚集

火車頭采集時(shí)采網(wǎng)址

所以下面給出臨時(shí)的解決辦法:我這里是用的火車頭采集器2010sp2個(gè)人版。

商業(yè)版網(wǎng)民的采集后的網(wǎng)址都存儲(chǔ)在 PageUrl目錄里面的,一個(gè)任務(wù)對(duì)應(yīng)一個(gè)db3.大家可以從最上面的任務(wù)往下數(shù)第一個(gè),對(duì)應(yīng)的就是Site_*.db3.這樣大家可以先備份一下,然后清空也不怕了,到時(shí)候直接還原網(wǎng)民名既可以,如果怕出錯(cuò),全部保存,一會(huì)恢復(fù)即可。

如圖:

若想更進(jìn)一步的查看,這一個(gè)db3其實(shí)是sqlite數(shù)據(jù)庫(kù)格式的文件,可以用db3數(shù)據(jù)庫(kù)編輯器查看撰改。根據(jù)jobid查看,有朋友問不知道jobid怎么辦,呵呵,大家可以到 Data目錄查看 3-新浪國(guó)內(nèi)新聞后面的新浪國(guó)內(nèi)新聞就是你自定義的網(wǎng)站欄目名稱。這一個(gè)跟jobid對(duì)應(yīng)上即可。

如圖:

最后大家備份好數(shù)據(jù)庫(kù)以后就可以(需要備份在 PageUrl與 Data目錄的你的任務(wù)名對(duì)應(yīng)的文件夾,最好是全部以防萬一,采集完就可以覆蓋下。)

后來從網(wǎng)站也看到了如下文件,跟我的這篇大同小異。大家可參考下。

火車頭是一個(gè)不錯(cuò)的采集軟件,“盜亦有道”,看你如何利用了。

Linker以前也偶爾研究下火車頭采集軟件,只是一直沒有購(gòu)物商業(yè)版本,想一想,現(xiàn)在的版本遠(yuǎn)沒有以前的1.x和2.x版本來得爽快。

一位兄弟,昨晚說他的火車頭采集軟件(公司版本的哦,有錢人!),總是提示任務(wù)地址庫(kù)重復(fù),研究了下,比較簡(jiǎn)單,告訴了他處理的方法,另外,經(jīng)歷搜索發(fā)現(xiàn),火車頭的3.0 sp1版本有過這一個(gè)bug,清除不掉任務(wù)地址庫(kù),但管理員已經(jīng)在sp2版本中解決掉這一個(gè)問題了。

后來這位朋友又問火車頭采集軟件的任務(wù)地址庫(kù)是哪個(gè)文件?怎么樣保存任務(wù)地址庫(kù)?怎么樣手動(dòng)清理任務(wù)地址庫(kù)文件?據(jù)Linker所知,編輯任務(wù)地址庫(kù),需要是商業(yè)版本了,若想手動(dòng)來處理,可以發(fā)現(xiàn),手動(dòng)地址庫(kù)文件是在火車頭根目錄下的pageurl目錄中,每一個(gè)任務(wù)對(duì)應(yīng)一個(gè)地址庫(kù)文件,mdb格式的,打開可以發(fā)現(xiàn),詳細(xì)地址是被加密了。火車頭也有些太商業(yè)了,嘿嘿!

既然知道任務(wù)地址庫(kù)的位置和文件了,手動(dòng)清理任務(wù)地址庫(kù),自然就簡(jiǎn)單了。刪除讓火車頭重復(fù)(刪除后,編輯該任務(wù),再保存),或直接刪除該庫(kù)里面的記錄,都能。想另存為其他任務(wù)所用,重命令為其它任務(wù)的id就行了。

簡(jiǎn)單測(cè)試通過。原創(chuàng)文章。

火車頭采集后的網(wǎng)址存儲(chǔ)位置及如何備份和清理

火車頭商業(yè)版采集網(wǎng)址管理詳解</

商業(yè)版網(wǎng)民在使用火車頭采集后,網(wǎng)址數(shù)據(jù)存儲(chǔ)在PageUrl目錄下的db3文件中,每個(gè)任務(wù)對(duì)應(yīng)一個(gè)獨(dú)特的Site_*.db3文件。為了數(shù)據(jù)安全,建議先備份,即便清空也不必?fù)?dān)心,只需恢復(fù)網(wǎng)民名即可。對(duì)于jobid的識(shí)別,可以通過查看Data目錄下的文件名,例如"3-新浪國(guó)內(nèi)新聞",它與jobid相對(duì)應(yīng)。務(wù)必保存在對(duì)應(yīng)任務(wù)的文件夾,以防萬一。

雖然火車頭曾有些許版本不如早期的1.x和2.x版本便捷,但作為優(yōu)秀的采集工具,其商業(yè)版本的使用者可體驗(yàn)到更加多功能。例如,有位朋友碰到地址庫(kù)重復(fù)的提示,其實(shí)這是3.0 sp1的一個(gè)已修復(fù)的bug。在商業(yè)版中,地址庫(kù)文件是mdb格式,位于火車頭根目錄的pageurl目錄,每個(gè)任務(wù)對(duì)應(yīng)一個(gè)加密的地址庫(kù)文件。

管理與清理任務(wù)地址庫(kù)</

要手動(dòng)管理或清理地址庫(kù),商業(yè)版網(wǎng)民可以訪問這些文件。清除重復(fù)地址或直接刪除記錄都是可實(shí)現(xiàn)的。若想將文案內(nèi)容轉(zhuǎn)移給其他任務(wù),只需重命名文件并指定新任務(wù)的id。經(jīng)歷測(cè)試,這一個(gè)操作流程非常直觀且有效。

總結(jié)來說,雖然火車頭在某些方面顯得商業(yè)化,但它的強(qiáng)大功能和管理工具無疑為網(wǎng)民提供了便利。希望這些信息對(duì)您的采集職業(yè)生涯獲得幫助。

上一篇:濰坊營(yíng)銷咨詢推廣服務(wù)?濰坊出租車收費(fèi)標(biāo)準(zhǔn) 濰坊出租車叫車平臺(tái)

下一篇:灰色生意是哪些行業(yè)?十大暴利灰色行業(yè)


標(biāo)題:火車頭采集器是干嘛的?火車頭采集時(shí)采網(wǎng)址? ??

地址:http://www.good-jn.cn/a/rwfb/86642.html


注明“來源:文芳閣”的所有作品,版權(quán)均屬于文芳閣軟文推廣平臺(tái),未經(jīng)本網(wǎng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品,如有對(duì)內(nèi)有異議請(qǐng)及時(shí)聯(lián)系btr2030@163.com,本人將予以刪除。