小網(wǎng)站優(yōu)質(zhì)內(nèi)容被高權(quán)重網(wǎng)站采集,導(dǎo)致小網(wǎng)站頁面沒有收錄也沒有排名,向搜索引擎反饋也沒有實(shí)質(zhì)性的效果,因?yàn)闊o法證明這些內(nèi)容是自己原創(chuàng)的,下面教大家如何從技術(shù)層面防止網(wǎng)站內(nèi)容被采集,但也不能完全杜絕被采集。

一、優(yōu)化層面
1、在更新網(wǎng)站內(nèi)容時(shí),添加一些能代表自己的內(nèi)容,例如“XXX網(wǎng)提示” “XXX提醒”,還有就是將品牌詞變換下,例如“黑帽百科SEO博客”可變換成“daBING了解”“DA兵知道”等,別人采集你的內(nèi)容在沒有及時(shí)修改的情況下,你就可以把這些作為證據(jù)向搜索引擎進(jìn)行反饋,反饋?zhàn)约旱脑瓌?chuàng)內(nèi)容被別人采集抄襲了。
沒有實(shí)質(zhì)證據(jù)的情況下,搜索引擎也不好怎么處理,你說你是原創(chuàng),但別人也可以說是他是原創(chuàng),如果你說更新時(shí)間可以證明,但內(nèi)容更新時(shí)間是可以修改的,所以這個(gè)是不能作為證據(jù)的。
2、還有一個(gè)方法是給內(nèi)容插圖加入水印,增加別人采集抄襲的時(shí)間成本。
二、技術(shù)層面
一般網(wǎng)站都會(huì)設(shè)置最新內(nèi)容更新欄目,這樣采集者采集的內(nèi)容都是最新而且還是沒有收錄的內(nèi)容,所以我們需要考慮不讓最新內(nèi)容被采集到,等最新內(nèi)容被搜索引擎收錄后,再更新出來,這樣別人采集的意義就不到了,設(shè)置方法如下所示:
1、首頁延時(shí)更新,不要將首頁設(shè)置成實(shí)時(shí)更新或固定時(shí)間段更新,我們網(wǎng)站把搜索蜘蛛養(yǎng)起來以后,首頁更新頻率就不用那么快了,例如新浪、網(wǎng)易那些大權(quán)重平臺(tái)網(wǎng)站首頁長(zhǎng)時(shí)間都是不更新的。
2、延時(shí)更新,并不代表不更新,只要我們將最新內(nèi)容鏈接地址做成sitemap主動(dòng)推送經(jīng)搜索引擎,就不需要考慮搜索引擎不會(huì)不來抓取我們網(wǎng)站了。
3、限制欄目分頁數(shù),一般5~10頁足夠了,沒有人會(huì)有這個(gè)時(shí)間去翻你網(wǎng)站幾十頁后面的內(nèi)容,正常用戶進(jìn)入你網(wǎng)站都是有需求,例如百度經(jīng)驗(yàn)欄目分頁限制為3頁,而且還不是最新內(nèi)容。
4、限制用戶列表頁內(nèi)容展示量
5、列表頁內(nèi)容鏈接盡可能設(shè)置成無規(guī)則排序,如果你的網(wǎng)站列表頁內(nèi)容是按照有規(guī)律遞增進(jìn)行排序的,采集者不需要找到你網(wǎng)站最新內(nèi)容入口就可以采集到你網(wǎng)站的最新內(nèi)容,可以設(shè)置成百度最近一周收錄排序到網(wǎng)站最新內(nèi)容列表里。
舉例: htt ps://jin gyan.baidu.com/article/1.html
htt ps://jin gyan.baidu.com/article/2.html
以此類推
htt ps://jing yan.baidu.com/article/99999999.html
例如愛奇藝、騰訊視頻鏈接就是無規(guī)則排序,這就導(dǎo)致他們視頻內(nèi)容就很難被采集。
如果你的站是新站,不建議使用上方法,等搜索蜘蛛抓穩(wěn)定了,就可以使用以上方法了。
網(wǎng)站內(nèi)容被采集技術(shù)層面處理方法也就以上這些了,但也不能完全避免網(wǎng)站被采集,有些采集者甚至用代理IP抓相關(guān)內(nèi)容爬搜索結(jié)果頁來采集你網(wǎng)站內(nèi)容。
注意:動(dòng)態(tài)程序網(wǎng)站也可設(shè)置調(diào)用前幾天更新的內(nèi)容,但必須提前做好sitemap文件和api推送。
限制IP的方法步驟這里就不詳細(xì)講解了,百度上都有,搜索一下就全出來了。
