◎歡迎參與討論,請在這里發(fā)表您的看法、交流您的觀點。
你到源碼站去搜,發(fā)現(xiàn)一堆“泛XX”的代碼,其中以“泛內(nèi)頁、泛目錄”居多,那這是個什么東西?

看各種程序的介紹,非常niubility的樣子。但站在小白的視角看來,依舊搞不懂是什么東西。

正常的網(wǎng)站,一個URL都對應(yīng)唯一的關(guān)鍵詞,比如我建立一個網(wǎng)站,設(shè)置2個url格式,一個列表頁,一個詳情頁:
https://www.test1.com/{cid}/
https://www.test1.com/{cid}/{pid}.html
這個url結(jié)構(gòu),至少得創(chuàng)建兩個數(shù)據(jù)表:
一個是cid--cname,存放“分類id和分類名稱”的映射關(guān)系
一個是pid-cid,存放“某個文章和對應(yīng)分類”的映射關(guān)系
cid是分類的id,pid是文章的id,每個pid對應(yīng)唯一的title。哪個pid歸屬于哪個cid的映射關(guān)系,是寫死在數(shù)據(jù)表里的。
只要你不改這個映射關(guān)系,每個pid詳情頁對應(yīng)的title,永遠是不變的。
而泛內(nèi)頁,是沒有這個映射關(guān)系的。pid這個變量,你在瀏覽器隨便寫,都能正常訪問,title一般是隨機匹配的。
舉幾個栗子:
1)url不變,每次刷新,模板和title都變。模板和title與pid之間沒有任何映射關(guān)系,隨機匹配的。

2)但這樣每次都變,對搜索引擎不友好。加上緩存,在一段時間內(nèi),讓模板與title和pid綁定
如設(shè)置緩存86400秒,依舊url不變,N次刷新,模板和title不變


3)有些另類的url后綴是不能訪問的,如.txt,.pdf,.xlxs.....

同理,通過創(chuàng)建新的url路由,來實現(xiàn)正常訪問


4)任意url隨機匹配關(guān)鍵詞

同理,列表頁這個cid,也沒有映射關(guān)鍵詞,url中的cid也可以隨便輸入,都能正常訪問

簡而言之,“泛XX”就是你隨便輸入url,都能正常訪問。頁面上出現(xiàn)的鏈接,都是程序隨機生成的,隨機就意味著無限大,baiduspider能發(fā)現(xiàn)無限大的未爬取的url,這樣就有可能帶來源源不斷的抓取。
至于怎么隨機,看程序的設(shè)置,可以“有范圍的”隨機,比如url必須符合某個格式,或者隨機的id,必須是在某個列表內(nèi)的才能訪問等
有時候賣程序也會換個說法,叫“XX繁殖”,比如內(nèi)頁繁殖啥的,意思都差不多。
最近有小白看了一些程序的介紹,表示內(nèi)心很激動,其實大可不必,SEO領(lǐng)域內(nèi),大多數(shù)情況下,程序都是次要的,即便再怎么“泛XX”,只是解決內(nèi)容量的問題,但解決不了收錄。
從功能的實現(xiàn)來講,不難,基本上工作1、2年的php,把邏輯告訴他,都能實現(xiàn)一個差不多的程序。
◎歡迎參與討論,請在這里發(fā)表您的看法、交流您的觀點。