• 新手興趣愛好者或者是應屆畢業生
新手興趣愛好者、應屆畢業生的爬蟲通常簡單粗暴,根本不管服務器壓力,加上人數不可預測,很容易把站點弄掛。
• 創業小公司
現在的創業公司越來越多,覺得大數據比較熱,就開始做大數據。發現自己手頭沒有數據。怎么辦?只能通過寫爬蟲獲取更多的數據。于是就有了不計其數的小爬蟲,出于公司生死存亡的考慮,不斷爬取數據維持公司的生計。
• 失控小爬蟲
有些網站已經做了相應的反爬,但是爬蟲依然孜孜不倦地爬取。雖然他們根本爬不到任何數據,或者一切數據都是不對的,可是爬蟲依然不停止。???這個很可能就是一些托管在某些服務器上的小爬蟲,已經無人認領了,依然在辛勤地工作著。
• 成型的商業對手
這個是最大的對手,他們有技術,有錢,要什么有什么,如果和你死磕,你就只能硬著頭皮和他死磕。否則法律手段解決。
• 抽風的搜索引擎
大家不要以為搜索引擎都是好人,他們也有抽風的時候,而且一抽風就會導致服務器性能下降,請求量跟網絡攻擊沒什么區別。