Code phát hiện google crawler đang duyệt web trong php

Thảo luận trong 'Ngôn ngữ lập trình web PHP' bắt đầu bởi admin, 11/10/14.

  1. admin

    admin Phạm Công Sơn Thành viên BQT

    Tham gia ngày:
    22/5/13
    Bài viết:
    3,738
    Đã được thích:
    711
    Điểm thành tích:
    113
    Giới tính:
    Nam
    • Code php phát hiện các công cụ tìm kiếm đang crawler duyệt web hay người dùng đang duyệt web.
    • Code giúp bạn tránh chặn các công cụ này khi sử dụng các tường lửa code trong web để chống ddos và flood web bạn.
    • Khi bạn xây dựng 1 tường lửa cho web bạn rất lo sợ chặn nhầm các ip của google và các công cụ bot spider bing, yahoo và nhiều công cụ khác.
    • Nay ITSEOVN sẽ hướng dẫn code các bạn nếu làm tường lửa thì tránh đừng chặn các ip và spider bot của các công cụ tìm kiếm này.
    • CODE như sau :
    PHP:
    function crawlerDetectWeb($USER_AGENT)
    {
        
    $crawlers = array(
        array(
    'Google''Google'),
        array(
    'msnbot''MSN'),
        array(
    'Rambler''Rambler'),
        array(
    'Yahoo''Yahoo'),
        array(
    'AbachoBOT''AbachoBOT'),
        array(
    'accoona''Accoona'),
        array(
    'AcoiRobot''AcoiRobot'),
        array(
    'ASPSeek''ASPSeek'),
        array(
    'CrocCrawler''CrocCrawler'),
        array(
    'Dumbot''Dumbot'),
        array(
    'FAST-WebCrawler''FAST-WebCrawler'),
        array(
    'GeonaBot''GeonaBot'),
        array(
    'Gigabot''Gigabot'),
        array(
    'Lycos''Lycos spider'),
        array(
    'MSRBOT''MSRBOT'),
        array(
    'Scooter''Altavista robot'),
        array(
    'AltaVista''Altavista robot'),
        array(
    'IDBot''ID-Search Bot'),
        array(
    'eStyle''eStyle Bot'),
        array(
    'Scrubby''Scrubby robot')
        );

        foreach (
    $crawlers as $c)
        {
            if (
    stristr($USER_AGENT$c[0]))
            {
                return(
    $c[1]);
            }
        }

        return 
    false;
    }


    $crawlerweb crawlerDetectWeb($_SERVER['HTTP_USER_AGENT']);

    if(
    $crawlerweb ==false)
    {
        
    //nếu không phải là các công cụ tìm kiếm thì chặn hoặc làm gì đó.
    }
    • Chúc các bạn thành công.
     
    Cảm ơn đã xem bài:

    Code phát hiện google crawler đang duyệt web trong php

    Đang tải...
  2. admin

    admin Phạm Công Sơn Thành viên BQT

    Tham gia ngày:
    22/5/13
    Bài viết:
    3,738
    Đã được thích:
    711
    Điểm thành tích:
    113
    Giới tính:
    Nam
    Hoặc nhều khi, google bot đọc mảng rất kém, khiến việc kiểm tra nhiều khi bị sai thì bạn dùng lênh if như sau

    PHP:
    function crawlerDetect($USER_AGENT)
    {

      if(
    stristr($USER_AGENT'Google') != false)
      {
          return 
    'Google';
      }
      elseif(
    stristr($USER_AGENT'msnbot') != false)
      {
          return 
    'msnbot';
      }
      elseif(
    stristr($USER_AGENT'bingbot') != false)
      {
          return 
    'bingbot';
      }
      elseif(
    stristr($USER_AGENT'facebook') != false)
      {
          return 
    'facebook';
      }
      elseif(
    stristr($USER_AGENT'Rambler') != false)
      {
          return 
    'Rambler';
      }
      elseif(
    stristr($USER_AGENT'Yahoo') != false)
      {
          return 
    'Yahoo';
      }
      elseif(
    stristr($USER_AGENT'AbachoBOT') != false)
      {
          return 
    'AbachoBOT';
      }
      elseif(
    stristr($USER_AGENT'accoona') != false)
      {
          return 
    'accoona';
      }
      elseif(
    stristr($USER_AGENT'AcoiRobot') != false)
      {
          return 
    'AcoiRobot';
      }
      elseif(
    stristr($USER_AGENT'ASPSeek') != false)
      {
          return 
    'ASPSeek';
      }
      elseif(
    stristr($USER_AGENT'CrocCrawler') != false)
      {
          return 
    'CrocCrawler';
      }
      elseif(
    stristr($USER_AGENT'Dumbot') != false)
      {
          return 
    'Dumbot';
      }
      elseif(
    stristr($USER_AGENT'FAST-WebCrawler') != false)
      {
          return 
    'FAST-WebCrawler';
      }
      elseif(
    stristr($USER_AGENT'GeonaBot') != false)
      {
          return 
    'GeonaBot';
      }
      elseif(
    stristr($USER_AGENT'Gigabot') != false)
      {
          return 
    'Gigabot';
      }
      elseif(
    stristr($USER_AGENT'Lycos') != false)
      {
          return 
    'Lycos';
      }
      elseif(
    stristr($USER_AGENT'MSRBOT') != false)
      {
          return 
    'MSRBOT';
      }
      elseif(
    stristr($USER_AGENT'Scooter') != false)
      {
          return 
    'Scooter';
      }
      elseif(
    stristr($USER_AGENT'AltaVista') != false)
      {
          return 
    'AltaVista';
      }
      elseif(
    stristr($USER_AGENT'IDBot') != false)
      {
          return 
    'IDBot';
      }
      elseif(
    stristr($USER_AGENT'eStyle') != false)
      {
          return 
    'eStyle';
      }
      elseif(
    stristr($USER_AGENT'Scrubby') != false)
      {
          return 
    'Scrubby';
      }
      return 
    false;
    }

    // search bot id

    $crawler crawlerDetect($_SERVER['HTTP_USER_AGENT']);

    if(
    $crawler==false)
    {
        /
    neu không phải bot thì làm gì đó.
    }
    else
    {
        
    // nếu là bot thì làm gì đó.
    }

     
  3. admin

    admin Phạm Công Sơn Thành viên BQT

    Tham gia ngày:
    22/5/13
    Bài viết:
    3,738
    Đã được thích:
    711
    Điểm thành tích:
    113
    Giới tính:
    Nam
    Theo mình, thì các bạn nên sử dụng cách 2 đó là kiểm tra bằng lệnh if việc kiểm tra sẽ hoàn hảo 100% hơn là sử dụng vòng for như cách 1 ở trên
     
  4. saudom

    saudom

    Vip Member

    Tham gia ngày:
    7/3/14
    Bài viết:
    12
    Đã được thích:
    0
    Điểm thành tích:
    1
    à. hóa ra mới biết cái HTTP_USER_AGENT để phát hiện con bot nữa
     
  5. vangg02

    vangg02 Thành Viên Mới

    Tham gia ngày:
    9/5/16
    Bài viết:
    4
    Đã được thích:
    0
    Điểm thành tích:
    1
    Giới tính:
    Nữ
    Viên uống Giảm cân Eva nice được làm từ 100% thảo dược thiên nhiên như cao ô mai, phục linh, lá sen, trà xanh nên không có tác dụng phụ nhưng vẫn giảm cân hiệu quả và an toàn cho người sử dụng. Đã đến lúc bạn có thể nói lời tạm biệt với lượng mỡ dư thừa trong cơ thể mình bằng cách sử dụng Thuốc giảm cân Eva Nice hằng ngày với một cách đơn giản và làm theo hướng dẫn. Sản phẩm được phân phối bởi " Khỏe đẹp tự nhiên " - " Khoedeptn.com "



    [​IMG]
    Eva nice khuyến mại 490.000 vnđ/ hôp
    giam can nhanh
    Website : khoedeptn.com
    Hotline : 090.4422.739 - 0983.986.913
    Đ/c : Tổ 28, Thịnh Liệt, Hoàng Mai, Hà Nội

    $Link$
     


Chủ để tương tự : Code phát
Diễn đàn Tiêu đề Date
Rao Vặt Toàn Quốc TipClub Phát code rikvip 500k miễn phí 6/9/16
Rao Vặt Toàn Quốc Encoders IFM - Bộ mã hóa vòng quay IFM - CTC 1/11/16
Rao Vặt Toàn Quốc Hải Tặc Bóng Đêm ra mắt server D GARP, dành tặng 500 Giftcode 20/9/16
Rao Vặt Toàn Quốc Đại Lý Encoder Hengstler 0521037 , ROTARY JOINT RIX CBP11/4 (S/N. 1308053) 30/7/16
Rao Vặt Toàn Quốc Đại Lý Encoder HEDSS ISL5815-002C-2000BZ1-5T, Cảm biến áp lực YOKOGAWA EJA530A 12/7/16

Like và Share ủng hộ ITSEOVN

Người dùng tìm kiếm ITSEOVN trên công cụ tìm kiếm

  1. nhan biet bot google php