V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
guoyu4126
V2EX  ›  程序员

网站被镜像怎么办

  •  1
     
  •   guoyu4126 · 2018-06-03 15:27:20 +08:00 · 8462 次点击
    这是一个创建于 2384 天前的主题,其中的信息可能已经有所发展或是发生改变。

    世界杯期间 网站被镜像

    导致 SEO 权重直接降低

    大量的赌博网站 镜像我们的网站。不知道从哪下手。 访问日志来看 没有什么异常 服务器也没有被攻击情况

    搞得现在很被动

    百度那边已经抓了好多了镜像站当索引 投诉也没什么用。

    35 条回复    2018-06-05 10:18:23 +08:00
    kaito
        1
    kaito  
       2018-06-03 15:52:37 +08:00 via Android
    镜像,百度其实是无法判断的,也其实也构成不了侵权,你只能举报他涉赌这个是非法信息。
    guoyu4126
        2
    guoyu4126  
    OP
       2018-06-03 15:56:57 +08:00
    @kaito 问题是我要怎么制止这个事儿。!!! 我们的原创内容 基本上刚发出就被他们抓走了
    GTim
        3
    GTim  
       2018-06-03 16:24:59 +08:00
    预判 ip 然后 block
    kamen
        4
    kamen  
       2018-06-03 16:31:08 +08:00 via Android
    分析流量 block ip
    icy37785
        5
    icy37785  
       2018-06-03 16:44:49 +08:00 via iPhone
    基本上只能 block ip,但是对真的有心人来说也不能并阻止他们。。。这些问题挺无奈,但是并没有一个特别好的方法解决。
    GTim
        6
    GTim  
       2018-06-03 17:02:46 +08:00
    @icy37785 有很多大数据网站的反爬,可以过滤掉 60+% 以上的爬虫
    zyqf
        7
    zyqf  
       2018-06-03 17:05:28 +08:00 via Android
    js 判断域名,不一致直接跳转。
    X-Force
        8
    X-Force  
       2018-06-03 19:38:30 +08:00
    检查 IP,吐脏数据,吐乱码~
    wwek
        9
    wwek  
       2018-06-03 21:32:50 +08:00   ❤️ 11
    在镜像你的站点上访问 加上 get 参数
    ?findyou=fuckyou11111
    然后在你自己站点服务器日志中找 fuckyou11111,然后把他的 ip 干掉 x.x.x.0/24
    mengzx
        10
    mengzx  
       2018-06-03 21:58:07 +08:00
    增加反爬虫机制,包括但不限于限制 ip 访问频次,核心数据 js,css 混淆加密,ua 和 ip 验证等
    bigpigeon
        11
    bigpigeon  
       2018-06-03 22:11:36 +08:00
    https 可以避免这问题把
    notreami
        12
    notreami  
       2018-06-03 22:32:59 +08:00
    什么办法都没用,爬取和反爬取属于道高一尺魔高一丈。
    目前看来,唯一的线索是你们反爬取的门槛太低,增加爬取难度,这类低级爬虫也就没能力了
    zc666
        13
    zc666  
       2018-06-03 23:19:55 +08:00 via iPad
    一个不成熟的建议,网站上加个 js,判断当前页面的域名是不是你的,不是的话就执行一些不好的操作(比如挖什么币之类的)
    caola
        14
    caola  
       2018-06-04 01:44:22 +08:00
    直接上 https,并把 CSP 规则写好,基本上就差不多了
    ldehai
        15
    ldehai  
       2018-06-04 05:34:53 +08:00
    网站没有后台的吗?纯静态复制起来就没难度
    userlol
        16
    userlol  
       2018-06-04 07:41:50 +08:00   ❤️ 1
    给镜像站加点料,你懂的的东西,不但搜索引擎不收录,而且自然会有人帮你封掉对方 IP 的
    不知你看明白没
    laoyuan
        17
    laoyuan  
       2018-06-04 07:49:39 +08:00
    10 年前遇到过盗图的,加料,然后联系那边的虚拟主机商,秒封
    annielong
        18
    annielong  
       2018-06-04 09:14:37 +08:00
    现在加料不一定好使了吧,先好多小汇聚直播类 黄 app,放的都是录像,基本上都是使用的是腾讯云的直播系统,也没见处理过
    justfindu
        19
    justfindu  
       2018-06-04 09:28:10 +08:00
    是不是因为你的服务器绑定解析域名时候没有排它, 比如 nginx 如果有 default 那个, 其他域名也一样可以解析到你的域名 然后一样可以显示. 需要设置排它域名直接返回 404
    justfindu
        20
    justfindu  
       2018-06-04 09:29:39 +08:00
    @justfindu

    server {
    listen 80 default_server;
    server_name _;
    return 403; // 404 各种都可以
    }

    比如 nginx 防止恶意解析
    arischow
        21
    arischow  
       2018-06-04 09:34:33 +08:00 via iPhone
    应该可以给它们所在的空间商投诉。
    jijiwaiwai
        22
    jijiwaiwai  
       2018-06-04 09:35:53 +08:00
    @bigpigeon HTTPS 没用
    alexbc
        23
    alexbc  
       2018-06-04 09:41:37 +08:00   ❤️ 2
    加点历史上今天的内容,只开放给那几个 IP 访问。
    omg21
        24
    omg21  
       2018-06-04 09:58:46 +08:00
    @zc666 爬虫会把 js 代码过滤掉,它只要正文内容,所以,这个办法不行。
    firedsxist0
        25
    firedsxist0  
       2018-06-04 10:48:59 +08:00   ❤️ 1
    我知道一个海外网站,总是被镜像,一点招也没有,毕竟自己也不能向 ZF 申述,
    然后他们出了个 App,可以在 App 内获取最新的几个官方地址,并且直接转入浏览
    然而这个 App 并没办法在 App store 内上架 摊手.jpg
    这个网站叫什么来着...记不起来了,就记得 App 叫什么草来着
    斜眼.jpg 假装无辜.jpg
    guoyu4126
        26
    guoyu4126  
    OP
       2018-06-04 13:08:56 +08:00
    我现在也束手无策了。 只把他的 IP 封掉了。 可是如果更换 IP 依旧如此 治标不治本

    我就是没想明白 为什么百度会收录。
    zeromake
        27
    zeromake  
       2018-06-04 14:12:36 +08:00
    @guoyu4126 大客户吧,主动提交网站了。
    flyz
        28
    flyz  
       2018-06-04 14:21:46 +08:00 via Android
    把所有的 js 都加密打包成一个,
    然后在里面藏点判断域名跳转的功能?
    yuriko
        29
    yuriko  
       2018-06-04 16:54:18 +08:00
    @firedsxist0 突然看懂笑出声
    8bit
        30
    8bit  
       2018-06-04 19:46:32 +08:00 via Android
    @annielong 直接加今天的料
    jon
        31
    jon  
       2018-06-05 09:27:40 +08:00
    @alexbc 哈哈哈笑出声,现在应该是历史上的昨天
    firedsxist0
        32
    firedsxist0  
       2018-06-05 09:36:32 +08:00
    @yuriko 看透别说透还是好朋友 斜眼.jpg
    DrugsZ
        33
    DrugsZ  
       2018-06-05 09:37:35 +08:00
    访问的时候,用 js 加密出来一段乱码,然后加到请求上,服务器端如果没有这个加密码就不让请求
    centralpark
        34
    centralpark  
       2018-06-05 10:06:25 +08:00
    楼主说的是内容被爬吧,不是反向代理镜像。。
    jijiwaiwai
        35
    jijiwaiwai  
       2018-06-05 10:18:23 +08:00
    人家只要铁了心要克隆你的网站,你就没办法防,除非你关站不开放服务,😄
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1117 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 18:03 · PVG 02:03 · LAX 10:03 · JFK 13:03
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.