V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
clearc
V2EX  ›  程序员

在一片对 V2EX Plus 作者的口诛笔伐中,还是可以听一下他的解释的

  •  
  •   clearc · 2023-05-14 14:18:37 +08:00 · 7762 次点击
    这是一个创建于 578 天前的主题,其中的信息可能已经有所发展或是发生改变。
    虽然正是热点,还是链接下前情:

    提出疑义: https://www.v2ex.com/t/939486
    站长声明: https://www.v2ex.com/t/939839
    作者解释: https://www.v2ex.com/t/939852


    本帖观点:

    1 、存在客观上能够被站方和用户认为的恶意行为(未主动告知的非授权访问、可以远端控制的配置)。

    2 、作者的回应具备一定合理性,能够部分解释动机和行为,但是依旧存在一定的回避性论述。

    3 、站方做防御措施、用户删除并举报都没有任何问题,也是应该做的。

    4 、现在大家情绪都有些激动,但对作者动机是否本身具备恶意,在没有实际证据前(如确实涉及黑产等),建议减少先入为主的判断。同时如果有确凿证据显示有问题 ,支持警务处理。

    5 、作者应该更积极论证自己动机的合理性以及对此结果的担当。


    理由:

    1 、在作者解释中,说明了全部代码是开源的,包括后端结果也是公开可验证,一定程度上降低了其恶意动机的怀疑度,对于帖子中质疑的修改后台和删除等问题,也给出了还算合理的解释。(当然开源并不能成为脱罪石,其后续解释是否为真需要严格验证)

    2 、作者说明开发时为学生,对隐私等方面不了解。这一点如果为真,确实能够部分阐释既开源同时又做“恶意行为”的矛盾点,大家学生的时候应该或多或少都有点想炫技同时又没有那么在乎一些用户隐私的欲望。

    3 、作者目前为实名,自称也在一家公司创业,能够极大增加其论述可信度。

    当然即便所有均为真,也无法回避实质上本插件实施了对站方和用户的允许外的恶意行为,还是需要作者体现一定的担当,即便是学生时期的项目。

    出了问题,透明是解决的良药。在秉承着受过基本教育的人本性非恶的基本原则下,目前情况我选择偏向于相信作者论述,但是也欢迎被打脸。
    32 条回复    2023-05-15 12:22:13 +08:00
    shzbkzo
        1
    shzbkzo  
       2023-05-14 14:27:10 +08:00   ❤️ 24
    别尬洗。

    爬虫功能是今年三月份加了,早就不是学生了,现在作者自己开公司了

    另外学生身份就可以做任何事了?学生可以是做坏事的挡箭牌?

    一个帖子打开放着不关闭,v2ex-plus 以 20 秒一次的速度一直请求 v2 ,相当于 ddos 了吧

    你不如直接说:中国人愿意用隐私换便捷
    o4kj893hg
        2
    o4kj893hg  
       2023-05-14 14:31:32 +08:00   ❤️ 2
    "可以远端控制的配置"

    这一点还不严重?
    shalk
        3
    shalk  
       2023-05-14 14:32:55 +08:00
    为了实现 vdaily ,在插件里加了一些不该有的功能。

    通过客户端收集数据,这不是得同意嘛,各种软件都会说是否同意收集数据,用户什么什么改善?

    为了统计小区什么地板畅销,就直接去每个人家里看看?
    wangritian
        4
    wangritian  
       2023-05-14 14:43:43 +08:00
    如果我是站长,可能会找一些朋友回传大量假数据给插件服务器,迫使他关闭这个功能
    weijancc
        5
    weijancc  
       2023-05-14 14:47:16 +08:00
    程序员在国人中算在意隐私的群体吧, 不打算用隐私换便捷. 生气的原因可能不是在意作者的动机是否恶意, 而是侵犯了用户的隐私.
    Bob0800
        6
    Bob0800  
       2023-05-14 14:48:31 +08:00
    @wangritian 沟通无效再做这种事吧... 如果人家愿意关你又何必做这种事。
    defunct9
        7
    defunct9  
       2023-05-14 14:54:47 +08:00
    吐一口老浓痰
    dawn009
        8
    dawn009  
       2023-05-14 14:55:30 +08:00   ❤️ 2
    看到目前为止,进展挺顺利的。作者承诺停掉这个功能,站长部署了防御规则。
    lwjef
        9
    lwjef  
       2023-05-14 15:06:51 +08:00
    插件作者就是作死,提供功能给用户是合理的,默认开启完全不能做。
    分布式爬虫还是太骚了,更骚的不仅用户端爬当前页还会爬未浏览页面。
    说到不牵涉隐私,用户的 ip 加浏览的页面不是隐私?

    洗一下
    @shzbkzo #1 20 秒是请求插件服务端。
    https://www.v2ex.com/t/939839#r_13072795

    @wangritian #4 这么做给自己找不痛快,如果防爬难度太大会影响用户体验也很耗站长精力。
    shzbkzo
        10
    shzbkzo  
       2023-05-14 15:17:22 +08:00
    @lwjef 洗不了哦

    https://www.v2ex.com/t/939839#r_13072767 这个回复有详细的爬取步骤

    第一步,请求插件服务端的 /api/topic/task 接口,接口返回值是{"sign":"646052931b3e3ac3cf9cd9f3","id":785109,"page":1,"url":"/t/785109?p=1"},url 的内容就是帖子 id

    第二步,爬取 url 对应的帖子内容

    第三步,将爬取到的帖子内容提交到 api/topic/info?task=hash 值这个接口


    另外,你发的 https://www.v2ex.com/t/939839#r_13072795 这个回复的贴图,只看到 task 请求,是因为他只筛选了 task 请求

    byteroam
        11
    byteroam  
       2023-05-14 15:45:50 +08:00   ❤️ 2
    多大个事,大公司这么干的多了,大家屁都不敢放一个,欺负个人也不用太过分啦,还是要给个改正的机会
    ryd994
        12
    ryd994  
       2023-05-14 15:45:59 +08:00 via Android   ❤️ 3
    @lwjef 他代码有 bug ,说的是 30 秒一次最多 3 次。实际上次数限制代码错的,是 30 秒一次无限重复。每次请求有 30%的概率返回任务,那就算是 90 秒一个任务,如果有人网页没关,一天下来的请求量也很恐怖了。

    作者当然说是无意中写的 bug 。但是对于灰产相关,我一向不吝以最大的恶意去揣测,再考虑默认启用而不通知用户。即使整件事都是无心之失,作者依然难辞其咎。

    我认为,作者现在应该做的,不是去澄清什么有意无意,而是先把脚本下架,替换成空脚本。自动更新会帮助大部分用户解决问题。原始代码保留以备大家检验。服务器端亦然。事情搞到这个地步,这个产品就已经废了,想挽救也是枉然。

    先好好认个错,这才是最大的诚意。有意还是无意,根本不是重点。
    lwjef
        13
    lwjef  
       2023-05-14 15:51:44 +08:00
    @byteroam #11 抱怨的人可太多了,大公司它不改法律也不制裁它能有啥办法,插件作者这些行为有人抱怨反感是应该的,至于有些细节上误解的或者不礼貌的的确没太大办法。

    不知道下面这个算屁吗。
    cookie 技术与隐私权纠纷第一案——法院为何判百度不侵权? - 案例分析 - 新闻资讯 - 知识产权司法保护网(知产法网)
    http://www.chinaiprlaw.com/index.php?id=2024
    Alfie007
        14
    Alfie007  
       2023-05-14 15:52:51 +08:00 via iPhone
    还好我是没用
    diagnostics
        15
    diagnostics  
       2023-05-14 16:38:53 +08:00   ❤️ 1
    用 V2EX PLUS 就是用个楼中楼功能罢了,换成 V2EX POLISH 完全平替,简单用了看起来也没爬虫的东西,UI 还更好,设计还更好。为啥我还要用 PLUS 呢?

    “人本性非恶”就是扯淡的,尤其是在中国这个环境下,只要能有利益,什么道德统统不存在,你忘记 996 了?
    diagnostics
        16
    diagnostics  
       2023-05-14 16:43:46 +08:00
    @diagnostics 还有一个就是,V2EX PLUS 背后已经是商业,而不是简单的开源,为爱发电了。

    换位思考,如果是你,有个财富自由的路径给你,你还为爱发电?
    november
        17
    november  
       2023-05-14 16:50:52 +08:00   ❤️ 3
    这都可以洗?
    “相信作者的论述”是什么意思?好像没人说作者说谎了啊。

    而且你用了“疑义”这词来形容那个帖子,是说爬虫这件事真假还有带商榷?

    不管是爬虫任务,还是作者声称关闭了爬取却依然再爬,甚至是作者声称只多 2-3 个请求却是平均 20s 一个,这些哪个是错的?

    那你说相信作者,也就是说你认为 v2er 说的“没有关闭爬虫,平均 20s 一个请求”都是诬陷的?

    利益不相关,没有用这个插件。只是没想到这都可以洗。
    taine221
        18
    taine221  
       2023-05-14 17:35:34 +08:00
    OP 可能是反串,本来觉得作者可能存在 ”心大“ 的成分

    现在尬洗一下,直接感觉就是故意的,拜拜了您嘞
    siweipancc
        19
    siweipancc  
       2023-05-14 19:21:47 +08:00 via iPhone
    跳出来逼人拉黑?演员?
    levelworm
        20
    levelworm  
       2023-05-14 19:30:12 +08:00 via Android
    @byteroam 也不是啦,大家喷腾讯啊什么的也是经常喷,只不过没法定位到个人,所以马和张就是主角了。楼主说的这个大家可以定位到个人,总不能说是谁逼迫他开发的吧?所以就直接喷个人了。
    yolee599
        21
    yolee599  
       2023-05-14 20:25:23 +08:00 via Android
    爬虫默认开启,没有一点坏心思我是不信的
    azure2023us559
        22
    azure2023us559  
       2023-05-14 22:24:16 +08:00 via Android
    花里胡哨的东西,不用不就完了。
    wjx0912
        23
    wjx0912  
       2023-05-15 09:11:51 +08:00
    虽然不用这个插件,大家点到即止。360 腾讯百度哪个干的不是这个的千百倍
    coolloves
        24
    coolloves  
       2023-05-15 09:30:16 +08:00
    已经养成习惯,下油猴脚本,先看代码的 xhr 请求了.有外域的,仔细看下
    encro
        25
    encro  
       2023-05-15 10:02:05 +08:00
    最近 V2EX 流行公关文,反转?
    xubingok
        26
    xubingok  
       2023-05-15 10:37:03 +08:00
    利益不相关,也没用过这个插件.

    我说评论的各位哟,都已经先入为主的戴上"灰产"的帽子去看待这个事情,那还有什么好说的.

    至于是不是灰产呢?这个很容易判断吧?
    ohwind
        27
    ohwind  
       2023-05-15 11:01:27 +08:00
    @encro 合着别人解释和网友探讨都是反转是吧?你要不要考虑下是不是自己公关文看多了才会觉得到处都是公关文?
    encro
        28
    encro  
       2023-05-15 11:20:28 +08:00
    @ohwind

    你说得对,看太多了。活了几十年,类似混淆视听,故意搅乱是非的案例见太多了,小到个人,大到国家。。。

    比如 v 站前面 python 书纸薄的,某跑路的机场,某卖水果的...

    事实怎么样无法辨别,作为消费者,我认为正确的选择就是 --- 避坑。

    我只是发表我的感叹,我认为我无法已无法辨别,因为获取的信息很片面,

    所以我认为我们不要去看个别的情,而是事情的合理合法。

    听其言,观其行吧。不宜过早下结论。对于任何下结论的,我们都需要持怀疑态度。。。



    “也欢迎被打脸”

    呵呵。。。
    LaGeNanRen
        29
    LaGeNanRen  
       2023-05-15 11:22:31 +08:00
    《我是学生,再给我 50 》
    ohwind
        30
    ohwind  
       2023-05-15 11:44:07 +08:00
    @encro 有没有一种可能,既然这个插件是开源的,你完全可以去对照源码去看这篇“公关文”的合理性?你既不愿意看源码自己分析,又不愿意听别人的分析,还要说别人是公关文,你这样是否有点不太合适?
    encro
        31
    encro  
       2023-05-15 12:00:33 +08:00
    @ohwind

    所以,我打了个问号。

    是你帮我拉直作为肯定,我没肯定,我只是发表我对文章的疑问而已。

    对于这个插件,我没有结论,我没有用过这个插件,也没看源码,以后也不会看,只是发表下个人感慨:最近反转文看的比较多,一个东西一旦多起来,那么究竟是大家都独立思考,还是有人故意混淆视听,就得好好辨别了。

    确实因为表达不当,让其它人对这个插件和文章产生负面看法,表示抱歉。
    cdswyda
        32
    cdswyda  
       2023-05-15 12:22:13 +08:00
    第一,客户端进行这个操作,本质上很危险,用户的所有信息对他都是透明的,让用户完全信赖他,有点难。
    第二,默认开启,且没有明显提示说明,比较不能接受。

    我没用过,但是我认为这个行为约等于黑产
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1420 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 27ms · UTC 17:04 · PVG 01:04 · LAX 09:04 · JFK 12:04
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.