V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
这是一个专门讨论 idea 的地方。

每个人的时间,资源是有限的,有的时候你或许能够想到很多 idea,但是由于现实的限制,却并不是所有的 idea 都能够成为现实。

那这个时候,不妨可以把那些 idea 分享出来,启发别人。
nicoljiang
V2EX  ›  奇思妙想

Dogedoge 中文搜索发布月余,目前搜索总量突破 100 万次。小结一下过去,也跟大家说说心中未来...[约 1200 字]

  •  4
     
  •   nicoljiang · 2019-07-22 20:00:12 +08:00 · 6582 次点击
    这是一个创建于 1970 天前的主题,其中的信息可能已经有所发展或是发生改变。

    一些数字

    data

    前情介绍

    38 天前,我在 V 站正式发布了 Dogedoge 搜索,初衷希望能让大家在百度之余和翻墙不便的情况下,有一个不错的备选( https://www.v2ex.com/t/573950 ),是 V 站当时较热的帖子之一。

    Dogedoge 不仅得到了很多人的支持,还得到了大佬的推荐(一度造成宕机)。使用的数量超出了预期,于是紧急做了很多本来佛系排期的事情,以应付可能发生的突然问题:

    1. 内容安全;
    2. 网络攻击;
    3. 搜索结果面太窄;

    大家看起来跟发布时并没有两样,的确是所有的新特性开发都暂停了,因为安全问题超出了我的预期(出现许多我做梦都想不到的敏感词)。

    小结一下这 30 几天里发生的事情:

    1. 被十余个自媒体&知乎(超级感谢🙏)推荐,其中动静最大的要属「阮一峰」在微博推荐: https://www.weibo.com/1400854834/HzjTGsNEM
    2. 经历了 8 次规模较大的 CC 攻击;
    3. 做了三次扩容(第一次是为了应付 阮一峰 推荐带来的流量暴增);
    4. 做了 12 次搜索结果优化;
    5. 做了 51 次搜索结果敏感内容处理(影响精力的最大头);
    6. 搭建流量统计系统(为了避免第三方 Cookies 的采集,没用任何第三方统计)。
    • 可以看到,这些几乎没有一件是能让用户直观感受到的事。对此我的想法是 —— 既然是搜索,那么最最重要的永远只有两件事:搜索结果的合理性 & 随时快速响应的稳定性。

    关于未来

    。壹

    如大家所见,前端依旧使用 duckduckgo.com 的皮,Logo 也非常缺乏诚意。所以第一件事恐怕是要开始启动一些改版计划,但应该会慢慢来,习惯的延续很重要。是以,若有美术功底、前端技术很棒的同学对 Dogedoge 有兴趣的,欢迎联系我: [email protected] ,我们可以探讨如何合作,或者仅仅是天马行空的想法;

    。贰

    1. 通过 3 次扩容后,系统也已经能扛住一定的突发请求了。是以,在这里想恳请喜欢 Dogedoge 的同学,在自己的广播站中为 Dogedoge 推荐一波。博客、论坛、朋友圈、微博 都可以,不需要专门赞美,希望能说一些客观想法。发了微博的同学可以把链接跟到帖子里,无论是有 1 个人看,还是 100 个人看,Dogedoge 都会铭记于心。虽然眼下还难以做出实质性的回报,但已经有了一些相关的想法,下面会阐述;

    2. 通过 10 余次搜索结果优化,目前搜索结果在大部分情况下已经比较丰富合理了。所以对于有网址导航产品的同学( V 站居民应该人手一个吧),Dogedoge 也恳请大家可以领养一波 —— 把 https://www.dogedoge.com/results?q=%s 加入到搜索框中的引擎选项中:

      1. 名称为「多吉搜索」或「 Dogedoge 搜索」均可,Logo: https://www.dogedoge.com/assets/logo_header.v108.svg
      2. 若 7 日平均每天搜索量平均能高于 1,000,可以联系我定制结果页的 Logo
      3. 若 7 日平均每天搜索量能高于 10,000,则可以联系我定制结果页的 Logo、名称、子域名

    。叁

    Dogedoge 要成为真正实用的搜索引擎,势必要支持很多的即时结果( Instant Result )。目前仅仅支持 IP 查询、货币兑换查询。其实非常重要的还有:天气、万年历(假日)、各种微型工具。但一个人的精力着实非常有限,所以想集思广益,谁有很实用、美观的 JS 程序,欢迎跟我探讨接入,Dogedoge 会在工具旁加上你的主链接。前端达人们若有其他更好的方案,也可以在回帖中或通过 [email protected] 与我讨论。

    。肆

    1. 在年底之前,希望能搞定「网盘搜索、图片搜索、视频搜索、资讯搜索」等几个重要的板块;
    2. 希望能启动新的「中文 Wiki 计划」。

    。伍

    因为已经备案了,所以排查敏感内容必然也是长久的重中之重。Dogedoge 会自觉维护祖国的完整和声誉,希望做一个遵纪守法的搜索工具,以能够长久、稳定地为大家服务(若有漏网之鱼,还请大家千万告知)。

    关于收入

    有很多人朋友特别担心会坚持不下去。其实想想目前成本着实不低,所以是迟早需要开拓一些收入的。目前有三个想法,请大家来讨论和把关一下:

    1. 部分商品的搜索结果,接入一些电商的联盟 —— 即「当用户搜索一些与商品相关的关键词时,通过商品的返利链接获得一些手」。如:搜索一些技术关键词时,右侧可以显示 3-6 个相关书籍的链接;
    2. 实现一些增值功能(但还没想好有一些什么样的增值功能);
    3. 针对开发者和小团队,推出更多更丰富更实惠的接口,例如:定制化的云搜索;
    4. 向广大用户乞讨(捐赠),以「资助者列表」的形式,在固定页面为大家的博客或产品放置一个带 icon 的链接;
    5. 还有别的好建议,欢迎回帖讨论。
    105 条回复    2019-10-05 10:32:15 +08:00
    1  2  
    noob1445
        1
    noob1445  
       2019-07-22 20:07:21 +08:00 via iPhone
    原来开发者就在 v 站,dalao
    Buges
        2
    Buges  
       2019-07-22 21:01:41 +08:00 via Android   ❤️ 32
    我来泼冷水了:你这玩意就别想“合法”的做下去。
    Google 当初退出中国可从来不是因为审查。
    “遵纪守法”完全就和一个搜索引擎,一个高效聚合索引信息的工具水火不容。
    这里的“合法”指的是“合规”,因为某国不是法制国家,也根本没有明确的法律条文告诉你什么能有,什么不能有。上面只会含含糊糊的一通电话,一个通知,让你自己“揣摩圣意”,根本没有明确的界限。这些内容太多又太含糊,你需要耗费大量精力也一定有漏网并且这个“度”还要你自己把握。
    当然了,你也可以屏蔽 gfwlist 的地址,甚至只索引 cn 的站点。这样一来,搜个剧 YouTube 本来该在置顶你没有,搜技术关键词没 wiki,如此种种,这算哪门子“实用的搜索引擎”?还不如去了广告的 baidu。
    至于「中文 wiki 计划」我不知道你指的什么,如果是类 Wikip.edia 那样的,那肯定不可能。因为 wiki 的核心理念,客观,中立,自由,在这里是“不合法”的。
    rogwan
        3
    rogwan  
       2019-07-22 21:03:31 +08:00 via Android
    干脆搞成付费搜索,每年 120 元这样的会员制,提供快照访问(快照更新要及时),专注提高搜索质量。如果搜索质量国内普遍比百度高,大约要多少会员量能覆盖住成本?
    yueye
        4
    yueye  
       2019-07-22 21:09:56 +08:00
    Personal Blocklist 和自定义搜索服务可以考虑成增值功能?

    搜索结果会增加按照时间排序的选项吗?
    nicoljiang
        5
    nicoljiang  
    OP
       2019-07-22 21:53:26 +08:00
    @rogwan
    个人的 Blocklist 可以考虑的。按时间排序对于通用搜索的部分,短期内还做不太到(如果是资讯服务,这块儿上线之后是 OK 的);
    至于自定义搜索服务,你说的是可以索引自己文档的搜索么?这个我确实打算开放(就是云搜索服务);

    @rogwan
    每年 120 元的会员费,假设完全没有免费搜索,那么 3000 位左右的付费用户大概可以收支平衡(这部分用户应该是相对重度的用户),但这么高频的基础服务,其实是没法做严格的收费服务的(会损失基础便捷性,大量的搜索数据本身也是优化搜索结果的重要依据);那么假如同时提供哪怕最基础的用户,双方哪怕能到 1:9,那直接就是 10 倍啦(因为对收费的用户还需要提供更多的增值服务);所以,收费的用户可以没有广告,但对于免费的部分,依然要有其他的营收方式。

    @Buges 从「法」的定义上,很惭愧,目前的确还是立足于中国,即便是某个条款也得遵守。对于 wikip 这种,其实是有一些方法的(目前在筹备); YouTube 也可以做到,但可能需要收费维持(当然我说的并不是简单的 VPN 或代理的方案)。不过非常非常感谢你的警醒。
    sunny2580839896
        6
    sunny2580839896  
       2019-07-22 22:02:39 +08:00
    从发布我就关注了,反正我一直在用,手机电脑也在使用,但是频率不是太高
    Counter
        7
    Counter  
       2019-07-22 22:12:04 +08:00 via Android
    谢谢作者,你的作品很好用,希望走得长远
    yincheng
        8
    yincheng  
       2019-07-22 22:22:21 +08:00 via Android
    DuckDuckGo 有一个叹号搜索我觉得思路不错,不过他家做的感觉略微有点复杂。借鉴一下做成功能拓展应该不错。
    dezhou
        9
    dezhou  
       2019-07-22 22:41:25 +08:00 via Android
    给个建议,单纯的出于好奇是做不久的,看你的发展路线图,不如好好专研技术而不是做大而全的搜索,毕竟是个个人维护的,从技术角度出发反而可以做成一个有趣的事情。
    koodai
        10
    koodai  
       2019-07-22 22:56:52 +08:00 via Android
    翻看了一下原帖,天哪!交口称赞,楼主了不起,搜索试了一下,确实很出色。已替换默认搜索引擎,希望项目能长期健康发展。
    Exia
        11
    Exia  
       2019-07-22 23:33:54 +08:00
    自从楼主推荐了这个搜索,我就一直用了,挺好的,支持一下
    Yourshell
        12
    Yourshell  
       2019-07-23 00:08:57 +08:00 via iPhone   ❤️ 1
    先天太监与后天太监🐒,不过狙击老太监百度我还是支持的😄
    gzdaijie
        13
    gzdaijie  
       2019-07-23 00:24:45 +08:00 via Android
    支持楼主!
    well666
        14
    well666  
       2019-07-23 00:45:20 +08:00 via iPhone
    对了,我刚才试了一下,有些结果虽然做了过滤,可是内容看起来还是挺讽刺的。
    香港💪还能搜到结果,虽然没什么特别敏感的,但是提到审查了。最近发生了那啥都懂的。hk01 还索引了真是...lz 专注非政治内容的话这些新闻媒体基本都是无关的,对于这个网站的目标人群来说也大都上不了,用 Google+duckduckgo+各种 news 基本上都能知道了,可以默认降权。或者参考后续那样的时间流,虽然来源换汤不换药但是好歹引用+时间线也算是尽力了(最喜欢看打脸,魔幻)。
    v2 都出国了.
    你这是铤而走险啊,希望能有个好结果吧。
    rogwan
        15
    rogwan  
       2019-07-23 00:46:54 +08:00 via Android
    @nicoljiang 如果只需要 3k 用户就能盈亏平衡,完全可以众筹一下开始啊。某度的搜索质量实在无法忍受了,基本都是 bing 和谷歌才能找到有效的结果,确实想要一个纯粹的搜索服务,我是愿意付这个会员费的。
    guiqiqi
        16
    guiqiqi  
       2019-07-23 00:48:09 +08:00 via iPhone
    支持大佬,下次在我的小破站里给大佬也做做宣传^_^
    AngryPanda
        17
    AngryPanda  
       2019-07-23 01:26:31 +08:00 via Android
    按照我的经验,要不了多久域名就会停止解析。
    xusp
        18
    xusp  
       2019-07-23 02:00:28 +08:00 via Android
    nicoljiang
        19
    nicoljiang  
    OP
       2019-07-23 02:16:20 +08:00
    @well666 多谢多谢,刚刚已经处理了一波。
    @rogwan 你提的这个方向确实是点醒到我。但如果完全收费(登录后才可搜索),我倒不是担心付费用户够不够,而是搜索这一随时可能急用的功能本身的基础体验就会降低(试想万一随手想搜个东西还得登录一波,然后可能长期在桌面端记录的密码忽然不记得了)。所以上面帖子里我也说了,可能觉得最平衡的是:付费有部分增值服务+免广告,免费搜索的时候会有部分广告(例如:支持者名单)
    @dezhou 能否详细说一下,技术角度出发是怎么个思路?
    @yincheng 嗯,这个确实是值得参考,但 IR 也还是要做的(出发点不太一样)。
    @sunny2580839896 @Counter @gzdaijie @koodai 希望不辜负你们的喜爱,谢谢。
    @Yourshell 我觉得百度目前最大的问题不在于阉割敏感结果(毕竟大家都要活着才能提供服务嘛),主要的问题是搜索结果太不客观(百家号、贴吧、知道 等内容的权重远远高于他们应得的)
    @guiqiqi 谢谢你小老弟。
    nicoljiang
        20
    nicoljiang  
    OP
       2019-07-23 02:17:02 +08:00
    @AngryPanda 你说的我都快哭了...
    MrGba2z
        21
    MrGba2z  
       2019-07-23 02:25:16 +08:00
    This site can ’ t be reached www.dogedoge.com ’ s server IP address could not be found.
    DNS_PROBE_FINISHED_NXDOMAIN
    kookpua
        22
    kookpua  
       2019-07-23 07:04:19 +08:00 via iPhone
    ios 的 safari 和 chrome 不能添加默认搜索引擎
    rogwan
        23
    rogwan  
       2019-07-23 07:11:26 +08:00 via Android
    @nicoljiang 从用户的角度看,只是希望有一个纯粹的高质量搜索服务,某度不是技术上做不到,而是被商业模式带歪了。狗搜索要可持续发展,无论会员还是广告,搜索服务的质量应该是优先商业模式的,会员服务比较纯粹,广告难免会影响搜索体验。

    登录影响搜索体验的问题很容易解决啊,免费未登录用户,按 IP 限制一下使用频率就可以了,搜索频率超过阙值跳登录框。

    1981
        24
    1981  
       2019-07-23 07:26:21 +08:00
    这个我还以为 DuckDuckGo,,,,
    welling
        25
    welling  
       2019-07-23 08:34:10 +08:00 via Android
    话说大佬是用业余时间搞,还是家里有矿
    xsdhy
        26
    xsdhy  
       2019-07-23 08:41:22 +08:00 via Android
    偶尔会用,有个建议,加上时间筛选,比如说一年内的
    chaorenry
        27
    chaorenry  
       2019-07-23 09:02:21 +08:00
    加油,即便失败了也比什么都不做好,顶多最后迫于压力关闭掉,但是很多人记忆种都会有你的作品,这也是一笔买不来的宝贵财富,互联网史里也会有你的一笔!
    Shazoo
        28
    Shazoo  
       2019-07-23 09:05:56 +08:00
    来个捐赠页面。这个必须要支持!
    amwyyyy
        29
    amwyyyy  
       2019-07-23 09:12:04 +08:00
    挺不错的, 已经设置为默认搜索
    atwoodSoInterest
        30
    atwoodSoInterest  
       2019-07-23 09:13:41 +08:00
    感觉“图片搜索、视频搜索、资讯搜索”这些不是很有必要,现在引入的用户应该大部分还是技术人员,对于这部分的需求不大吧?现在先活下来(有固定收入,内容审核),再丰富功能吧
    xiaotuzi
        31
    xiaotuzi  
       2019-07-23 09:29:24 +08:00 via iPhone
    已设置为默认搜索引擎,支持一下。
    担忧楼主收入问题以及合法性。
    我这里大胆做一个设想,也是我一直觉得也许可行的事情,或许可以降低一些成本(我个人认为)。

    设想:每人在搜索的时候都是用自己的电脑或者手机,会使用相关的软件这些,是否可以调用用户的设备处理器去处理相关搜索?这样就能分担一些服务器的压力。就是做成桌面软件,然后调用系统处理搜索功能。

    天马行空的想法啦,希望能有一些帮助。
    最后,希望楼主越办越好!
    xiaotuzi
        32
    xiaotuzi  
       2019-07-23 09:30:55 +08:00
    已设置为默认搜索引擎,支持一下。
    担忧楼主收入问题以及合法性。
    我这里大胆做一个设想,也是我一直觉得也许可行的事情,或许可以降低一些成本(我个人认为)。

    设想:每人在搜索的时候都是用自己的电脑或者手机,会使用相关的软件这些,是否可以调用用户的设备处理器去处理相关搜索?这样就能分担一些服务器的压力。就是做成桌面软件,然后调用系统处理搜索功能。

    天马行空的想法啦,希望能有一些帮助。
    最后,希望楼主越办越好!
    xiaotuzi
        33
    xiaotuzi  
       2019-07-23 09:42:15 +08:00
    已去 csdn 社区推送一波,只能帮助楼主到这里了!
    dazkarieh
        34
    dazkarieh  
       2019-07-23 09:46:11 +08:00
    用过一次就把 dogedoge 设置成 chrome 和 alfred 的默认中文搜索引擎,向周围的亲朋好友安利了一把,还顺手做了个简陋的 PopClip 扩展:
    https://github.com/bosconb/popclip-extension-for-dogedoge
    大佬能以一人之力做好这么大一个工程着实不易,感谢🙏感恩🙏,有困难吼一声。

    我赞同#30 的部分观点,图片视频先缓缓,活下来再说,印象中涉黄的很大部分都是图片视频。
    xusp
        35
    xusp  
       2019-07-23 09:47:52 +08:00 via Android
    @xiaotuzi 你的设想很外行啊。 搜索是个 io 密集操作,调用处理器做啥
    xiaotuzi
        36
    xiaotuzi  
       2019-07-23 09:52:46 +08:00 via iPhone
    @xusp 做个微型内置服务器处理搜索,类似 IDE,我们开发不是需要处理一些数据嘛,所以我觉得做成桌面应用可以直接使用电脑处理器处理。我确实不太懂搜索引擎如何开发,到我做本地 PHP 开发也是直接用 ide 完成执行程序的,不是吗?
    codespots
        37
    codespots  
       2019-07-23 09:54:36 +08:00
    据说大佬是个 PM,而不是 RD,佩服!
    pengbo37877
        38
    pengbo37877  
       2019-07-23 10:15:48 +08:00
    大佬联系我,可以投资
    zsl199512101234
        39
    zsl199512101234  
       2019-07-23 10:56:07 +08:00
    @rogwan 我选择 google
    xusp
        40
    xusp  
       2019-07-23 10:59:20 +08:00
    @xiaotuzi、、、、、、、我接下来说话有点难听了,但是,求求你不要秀你的见识了。
    nicoljiang
        41
    nicoljiang  
    OP
       2019-07-23 11:14:37 +08:00   ❤️ 1
    @MrGba2z 看起来是解析有问题
    @kookpua Chrome 是可以的呀
    @rogwan 限制 IP 恐怕很难,ADSL 基本 IP 都在变的,然后移动基站 IP 又很集中,风险比较大
    @1981 嗯,两篇帖子都有提到,目前直接用了 duck 的皮。但我觉得哪怕只是把 Duck 像素级 Copy 得足够好,难度都很大,因为 Duck 是一个很优秀的搜索引擎
    @welling 搞了 1 年多的
    @xsdhy 多谢建议,后面会增加的。
    @chaorenry 感谢感谢,很燃,很有动力!
    @Shazoo 嘻嘻,近期上一下捐赠,多谢多谢
    @atwoodSoInterest 你说的有道理,这也是为什么迟迟没上的原因(资源消耗量大,安全成本很高)
    @xiaotuzi 超级感谢你帮忙推荐,虽然技术上可行性不太大,但这个想法脑洞很棒
    @dazkarieh 太棒了,希望多一些插件,顺便了解到一个军刀般的好工具
    @codespots 我相信若是一个专业的 RD,必然会做的更好
    @pengbo37877 竟然有金主爸爸垂青,您可以通过 [email protected] 联系我,或者留意下您的联系方式我来联系您
    Shazoo
        42
    Shazoo  
       2019-07-23 11:21:03 +08:00
    @nicoljiang 嗯。我也希望捐转股。嘿嘿
    wuhaoworld
        43
    wuhaoworld  
       2019-07-23 11:21:38 +08:00
    初期而言,「网盘搜索、图片搜索、视频搜索、资讯搜索」一点都不重要
    newworld
        44
    newworld  
       2019-07-23 11:24:20 +08:00 via iPhone
    黄赌毒不禁 活不久 一旦搞黑帽 SEO 的和菠菜的这些人知道了,你估计就快要 GG 了……搞菠菜的 百度都头痛的一波人
    bravecarrot
        45
    bravecarrot  
       2019-07-23 11:30:54 +08:00
    bug report:
    query=获奖 CG 短片
    结果页的 url 的 icon 都挂掉了。
    zkqiang
        46
    zkqiang  
       2019-07-23 11:40:49 +08:00
    希望能提供定向搜索,比如程序员工作中肯定希望搜到全是技术网站,而不会有其他干扰
    这种定向可以做成订阅付费的会员功能,至少我肯定会买的
    zkqiang
        47
    zkqiang  
       2019-07-23 11:42:10 +08:00
    毕竟有时候即使关键词很准确,但依然充斥着 广告文、营销文 等影响效率的页面
    nicoljiang
        48
    nicoljiang  
    OP
       2019-07-23 12:49:43 +08:00
    @Shazoo 我也想过这种众包持股(因为其实想效仿 wiki )但法律好像不允许。
    @newworld 这个真是巨头疼,还有用 cn 域名搞的
    @bravecarrot 奇怪,我这儿看没挂呀...
    @wuhaoworld 明白,我会再权衡一下
    @zkqiang 嗯嗯,差不多就是垂直或行业内容搜索吧,后续的确考虑过作为高级功能来做。
    flowfire
        49
    flowfire  
       2019-07-23 13:09:14 +08:00 via iPhone
    我想知道敏感词是哪来的……有相关机构会给一张表吗,还是全靠自己猜……
    zkqiang
        50
    zkqiang  
       2019-07-23 13:35:38 +08:00
    @flowfire 文化局有敏感词库
    twor2
        51
    twor2  
       2019-07-23 14:10:31 +08:00   ❤️ 1
    初期而言,「网盘搜索、图片搜索、视频搜索、资讯搜索」一点都不重要 +1

    肯舍弃百度的转投的你这个搜索的,目前是哪些人?你的产品线路要照顾这些人,而不是对标百度
    haozes
        52
    haozes  
       2019-07-23 15:10:39 +08:00
    搜了下波多野结衣老师,LZ 的引擎搜出来的,不是我想看到的
    nicoljiang
        53
    nicoljiang  
    OP
       2019-07-23 15:46:26 +08:00
    @flowfire 据我所知,没有官方词库,问过服务商也表示没有,不提供。靠网上资料+自己收集吧;
    @twor2 了解,有道理。
    @haozes 低俗内容方面,目前确实是短板,且短期内可能不是重点(没有政治资源护体,胆儿小)。
    melonzzz
        54
    melonzzz  
       2019-07-23 15:55:31 +08:00
    ![WX20190723-155334.png]( https://i.loli.net/2019/07/23/5d36bd363e72a28993.png)
    给大佬提个 bug
    melonzzz
        55
    melonzzz  
       2019-07-23 15:56:45 +08:00
    想知道大佬是如何实现的...真牛逼
    codingBug
        56
    codingBug  
       2019-07-23 16:00:55 +08:00
    加油,不过没有合适的变现途径的话,恐不长久。
    faketemp
        57
    faketemp  
       2019-07-23 16:05:56 +08:00 via iPhone
    广东 经常抽风 无法访问或者速度极慢 严重影响使用效果 如何破?
    iamalive2008
        58
    iamalive2008  
       2019-07-23 16:22:03 +08:00
    每天在用 支持一下
    rogwan
        59
    rogwan  
       2019-07-23 16:23:12 +08:00 via Android
    @nicoljiang 建议楼主做付费搜索服务,是因为你承诺不追踪用户行为,那你就失去了给用户精准画像的能力,推送广告你就做不好,保护用户隐私和精准推广告是相悖的。

    限制 IP 的方法怕误伤,随请求下发一个 session id 就可以了,放浏览器缓存,也可以用其他限制请求频率的方式。
    flowfire
        60
    flowfire  
       2019-07-23 16:45:16 +08:00
    @nicoljiang #53 讲道理,如果是我的话,我能接受在首页留个邮箱,然后注明, 可以用以 .gov.cn 结尾的邮箱发邮件来要求清除搜索结果和屏蔽关键词。
    但是如果是要我自己靠猜来自我阉割的话,那我还是呆在墙外吧
    nicoljiang
        61
    nicoljiang  
    OP
       2019-07-23 17:11:34 +08:00
    @faketemp 可能是解析到国外的服务器(按理广东应该很快)。昨天换了新的 CDN 方案,不知道你今天感觉如何?
    @melonzzz 这个问题很奇怪,我总复现不了,你能帮忙看一下 http 请求吗(或者把微信发我邮箱 [email protected] 我加你)?
    @flowfire 有条件当然呆在墙外哦,不过你这似乎是个可行的办法。
    @codingBug 确实是现在需要考虑的事情了,尤其是搜索量起来之后。
    @iamalive2008 多谢多谢,愿能不负所望。
    faketemp
        62
    faketemp  
       2019-07-23 17:14:32 +08:00
    @nicoljiang  早上还行 十点以后到现在网站压根打不开 一直显示正在连接 或者无法显示该网站
    尝试了电信网络、移动 4G 都是一样问题
    faketemp
        63
    faketemp  
       2019-07-23 17:17:41 +08:00
    PING duckduckgo.com (69.171.237.26): 56 data bytes
    Request timeout for icmp_seq 0
    Request timeout for icmp_seq 1
    Request timeout for icmp_seq 2
    Request timeout for icmp_seq 3
    ……

    traceroute duckduckgo.com
    traceroute to duckduckgo.com (69.171.237.26), 64 hops max, 52 byte packets
    1 192.168.101.254 (192.168.101.254) 6.993 ms 1.196 ms 1.341 ms
    2 100.64.0.1 (100.64.0.1) 5.341 ms 3.673 ms 6.969 ms
    3 183.57.63.21 (183.57.63.21) 15.508 ms
    183.57.61.161 (183.57.61.161) 14.470 ms 30.643 ms
    4 97.96.128.219.broad.fs.gd.dynamic.163data.com.cn (219.128.96.97) 66.582 ms
    89.96.128.219.broad.fs.gd.dynamic.163data.com.cn (219.128.96.89) 14.527 ms
    183.57.62.1 (183.57.62.1) 8.885 ms
    5 * 202.97.94.122 (202.97.94.122) 31.916 ms
    202.97.94.126 (202.97.94.126) 11.475 ms
    6 * * *
    7 *
    faketemp
        64
    faketemp  
       2019-07-23 17:27:40 +08:00
    @nicoljiang 实测,域名被解析为国外 IP,而且该 IP 已经被和谐了 所以无法访问 原因未知

    打开那个那个之后,才可以流畅使用 呃 为什么广东访问会自动连接国外 CDN?……
    newworld
        65
    newworld  
       2019-07-23 17:44:50 +08:00 via iPhone
    @nicoljiang #48 建议 迁移国外 更换域名 不然你的热血终将会被现实泼冷水
    mohoumk2
        66
    mohoumk2  
       2019-07-23 17:50:02 +08:00 via Android
    首先要把来自百度的 ip 拉入黑名单
    nicoljiang
        67
    nicoljiang  
    OP
       2019-07-23 18:36:01 +08:00
    @faketemp 唔...那个...域名是 dogedoge.com ,不是 Duckduckgo 呀...( Duckduckgo 是我仰慕对象)
    @newworld 在国外太容易被屏蔽啦。希望通过遵纪守法,管控内容来安身~
    @mohoumk2 你是说百度公司嘛?哈哈哈,我群里已经有一个百度的同学啦~
    faketemp
        68
    faketemp  
       2019-07-23 18:45:42 +08:00 via iPhone
    @nicoljiang 哈哈哈 不好意思 是我乌龙了🤪
    nicoljiang
        69
    nicoljiang  
    OP
       2019-07-23 18:46:05 +08:00
    @faketemp Duckduckgo 在国内本身是被墙的。我想在国内做一个能赶超 Duckduckgo 的搜索服务。
    melonzzz
        70
    melonzzz  
       2019-07-23 19:06:16 +08:00
    @nicoljiang 发了
    kkkkkkkkkkkkk
        71
    kkkkkkkkkkkkk  
       2019-07-23 19:13:41 +08:00
    楼主真牛,这个是独立创业的项目吗? 需要人手的话,我可以考虑加入
    kios
        72
    kios  
       2019-07-23 19:31:53 +08:00
    做的真的很不错,点赞!
    yueye
        73
    yueye  
       2019-07-23 20:44:45 +08:00
    自定义搜索服务指的是 Google Custom Search。你误解成本地文档搜索了。。。
    Luzifer
        74
    Luzifer  
       2019-07-23 20:57:15 +08:00
    确实很好用
    nicoljiang
        75
    nicoljiang  
    OP
       2019-07-23 22:34:18 +08:00
    @yueye 嗯嗯,我没有误解。我是指我是想着从这个角度出发来做自定义搜索。做一个百度现在已经做的很好的东西没有意义呀。
    @kios @Luzifer 很开心你们喜欢。
    @kkkkkkkkkkkkk 目前是 side 状态,你是做什么的呀?
    MyFaith
        76
    MyFaith  
       2019-07-23 23:23:47 +08:00
    https://myfaith-images.oss-cn-hongkong.aliyuncs.com/picgo/20190723232247-2019-7-23.png

    部分 favicon 有问题,不知道是不是我自己的问题
    MyFaith
        77
    MyFaith  
       2019-07-23 23:31:05 +08:00
    另外,没想到竟然有货币功能,其实用百度只是查汇率方便一些,其实也可以把计算器,长度转换这一类的做出来
    nicoljiang
        78
    nicoljiang  
    OP
       2019-07-23 23:47:31 +08:00
    @MyFaith
    没错是有这些打算。货币方面,doge 的准确度理论上比百度高,并且货币种类更全( 167 个法币+6 个加密资产)、更实时。
    关于这个 icon 的问题,之前也有人遇到。但我始终复现不了,你能帮忙看一下「 F12 」里的情况吗?
    conver
        79
    conver  
       2019-07-24 00:08:00 +08:00 via iPhone
    貌似跟 Google 的搜索结果差不多,厉害了
    kkkkkkkkkkkkk
        80
    kkkkkkkkkkkkk  
       2019-07-24 12:11:49 +08:00
    @nicoljiang 我这边 Python、Java、前端项目以及基本的运维方面都没有问题,当然,都是互联网项目,没接触过搜索引擎相关的

    如果有需要的话,可以私聊,邮件我你的微信号到 doge # sbw.me
    kveln
        81
    kveln  
       2019-07-24 14:39:31 +08:00
    已设为浏览器默认搜索
    nicoljiang
        82
    nicoljiang  
    OP
       2019-07-24 15:08:51 +08:00
    @conver
    @kveln 多谢喜欢,还有许多不足,但愿能尽快加强,不负期待。
    MyFaith
        83
    MyFaith  
       2019-07-24 16:45:23 +08:00
    @nicoljiang 晚上下班我回家看下,公司没有这个问题
    MyFaith
        84
    MyFaith  
       2019-07-24 21:08:54 +08:00
    @nicoljiang 家里已经正常了。。
    610915518
        85
    610915518  
       2019-07-25 08:00:36 +08:00 via iPhone
    备案就算了……
    jiumingzhu
        86
    jiumingzhu  
       2019-07-25 08:55:21 +08:00
    木秀于林,风必摧之,愿一帆风顺!
    公司不允许 FQ
    从正式发布就设为默认搜索了,好用~
    nicoljiang
        87
    nicoljiang  
    OP
       2019-07-25 13:55:44 +08:00
    @MyFaith 好的。
    @610915518 没明白你的意思...
    @jiumingzhu 多谢支持~
    clownxiaoqiang
        88
    clownxiaoqiang  
       2019-07-26 10:09:28 +08:00
    做的挺不错的,日常在 google 和 doge 之间切换使用
    KamenReborn
        89
    KamenReborn  
       2019-07-27 19:28:26 +08:00
    搜索质量相当不错!
    yigemeirenyongde
        90
    yigemeirenyongde  
       2019-07-30 17:53:39 +08:00
    怎么感觉老哥你是采集 google 的?
    MyFaith
        91
    MyFaith  
       2019-08-03 13:02:21 +08:00
    提个 BUG,搜索结果页面,点击描述空白位置会打开很多个新标签页,三台机器都是这样
    zepto
        92
    zepto  
       2019-08-09 11:41:02 +08:00

    推荐已发,从你发布后不久就开始用了
    nicoljiang
        93
    nicoljiang  
    OP
       2019-08-09 14:09:27 +08:00
    @zepto 感谢,并且记下了,努力不负所望
    @MyFaith 我排查一下这个问题,谢谢你反馈
    luckrill
        94
    luckrill  
       2019-08-10 22:32:08 +08:00
    因为对搜索引擎的不满意,我开发了 搜索引擎工具

    http://search.readmorejoy.com/

    欢迎大家看看,提些建议
    zepto
        95
    zepto  
       2019-08-19 19:36:24 +08:00
    杭州电信好像有点不稳定
    nicoljiang
        96
    nicoljiang  
    OP
       2019-08-20 02:08:19 +08:00
    @zepto 这个黄色的应该是 Initial connection 过程。
    如果能稳定复现,麻烦你看一下请求的 IP 是哪个。(说不定解析到国外去了)
    koodai
        97
    koodai  
       2019-08-22 17:41:16 +08:00 via iPhone
    作者你好,我设为浏览器默认搜索有一阵子了,Chrome 最新版、win10 系统。之前搜索 OK 的,最近划词搜索总是跳到首页去。不知道是做了什么规则处理吗? 还有,经常性从搜索结果页跳第三方的时候速度很慢。

    期望你的改进
    nicoljiang
        98
    nicoljiang  
    OP
       2019-08-23 00:53:59 +08:00
    @koodai 你好。Chrome 划词搜索会自动跳到首页一般都是关键词的变量设置错误。当监测到关键词为空的时候,就会自动跳转到首页。
    另外,跳入第三方慢的话,多半可能是那个网站较慢(因为多吉目前会对一些繁体、英语结果放行,这些网站很有可能服务器不在大陆,但拥有一些高质量的信息)。如果你确定是平时访问很快的大网站,不知道是否能做一些跟踪,比如告诉我是什么网站,什么关键词。
    可以随时跟我邮件沟通: [email protected]
    多谢喜欢~
    dezhou
        99
    dezhou  
       2019-08-23 03:03:02 +08:00 via Android
    @nicoljiang 从技术上做得更有特色一些,比如响应时间、存储格式、压缩比、多媒体、网络架构、检索的域名范围、分词算法、倒排,单纯的堆砌功能跟百度的几万人 PK 胜算为 0,但百度的弱点在于架构上很难改变,而这个就是从创新上可以打败大公司的一个方面
    nicoljiang
        100
    nicoljiang  
    OP
       2019-08-23 11:35:56 +08:00
    @dezhou 说的有道理。不过难点也在这里,就算 pk 算力、算法,索引范围,规模,都很难跟百度相提并论。确实得保持一些自己的特色,然后在便利功能方面,尽量完善。
    1  2  
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1067 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 90ms · UTC 18:14 · PVG 02:14 · LAX 10:14 · JFK 13:14
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.