V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  tmacLiu9527  ›  全部回复第 3 页 / 共 7 页
回复总数  124
1  2  3  4  5  6  7  
@0073461 缓存得预判搜索关键词! 关键词是个超级 fat 的 tail! 每万条搜索的 cache hit 是 2%. 所以对于搜过的可以优化一定的 ttl, 但是没有搜过的很困难!
@Lemeng V2 标语 - Do have faith in what you're doing.
@Lemeng 有心就不难!
@wewin 你好! 我们在 prototyping 时候有试过你说的方案, 但是存在几个问题

1. IP rate limit (这个可以 proxy, 但是存在 serious legal risk)
2. Latency (这个体验不好, P50 ≥ 2.3s)
3. 合法合规 (这个挑战性比较大, 而且实时处理有很高的 overhead)

所以直接搜比较有挑战性! 但是用其他搜索引擎的结果用来做排序的参考是个不错的选择!
@lishuolin 你好! 谢谢!

目前必须的备案都已完成!

1. 对于广告, 可以看一下我之前的回复!
2. 我们不会索引内容农场的链接! 但是偶尔会漏, 如果大家能够及时反馈, 我们能够很快速的取消索引!
@Geo200 谢谢反馈! 这个下一周就能解决! 我们之前 pagination 用的比较 naive 的方法 (没有覆盖实时添加删减的链接), 因为大部分用户在 1-2 页就解决问题了!
@lin0kin @sunshijie 按时间范围选择结果已上线! 可以选择某一个时间段内的结果! 但是不推荐使用时间倒序, 相关性不是很理想!
@shenmezhidedu 哈喽!

如果想单次搜索屏蔽, 可以使用 "关键词 -baidu -taobao -alibaba", 如果想持续屏蔽, 可以点首页的右下角添加到相应的设置里!

希望可以帮到你!
@laycher 哈喽! 谢谢推荐!

+后面是不需要冒号的!

如果想看到更多的 csdn 的内容, 可以尝试 more:csdn.net
@johnsonshu 支持开发者! 非常同意你说的信息可用度的问题, 或许我们可以借鉴一些非英文语言的国家的解决方案

1. 对于高质量内容的翻译程度高
2. 内部高质量内容产生的生态好

目前的搜索引擎天然权重赋予站点大于内容, 导致很多高质量的站点和博客得不到相应的曝光. 相信接下来各种新趋势的推动下 (Web3.0, DAO, etc.) 可以让个人内容产生者有一个新的生态可以打破现在的僵局. 如果我们能在这个方面出一份力, 那也义不容辞.

回答你的问题, 如果在合法合规的前提下, 快照是一个非常好的解决方案 (我们目前对于 stackoverflow 和 github issues 会提供快照功能). 如果你想具体沟通对接的问题, 可以加我 wx : )
@Ciicing 谢谢! 有问题或者需求的话请和我们反馈!
@Geo200 已经修复!
@Geo200 你好! 谢谢反馈! 这个问题是我们昨天加日期 filter 时候导致的一个 bug, 页面日期的权重人为干扰逻辑出了些问题! 下午就能修复! 抱歉给你带来不好的体验 :(
@VZEXEZVzzz 你好! 感谢对 F 搜的肯定

回答你的问题

我们的愿景是 - 1). 让信息可得、可信、可用, 2). 让用户可以不断拓展知识获取边界和高效管理知识

对于 1 来说, 我们认为信息和知识应该是公共使用的, 每个人都有平等的 access, 所以应该是永远免费的. 对于广告商业化来说, 我们认为合理的展示广告是可行的. 我们对合理的定义, 一是对广告的真实性和合理性进行审核, 不是盲目变现. 二是需要帮助用户高效生成高质量的广告 (如果你试过 Google AdWrods, 那应该有上下文). 我们认为广告不能占屏, 广告不能给用户建立上下文时制造阻力, 广告更加不能作恶. 上面这几点会是我们商业化的指向标 (如果我们到那一步的话).

对于 2 来说, 如果产品成长到能够提供增值服务的阶段, 并且确实也给用户提供了价值, 那就是个定价的问题, 产品发现和定价都需要早期的用户帮助去迭代和改进.

总的来说, 我们想做个能和用户长期依存的产品, 产品愿意聆听, 用户就愿意反馈, 如果确实有价值, 那用户也不会吝啬帮助产品生存. 以上是我们的观点.
@SingeeKing 谢谢反馈! 这周三之前就可以加上!
@sunshijie 今天就能有!
@eason1874 好的! 谢谢反馈!
@xfcy 哈喽! 小白功能目前比较傻傻的 - 但是这周会有个比较大的改版, 到时候可以体验一下! 一定会提高很多效率!
@MonoLogueChi 谢谢反馈! 这个问题我具体回答一下,

目前我们有三个 variation, 正在实验哪个 variation 会更好 (也可能是个 variation 的组合). 它们分别是

1. Fsou 的热搜词
2. 国内的热搜词
3. 国外的热搜词

随机收到 1 和 2,

第一个 variation - 量目前太少 (50k / day), 因为搜索的 q 是个 fat tail 的事件 (general search), 细分到某一个起始字的量不够, 结果目前不理想, 还需要更多的积累.

第二个 variation - 因该是你遇到的问题, 国内的关键词很容易被污染, 我们在实现过程中也发现了, 这个需要些时间去解决, 我们预计 eta 在 7 天左右.

第三个 variation - 被污染程度比较小, 但是相关度会有所下降, 并且存在合法合规的问题, 我们目前的实现方式中以这个 variation 做参考, 但客户端不会收到这个 variation.

希望能回答到你的疑问 :)
@SingeeKing 谢谢! 我们在做用 wikipedia 的摘要替换目前的解决方案. 但是还有几个小问题需要解决一下才能上线.
1  2  3  4  5  6  7  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1309 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 13ms · UTC 23:37 · PVG 07:37 · LAX 15:37 · JFK 18:37
Developed with CodeLauncher
♥ Do have faith in what you're doing.