V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  gouchaoer  ›  全部回复第 49 页 / 共 61 页
回复总数  1205
1 ... 45  46  47  48  49  50  51  52  53  54 ... 61  
2017-02-01 09:00:33 +08:00
回复了 happyjohann 创建的主题 求职 上海、香港、台湾有哪些图像识别、图像处理相关公司?
图像处理不可能用 php+imagick 的,都是 c 艹
真的要搞这个去大厂有一些职位,腾讯的优图,各电商都有一些职位,不过不多
2017-02-01 08:57:25 +08:00
回复了 happyjohann 创建的主题 求职 上海、香港、台湾有哪些图像识别、图像处理相关公司?
图像处理你不是业界大牛的话会是个坑的
老实积累再找感兴趣方向吧
另外对 php 和 py 的比较上面,在 web 后台方面基础设施、库和生态 php 都很成熟的,语言本身综合评价上 php 比 py 强很多(兼容性、性能、语言 feature 等方面),当然了其实只要 get thing done 用啥语言都好。。。只是对我而已 php 最省心。。。
2017-01-30 10:07:10 +08:00
回复了 levineet 创建的主题 问与答 亲戚住对门,是否应该提供 WIFI 密码?
为啥要设置 wifi 密码,输入多麻烦
服务器 cpu 要的是稳定,爬虫不需要稳定的。。。。直接上 pc 就完了。。。。
cpu 的话 i7 性价比最高,内存 32g 吧,推荐 windows7 操作系统,好用
2017-01-29 11:46:52 +08:00
回复了 redtea 创建的主题 问与答 亲戚来访,是否应该提供 WIFI 密码?
矫情。。。就算 wifi 密码分享出去了别人用万能 wifi 钥匙蹭一下你的网又怎样。。。网速慢了换密码就完了
试试 swagger
@rffan py 的多线程是假多线程,可能有问题。。。弄成多进程的话,执行就和 php 方式类似了,不过 php 的 php-fpm 要成熟很多, gunicorn 之类的不好说
2017-01-25 16:09:34 +08:00
回复了 lotabout 创建的主题 分享创造 分享一个用 rust 撸的 Fuzzy Finder
@lotabout 我不要听“败家证明我,各有千秋”这种,我就行听你粉 rust 好的 /黑 rust 烂的
2017-01-25 11:47:42 +08:00
回复了 kancloud 创建的主题 推广 看云祝您 2017 新年快乐,新春满额送红包啦!
为嘛是 php 节点
2017-01-25 11:19:24 +08:00
回复了 lotabout 创建的主题 分享创造 分享一个用 rust 撸的 Fuzzy Finder
rust 优缺点你感觉有哪些?
2017-01-24 08:32:42 +08:00
回复了 dangyuluo 创建的主题 程序员 有什么比较轻量级的定时任务队列么?
@alexsunxl 这个是哪个命令呢?
2017-01-21 09:29:24 +08:00
回复了 nikoo 创建的主题 问与答 如何隐藏页面的文字来避免爬虫?
防那种业余的爬虫很简单,你页面动态生成的话。。。制作一些 html 模板,翻页啊文章正文的元素的 id 之类的经常变,但是由于你前端 js 已经和模板耦合很厉害了,如果 js 是由后端生成的可以这么做。。。这样可以防一些傻瓜爬虫
2017-01-21 09:16:04 +08:00
回复了 nikoo 创建的主题 问与答 如何隐藏页面的文字来避免爬虫?
作为全职爬虫工程师,我表示上面的都不靠谱。。。。

第一,转化成图片是个很不错的方法, cpu 不是问题,你把图片缓存起来就 ok 了。。然而对 seo 和移动端不那么友好。。。。至于爬虫要 ocr ,这个也要付出相应的成本


第二,根据账户行为控制,如果注册用手机注册,那么封了一个爬虫账号后就等于封了一个手机,爬的成本立刻上升。然后由于市场上有几 kw 个黑市手机号,能搞到这些手机号注册的业余爬虫码农做不到。那么基于行为怎么搞呢?很简单,一个用户的翻页速度和跨作品阅读都是很好的特征,写一些代码就能判断出爬虫,封的时候要慢慢封,不要让人猜出你封的策略。。。。


当然了,我个人倾向第二个方案。。。。你如果想要 seo 的话,可以每段做成一个 html ,路径用 hash ,让人猜不出路径规则无法遍历,这样搜索引擎又能索引,又能放爬虫。
2017-01-20 19:42:39 +08:00
回复了 Nicksxs 创建的主题 PHP 求助关于 PHP -leveldb
他有个 php7 分支不知道你看到没, issue 里已经有人能编译出来了,当然只是能 work 估计还要很多工作要做
2017-01-19 17:03:39 +08:00
回复了 ioioioioioioi 创建的主题 PHP PHP 7.1 数组兼职竟然可以重复,如何去掉这个特性?
可能是 linux 下带了\r 之类的,你比较一下两个 key 肯定不一样,退一万步。。。 array 本质上是 hash , key 怎么可能相同
2017-01-19 12:55:32 +08:00
回复了 heat 创建的主题 问与答 请问如何用 PHP 的 CURL 完全模拟 FILES 上传?
@已经被淘汰了。。。注意最新写法
天真
2017-01-18 08:57:19 +08:00
回复了 lzjun 创建的主题 Python 理解 Python 装饰器就看这一篇
def wrapper(*args, **kwargs):
# args 是一个数组, kwargs 一个字典
logging.warn("%s is running" % func.__name__)
return func(*args, **kwargs)
return wrapper

你这个函数最后会让人绝望的,因为谁都看不懂
2017-01-17 23:58:43 +08:00
回复了 Ciefdx 创建的主题 VPS 同志们做博客都用什么虚拟主机?
推荐阿里云+wordpress+域名备案
1 ... 45  46  47  48  49  50  51  52  53  54 ... 61  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2891 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 40ms · UTC 12:29 · PVG 20:29 · LAX 04:29 · JFK 07:29
Developed with CodeLauncher
♥ Do have faith in what you're doing.