V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  n3r0  ›  全部回复第 5 页 / 共 5 页
回复总数  91
1  2  3  4  5  
@clemente0620 数据的前期处理用了机器学习,文章生成是直接按照类目+关联度的算法从数据库取的内容,没有 AI,不然计算量太大了承受不起。
@cainiuwow 哈哈哈谢谢,字数限制主要是为了用户体验,理论上几万字都没问题,但是目前的生成速度太慢了。
等后期再优化的好一点,会考虑哒😁
@cainiuwow 能帮上忙就太好了😁一度因为它直接生成的效果不稳定打算放弃,后面还是加了个段落替换功能,感觉做个参考还可以。现在每天小几百人访问,也挺有成就感的,哈哈。
@tfdetang 不是。目前的效果还不够理想,等优化的差不多了可以放出来交流一下🤦‍♀️
现在只能说是,“人工”的部分还大于“智能”🤣
@dick20cm 之前我只查到过 MIT 有做过英文假论文的生成,这个倒是不清楚,回去了解一下,感谢😁
我觉得对真正的产品考验最大的,应该还是通用性,单一类目的生成还是比较容易的。
2020-02-09 20:22:07 +08:00
回复了 Winter1sComing 创建的主题 职场话题 互联网开发岗本科生和研究生的差别大吗
一个比较敬佩的博士师兄跟我说过,技术跟学历没啥关系。
搞工程研发也不是那么简单的事情。
我个人觉得最重要的是,还是要有足够的积累,所以选你最热爱的吧,不论是搞研究还是搞应用。
@hhxiaolei 网站的菜单,关于作者,里面有工作邮箱。抱歉不想留在公共场合,容易被爬虫广告邮件骚扰🤣
@mosbic 会努力让它编的越来越好😝
@hhxiaolei 目前还不行,一是考虑到自己服务器可能支撑不了,二是目前的数据整理的太乱🤣放出去有点丢人,还在进一步的优化当中。日后如果效果比较稳定了,可以开放一些高级接口,直接获取相关的段落。
@sevenQu 有道理,目前整篇文章就是按段落为单位生成的,只是还没有具体做一些区分,后面应该可以把正文再分成几个部分,然后按套路生成😁
@easylee 这种情况,一般是某些关键词匹配到的数据没有优化好🤦‍♂️可以重新生成试试,或者替换相关段落。

数据量太大,过滤了好多遍还是有漏网之鱼,头痛啊。
1  2  3  4  5  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3124 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 13ms · UTC 10:44 · PVG 18:44 · LAX 02:44 · JFK 05:44
Developed with CodeLauncher
♥ Do have faith in what you're doing.