V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  vtoexsir  ›  全部回复第 4 页 / 共 4 页
回复总数  77
1  2  3  4  
@oott123 非常感谢!
@oott123 多谢您回复,没看到有什么特别的属性?
请您详细指点下哪里?
2016-10-30 11:32:51 +08:00
回复了 vtoexsir 创建的主题 Python Python 模块 mammoth 怎么转换 docx 文件为 html?
@zhuangzhuang1988 太菜了,还没那两下子!@@@
2016-10-29 22:12:11 +08:00
回复了 vtoexsir 创建的主题 Python Python 模块 mammoth 怎么转换 docx 文件为 html?
@yexiaoxing 感谢您的回复,如上代码在 cmd 执行,在 output-dir 文件夹会生成 html 文件和图片文件,存在的问题是:
html 文件中图片元素(如:<img src="1.png" />)没有高和宽属性,我希望 html 文件中的图片元素保持高宽属性的值,不要过滤掉.如:<img src="1.png" width="300" height="200" />.
这样的效果,用 python 代码可以实现的吗?怎么写呢?
2016-10-24 12:04:29 +08:00
回复了 vtoexsir 创建的主题 Python BeautifulSoup 怎么直接插入一段 html 代码?
看来我是强人所难了!
谢谢各位!
2016-10-24 12:03:47 +08:00
回复了 vtoexsir 创建的主题 Python BeautifulSoup 怎么直接插入一段 html 代码?
@XYxe 多谢您的回复!
您的方法是常用的路子,可以达到要求.但是这样做逻辑上不太直接.
我的代码(伪代码)一看,就知道是用一段 html 源码替换 b 标签的文本内容.
2016-10-22 09:33:08 +08:00
回复了 vtoexsir 创建的主题 Python BeautifulSoup 怎么直接插入一段 html 代码?
@wyntergreg 多谢您的回复,我知道 bs.replace_with(tag_or_navstr_or_str)的参数是 bs 的 tag 类型或者 navigableString 类型或者干脆是 python 的字符串类型.
我就是想怎么插入一段 html 代码,让 bs 自动正确识别,代码该怎么写?
2016-10-18 21:14:06 +08:00
回复了 vtoexsir 创建的主题 Python python 中怎样在多层循环间灵活的跳转?
@Contextualist
这种写法似乎更简单!
如果要获得网页源码渲染之后的网页文本,恐怕要使用类似 selenium 之类真的加载到浏览器,然后获取到.
这样相当耗资源,速度也慢.
我想使用 bs 来获得网页文本,而且要求格式与从网页上看到的一样.相对于使用 selenium,这样做可能快点吧.
2016-10-10 19:36:26 +08:00
回复了 vtoexsir 创建的主题 Python python 怎么给原有模块添加自定义方法?
新建 myBS.py 文件,内容如下:
import bs4


def getTextWithoutScript(self, separator=u"", strip=False,
withoutScript=True, withoutComment=True):
"""获取网页文本,不包含 html 源码中的 script 脚本的内容"""
return separator.join([s for s in self._all_strings(strip) if s.parent.name.lower() != 'script'])


bs4.Tag.getTextWithoutScript = getTextWithoutScript

使用方法:
首先导入 myBS.py,其他使用方法就是直接调用,与 bs 的原生方法一样:
import myBS
from bs4 import BeautifulSoup as bs

s=bs(html_code,'html5lib')
s.getTextWithoutScript()

不方便的地方:在 pycharm 下该新加入 BS 的方法不能智能提示!
感谢诸位老师!
2016-01-22 20:00:22 +08:00
回复了 vtoexsir 创建的主题 编辑器 请问 sublime 3 有没有正则提取文本的插件?
@feiyuanqiu 此方法可行,多谢!
2016-01-17 11:38:44 +08:00
回复了 skyxin888 创建的主题 问与答 Android 想学一些后台的东西 是选 Python 还是 ruby
@zythum ok ,心理分析的不错!
结一下:设置 mac 启动项,对于 mac 小白而言,最方便直观的是 macbooster 。 launchctrol 就需要一定的技术和知识了。再次直接修改启动配置文件。再次感谢各位的指教!
@Autonomous 没有看到 clean my mac 3 上有这个功能,请截图指示下!
@erinsnow 多谢您回复!这里设置似乎不太正常:有的启动项不再这里,但还是启动了。
2016-01-05 13:17:44 +08:00
回复了 hilenlai 创建的主题 问与答 PopClip 有没有有道词典的弹出窗口翻译插件?
2015-09-27 08:30:07 +08:00
回复了 Sylv 创建的主题 分享创造 [PopClip 插件] 欧路词典划词翻译
多谢分享!
1  2  3  4  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3425 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 22ms · UTC 11:53 · PVG 19:53 · LAX 03:53 · JFK 06:53
Developed with CodeLauncher
♥ Do have faith in what you're doing.