网络第一篇python爬取图文到word(图文间隔混排)
网上关于python爬取图片及文字的教程一搜一大把,但是这些python程序都是把文字与图片单独保存的!可以说本文是将爬取到的图片及文字保存到word中的网络教程第一篇(至少我找了两天没有找到类似的教程),有些教程只是单纯地把图片堆砌到word末尾。关于网络爬虫的其他简略教程可以看我之前的几篇文章:
python+BeautifulSoup爬取网易新闻到txt文件
python操作word文档用的是 Python-docx Document库,如果没有安装的[……]
BeautifulSoup中的select筛选器
以下代码python3.7版本测试通过。beautifulsoup使用select、find_all等方法可以十分简便地获取到想要的结果。多层div查找,指定class或id查找。
python+BeautifulSoup爬取网易新闻到txt文件
[……]
python+BeautifulSoup爬取网易新闻到txt文件
python支持跨平台运行,但是python2.x与python3.x的源码不一定通用, python3自带的2to3功能可以将2.x的源码转换成3.x的源码,可以在网上搜下教程获取我这篇文章里看下:Python3.7使用钉钉2.x版本接口(取token发钉钉消息)
本文python代码基于python3.7版本制作。使用BeautifulSoup库操作python爬取到的页面内容还是很方便的。这里直接以网易新闻科技板块第二页做示例:url = ‘http://tech.163.com/special/gd2016_02/’
python3.7爬取网易新闻完整源码
在[……]
jquery查找div元素第一个元素id
为方便查询以及备忘,jquery的元素查找、取值赋值、属性添加等操作做了整理
关于jquery查询或操作的更多内容可以前往菜鸟教程:https://www.runoob.com/jquery/jquery-ref-selectors.html
另外jquery的post/get操作亦做简单记录(摘录自菜鸟教程)
[……]
python3.7爬取新浪博客所有文章存入word
本文使用python抓取新浪博客全部文章的源码基于网上旧版教程,因网上同类文章重复过多,很多站点的python爬取教程都是一模一样,该教程的原始出处已无法考证。现在网上流传的教程基本已经无法在python3.7版本下运行了,需要进行不少修改,这次的代码写的比较仓促,有很多累赘代码没有时间删除优化。另外在使用这个python爬取的过程中发现对表格的支持不友好,另外不支持爬取图片。爬取图片的教程网上有很多,也可以参考我之前的文章:python3.7保存防盗链图片referer
本代码基本保留了网上流传老版本的所有代码,并已针对python3.7环境做出相应的修改(同时也保留了老版本大代码,但[……]
安装node解决微信小程序云函数调用失败
一切按部就班按官方的指导下载微信开发者工具,小程序也成功开通拿到了 AppID(小程序ID) ,但是在真机调试这边 点击获取openid 老是提示错误信息。
VM86:1 [云函数] [login] 调用失败 Error: errCode: -404011 cloud function execution error | errMsg: cloud.callFunction:fail cloud function service error code -504002, error message Function not found: [login]; at cloud.callFunc[……]