利用python备份新浪微博(仅文字)

使用python3.7爬取新浪微博内容并保存到txt文件。如果有需要保存图片的可以参考之前的文章:网络第一篇python爬取图文到word(图文间隔混排)

本教程与之前的python系列文章不同之处在于,使用的是直接调取微博公开的开放接口,返回的是json数据,之前爬取的时候是对返回的html网页数据进行正则处理或使用BeautifuSoup包进行处理!

开始之前请明确你要备份的新浪微博的用户id串号,方法很简单,现在网页上登录微博,然后找到你要备份的微博的人的微博头像右键“检查”会打开浏览器的调试窗口并定位到 usercard 这里就是用户id

下面上获取全部新浪微博内[……]

wordpres自定义页面模板风格

利用wordpress的自定义页面模板实现与wordpress站点页面风格迥异的展现效果。

一、新建页面模板

找到wordpress当前使用的主题所在文件夹,一般位于/wp-content/themes/主题文件夹/template/ 目录

新建template-test.php文件,内容如下(如果你的主题本身有模板文件,建议参考自有主题的模板文件进行修改)

二、发布页面

在wordpress后台–页面–新建页面。 随便输入一些内容,然后选择你刚才新建的模板名“这是页面模板名字”然后发布即可。这是再访问该页面看看效果。

利用好页面模板的功能完全可[……]

网络第一篇python爬取图文到word(图文间隔混排)

网上关于python爬取图片及文字的教程一搜一大把,但是这些python程序都是把文字与图片单独保存的!可以说本文是将爬取到的图片及文字保存到word中的网络教程第一篇(至少我找了两天没有找到类似的教程),有些教程只是单纯地把图片堆砌到word末尾。关于网络爬虫的其他简略教程可以看我之前的几篇文章:

python3.7爬取新浪博客所有文章存入word

BeautifulSoup中的select筛选器

python+BeautifulSoup爬取网易新闻到txt文件

python操作word文档用的是  Python-docx Document库,如果没有安装的[……]

python+BeautifulSoup爬取网易新闻到txt文件

python支持跨平台运行,但是python2.x与python3.x的源码不一定通用, python3自带的2to3功能可以将2.x的源码转换成3.x的源码,可以在网上搜下教程获取我这篇文章里看下:Python3.7使用钉钉2.x版本接口(取token发钉钉消息)

本文python代码基于python3.7版本制作。使用BeautifulSoup库操作python爬取到的页面内容还是很方便的。这里直接以网易新闻科技板块第二页做示例:url = ‘http://tech.163.com/special/gd2016_02/’

python3.7爬取网易新闻完整源码

在[……]