前阵子做一个网站用户有需要把她们在微信公众号发的文章采集到WordPress上的需求,我找了很多不同的方法和插件(大多数没用或者已经下线),注意给我找到了一个非常不错的采集插件叫胖鼠采集。
胖鼠采集介绍
胖鼠采集是我网上冲浪终于找到的一个有用的采集插件。由国人(www.fatrat.cn)开发。微信公众号文章采集只是它非常小的一个功能分支而已。
“帮助你网站自动化的采集工具, 支持采集所有网站列表及详情页面 它拥有微信、简书、知乎、列表、历史、详情、等多种采集方式、还有自动采集, 自动发布, 自动打标签, 等许多黑科技功能, 一次创建规则, 后续省心省力. 还有许多演示例子,一键可用。如: 微信、简书、知乎、御龙在天、寻仙、虎扑等许多例子、快去享受吧!”
手动采集微信公众号文章
下载安装插件后,去到它的采集中心,在“微信爬虫”复制我们想要采集的微信公众号文章链接,多篇文章用回车一行一个,粘贴完后点采集即可。
微信公众号的文章链接可以直接打开文章,在右上角“复制链接”
采集成功后去到“数据桶中心”,里面会出现一个微信选项,因为你刚刚才采集的微信公众号文章,点击“进入桶”。
里面的侧边栏说的很清楚了 “第一次来数据桶, 要想发布文章, 点击下方保存发布配置,可快速保存默认发布配置” 这里我们可以给这个数据库一个默认的设置,方便下次直接发布采集的文章就可以了。
完成侧边栏的设置后,去到刚刚采集的文章下面点发布即可。(有的时候就算采集显示成功,尤其是多篇文章采集时,有些文章不会显示在这,在采集一次就行)
发布后,根据你在数据库里面选择的发布类型,在文章或页面里就可以看到采集的文章。里面的样式其实挺一言难尽的,你多多少少都需要手动调整一些内容。
自动采集微信公众号文章
- 为避免公众号被封禁,此功能已进行频率控制,请避免频繁使用。
- 如需大批量采集,建议有条件的用户准备多个微信公众号参数并进行轮换使用,以规避频繁调用风险。
- 其他选择是申请几个空白公众号专用于接口调用(无需备案或其他花费)。
- 功能用于学习交流,对于因不当使用此功能而导致的账号封禁,请自行负责
先通过F12打开检测界面后登陆微信公众平台,登录进入微信公众号首页。
在控制台 console中 执行命令:
console.log( new URLSearchParams(window.location.search).get("token"))
保存返回的结果,之后需要录入胖鼠采集工具里。
- 首先控制台切换到网络模块,在过滤URL中输入 https://mp.weixin.qq.com/cgi-bin/appmsgpublish
- 选择可见的网络请求中最后一次请求点击
- 会出现该请求的详细参数,选择消息头(火狐)或者标头(谷歌),下滑至请求头(火狐)或者请求标头(谷歌)
- 找到Cookie参数,复制值(只要值)
-
保存返回的值,之后需要录入胖鼠采集工具里。
打开胖鼠采集-采集中心-微信公众号历史文章采集
- 录入步骤4获取的微信公众平台cookie
- 录入步骤3获取的微信公众平台token
- 输入要采集的微信公众号名称全称(必须全称)
- 设置起始采集页数及要采集的页数(1页为20次文章发布)
- 点击采集按钮,等待文章入库
因官方接口返回的结果规律为每次发布(比方此公众号每日更新1次,每次更新5篇文章,那么采集1页为此公众号20天的发布,20天*每天5页=100条文章入库)
打开胖鼠采集-数据桶管理-微信 存在待采集文章时,待采集后面会显示一个play按钮,点击play按钮,等待全部入库完成。
自动采集内容来自胖鼠采集官方文章。