分享笔记:

WordPress采集微信公众号文章

胖鼠采集微信文章

前阵子做一个网站用户有需要把她们在微信公众号发的文章采集到WordPress上的需求,我找了很多不同的方法和插件(大多数没用或者已经下线),注意给我找到了一个非常不错的采集插件叫胖鼠采集

wordpress采集微信公众号文章

胖鼠采集介绍

胖鼠采集是我网上冲浪终于找到的一个有用的采集插件。由国人(www.fatrat.cn)开发。微信公众号文章采集只是它非常小的一个功能分支而已。

“帮助你网站自动化的采集工具, 支持采集所有网站列表及详情页面 它拥有微信、简书、知乎、列表、历史、详情、等多种采集方式、还有自动采集, 自动发布, 自动打标签, 等许多黑科技功能, 一次创建规则, 后续省心省力. 还有许多演示例子,一键可用。如: 微信、简书、知乎、御龙在天、寻仙、虎扑等许多例子、快去享受吧!”

胖鼠采集微信公众号文章插件

手动采集微信公众号文章

下载安装插件后,去到它的采集中心,在“微信爬虫”复制我们想要采集的微信公众号文章链接,多篇文章用回车一行一个,粘贴完后点采集即可。

粘贴微信公众号文章链接采集

微信公众号的文章链接可以直接打开文章,在右上角“复制链接”

采集成功后去到“数据桶中心”,里面会出现一个微信选项,因为你刚刚才采集的微信公众号文章,点击“进入桶”。

微信公众号文章采集数据

里面的侧边栏说的很清楚了 “第一次来数据桶, 要想发布文章, 点击下方保存发布配置,可快速保存默认发布配置” 这里我们可以给这个数据库一个默认的设置,方便下次直接发布采集的文章就可以了。

微信公众号文章采集数据发布设置

完成侧边栏的设置后,去到刚刚采集的文章下面点发布即可。(有的时候就算采集显示成功,尤其是多篇文章采集时,有些文章不会显示在这,在采集一次就行)

微信公众号文章采集数据发布

发布后,根据你在数据库里面选择的发布类型,在文章或页面里就可以看到采集的文章。里面的样式其实挺一言难尽的,你多多少少都需要手动调整一些内容。

微信公众号文章采集

自动采集微信公众号文章

  • 为避免公众号被封禁,此功能已进行频率控制,请避免频繁使用。
  • 如需大批量采集,建议有条件的用户准备多个微信公众号参数并进行轮换使用,以规避频繁调用风险。
  • 其他选择是申请几个空白公众号专用于接口调用(无需备案或其他花费)。
  • 功能用于学习交流,对于因不当使用此功能而导致的账号封禁,请自行负责

先通过F12打开检测界面后登陆微信公众平台,登录进入微信公众号首页。

登录微信公众号后台自动采集文章
图片来自胖鼠采集官方网站
登录微信公众号后台自动采集文章
图片来自胖鼠采集官方网站
微信公众号后台采集返回值数
图片来自胖鼠采集官方网站
在控制台 console中 执行命令:
console.log(  new URLSearchParams(window.location.search).get("token"))

保存返回的结果,之后需要录入胖鼠采集工具里。

微信公众号后台采集返回值数
图片来自胖鼠采集官方网站
  • 首先控制台切换到网络模块,在过滤URL中输入 https://mp.weixin.qq.com/cgi-bin/appmsgpublish
  • 选择可见的网络请求中最后一次请求点击
  • 会出现该请求的详细参数,选择消息头(火狐)或者标头(谷歌),下滑至请求头(火狐)或者请求标头(谷歌)
  • 找到Cookie参数,复制值(只要值)
  • 保存返回的值,之后需要录入胖鼠采集工具里。

wordpress自动采集微信公众号文章
图片来自胖鼠采集官方网站

打开胖鼠采集-采集中心-微信公众号历史文章采集

  • 录入步骤4获取的微信公众平台cookie
  • 录入步骤3获取的微信公众平台token
  • 输入要采集的微信公众号名称全称(必须全称)
  • 设置起始采集页数及要采集的页数(1页为20次文章发布)
  • 点击采集按钮,等待文章入库

因官方接口返回的结果规律为每次发布(比方此公众号每日更新1次,每次更新5篇文章,那么采集1页为此公众号20天的发布,20天*每天5页=100条文章入库)

wordpress自动采集微信公众号文章
图片来自胖鼠采集官方网站

打开胖鼠采集-数据桶管理-微信 存在待采集文章时,待采集后面会显示一个play按钮,点击play按钮,等待全部入库完成。

自动采集内容来自胖鼠采集官方文章

为笔记评分

平均评分 5 / 5. 摘星者: 3

有疑问?留个言吧!

?>

更多结果...

Generic selectors
Exact matches only
Search in title
Search in content
Post Type Selectors