这不是一篇技术教程。这是一次真实的协作过程——从求助、到找方案、到踩坑、到解决。有血有肉,没有美化。
粉丝发来一条消息
"虾哥,这个资料老板要我转成word文档。" 接着就发来一个链接,
我说这个收费的网站,要遵守对方的条款。不能直接截取内容。
他说在网页上看不收费的,想下载到本地随时可以看,我就问他能不能找到原版的PDF文件下载,他说没有,我也让workBuddy找找。结果还是没有找到。
我想了想,回复:我先给你弄一下吧,workBuddy应该是可以的
方案制定
我打开workBuddy,帖给它URL,先讲一下需求,要转成word文档。由于考虑到这应该是一个爬虫任务,于是先让他给我制定方案,不要直接开始干活,遇到问题搞定不不说,还浪费我的积分。
制定方案对话模式不能是"draft"模式,要选择Plan模式。
其实我脑子里是有思路的,但这个事情得让workBuddy来处理,下次遇到类似的事情的时候才不能给我绕圈子。
workBuddy给我的方案是:
说起来,还是不错了, 那我就先让workBuddy给我找一下吧,毕竟我们通过搜索引擎没有找到,万一找到了,不也省事了吗?
结果,没有找到。workBuddy找到几个老版本的,基本上没有这个全。
那就开始我们自动化爬虫之旅吧,网页自动化 + 截图。数据下来了,后面就好说了。
开始动手
于是,我就让workBuddy给我写代码。
代码很快写完了, 他按标准的网页自动化代码开发的,开发完成我贴给他URL开始执行.
又失忆了
结果第一行就崩了。我看他控制台又再使用默认的3.7的Python版本。我用Python 3.12.7,支持UTF-8编码。所以,我给它加了一行,指定编码为UTF-8。
我一看他又要改代码,适配3.7的python,赶紧停止(这点workBuddy还是挺不错的,看着不对,可以直接操纵停止任务执行,避免任务启动失败一直跑,浪费我的积分。)
报错信息如下:
UnicodeEncodeError: 'gbk' codec can't encode character '\U0001f680'
emoji火箭符号把Python搞崩了——Windows默认编码是GBK,不支持这些花里胡哨的字符。
workBuddy阶段性的失忆也是常有的事,希望以后版本会越来越智能吧,于是追加一句,
这回没有再出错,跑出来了,
翻页的问题又折腾了一会儿,截图终于保存到本地文件夹里了.
清晰度太低了
能正常翻页了,能去重了,但看到截图的时候还是皱了下眉——
文字糊的,表格看不清。
不用紧张,直接告诉他:
不一会儿,直接修改完跑出来结果了, 并进行了总结回复:
最终成果
粉丝想要的资料,我该踩的雷踩完了,让粉丝自己去跑一下,授人以鱼,不如授人以渔:
于是,我将我保存的16张图片,以及我也workBuddy的对话记录,都发给了粉丝。
粉丝说:可以了。
复盘:这次协作到底哪里出了问题
回头看整个过程,我复盘了一下自己踩的坑:
第一个坑:环境规则没记住。粉丝明明在SOUL里写了要用conda py312,我看到报错才想起来。这说明什么?说明我每次都是在出问题之后才去看规则,而不是先看再动手。workBuddy经常会遇到这样的问题,希望以后版本升级能够修复吧,现阶段如果忘记了,强调一下就可以了。
第二个坑:把"网络请求结束"当成"页面加载完成"。这是Web自动化里最常见的误区之一。异步加载的页面,请求发完了不代表DOM出来了。
第三个坑:翻页按钮找不到。现代网页越来越多这样的设计——没有可见的UI元素,但交互事件挂在父容器上。不实际点一下根本不知道行不行。
第四个坑:没有先验重机制。截图之前没有和上一张对比,结果浪费了大量时间截重复的图。
第五个坑:默认清晰度不够。如果刚刚开始就直接告诉它,要高清截图,那就会省下一些积分。
最后,如果不确定的事情,就直接问workBuddy,让他给方案,如果确定的事情,或者踩坑之后,总结前后的对话内容,一次性交待清楚,会省下一些时间和积分。
一个感悟
写这篇文章的时候,我一直在想一个问题:粉丝为什么自己不折腾,要来找我?
是因为:
1.他不知道这个事能不能做,如何做— 他需要我的帮助,一个业务出身的人员,对技术的可行性分析不足。
2.他知道自己的能力边界— 他确定自己搞不定,但他知道这个问题有解
3.他知道找对的人— 程序员很多,但愿意帮他折腾几个小时的人不多
其实很多来找我的人都是这样——他们不是不会,是不值得自己学。
所以找到一个靠谱的搭子,比学会所有技能更重要。
这篇文章的代码我不打算优化得太漂亮——因为真实的工作就是这样,有临时变量,有重复逻辑,有为了赶时间没来得及重构的注释。
能用就行。好用最重要。
📦 扫码免费领取
文中提到的自动化截图脚本和完整对话记录
👆 扫码领取,备注"截图"更快通过
作者:8点虾聊AI | 专注AI效率工具与自动化工作流
2026年4月25日