图文自动发布(安卓手机)· 操作手册
Akke 内容工具 · 首发跑通 2026-06-03(饭粒账号 @一筑·全屋定制)· 给运营参考怎么用 + 说明为什么定时是半自动
一句话:把做好的「苹果便签风图文卡片」(一组 PNG)自动发到抖音。走 安卓手机 App(ADB + u2)通道 —— 电脑把图片推进手机相册,再用 u2 驱动抖音的发布流程:选图 → 填标题/正文/标签 → 发布。立即发=全自动;定时发=半自动(脚本全做完,只剩你手指拨 5 秒时间轮)。
发布通道
安卓手机 App
ADB + uiautomator2
SECTION 01这是干嘛 & 整体链路
给一个「主题 + 参考」,先由 Claude 生成内容、渲染成苹果备忘录风格的图文卡片(米黄底 + 高亮重点,不是 AI 文生图,是 HTML/CSS 截图,零成本质量可控),再把这组卡片自动发到抖音。本页只讲最后一步「发布」。
① 出内容
Claude · 判断题 —— 生成标题/正文/标签 + 内容 JSON。
② 出图
render.ts · 几秒 —— JSON → 每张 1080×1440 PNG(本机 Chrome 截)。
③ 进相册
adb push · 秒 —— 电脑把 PNG 推进手机相册 + 媒体扫描。
④ 发布
u2 驱动手机 · ~1 分 —— 开抖音→选图→填文案→发布(或定时)。
为什么能自动:安卓可以 adb push 一秒把图片塞进相册,u2 又能读到抖音发布页的界面元素去点。整条链路(含发布页、定时入口)真机验证全通。
SECTION 02输入:能接什么来源 / 出什么形式(有限制,重要)
很多人会问:"我直接把一个抖音/小红书链接发给你,能产出吗?"答案有落差,先说清,免得期望错位:
① 来源(参考素材)能接什么
| 你给的来源 | 能不能直接产出 | 说明 |
| 主题 / 一句话 | ✅ 最稳 | 例:「全屋定制签合同避坑」。直接生成,不依赖任何抓取。 |
粘贴的参考文字 (标题/文案) | ✅ 最稳 | 你把看到的好文案复制给我即可,零抓取风险。 |
| 抖音「图文帖」链接 | ✅ 已实测跑通 | 脚本下载帖子里每张图,Claude 直接读图(OCR 卡片上的文字 / 理解版式)+ 抽文案、话题、热门评论、收藏/点赞数。2026-06-03 实测:一条「全屋定制避坑指南」图文帖,4 张图全下全读、7 个章节内容 + 收藏 1647 等数据全拿到。 注意:v.douyin.com/xxx 短链要先 302 解析出 aweme_id(或直接给 aweme_id)再跑,脚本只认 /video/数字 形式。 |
| 抖音「视频」链接 | ⚠️ 仅文字层 | 只抽标题/文案/话题/热门评论 + 互动数,不转写口播、不读视频画面(视频不下载帧)。同日实测一条视频:文案/点赞数正常拿到、无图可下。 |
| 小红书链接 | ❌ 没做 | 解析脚本目前只支持抖音,小红书没实现(已确认不做)。 |
② 内容形式:参考可图文/视频,产出只「图文」
- 参考素材可以是图文帖、也可以是视频,但取的东西不同:图文帖会下载图片、Claude 读图(含卡片上的文字 + 版式);视频只取文字层(标题/文案/评论),不转写口播、不读画面。
- 产出永远是「图文」(苹果便签风卡片)。这套发布流程只发图文,不发视频。哪怕你参考的是一条爆款视频,产出的也是一组图文卡片,不是视频。
抖音图文链接怎么给 · 一个真实例子(2026-06-03 实跑)
你不用做任何处理,把抖音那条「复制打开抖音…」整段口令或链接直接发我即可(我会自己挑出链接)。后台实际跑的流程:
① 你发
抖音分享口令 / 链接,例:https://v.douyin.com/aSW7zBsw5MM/(「佳佳~李二妞家具基地」的图文帖)。
② 解析短链
v.douyin.com 短链 302 跳转 → 拿到 aweme_id 7615574711297317779(短链里没有 id,必须先跟跳转)。
③ 下载图片
parse_ref 从 detail 抽 4 张图 URL → 下载到 tuwen/ref/7615574711297317779/img-1~4.webp。
④ 读图提炼
Claude 读这 4 张图,提取出完整内容:「全屋定制避坑指南」7 章(报价坑 / 材料环保 / 板材结构 / 五金 / 设计量房 / 合同付款 / 安装验收)+ 极简口诀,连收藏数 1647 都拿到。
⑤ 出你的稿
基于读到的内容,给你生成一版你自己品牌的图文卡片(不是照搬,是参考重做)。
给链接的小抄:① 整段口令直接发,不用自己删字;② 必须是「图文帖」(左右滑多张图),视频帖只出文字层;③ 抓不到先看 §下面「现状」——多半查 VPN/代理。
现状(2026-06-03 实测):抖音图文帖链接「下载图片 → Claude 读图 → 出稿」已在本机端到端跑通。诚实保留:同一天早些时候曾抓到空 body(疑与本机代理/VPN 开关状态有关),所以哪天若抓不到,先查 VPN/代理,多半是网络问题不是脚本坏。
最省心的用法:发主题、参考文案文字、或把图文帖截图/存图发我(读图绕开抓取、不挑来源、最稳)。其次是抖音图文帖/视频链接(图文帖能读图、视频仅文字)。小红书链接不支持。
SECTION 03为什么是「安卓手机」,不是网页版 / iPhone
本来想走创作者中心网页版,走不通:
- 本机代理/VPN 动了 TLS —— creator.douyin.com 网页版 + cookie 路径在饭粒这台 Mac 上拿不到数据(同一现象:直连 PyPI 挂、国内镜像通)。手机自带网络绕开了这个问题。
为什么不是 iPhone(同事若是苹果机要注意):
iPhone 卡在第 0 步「图片进相册」:安卓 adb push 一秒进相册;iOS 沙盒封死了这条路,连你们发私信用的 WDA 也没法把图片写进相机胶卷,只能手动 AirDrop / 导入 —— 这一步就破了全自动。所以图文发布必须用安卓手机,iPhone 那套发 DM 的方案不能平移过来。
结论:图文发布集中用一台安卓手机最省事。同事如果也是安卓机,可照搬(见 §5)。
SECTION 04为什么「定时发布」没法全自动(核心)
立即发是全自动的;唯独「定时发布」要你手指拨一下时间。原因是抖音那个时间选择器的实现方式,对自动化极不友好 —— 它是 3 个惯性滚轮(技术上是 SeekBar 控件:日期 / 小时 / 分钟),真机实测两个硬伤:
| 硬伤 | 具体表现 |
| ① 读不到当前值 | 界面元素的可读属性(content-desc)永久卡在打开选择器那一刻的初值,不管轮子被拨到哪,程序读到的永远是初始时间 → 没法确认"现在停在几点"。 |
| ② 滑动不稳定 | 注入的滑动手势大多被忽略,偶尔才走 1 格,且步数不恒定(惯性滚动会甩过头)。普通滑动、快滑、无障碍滚动、键事件全试过都不可靠。 |
两个加一起 = 既滑不准、又读不到滑到哪了,盲拨必然把时间设错。要做到全自动,唯一办法是加「截图 OCR 闭环」:截屏识别中间高亮的 3 个数字 → 跟目标比 → 没到再滑一格 → 循环到命中。
为什么不做 OCR 闭环:① 引入 OCR 依赖,且要靠识别准确率 + 滑动重试,更重更脆;② 拨轮子对人只是 5 秒的事,对盲注入却是整条链路最不稳的一环 —— 为省这 5 秒引入一堆脆弱性,性价比太低。所以定时设计成「脚本做完一切、人拨 5 秒轮子、脚本再点确定+发布」的半自动。哪天觉得拨轮子烦,再加 OCR 闭环。
SECTION 05怎么用(每次)
最省事:直接跟 Claude 说一句,不用记命令。前提:手机 USB 连电脑、开 USB 调试、抖音登着你的号。
开口三选一(喂什么都行):
- 给主题:「把"全屋定制签合同避坑"做成图文发了」。
- 给参考文案:「照这段文案做条图文:…(把文字粘进来)」。
- 给抖音图文链接 👈:「参考这条做一条发了 https://v.douyin.com/xxx」。整段"复制打开抖音…"口令直接发即可,我会自动解析链接 → 下载帖子图片 → 读图 → 参考重做你自己的图文(链接细节和实例见 §02)。必须是图文帖(多图),视频只取文字。
立即发 全自动
说一句「把 XX(主题/这条链接)做成图文发了」。流程:生成/参考内容 → 出图 → 选图填文案 → 停在发布页截图给你看 → 你点头 → 发。你只动两下:审文案、发布页点头。
# 手动版(先 --no-publish 停发布页核对,确认后去掉再真发):
python3 tuwen/publish_app.py --slug qianhetong --mode now --no-publish
python3 tuwen/publish_app.py --slug qianhetong --mode now
定时发 半自动 · 两段
跟 Claude 说:「把这条图文定时发到后天晚上 8 点」。流程:脚本自动选图填文案 → 打开定时选择器后停 → 告诉你「拨到 X月X日 / 20 / 00」→ 你在手机上拨 3 个轮子(5 秒) → 回一句"好了" → 脚本点确定 + 发布。
# phase1:选图填文案 + 打开定时选择器后停,打印要拨到的时间
python3 tuwen/publish_app.py --slug qianhetong --mode schedule --at "2026-06-05 20:00"
# —— 此时人工在手机上拨 3 个轮子到上面那个时间 ——
# phase2:拨好后点确定 + 发布(设备须仍停在选择器,别切走)
python3 tuwen/publish_app.py --slug qianhetong --finalize-schedule
点「确定」后,高级设置里会回显「X月Y日 HH:MM 发布」,可核对时间对不对。抖音原生定时范围:最早 +2 小时、最晚 +14 天。
SECTION 06同事怎么配(也得是安卓机)
照搬即可,但第一次有一步必做:重标坐标。
# 一次性准备
git pull # 拉最新(脚本在 tuwen/publish_app.py)
pip install uiautomator2 # 装 u2;adb 用 platform-tools
adb devices # 手机 USB 连、开 USB 调试、抖音登你自己号
⚠️ 重标坐标(唯一额外门槛):脚本里的屏幕坐标是按饭粒那台红米标的,你手机机型/分辨率不同,坐标对不上。让你的 Claude 第一次照发布流程跑一遍、dump 界面,把 publish_app.py 顶部那几个坐标(CAPTURE_BTN / ALBUM_BTN / PIC_TAB / COL_X / ROW_Y)改成你手机的。标一次就固定,以后跟饭粒用法完全一样。
之后日常:跟你的 Claude 说「发个图文 / 定时发到 X 点」就行。定时同样要你手动拨一下时间轮。
SECTION 07已知边界 & 坑(维护 / 换机的人看)
- 坐标机型专属:当前按红米 houji 1200×2670 标定,换机必重标(见 §5)。
- 标签上限 5:抖音发布最多 5 个话题标签,脚本自动取前 5(多了请把曝光量最小的放后面)。最后一个
#标签 后留个空格才"落定",否则会弹话题联想黏上长尾词。
- 正文 emoji 入框前必剥:安卓输入法对 emoji 会截断,脚本发布前自动去掉 emoji(图片里的 emoji 不受影响)。
- 多选要点缩略图右上的「选择」圈,不是点缩略图本体(点本体会进单图预览)。脚本靠把卡片 mtime 设成最新让它们排相册最前、按序选 card-1…N。
- 收键盘的 back 键会误导航:填完文案收键盘那一下可能把页面退回上一步,脚本已做"退回了就再下一步回来"的兜底。
- 定时全自动 = TODO:需截图 OCR 闭环,ROI 低暂不做(见 §3)。