upio.ai / Akke / 图文自动发布

图文自动发布(安卓手机)· 操作手册

Akke 内容工具 · 首发跑通 2026-06-03(饭粒账号 @一筑·全屋定制)· 给运营参考怎么用 + 说明为什么定时是半自动
01 这是干嘛 02 来源 & 形式 03 为什么是安卓手机 04 为什么定时半自动 05 怎么用 06 同事怎么配 07 已知边界 & 坑
一句话:把做好的「苹果便签风图文卡片」(一组 PNG)自动发到抖音。走 安卓手机 App(ADB + u2)通道 —— 电脑把图片推进手机相册,再用 u2 驱动抖音的发布流程:选图 → 填标题/正文/标签 → 发布。立即发=全自动;定时发=半自动(脚本全做完,只剩你手指拨 5 秒时间轮)。
发布通道
安卓手机 App
ADB + uiautomator2
立即发布
全自动
选图+文案+发布
定时发布
半自动
人工拨 5 秒时间轮
首发
已成
6 图图文 + 5 标签
SECTION 01这是干嘛 & 整体链路

给一个「主题 + 参考」,先由 Claude 生成内容、渲染成苹果备忘录风格的图文卡片(米黄底 + 高亮重点,不是 AI 文生图,是 HTML/CSS 截图,零成本质量可控),再把这组卡片自动发到抖音。本页只讲最后一步「发布」

① 出内容
Claude · 判断题 —— 生成标题/正文/标签 + 内容 JSON。
② 出图
render.ts · 几秒 —— JSON → 每张 1080×1440 PNG(本机 Chrome 截)。
③ 进相册
adb push · 秒 —— 电脑把 PNG 推进手机相册 + 媒体扫描。
④ 发布
u2 驱动手机 · ~1 分 —— 开抖音→选图→填文案→发布(或定时)。
为什么能自动:安卓可以 adb push 一秒把图片塞进相册,u2 又能读到抖音发布页的界面元素去点。整条链路(含发布页、定时入口)真机验证全通。
SECTION 02输入:能接什么来源 / 出什么形式(有限制,重要)

很多人会问:"我直接把一个抖音/小红书链接发给你,能产出吗?"答案有落差,先说清,免得期望错位:

① 来源(参考素材)能接什么

你给的来源能不能直接产出说明
主题 / 一句话✅ 最稳例:「全屋定制签合同避坑」。直接生成,不依赖任何抓取。
粘贴的参考文字
(标题/文案)
✅ 最稳你把看到的好文案复制给我即可,零抓取风险。
抖音「图文帖」链接✅ 已实测跑通脚本下载帖子里每张图,Claude 直接读图(OCR 卡片上的文字 / 理解版式)+ 抽文案、话题、热门评论、收藏/点赞数。2026-06-03 实测:一条「全屋定制避坑指南」图文帖,4 张图全下全读、7 个章节内容 + 收藏 1647 等数据全拿到。
注意v.douyin.com/xxx 短链要先 302 解析出 aweme_id(或直接给 aweme_id)再跑,脚本只认 /video/数字 形式。
抖音「视频」链接⚠️ 仅文字层只抽标题/文案/话题/热门评论 + 互动数不转写口播、不读视频画面(视频不下载帧)。同日实测一条视频:文案/点赞数正常拿到、无图可下。
小红书链接❌ 没做解析脚本目前只支持抖音,小红书没实现(已确认不做)。

② 内容形式:参考可图文/视频,产出只「图文」

抖音图文链接怎么给 · 一个真实例子(2026-06-03 实跑)

你不用做任何处理,把抖音那条「复制打开抖音…」整段口令或链接直接发我即可(我会自己挑出链接)。后台实际跑的流程:

① 你发
抖音分享口令 / 链接,例:https://v.douyin.com/aSW7zBsw5MM/(「佳佳~李二妞家具基地」的图文帖)。
② 解析短链
v.douyin.com 短链 302 跳转 → 拿到 aweme_id 7615574711297317779(短链里没有 id,必须先跟跳转)。
③ 下载图片
parse_ref 从 detail 抽 4 张图 URL → 下载到 tuwen/ref/7615574711297317779/img-1~4.webp
④ 读图提炼
Claude 读这 4 张图,提取出完整内容:「全屋定制避坑指南」7 章(报价坑 / 材料环保 / 板材结构 / 五金 / 设计量房 / 合同付款 / 安装验收)+ 极简口诀,连收藏数 1647 都拿到。
⑤ 出你的稿
基于读到的内容,给你生成一版你自己品牌的图文卡片(不是照搬,是参考重做)。
给链接的小抄:① 整段口令直接发,不用自己删字;② 必须是「图文帖」(左右滑多张图),视频帖只出文字层;③ 抓不到先看 §下面「现状」——多半查 VPN/代理。
现状(2026-06-03 实测):抖音图文帖链接「下载图片 → Claude 读图 → 出稿」已在本机端到端跑通。诚实保留:同一天早些时候曾抓到空 body(疑与本机代理/VPN 开关状态有关),所以哪天若抓不到,先查 VPN/代理,多半是网络问题不是脚本坏。
最省心的用法:发主题参考文案文字、或把图文帖截图/存图发我(读图绕开抓取、不挑来源、最稳)。其次是抖音图文帖/视频链接(图文帖能读图、视频仅文字)。小红书链接不支持
SECTION 03为什么是「安卓手机」,不是网页版 / iPhone

本来想走创作者中心网页版,走不通:

为什么不是 iPhone(同事若是苹果机要注意):

iPhone 卡在第 0 步「图片进相册」:安卓 adb push 一秒进相册;iOS 沙盒封死了这条路,连你们发私信用的 WDA 也没法把图片写进相机胶卷,只能手动 AirDrop / 导入 —— 这一步就破了全自动。所以图文发布必须用安卓手机,iPhone 那套发 DM 的方案不能平移过来。
结论:图文发布集中用一台安卓手机最省事。同事如果也是安卓机,可照搬(见 §5)。
SECTION 04为什么「定时发布」没法全自动(核心)

立即发是全自动的;唯独「定时发布」要你手指拨一下时间。原因是抖音那个时间选择器的实现方式,对自动化极不友好 —— 它是 3 个惯性滚轮(技术上是 SeekBar 控件:日期 / 小时 / 分钟),真机实测两个硬伤:

硬伤具体表现
① 读不到当前值界面元素的可读属性(content-desc)永久卡在打开选择器那一刻的初值,不管轮子被拨到哪,程序读到的永远是初始时间 → 没法确认"现在停在几点"。
② 滑动不稳定注入的滑动手势大多被忽略,偶尔才走 1 格,且步数不恒定(惯性滚动会甩过头)。普通滑动、快滑、无障碍滚动、键事件全试过都不可靠。

两个加一起 = 既滑不准、又读不到滑到哪了,盲拨必然把时间设错。要做到全自动,唯一办法是加「截图 OCR 闭环」:截屏识别中间高亮的 3 个数字 → 跟目标比 → 没到再滑一格 → 循环到命中。

为什么不做 OCR 闭环:① 引入 OCR 依赖,且要靠识别准确率 + 滑动重试,更重更脆;② 拨轮子对人只是 5 秒的事,对盲注入却是整条链路最不稳的一环 —— 为省这 5 秒引入一堆脆弱性,性价比太低。所以定时设计成「脚本做完一切、人拨 5 秒轮子、脚本再点确定+发布」的半自动。哪天觉得拨轮子烦,再加 OCR 闭环。
SECTION 05怎么用(每次)

最省事:直接跟 Claude 说一句,不用记命令。前提:手机 USB 连电脑、开 USB 调试、抖音登着你的号。

开口三选一(喂什么都行):

立即发 全自动

说一句「把 XX(主题/这条链接)做成图文发了」。流程:生成/参考内容 → 出图 → 选图填文案 → 停在发布页截图给你看 → 你点头 → 发。你只动两下:审文案、发布页点头。
# 手动版(先 --no-publish 停发布页核对,确认后去掉再真发):
python3 tuwen/publish_app.py --slug qianhetong --mode now --no-publish
python3 tuwen/publish_app.py --slug qianhetong --mode now

定时发 半自动 · 两段

跟 Claude 说:「把这条图文定时发到后天晚上 8 点」。流程:脚本自动选图填文案 → 打开定时选择器后停 → 告诉你「拨到 X月X日 / 20 / 00」→ 你在手机上拨 3 个轮子(5 秒) → 回一句"好了" → 脚本点确定 + 发布。
# phase1:选图填文案 + 打开定时选择器后停,打印要拨到的时间
python3 tuwen/publish_app.py --slug qianhetong --mode schedule --at "2026-06-05 20:00"
# —— 此时人工在手机上拨 3 个轮子到上面那个时间 ——
# phase2:拨好后点确定 + 发布(设备须仍停在选择器,别切走)
python3 tuwen/publish_app.py --slug qianhetong --finalize-schedule
点「确定」后,高级设置里会回显「X月Y日 HH:MM 发布」,可核对时间对不对。抖音原生定时范围:最早 +2 小时、最晚 +14 天
SECTION 06同事怎么配(也得是安卓机)

照搬即可,但第一次有一步必做:重标坐标

# 一次性准备
git pull                                   # 拉最新(脚本在 tuwen/publish_app.py)
pip install uiautomator2                    # 装 u2;adb 用 platform-tools
adb devices                                # 手机 USB 连、开 USB 调试、抖音登你自己号
⚠️ 重标坐标(唯一额外门槛):脚本里的屏幕坐标是按饭粒那台红米标的,你手机机型/分辨率不同,坐标对不上。让你的 Claude 第一次照发布流程跑一遍、dump 界面,把 publish_app.py 顶部那几个坐标(CAPTURE_BTN / ALBUM_BTN / PIC_TAB / COL_X / ROW_Y)改成你手机的。标一次就固定,以后跟饭粒用法完全一样。

之后日常:跟你的 Claude 说「发个图文 / 定时发到 X 点」就行。定时同样要你手动拨一下时间轮。

SECTION 07已知边界 & 坑(维护 / 换机的人看)
  • 坐标机型专属:当前按红米 houji 1200×2670 标定,换机必重标(见 §5)。
  • 标签上限 5:抖音发布最多 5 个话题标签,脚本自动取前 5(多了请把曝光量最小的放后面)。最后一个 #标签 后留个空格才"落定",否则会弹话题联想黏上长尾词。
  • 正文 emoji 入框前必剥:安卓输入法对 emoji 会截断,脚本发布前自动去掉 emoji(图片里的 emoji 不受影响)。
  • 多选要点缩略图右上的「选择」圈,不是点缩略图本体(点本体会进单图预览)。脚本靠把卡片 mtime 设成最新让它们排相册最前、按序选 card-1…N。
  • 收键盘的 back 键会误导航:填完文案收键盘那一下可能把页面退回上一步,脚本已做"退回了就再下一步回来"的兜底。
  • 定时全自动 = TODO:需截图 OCR 闭环,ROI 低暂不做(见 §3)。