有大有小 · 第 3 次会议

一个月 · 从底盘到矩阵
智能获客 + 多通道触达 + AI 内容矩阵

过去一个月,我们完成了号源体系、评论池清洗、AI 文案迭代、双链路防风控、内容矩阵搭建。这次会议把全部进度按数据 → 系统 → 文案 → 内容 → 通道五条线汇报,并提出需要"有大有小"协同支持的事项。

会议 · 第 3 次进展同步 日期 · 2026-05-21 数据口径 · Supabase 生产库实时快照

PART 01 · 数据底盘

一个月线索池:2.5 万评论 · 2.1 万独立潜客

线索的"水源"已经稳定 — 评论入库时效近 99% 在 30 天内、近 64% 在 7 天内,覆盖 606 个活跃竞品号、12,600+ 条视频。

累计评论
25,057
较上次会议 +52%(5/12 起)
独立潜客
21,680
按抖音 user_id 唯一
已抓视频
12,633
每天新增 ~400 条
高+中意向
6,723
高 4,209 + 中 2,514

我们抓入库时间分布即评论被 Akke 抓到的时间

最近 24 小时内抓到
3,896
15.5%
3 天内抓到
10,741
42.9%
7 天内抓到
16,059
64.1%
14 天内抓到
18,342
73.2%
30 天内抓到
25,023
99.9%
字段说明:created_at 是我们 worker 把这条评论写进 DB 的时刻,反映抓取系统吞吐量;与右图 comment_time(评论者发布时间)严格区分。

评论真实发布时间分布即评论者在抖音上敲出的真实时间

最近 24 小时内发的
1,464
5.8%
7 天内发的
11,203
44.5%
30 天内发的
17,237
68.5%
90 天内发的
19,253
76.5%
1 年内发的
21,459
85.3%
字段说明:comment_time 从抖音原始 create_time 字段(epoch 时间戳)取得,与 created_at(我们抓入库的时间)严格区分。
数据完整度:24,434 / 25,157 条评论有 comment_time(97.1%),723 条(2.9%)NULL;>1 年的 2,975 条对应老视频下的存量评论。
时效价值:44.5% 评论是过去 7 天内发出的、68.5% 在过去 30 天内 — 意味着相当比例的评论者装修需求仍在"决策窗口"内。我们抓取系统的吞吐已能在 1 周内把目标号源的新评论全消化,下一步是把"评论 → 触达"的匹配延迟从天级压到小时级。

PART 02 · 号源体系 + 数据清洗

2,062 个抖音同行号 → AI 自动按业务类型 + 意向浓度分级

通过评论池反向挖掘 + 关键词圈选 + 自动分档审核,五次扩库到 2,062 个号源;每条评论都过 AI 双模型分析(意向打分 + 业务分类),自动剔除 60% 的同行互动/广告/灌水。

号源总规模
2,062
5 批次扩张(5/12 → 5/20)
活跃号源(7d)
606
29.4% 仍在产出新评论
业务类型
5
本地 / 工厂 / 知识 / 品牌 / 平台
无关评论自动剔除
14,991
59.8% 噪音被 AI 过滤

★ 不同号源类型的"潜客浓度"差异显著按评论意向标签聚合

号源类型活跃号评论数独立用户高意向中意向无关高+中%
平台号 行业媒体 / 资讯34844141749511455.6%
知识号 设计师 / KOL / 讲解类573,4793,1948118581,11348.0%
本地号 地方工长 / 区域装修队3281,2351,09222612976128.7%
工厂号 板材厂 / 整装工厂1991,2981,10014016086123.1%
品牌号 欧派 / 索菲亚 / 兔宝宝191,1339524418577120.2%
历史归档 已合并/停用号的孤儿17,25815,1922,7901,07311,25522.4%
关键洞察:知识号(设计师 / KOL)下的评论意向浓度是品牌号的 2.4 倍。原因:品牌号下的评论多为同行打广告 + 老客打卡;设计师讲拆单/避坑视频下的评论才是真实业主"对号入座"。下一步我们会在号源审核上把"知识号"权重 ×2,优先抓设计师视角的内容。

活跃号源按业务类型分布606 个活跃号

本地号地方工长 / 装修队 / 区域工厂
328
工厂号板材厂 / 整装工厂 / 工坊
199
知识号设计师 / 行业 KOL
57
品牌号欧派 / 索菲亚 / 兔宝宝等
19
平台号媒体 / 行业资讯
3

AI 双模型清洗 · 工作流DeepSeek V4-Pro / V4-Flash

📥
原始评论
25,057
🔍
入库规则过滤
招商/广告/同行
~60%过
🧠
V4-Flash 打标
意向 + 业务分类
24,713
高+中意向
进入触达池
6,723
每条评论被 AI 分析时同时打 3 个轴:意向轴(高/中/低/无关)、分类轴(家装/家电/家具)、同业反讽轴(拦同行/官方号画像评论)。三轴交叉自动短路 — 比如"家电+无关"直接 reject 不进触达池。

PART 03 · 与平台风控的对抗

双链路 · 纵深防御 · 让账号"看起来像真实用户"

抖音对"爬虫 / 营销私信"部署了多层风控,我们把采集触达设计成两条独立链路 — 独立账号池、独立速率预算、独立健康状态机。任一边被风控,另一边继续运转。

30
采集端 连续 0 封号
11%
触达端 风控命中率(行业 ~30%)
10×
iPhone WDA 比 Web 路径风控宽松
2
独立链路 风控传染隔离
链路一 · COLLECT
🔍 数据采集
从公开内容中找到表达需求的潜客
A
官方 Web API 优先 ⚡ 10× faster
用与官方 Web 等价的签名直调评论 API,请求形态与真实用户一致 — 比浏览器自动化快一个数量级,绝大多数任务无需开浏览器。
B
无头浏览器指纹补丁(兜底) 8 项 JS 补丁
API 失败才落浏览器:注入 8 项 JS 补丁 — 隐藏自动化标记伪造 GPU 厂商Canvas 像素噪声、对齐时区/分辨率/语言。让 JS 可见的指纹接近真实桌面。
C
行为时序随机化 jitter ±30%
所有等待都包了抖动函数,操作间隔围绕基准上下浮动 — 破坏"机器规律性间隔"指纹;UA 池随机轮换,多桌面平台型号交叉。
D
账号健康状态机 多租户硬隔离
每号有日使用量 + 连续失败计数。低位阈值进冷却、高位阈值升级封禁告警,成功立即清零。多租户硬隔离 — 每客户独立账号池。
E
入库前广告过滤 省 ~25% AI 预算
同行打的广告污染线索 + 浪费 AI 预算。写库前规则识别 招商加盟 / 加微留联 / 工厂直供 / 地理+行业组合,命中即归档"已跳过"。
链路二 · OUTREACH
💬 客户触达
把审核过的文案以个人身份送到陌生客户
A
主链 · iPhone 真机 WDA 2026-04-30 切换
放弃 Web 路径,切到 iPhone WebDriverAgent + 真机操控抖音 App — 风控宽松 10×。Mac 远程 Mirroring 可同时操控多机。
B
协议层 vs 业务层 双校验 protobuf decode
DM 接口"成功"分两层:协议 200 OK 只代表收到,解 protobuf 拿业务级 status_code 才算送达 — 风控会静默丢弃但返 200,单看 HTTP 状态会被骗。
C
验证码 vs 封号 严格二分 防误封
遇错严格区分两类:含"验证中间页"关键词 → 指纹被挑战,账号没事,只标本次失败;含"Cookie 失效/封禁" → 账号级故障,进封禁流程。混淆两者会大量误封正常号。
D
三层节流 · 日量 / 时段 / 间隔 ≤30/天
单号每天 ≤ 30 条 + 早 9~晚 11 时段窗 + 单条间随机 60~180 秒抖动。模拟"人花一天慢慢回评论"的节奏 — 而非批处理冲量。
E
风控状态码字典 + 自动停号 4 类自动处置
7173 陌生人配额 · 7462 单向限频 · 7911 24h 冷却 · 22102 内容拦截 — 各自映射不同处置策略。命中后自动停号 + Lark 实时告警。
🛡️
对抗成果:采集端连续 30 天 0 封号;触达端 7 天送达 254 条 DM,仅 11% 命中 7173/7462 配额,远低于行业 30%+ 水位。两条链路任一被风控不影响另一边。
完整方案 →

PART 04 · AI 文案迭代

破冰打招呼 V17 · 反向评论 V14 · 共计 31 轮 prompt 迭代

每条 DM / 评论都不是模板填空,而是 LLM 基于客户昵称 + 视频上下文 + 评论原文实时生成。一个月里我们把"破冰打招呼"迭代了 17 轮,"反向评论"迭代了 14 轮 — 不停在专业度、口语化、避雷之间打磨。

🧊 破冰打招呼 · ice_breakDM 首次触达文案

解决问题:陌生人首发 DM 既要让对方看出"看过你视频",又不能像营销硬推 — 模型在"贴心 / 推销 / 客气"三角间不停校准。
17 轮关键迭代
V1 · 4/29 单段
V4 · 5/9 注入品牌
V7 · 5/12 防泄漏
V10 · 5/14 拆价格
V12 · 5/14 软化硬约束
V13 · 5/14 加礼貌前缀
V14 · 5/14 双无信号 self-check
V15 · 5/14 (G) 分支
V16 · 5/14 5 个硬绑 ban
V17 · 5/15 称谓全锁
代表性变化:删气候话术(潮气重/回南天太硬)→ 后置 5 个硬绑 ban check 兜底 self-check → 双无信号短路防硬推销 → 称谓 7 档锁定(避免"友友"等抖音 slang 显年轻、显敷衍)。

💬 反向评论 · reverse-comment在客户视频下"以业主朋友"身份评论

解决问题:客户视频底下我们留一条"专业评论" — 既要让客户感到被理解,又要让其他业主路过看到也觉得"这条评论靠谱",间接为品牌引流。
14 轮关键迭代
V1 · 5/11 风控升级
V2 · 5/12 位置隔离
V3 · 5/13 销售路线
V5 · 5/13 Py 单路径
V7 · 5/14 禁陈述对方
V8 · 5/13 4 步开场
V9 · 5/13 按昵称推性别
V10 · 5/14 audit + 改朋友
V12 · 5/15 称呼 7 档锁
V14 · 5/18 价格锚定占位化
代表性变化:删"家人们/友友"等 slang → 按昵称推性别("姐"/"哥"/"老板")→ 引入 audit 步骤检测杜撰话术 → 价格锚定占位化(让品牌方填入实际报价)→ 同行打听过滤。
沉淀:所有 prompt 版本进 Langfuse 做版本化管理,可一键回滚;每条线上生成都打 trace、可重放、可对比。这也是"待支持事项 #2" — 我们希望"有大有小"派一位资深销售/设计师 review 当前文案在专业话术上的细节。

PART 05 · 内容矩阵

最近搭建的两条视频账号工作流 · 双视角内容供给

触达的下一步是"养号 + 内容矩阵" — 让"有大有小"在抖音上同时有品牌输出用户视角两种内容形态,覆盖业主从"刷到 → 信任 → 私信"的完整心智链。

🎬

工作流 A · AI 业主/设计师短剧

品牌角度 · BRAND POV
每天自动产出 1 条"业主吐槽 + 设计师答疑"的 30~45 秒 AI 真人短剧,剧本融入有大有小的工艺亮点、报价透明、案例素材。让品牌号持续有内容供给,避免传统拍摄 + 剪辑的 3 天/条产能瓶颈。
选题 脚本 分镜 视频 配音 字幕 成片
核心 AI 模型DeepSeek V4 + 可灵 + 火山 TTS
单条成本≈ ¥10
建设进度✓ Scaffolding · 待 PM 拍板 vendor
3 个审核 gate选题 / 脚本 / 成片
📲

工作流 B · 小红书爆款 → 抖音二改

用户角度 · USER POV
PM/运营粘小红书业主装修日记爆款链接 → 30 秒拿到二改视频(水平翻转 + 音频变速 + 抖音风格标题/标签/正文)。借助"真实业主视角"内容快速铺量,避免品牌号过于"硬广"导致用户跳过。
粘链接 下载原片 翻转+变速 改写标题 导出
核心引擎FFmpeg + DeepSeek V4 改写
单条耗时≈ 30 秒
建设进度✓ 已生产运营 · PM 即用
下一版BGM 替换 / 品牌水印 / 批量录入
双视角的价值:品牌角度(专业 / 工艺 / 报价)单独看会显得"硬广",用户角度(业主吐槽 / 翻车踩坑)单独看缺乏可信背书 — 两条工作流并行,让"有大有小"的抖音号矩阵同时拥有权威信源真实口碑,覆盖业主决策的双侧心智。

PART 06 · 平台与通道扩展

小红书抓取上线 · Outbound v0.1 三通道骨架已完工

从"抖音 + 私信"单链,升级为"抖音 + 小红书双平台获客 × 私信 + 电话 + 短信 + 企微四通道触达"网络。Outbound 三通道 v0.1(电话/短信/企微)的骨架代码、数据库 schema、审批 UI、沙箱端到端全部完成,离上线只差"甲方选供应商 + 提供凭证"。

A · 小红书抓取建设状态第二平台

模块说明状态
数据库表结构xhs_source_accounts / xhs_notes / xhs_comments + RLS✓ 已上线
签名服务反编译小红书签名算法 → Docker 容器化✓ 已部署
抓取客户端主页 URL → 笔记列表 → 评论;normal / video 两类✓ 已联调
本机 PoC 端到端命令行一键拉单博主 N 篇笔记 + 全部评论入库✓ 跑通
生产环境部署本周接入服务器开始批量抓全屋定制同行号本周上线
同行号源沉淀复用抖音"评论反挖"方法论,目标 4 周扩到 500+规划中

B · 电话 / 短信 / 企业微信 — Outbound Pipeline v0.1 已完工

建设状态分支 feat/outbound-pipeline · 6 commits · 2,851 行代码

模块说明状态
17 章节设计稿覆盖架构 / 数据模型 / 审批流 / 沙箱 / 合规 / 风险全 17 章✓ 完成
数据库 schemaoutbound_forms / leads / messages / dispatches / consent / dnc / channel_configs / audit_log 共 8 张表 + RLS + rollback SQL✓ 已写入
Next.js 公开收资页/forms/<slug> 可定制字段 + 合规授权文案 + 提交即落 outbound_leads✓ 完成
Dashboard 审批 4 页Forms / Leads / Dispatches / Settings — 运营审 → 一键放行调度✓ 完成
3 个 Cron 路由意向打分 / 自动派发 / 状态回收✓ 完成
Python Outbound worker独立 FastAPI 进程,含 DNC(退订名单)+ 限速 + dispatcher 编排✓ 完成
电话 / 短信 / 企微 三通道 adapter每通道 mock + stub 双实现:mock 端到端跑通;stub 留给真供应商接入✓ 沙箱通
真供应商接入电话:容联七陌 / 阿里云 stub 待真凭证 | 短信:阿里云 / 腾讯 stub | 企微:官方 API stub待选供应商
生产部署独立 Fly app akke-outbound-prod(Dockerfile + fly.toml 已写好)待 PR 合 + Fly 起
📞
电话外呼
v0.1 ✓
面向"评论中暴露电话 / 表单留联"的高意向客户,AI 外呼 / 人工座席首次跟进。adapter mock 跑通 call_sid 全流程。
触达策略仅留联客户
候选供应商容联七陌 / 阿里云
阻塞项甲方选供应商 + 凭证
💬
短信触达
v0.1 ✓
作为 DM ≥7 天未回客户的二次唤醒通道,AI 个性化模板 + 退订(DNC)名单。adapter mock 跑通发送 + 回执。
触发DM 7 日无回
候选供应商阿里云 / 腾讯 / 运营商
阻塞项甲方运营商号段 + 模板报备
🏢
企业微信
v0.1 ✓
"已回复 → 待落地"客户承接通道。私信加微后自动入企微通讯录 + 自动标签。adapter mock 跑通 external_userid。
触发客户主动留微
候选供应商企微官方 API
阻塞项甲方 IT 审批 + 服务商配置
沙箱双层守卫:v0.1 默认 OUTBOUND_LIVE_MODE=false — env 一层 + dispatcher 二层,无论 channel_configs 怎么配,沙箱模式下都强制走 mock,永远不可能误发到真客户。要切真发必须同时满足:env 切 true + config 切真 adapter + 显式更新 org row — 三重确认。

PART 07 · 需要"有大有小"协同支持

三类共 6 项 · 紧迫资源 + 内容反哺 + 商务对齐

下面 3 个 ⭐ 标的是"有大有小"原始提出的协同要点,3 个 ⚙️ 标的是我们工程视角发现的关键依赖。

⭐ ASK #1
提升用户回复信任度 — 需要更多"有内容"的抖音账号支持
紧迫
当前 DM 触达瓶颈不是线索池规模(6,723 高+中意向待触达),而是抖音的陌生人私信配额(24h 单号 ≤ 30 条 + 7911 风控冷却)。新号主页空号更容易被对方点开主页时秒退 — 主页有内容 = 信任前置。
请求支持:由"有大有小"提供 5~10 个已经运营有内容的抖音账号(主页有 ≥10 条品牌相关视频、有粉丝/赞),交给我们承载触达。预期效果:单号日均触达从 30 提到 50,7d 触达从 254 翻到 ≥ 500 条;同时客户首次开聊回复率因主页背书提升 30%+。
⭐ ASK #2
协助 AI 模型 + 提示词在打招呼 / 反向评论的专业度升级
紧迫
17 轮破冰 / 14 轮反向评论的迭代主要在话术工程层面(防泄漏 / 称呼 / 自检),但行业专业度(板材工艺差异 / 报价拆解 / 全屋系统差异)我们无法独立 review — 这是"有大有小"作为甲方比 LLM 更懂的部分。
请求支持:派一位资深销售 / 设计师每周 1 次(2 小时)和我们一起 review Langfuse 上 20~30 条真实生成样本 — 标出"哪些表述外行"、"哪些可以更专业"、"哪些可信但口语化"。预期效果:让破冰 / 反向评论的"专业度感受"从 LLM 通用全屋定制 baseline 升级到"有大有小品牌特色"。
⭐ ASK #3
确认抖音→微信加微衔接的信息对齐(案例 / 话术继承)
紧迫
客户在抖音 DM 中得到的承诺 / 案例分析 / 报价区间,到了销售加微信后的开场,是否对齐?如果销售开场重置上下文("您好,我是有大有小销售小李")会破坏抖音侧累积的信任 — 客户会想"你怎么不知道我们刚聊过"。
请求支持:① "有大有小"销售加微的标准开场是否能继承抖音侧对话摘要(我们可以推送 JSON 给销售工具);② 抖音侧推给客户的案例分析模板,是否和销售微信侧已有的案例库一致 — 不一致会让客户"听两套故事";③ 双方同款话术 SOP 谁拍板。
⚙️ ASK #4
销售坐席 — lead 落地端的承接配置
协同
7 天发出 254 条 DM、累计 2,996 个对话进入接入态,但已成交 / 已量房的数据现在没有回流到我们系统。AI 看不到真实 conversion 信号,意向打分模型无法用结果反哺。
请求支持:① 销售/设计师按城市分组对接 lead;② CRM 里加一个"线索来源 = Akke" 标签 + 阶段状态(量房 / 报价 / 签单 / 流失原因)每周回写一次给我们;③ 城市清单 — 现在 606 个活跃号源中 77% 没填城市,需要"有大有小"明确重点市清单(异地转化 ≈ 0)。
⚙️ ASK #5
品牌语料 — AI 短剧 / DM / 反向评论的"专属知识库"
协同
视频工作流 A(AI 短剧)和 DM persona "小艳"目前都用通用全屋定制 baseline。如果接入有大有小的工艺亮点 / 标杆案例 / 报价规则 / 异议处理 FAQ,DM 转化率和短剧内容质量预期都能再提升一档。
请求支持:"有大有小"打包提供 ① 产品手册 + 工艺亮点 1 页纸;② 5~10 个标杆已成交案例(户型 / 预算 / 工期 / 客户痛点);③ 销售常用话术 + FAQ 50 问。我们注入 LLM 上下文,全程版本化管理 + 可一键回滚。
⚙️ ASK #6
Outbound 通道供应商选定 + 资质提供(v0.1 骨架已就位)
协同
PART 06 中的电话 / 短信 / 企微 三通道 v0.1 骨架已完工(adapter mock 端到端跑通),目前唯一的阻塞是:真供应商凭证必须挂在甲方品牌名下,我们没法用第三方渠道发。沙箱模式下系统已能跑完整工作流,等供应商凭证一接就能切真发。
请求支持:① 短信 — 选 1 家(阿里云/腾讯/运营商),甲方签约 106 号段 + 报备模板;② 外呼 — 选 1 家(容联七陌/阿里云),甲方提供 AXB 隐私通道或自有座席团队;③ 企微 — 甲方 IT 部门审批开通企微开放 API + 添加 Akke 为服务商应用,并确认"客户加微后归属甲方哪个企微号"。凭证到位后切换 ENV + 配置可在 1 个工作日内上线 live mode。

PART 08 · 下一阶段重点

本周 + 本月 · 9 件事

本周(5/21 - 5/27)

① 小红书抓取从本机 PoC 切到生产,批量抓 50 个种子号
② AI 短剧工作流 vendor 拍板 → 跑 1 条 dry-run 给"有大有小"看成片
③ 抖音第六批扩库(评论池 30,000+ 时启动,目标 +150 STRONG 号)
④ DM 7 日触达从 254 提到 ≥ 500(需 ASK #1 落地)
⑤ 等"有大有小"提供 5~10 个有内容的抖音账号

本月(5 月余 + 6 月)

⑥ 小红书同行号源体系扩到 500+,与抖音并行
⑦ 跨平台同人去重表上线(识别同业主在抖音 + 小红书的双触点)
⑧ Outbound v0.1 上线 live mode(甲方凭证到位即接通真供应商,1 工作日切真发)
⑨ 与"有大有小"销售联调"抖音 → 加微"信息对齐 SOP(需 ASK #3 落地)