起因:能不能从飞瓜拉某个博主视频下面的高意向评论?2026-06-04 用饭粒已登录的飞瓜账号实测,结论是不能,且两层都堵死:
| 你想要的 | 飞瓜实际给的 | 结论 |
|---|---|---|
| 发现「号」 按行业/粉丝/地区筛达人 | 达人库列表(聚合指标:粉丝/类目/带货) | ⚠️ 理论能,但卡付费墙(见下) |
| 发现「意向」 某视频下哪条评论是高意向买家 | 什么都不给 —— 平台从不返回评论原文,更没有意向分 | ❌ 根本没有这功能 |
MemberLevelName=免费,「达人库筛选」是付费功能:发任何行业筛选,服务端直接忽略,返回不变的全网明星号(刘德华/陈赫…)。抖音号(UniqueId) + 数字UID,不给 sec_uid(MS4… 开头那串)——而号源表 source_accounts.douyin_id 要的就是 sec_uid,还得另解一道 抖音号→sec_uid(Fly 东京 IP 这条查询被抖音封了)。对比上一页 §04 获取渠道:蝉妈妈(精筛主力)5/28 关键词枯竭 + 5/29 封号;抖音搜索撞验证码半自动;抖音指数只能验词不能找号。各路第三方都给不了"意向评论",且都有 sec_uid 或限流的坎。
既然平台只能"发现号"、给不了"意向",那就反过来用我们自己已经抓进库的评论池去挖号——这是默认主渠道,零成本、不依赖任何外部账号。
comments.douyin_user_id 字段存的就是评论者的 sec_uid(MS4… 格式)。评论池里天然躺着一大堆号的 sec_uid——不用飞瓜、不用解析、直接能入库。♥️云朵♥️),同行昵称必带业务标签(武汉全屋定制工厂|金艺家居)——营销本能,两类命名习惯完全不同。挖出来一堆候选号,怎么定谁先抓、谁该留?用两套分,打在漏斗的两段——这是本页和上一页的分工:
| ① 昵称先验分(本页,新) | ② 真实产出分(上一页,已有) | |
|---|---|---|
| 打分时机 | 入库之前(号还没抓过) | 入库抓取之后(攒了真实评论) |
| 看什么 | 只看昵称(没别的可看) | 真实抓取产出:视频/评论/高意向占比 |
| 满分/档 | 0–100 → S / A / B / C | 0–100(5 维)→ A / B / C / D |
| 作用 | 准入 + 抓取优先级(定先抓谁) | 优胜劣汰的裁判(定留谁、升 tier) |
昵称先验分怎么算(基线 50,叠加/扣分,封顶 0–100):
| 信号 | 分 | 命中啥昵称 |
|---|---|---|
| 强定制核心 | +25 | 明写「全屋定制/整装/整家/定制柜」 |
| 装修信号 | +12 | 含「装饰/装修/设计师/软装」 |
| 明确业务桶 | +10 | 门窗/木门/柜/设计师软装/家居家具/装饰公司 |
| 工厂源头 | +10 | 工厂/工坊/源头/制造 |
| 头部品牌 | +12 | 欧派/索菲亚/好莱客/尚品宅配… |
| 正规门店 | +5 | 官方号/旗舰店/有限公司/体验馆 |
| 昵称模糊 | −12 | 纯英文/单字/只有"定制"两字 |
按总分定档(S 最高,逐级减信号):
2026-06-04 跑了一轮评论池反挖,从评论池里捞出 866 个新同行号候选(已过同行词入选 + 不在库 + sec_uid 合规),经 deny 过滤 + 先验分分档:
S / A / B 各档判别特征(一眼区分):
| 档 | 数 | 判别特征 | 样例 |
|---|---|---|---|
| S | 107 | 昵称明写"全屋定制/整装",常叠工厂源头/品牌 | 漯河东哥诗尼曼全屋定制(97) · 全屋定制超级工厂(95) |
| A | 31 | 装修主业 + 正规门店,但没喊"全屋定制"四字 | 天津皮阿诺整装有限公司官方号(90) · 武汉上筑空间装饰工程(77) |
| B | 250 | 装修/设计同行但散;含 designer 50 + 知识号 39(实测最高产人群) | 金碧装饰小姜(72) · 室内装修设计师小杨(72) |
| C | 114 | 只露一个单品类词(门窗/木工/家具个人号),看不出聚不聚业主 | 北京装门窗小冯(60) · 太原木工张哥(60) |
deepseek-flash,实测 ~¥0.004 一条评论(同行评论还在进 LLM 前就免费拦掉)。388 个号 14 天产的评论撑死几千条 → 总共 ¥10–60。真·吞金的是发 DM 的话术生成,跟扩号源无关。入库不是终点。先验分只是"猜",真好坏要抓 14 天看真实 buyer% 来验。分自动 / 手动两段:
自动段(cron 全自动,不用人管):
| 步 | 谁干 | 频率 | 干啥 |
|---|---|---|---|
| ① 入队 | /api/cron/scrape | 每小时 :10 | 扫所有 is_active=true 的号,每个塞一张待抓任务。388 新号下个整点全进队 |
| ② 抓 | Fly worker | ~30s 轮询 | 领任务 → 开号主页 → 翻视频 → 逐条抓评论 → 写 videos/comments |
| ③ 打意向分 | /api/cron/analyze | 每 5 分钟 | 新评论喂 LLM → 标 高意向/中意向/无关(飞瓜给不了的那个分) |
手动段(要人跑脚本,约 6/18 窗口满后):
| 步 | 干啥 |
|---|---|
| ④ 等 14 天 | 装修号 10–14 天才发一条新视频,抓一两次样本太少。给 ≥2 个发视频周期攒够评论。今天 6/4 → 窗口到 6/18 |
| ⑤ 跑审计 | 对每个新号算 buyer% = 高意向评论 ÷ 总评论(例:抓了 100 条、18 条高意向 → 18%),外加看号活不活、跨不跨题。脚本:source-relevance 审计 |
| ⑥ 优胜劣汰 | 按 buyer% 分桶手动关烂号(is_active=false,只关不删留 sec_uid):号封了→关 / 有评论但 buyer%≈0→关 / 跨题→关 / buyer% 高→留并升 tier1 高频抓 |
这套反挖不是独立工具,是嵌进现有抓取流水线的进货口。端到端一条龙:
is_active=truesource_accounts 池 → /api/cron/scrape 每小时把 active 号入队 → 和存量 2,600+ 老号同一条轮转(新号先在 tier0 常规抓)/api/cron/analyze 给评论打高意向标签 → 喂给真实产出分(5 维)的"高意向占比/条数"两项is_active=false)把抓取预算集中到好号| 机制 | 这批 388 怎么接进去 |
|---|---|
| 号源机制 | 388 个 is_active=true 入 source_accounts,下个整点起被 /api/cron/scrape 自动纳入轮转,先跑 tier0 |
| 视频机制 | worker 逐个抓它们的主页视频 + 评论,写 videos/comments;和老号共用同一 worker(注意单 VM 单浏览器,串行抓) |
| 打分机制 | 攒够评论后自动进 5 维产出分;本批先验分(S/A/B/C)不落库,留在审计文件做事后对照(DB 无先验分字段) |
| 运营触达 | 这些号评论区抓出的高意向业主,进 leads 池 → 运营拉单发 DM/反评(和现有触达闭环无缝) |
comments.status='contacted' 数"已联系",但运营手动发完常漏回标这个字段,导致看着 82% 没碰。改用真实信号(messages.sent_at IS NOT NULL 才算发过)重算后,结论变成下面三个约束并存。① 真实可 claim 漏斗(按用户去重,绕开 500 cap)
| 环节 | 数 | 说明 |
|---|---|---|
| 高意向 eligible 评论 | 2,316 | 顶层评论、非无关/skipped |
| → 独立用户 | 2,143 | 按 douyin_user 去重 |
| − 已真实发过 DM | 1,330(62%) | 真实触达其实做了很多 |
| = 可 claim 高意向用户 | 1,522 | 未联系 + 未锁定 |
| 其中 近 7d 新鲜 | 175 | 🔴 真正有价值的就这些 |
| 其中 陈旧(8d+) | 1,347 | 无头像命中率随时效暴跌(48h≈0),近死量 |
→ 有价值的"新鲜"高意向只有 175 个 ≈ 2.6 天的发送量。"22 天库存"是假富裕(1,347 是陈旧死量)。所以新鲜供给是薄的,不是充足——这推翻了早版"纯触达瓶颈"。
② claim 机制把可发 leads 埋在已联系下面 —— "拉不到"的真因
运营拉单走 claim_leads_batch,它在 get_ranked_leads 的排序上扫 --limit × 30 行。但排序把已联系的也排在里面,而最新鲜的高意向恰恰已被先发掉了,全堆在顶部:
| 拉单深度 | 扫到的可 claim 高意向 |
|---|---|
| --limit=1(扫 top 30) | 0 |
| --limit=2(扫 top 60) | 0 |
| --limit=5(扫 top 150) | 27 |
| --limit=10(扫 top 300) | 82 |
| --limit=16(扫 top 500,函数硬上限) | 167 |
top500 里 468 个高意向,291 个已联系占满顶部 → 小批拉单(--limit 1/2)扫到的全是已联系的,返回 0。这就是"经常拉不到高意向"的真因:不是没 leads,是可发的被埋在已联系下面,且 get_ranked_leads 硬 LIMIT 500。
get_ranked_leads 里把已联系用户在 LIMIT 500 之前就排除(或加大扫描深度),可立刻让那 175 新鲜 + 全部可 claim 稳定浮上来——零成本、不加号源、直接缓解"拉不到"。比买飞瓜便宜得多。③ 触达漏斗 —— 仍只用了 54% 安全产能
| 环节 | 量/天 | 判断 |
|---|---|---|
| opener/草稿自动生成 | 387 | 过剩,不是瓶颈 |
| 实际发出 DM | 68 | 稳定(5/29–6/4 = 49–82) |
| 风控安全上限(~5 运营号×25) | ~125 | 🔴 还有近一倍空间闲置 |
5 个运营手动 ADB/WDA 一条条发,单人 ~14/天 vs 单号安全 cap 25 → 触达确实没满(54%),但它不是唯一瓶颈,新鲜供给同样薄。
④ 飞瓜账修正
| 飞瓜前提 | 结论 | 依据 |
|---|---|---|
| ① 缺号源/新鲜供给 | △ 半真 | 新鲜高意向确实只 2.6 天量——但先做免费先手(②修 claim cap + 扩采集覆盖)比买飞瓜便宜;且要先确认 1,347 陈旧 leads 是否还值得发 |
| ② 同城精筛有用 | ❌ 假 | 客户全国统一价 568元/㎡、leads 散 39 省、无目标城市 → 地区精筛无落点 |
修正:早版"扩号源/飞瓜全没用"过头了。同城精筛仍无用,但新鲜供给薄是真的——只是买飞瓜应排在"免费修 claim + 提触达 + 扩免费采集覆盖"之后。
⑤ 三个杠杆(按性价比排序)
| 优先级 | 动作 | 为什么 |
|---|---|---|
| 高·免费 | 修 claim:已联系用户在 LIMIT 500 前排除 / 加大扫描深度 | 立刻放出被埋的可发 leads,直接解"拉不到",零成本 |
| 高 | 触达 68 → ~125(WDA 批量自动化 + 优先发最新鲜) | 闲置一半安全产能,把新鲜 leads 发出去 |
| 中 | 扩免费采集覆盖(反挖/f2/抖音搜索)增新鲜流入 | 新鲜供给 2.6 天薄,需更多 inflow;但走免费渠道 |
| 低 | 付费飞瓜 | 仅当上面都做完仍缺新鲜、且陈旧 leads 确认无价值时才考虑;同城精筛对本客户无用 |