upio.ai / Akke / 飞瓜能不能用 · 号源反挖漏斗

飞瓜能不能用？—— 评论池反挖号源 + 两段打分漏斗

Akke 项目 · 2026-06-04 · 配套号源打分与筛选（讲入库后的 5 维产出分），本页讲入库前怎么找号、怎么打先验分

★ 07 真瓶颈·三约束 01 飞瓜能给/不能给什么 02 替代：评论池反挖 03 两段打分 04 本次结果 05 怎么验证 / 跑 06 和现有机制联动

一句话结论：飞瓜（和蝉妈妈、抖音指数一样）是「发现号」平台 = 只告诉你"谁可能是好号"，永远给不了"带买家意向分的评论"。意向分是 Akke 自家 LLM 在直抓的抖音评论上算的，全市场没第三方能替。所以扩号源默认走「评论池反挖」——零成本、号自带 sec_uid、不依赖任何付费平台。

⚠️ 更上一层的结论（2026-06-04 全链路诊断，晚间修正版）：经数据复核，瓶颈不是单一的"触达"，是三个约束并存——① 新鲜高意向供给薄（真实可 claim 的 7d 新鲜 leads 只有 ~175 个 ≈ 2.6 天量）；② claim 机制把可触达 leads 埋在已联系下面（小批拉单常返回 0，正是"拉不到"的真因，免费可修）；③ 触达只用了 54% 安全产能（68/125）。飞瓜的"同城精筛"仍无落点（客户全国统一价），但"扩号源没用"这句过头了——新鲜供给确实薄。完整修正在 §07。

SECTION 01飞瓜到底能给什么、不能给什么

起因：能不能从飞瓜拉某个博主视频下面的高意向评论？2026-06-04 用饭粒已登录的飞瓜账号实测，结论是不能，且两层都堵死：

你想要的	飞瓜实际给的	结论
发现「号」按行业/粉丝/地区筛达人	达人库列表（聚合指标：粉丝/类目/带货）	⚠️ 理论能，但卡付费墙（见下）
发现「意向」某视频下哪条评论是高意向买家	什么都不给 —— 平台从不返回评论原文，更没有意向分	❌ 根本没有这功能

为什么卡住（免费会员墙 + 没 sec_uid，脚本绕不过）：

飞瓜 API 已被完全逆向（鉴权/参数/接口全摸通，无加密签名，理论可纯 HTTP 跑）—— 技术不是瓶颈。
但饭粒账号 MemberLevelName=免费，「达人库筛选」是付费功能：发任何行业筛选，服务端直接忽略，返回不变的全网明星号（刘德华/陈赫…）。
就算付费，飞瓜达人列表也只给 抖音号(UniqueId) + 数字UID，不给 sec_uid（MS4… 开头那串）——而号源表 source_accounts.douyin_id 要的就是 sec_uid，还得另解一道抖音号→sec_uid（Fly 东京 IP 这条查询被抖音封了）。

→ 真要用飞瓜：① 升级到含「达人库」的付费档 + ② 解决抖音号→sec_uid，两关都过才全自动。性价比最低，只在别的渠道枯竭才值得。

对比上一页 §04 获取渠道：蝉妈妈（精筛主力）5/28 关键词枯竭 + 5/29 封号；抖音搜索撞验证码半自动；抖音指数只能验词不能找号。各路第三方都给不了"意向评论"，且都有 sec_uid 或限流的坎。

SECTION 02替代路子 · 评论池反挖（path B）

既然平台只能"发现号"、给不了"意向"，那就反过来用我们自己已经抓进库的评论池去挖号——这是默认主渠道，零成本、不依赖任何外部账号。

核心洞察

我们抓的每条评论，comments.douyin_user_id 字段存的就是评论者的 sec_uid（MS4… 格式）。评论池里天然躺着一大堆号的 sec_uid——不用飞瓜、不用解析、直接能入库。

为什么有同行

同行（本地工厂/设计师/装修公司）也会去欧派、装修博主视频下蹭流量评论——所以评论池里既有真业主，也有大量同行号。

怎么挑出同行

昵称 grep 同行词（定制/工厂/装饰/设计师/门窗…）= 高精度筛同行。因为业主昵称生活化（♥️云朵♥️），同行昵称必带业务标签（武汉全屋定制工厂｜金艺家居）——营销本能，两类命名习惯完全不同。

为什么要这些号

挖到的同行号，把它们当新号源去抓——它们自己的视频评论区，又聚集了一批新的装修业主 → 滚雪球扩号池。

和飞瓜比，优势：① 零成本（不用付费会员）；② 号自带 sec_uid（直接入库，省一道解析）；③ 不撞限流/验证码/封号；④ 越抓越多评论 → 越挖越多号，自循环。唯一上限：得先有评论池存量（靠现有号源持续抓积累）。

SECTION 03两段打分 · 先验分 vs 产出分（别混）

挖出来一堆候选号，怎么定谁先抓、谁该留？用两套分，打在漏斗的两段——这是本页和上一页的分工：

	① 昵称先验分（本页，新）	② 真实产出分（上一页，已有）
打分时机	入库之前（号还没抓过）	入库抓取之后（攒了真实评论）
看什么	只看昵称（没别的可看）	真实抓取产出：视频/评论/高意向占比
满分/档	0–100 → S / A / B / C	0–100（5 维）→ A / B / C / D
作用	准入 + 抓取优先级（定先抓谁）	优胜劣汰的裁判（定留谁、升 tier）

关键：为什么必须两套，不能只用产出分——候选号还没抓过、零产出数据，拿 5 维产出分去打全是 D（没视频没评论）。所以入库前必须先有一套只看昵称的先验分，决定"值不值得占一个抓取名额"。先验分只排序、不定生死；生死等抓了 14 天看真实产出再判。

昵称先验分怎么算（基线 50，叠加/扣分，封顶 0–100）：

信号	分	命中啥昵称
强定制核心	+25	明写「全屋定制/整装/整家/定制柜」
装修信号	+12	含「装饰/装修/设计师/软装」
明确业务桶	+10	门窗/木门/柜/设计师软装/家居家具/装饰公司
工厂源头	+10	工厂/工坊/源头/制造
头部品牌	+12	欧派/索菲亚/好莱客/尚品宅配…
正规门店	+5	官方号/旗舰店/有限公司/体验馆
昵称模糊	−12	纯英文/单字/只有"定制"两字

按总分定档（S 最高，逐级减信号）：

S 档 ≥85

107

昵称明写"全屋定制"+工厂/品牌，高置信

A 档 ≥75

装修主业+正规门店，但没喊全屋定制

B 档 ≥65

250

装修/设计同行但散；含设计师50+知识号39

C 档 <65

114

只露一个单品类词（门窗/木工个人号）

⚠️ 先验分会误杀真高产号（必须知道的坑）：上一页实测 buyer%（买家占比）Top20 里，「糖果家🏠软装中」排第 2（18.6%）、还有一堆 designer 号——而「软装中」这种业主日记号正是先验分扣分甚至直接剔的。号源真价值标准是"评论区聚不聚业主"，不是"昵称像不像同行"。所以先验分只敢用来排抓取顺序，真高产等产出分（buyer%）说了算；下一轮要反哺：统计实测 buyer% 高的昵称模式，松绑对 designer/软装号的扣分。

SECTION 04本次结果 · 866 → 入库 388

2026-06-04 跑了一轮评论池反挖，从评论池里捞出 866 个新同行号候选（已过同行词入选 + 不在库 + sec_uid 合规），经 deny 过滤 + 先验分分档：

raw 候选

866 个 —— 只过了一道"昵称像同行"的正则，高召回低精度（混着上游材料/跨行业/业主号）

deny 过滤

剔 364（42%）

按文档化的 deny 模式整桶剔噪音：上游材料/单品类 151（瓷砖/板材/五金/涂料代理）· 其他长尾 86（食品/水泥/陶瓷/财税/电器）· 跨行业 35（美甲/养殖/汽车救援）· 5/18 黑名单 22 · 智能家居 12 · 回收维修 10 · 业主日记号/B2B 工装等

KEEP + 打分

502 个 → S107 / A31 / B250 / C114

入库决策

入 S+A+B = 388（C 档 114 整桶弃——几乎无真噪音，但全是木工/门窗单品类弱信号个人号，buyer% 大概率低，不值得占名额，留清单当弹药库）

实际入库

388 / 388 成功 · source_accounts 2,669 → 3,057 · 分类：本地号 271 / 工厂号 67 / 知识号 39 / 品牌号 11

S / A / B 各档判别特征（一眼区分）：

档	数	判别特征	样例
S	107	昵称明写"全屋定制/整装"，常叠工厂源头/品牌	漯河东哥诗尼曼全屋定制(97) · 全屋定制超级工厂(95)
A	31	装修主业 + 正规门店，但没喊"全屋定制"四字	天津皮阿诺整装有限公司官方号(90) · 武汉上筑空间装饰工程(77)
B	250	装修/设计同行但散；含 designer 50 + 知识号 39（实测最高产人群）	金碧装饰小姜(72) · 室内装修设计师小杨(72)
C	114	只露一个单品类词（门窗/木工/家具个人号），看不出聚不聚业主	北京装门窗小冯(60) · 太原木工张哥(60)

这次花多少钱：抓取本身 0 边际成本（worker 是固定月租）；唯一花钱的是 LLM 给评论打意向分，用便宜的 deepseek-flash，实测 ~¥0.004 一条评论（同行评论还在进 LLM 前就免费拦掉）。388 个号 14 天产的评论撑死几千条 → 总共 ¥10–60。真·吞金的是发 DM 的话术生成，跟扩号源无关。

SECTION 05后续怎么验证、怎么跑

入库不是终点。先验分只是"猜",真好坏要抓 14 天看真实 buyer% 来验。分自动 / 手动两段：

自动段（cron 全自动，不用人管）：

步	谁干	频率	干啥
① 入队	`/api/cron/scrape`	每小时 :10	扫所有 `is_active=true` 的号，每个塞一张待抓任务。388 新号下个整点全进队
② 抓	Fly worker	~30s 轮询	领任务 → 开号主页 → 翻视频 → 逐条抓评论 → 写 `videos`/`comments`
③ 打意向分	`/api/cron/analyze`	每 5 分钟	新评论喂 LLM → 标高意向/中意向/无关（飞瓜给不了的那个分）

手动段（要人跑脚本，约 6/18 窗口满后）：

步	干啥
④ 等 14 天	装修号 10–14 天才发一条新视频，抓一两次样本太少。给 ≥2 个发视频周期攒够评论。今天 6/4 → 窗口到 6/18
⑤ 跑审计	对每个新号算 buyer% = 高意向评论 ÷ 总评论（例：抓了 100 条、18 条高意向 → 18%），外加看号活不活、跨不跨题。脚本：`source-relevance 审计`
⑥ 优胜劣汰	按 buyer% 分桶手动关烂号（`is_active=false`，只关不删留 sec_uid）：号封了→关 / 有评论但 buyer%≈0→关 / 跨题→关 / buyer% 高→留并升 tier1 高频抓

怎么验"这批 388 到底值不值"：6/18 审计时对这 388 个号单独算 buyer% 分布——

若 S/A 档 buyer% 明显高于 B/C → 证明先验分排序有效，下次照用；
若某类（如 designer/知识号）意外高 → 回头从 C 档/被剔的桶里精准补同类，并松绑先验分对它的扣分；
若整批 buyer% 普遍低 → 说明评论池反挖这批质量到顶，该换挖法（f2 相关推荐 seed）。

SECTION 06怎么和现有号源机制、视频机制联动

这套反挖不是独立工具，是嵌进现有抓取流水线的进货口。端到端一条龙：

进货

评论池反挖（本页）/ f2 相关推荐 / 飞瓜付费(枯竭才用) → 拿到候选号 sec_uid

先验分

昵称先验分 S/A/B/C → 定准入 + 抓取优先级 → 入库 is_active=true

号源机制

进 source_accounts 池 → /api/cron/scrape 每小时把 active 号入队 → 和存量 2,600+ 老号同一条轮转（新号先在 tier0 常规抓）

视频机制

worker discover_videos_from_profile 抓号的视频写 videos → 再逐个视频抓评论写 comments（复抓窗口 7d，见上一页 §02）

意向分

/api/cron/analyze 给评论打高意向标签 → 喂给真实产出分（5 维）的"高意向占比/条数"两项

产出分 + tier

5 维质量分实时算 A/B/C/D；按"近 7 天高意向贡献"排 Top → 升 tier1 每小时高频抓（走 scrape-hot），其余 tier0

优胜劣汰

14d 后 buyer% 审计 → 关烂号（is_active=false）把抓取预算集中到好号

回灌

好号的视频 → 做 f2 相关推荐 seed 挖更多同类号（回到"进货"）；真实 buyer% 反过来校准昵称先验分 → 漏斗自我进化

两套分各管一段、首尾相接：昵称先验分（入库前·定先抓谁）→ 抓 14d → 真实产出分（入库后·定留谁升谁）。先验分的错（误杀软装号）由产出分纠正，纠正结果再回写先验分规则——这就是"用末端高意向产出，反过来决定开头找谁、抓谁"的完整闭环。

机制	这批 388 怎么接进去
号源机制	388 个 `is_active=true` 入 `source_accounts`，下个整点起被 `/api/cron/scrape` 自动纳入轮转，先跑 tier0
视频机制	worker 逐个抓它们的主页视频 + 评论，写 videos/comments；和老号共用同一 worker（注意单 VM 单浏览器，串行抓）
打分机制	攒够评论后自动进 5 维产出分；本批先验分（S/A/B/C）不落库，留在审计文件做事后对照（DB 无先验分字段）
运营触达	这些号评论区抓出的高意向业主，进 leads 池 → 运营拉单发 DM/反评（和现有触达闭环无缝）

SECTION 07 ★该不该继续扩号源？—— 三个约束并存（修正版）

⚠️ 自我修正（2026-06-04 晚）：本节早版结论是「供给充足、纯触达瓶颈、号源没用」——那是错的。错因：用 comments.status='contacted' 数"已联系"，但运营手动发完常漏回标这个字段，导致看着 82% 没碰。改用真实信号（messages.sent_at IS NOT NULL 才算发过）重算后，结论变成下面三个约束并存。

① 真实可 claim 漏斗（按用户去重，绕开 500 cap）

环节	数	说明
高意向 eligible 评论	2,316	顶层评论、非无关/skipped
→ 独立用户	2,143	按 douyin_user 去重
− 已真实发过 DM	1,330（62%）	真实触达其实做了很多
= 可 claim 高意向用户	1,522	未联系 + 未锁定
其中近 7d 新鲜	175	🔴 真正有价值的就这些
其中陈旧（8d+）	1,347	无头像命中率随时效暴跌(48h≈0)，近死量

新鲜可发 175（2.6 天）

日发 68

→ 有价值的"新鲜"高意向只有 175 个 ≈ 2.6 天的发送量。"22 天库存"是假富裕（1,347 是陈旧死量）。所以新鲜供给是薄的，不是充足——这推翻了早版"纯触达瓶颈"。

② claim 机制把可发 leads 埋在已联系下面 —— "拉不到"的真因

运营拉单走 claim_leads_batch，它在 get_ranked_leads 的排序上扫 --limit × 30 行。但排序把已联系的也排在里面，而最新鲜的高意向恰恰已被先发掉了，全堆在顶部：

拉单深度	扫到的可 claim 高意向
--limit=1（扫 top 30）	0
--limit=2（扫 top 60）	0
--limit=5（扫 top 150）	27
--limit=10（扫 top 300）	82
--limit=16（扫 top 500，函数硬上限）	167

top500 里 468 个高意向，291 个已联系占满顶部 → 小批拉单（--limit 1/2）扫到的全是已联系的，返回 0。这就是"经常拉不到高意向"的真因：不是没 leads，是可发的被埋在已联系下面，且 get_ranked_leads 硬 LIMIT 500。

免费先手：在 get_ranked_leads 里把已联系用户在 LIMIT 500 之前就排除（或加大扫描深度），可立刻让那 175 新鲜 + 全部可 claim 稳定浮上来——零成本、不加号源、直接缓解"拉不到"。比买飞瓜便宜得多。

③ 触达漏斗 —— 仍只用了 54% 安全产能

环节	量/天	判断
opener/草稿自动生成	387	过剩，不是瓶颈
实际发出 DM	68	稳定（5/29–6/4 = 49–82）
风控安全上限（~5 运营号×25）	~125	🔴 还有近一倍空间闲置

5 个运营手动 ADB/WDA 一条条发，单人 ~14/天 vs 单号安全 cap 25 → 触达确实没满（54%），但它不是唯一瓶颈，新鲜供给同样薄。

④ 飞瓜账修正

飞瓜前提	结论	依据
① 缺号源/新鲜供给	△ 半真	新鲜高意向确实只 2.6 天量——但先做免费先手（②修 claim cap + 扩采集覆盖）比买飞瓜便宜；且要先确认 1,347 陈旧 leads 是否还值得发
② 同城精筛有用	❌ 假	客户全国统一价 568元/㎡、leads 散 39 省、无目标城市 → 地区精筛无落点

修正：早版"扩号源/飞瓜全没用"过头了。同城精筛仍无用，但新鲜供给薄是真的——只是买飞瓜应排在"免费修 claim + 提触达 + 扩免费采集覆盖"之后。

⑤ 三个杠杆（按性价比排序）

优先级	动作	为什么
高·免费	修 claim：已联系用户在 LIMIT 500 前排除 / 加大扫描深度	立刻放出被埋的可发 leads，直接解"拉不到"，零成本
高	触达 68 → ~125（WDA 批量自动化 + 优先发最新鲜）	闲置一半安全产能，把新鲜 leads 发出去
中	扩免费采集覆盖（反挖/f2/抖音搜索）增新鲜流入	新鲜供给 2.6 天薄，需更多 inflow；但走免费渠道
低	付费飞瓜	仅当上面都做完仍缺新鲜、且陈旧 leads 确认无价值时才考虑；同城精筛对本客户无用

一句话（修正版）：不是"纯触达瓶颈"，是新鲜供给薄（175/2.6天）+ claim 把可发 leads 埋住（小拉单返 0）+ 触达只用 54% 三者并存。先做免费的两件（修 claim cap、提触达），再谈要不要花钱扩源——飞瓜排最后。