upio.ai / Akke / 飞瓜能不能用 · 号源反挖漏斗

飞瓜能不能用?—— 评论池反挖号源 + 两段打分漏斗

Akke 项目 · 2026-06-04 · 配套 号源打分与筛选(讲入库后的 5 维产出分),本页讲入库前怎么找号、怎么打先验分
★ 07 真瓶颈·三约束 01 飞瓜能给/不能给什么 02 替代:评论池反挖 03 两段打分 04 本次结果 05 怎么验证 / 跑 06 和现有机制联动
一句话结论:飞瓜(和蝉妈妈、抖音指数一样)是「发现号」平台 = 只告诉你"谁可能是好号",永远给不了"带买家意向分的评论"。意向分是 Akke 自家 LLM 在直抓的抖音评论上算的,全市场没第三方能替。所以扩号源默认走「评论池反挖」——零成本、号自带 sec_uid、不依赖任何付费平台。
⚠️ 更上一层的结论(2026-06-04 全链路诊断,晚间修正版):经数据复核,瓶颈不是单一的"触达",是三个约束并存——① 新鲜高意向供给薄(真实可 claim 的 7d 新鲜 leads 只有 ~175 个 ≈ 2.6 天量);② claim 机制把可触达 leads 埋在已联系下面(小批拉单常返回 0,正是"拉不到"的真因,免费可修);③ 触达只用了 54% 安全产能(68/125)。飞瓜的"同城精筛"仍无落点(客户全国统一价),但"扩号源没用"这句过头了——新鲜供给确实薄。完整修正在 §07
SECTION 01飞瓜到底能给什么、不能给什么

起因:能不能从飞瓜拉某个博主视频下面的高意向评论?2026-06-04 用饭粒已登录的飞瓜账号实测,结论是不能,且两层都堵死:

你想要的飞瓜实际给的结论
发现「号」
按行业/粉丝/地区筛达人
达人库列表(聚合指标:粉丝/类目/带货)⚠️ 理论能,但卡付费墙(见下)
发现「意向」
某视频下哪条评论是高意向买家
什么都不给 —— 平台从不返回评论原文,更没有意向分根本没有这功能
为什么卡住(免费会员墙 + 没 sec_uid,脚本绕不过)
  • 飞瓜 API 已被完全逆向(鉴权/参数/接口全摸通,无加密签名,理论可纯 HTTP 跑)—— 技术不是瓶颈。
  • 但饭粒账号 MemberLevelName=免费「达人库筛选」是付费功能:发任何行业筛选,服务端直接忽略,返回不变的全网明星号(刘德华/陈赫…)。
  • 就算付费,飞瓜达人列表也只给 抖音号(UniqueId) + 数字UID不给 sec_uid(MS4… 开头那串)——而号源表 source_accounts.douyin_id 要的就是 sec_uid,还得另解一道 抖音号→sec_uid(Fly 东京 IP 这条查询被抖音封了)。
→ 真要用飞瓜:① 升级到含「达人库」的付费档 + ② 解决 抖音号→sec_uid,两关都过才全自动。性价比最低,只在别的渠道枯竭才值得。

对比上一页 §04 获取渠道:蝉妈妈(精筛主力)5/28 关键词枯竭 + 5/29 封号;抖音搜索撞验证码半自动;抖音指数只能验词不能找号。各路第三方都给不了"意向评论",且都有 sec_uid 或限流的坎。

SECTION 02替代路子 · 评论池反挖(path B)

既然平台只能"发现号"、给不了"意向",那就反过来用我们自己已经抓进库的评论池去挖号——这是默认主渠道,零成本、不依赖任何外部账号。

核心洞察
我们抓的每条评论,comments.douyin_user_id 字段存的就是评论者的 sec_uid(MS4… 格式)。评论池里天然躺着一大堆号的 sec_uid——不用飞瓜、不用解析、直接能入库。
为什么有同行
同行(本地工厂/设计师/装修公司)也会去欧派、装修博主视频下蹭流量评论——所以评论池里既有真业主,也有大量同行号。
怎么挑出同行
昵称 grep 同行词(定制/工厂/装饰/设计师/门窗…)= 高精度筛同行。因为业主昵称生活化(♥️云朵♥️),同行昵称必带业务标签(武汉全屋定制工厂|金艺家居)——营销本能,两类命名习惯完全不同。
为什么要这些号
挖到的同行号,把它们当新号源去抓——它们自己的视频评论区,又聚集了一批新的装修业主 → 滚雪球扩号池。
和飞瓜比,优势:① 零成本(不用付费会员);② 号自带 sec_uid(直接入库,省一道解析);③ 不撞限流/验证码/封号;④ 越抓越多评论 → 越挖越多号,自循环。唯一上限:得先有评论池存量(靠现有号源持续抓积累)。
SECTION 03两段打分 · 先验分 vs 产出分(别混)

挖出来一堆候选号,怎么定谁先抓、谁该留?用两套分,打在漏斗的两段——这是本页和上一页的分工:

① 昵称先验分(本页,新)② 真实产出分上一页,已有)
打分时机入库之前(号还没抓过)入库抓取之后(攒了真实评论)
看什么只看昵称(没别的可看)真实抓取产出:视频/评论/高意向占比
满分/档0–100 → S / A / B / C0–100(5 维)→ A / B / C / D
作用准入 + 抓取优先级(定先抓谁)优胜劣汰的裁判(定留谁、升 tier)
关键:为什么必须两套,不能只用产出分——候选号还没抓过、零产出数据,拿 5 维产出分去打全是 D(没视频没评论)。所以入库前必须先有一套只看昵称的先验分,决定"值不值得占一个抓取名额"。先验分只排序、不定生死;生死等抓了 14 天看真实产出再判。

昵称先验分怎么算(基线 50,叠加/扣分,封顶 0–100):

信号命中啥昵称
强定制核心+25明写「全屋定制/整装/整家/定制柜」
装修信号+12含「装饰/装修/设计师/软装」
明确业务桶+10门窗/木门/柜/设计师软装/家居家具/装饰公司
工厂源头+10工厂/工坊/源头/制造
头部品牌+12欧派/索菲亚/好莱客/尚品宅配…
正规门店+5官方号/旗舰店/有限公司/体验馆
昵称模糊−12纯英文/单字/只有"定制"两字

按总分定档(S 最高,逐级减信号):

S 档 ≥85
107
昵称明写"全屋定制"+工厂/品牌,高置信
A 档 ≥75
31
装修主业+正规门店,但没喊全屋定制
B 档 ≥65
250
装修/设计同行但散;含设计师50+知识号39
C 档 <65
114
只露一个单品类词(门窗/木工个人号)
⚠️ 先验分会误杀真高产号(必须知道的坑):上一页实测 buyer%(买家占比)Top20 里,「糖果家🏠软装中」排第 2(18.6%)、还有一堆 designer 号——而「软装中」这种业主日记号正是先验分扣分甚至直接剔的。号源真价值标准是"评论区聚不聚业主",不是"昵称像不像同行"。所以先验分只敢用来排抓取顺序,真高产等产出分(buyer%)说了算;下一轮要反哺:统计实测 buyer% 高的昵称模式,松绑对 designer/软装号的扣分。
SECTION 04本次结果 · 866 → 入库 388

2026-06-04 跑了一轮评论池反挖,从评论池里捞出 866 个新同行号候选(已过同行词入选 + 不在库 + sec_uid 合规),经 deny 过滤 + 先验分分档:

raw 候选
866 个 —— 只过了一道"昵称像同行"的正则,高召回低精度(混着上游材料/跨行业/业主号)
deny 过滤
剔 364(42%)
按文档化的 deny 模式整桶剔噪音:上游材料/单品类 151(瓷砖/板材/五金/涂料代理)· 其他长尾 86(食品/水泥/陶瓷/财税/电器)· 跨行业 35(美甲/养殖/汽车救援)· 5/18 黑名单 22 · 智能家居 12 · 回收维修 10 · 业主日记号/B2B 工装等
KEEP + 打分
502 个 → S107 / A31 / B250 / C114
入库决策
入 S+A+B = 388(C 档 114 整桶弃——几乎无真噪音,但全是木工/门窗单品类弱信号个人号,buyer% 大概率低,不值得占名额,留清单当弹药库)
实际入库
388 / 388 成功 · source_accounts 2,669 → 3,057 · 分类:本地号 271 / 工厂号 67 / 知识号 39 / 品牌号 11

S / A / B 各档判别特征(一眼区分):

判别特征样例
S107昵称明写"全屋定制/整装",常叠工厂源头/品牌漯河东哥诗尼曼全屋定制(97) · 全屋定制超级工厂(95)
A31装修主业 + 正规门店,但没喊"全屋定制"四字天津皮阿诺整装有限公司官方号(90) · 武汉上筑空间装饰工程(77)
B250装修/设计同行但散;含 designer 50 + 知识号 39(实测最高产人群)金碧装饰小姜(72) · 室内装修设计师小杨(72)
C114只露一个单品类词(门窗/木工/家具个人号),看不出聚不聚业主北京装门窗小冯(60) · 太原木工张哥(60)
这次花多少钱:抓取本身 0 边际成本(worker 是固定月租);唯一花钱的是 LLM 给评论打意向分,用便宜的 deepseek-flash,实测 ~¥0.004 一条评论(同行评论还在进 LLM 前就免费拦掉)。388 个号 14 天产的评论撑死几千条 → 总共 ¥10–60。真·吞金的是发 DM 的话术生成,跟扩号源无关。
SECTION 05后续怎么验证、怎么跑

入库不是终点。先验分只是"猜",真好坏要抓 14 天看真实 buyer% 来验。分自动 / 手动两段:

自动段(cron 全自动,不用人管)

谁干频率干啥
① 入队/api/cron/scrape每小时 :10扫所有 is_active=true 的号,每个塞一张待抓任务。388 新号下个整点全进队
② 抓Fly worker~30s 轮询领任务 → 开号主页 → 翻视频 → 逐条抓评论 → 写 videos/comments
③ 打意向分/api/cron/analyze每 5 分钟新评论喂 LLM → 标 高意向/中意向/无关(飞瓜给不了的那个分)

手动段(要人跑脚本,约 6/18 窗口满后)

干啥
④ 等 14 天装修号 10–14 天才发一条新视频,抓一两次样本太少。给 ≥2 个发视频周期攒够评论。今天 6/4 → 窗口到 6/18
⑤ 跑审计对每个新号算 buyer% = 高意向评论 ÷ 总评论(例:抓了 100 条、18 条高意向 → 18%),外加看号活不活、跨不跨题。脚本:source-relevance 审计
⑥ 优胜劣汰按 buyer% 分桶手动关烂号is_active=false,只关不删留 sec_uid):号封了→关 / 有评论但 buyer%≈0→关 / 跨题→关 / buyer% 高→留并升 tier1 高频抓
怎么验"这批 388 到底值不值":6/18 审计时对这 388 个号单独算 buyer% 分布——
  • 若 S/A 档 buyer% 明显高于 B/C → 证明先验分排序有效,下次照用;
  • 若某类(如 designer/知识号)意外高 → 回头从 C 档/被剔的桶里精准补同类,并松绑先验分对它的扣分;
  • 若整批 buyer% 普遍低 → 说明评论池反挖这批质量到顶,该换挖法(f2 相关推荐 seed)。
SECTION 06怎么和现有号源机制、视频机制联动

这套反挖不是独立工具,是嵌进现有抓取流水线的进货口。端到端一条龙:

进货
评论池反挖(本页)/ f2 相关推荐 / 飞瓜付费(枯竭才用) → 拿到候选号 sec_uid
先验分
昵称先验分 S/A/B/C → 定准入 + 抓取优先级 → 入库 is_active=true
号源机制
source_accounts 池 → /api/cron/scrape 每小时把 active 号入队 → 和存量 2,600+ 老号同一条轮转(新号先在 tier0 常规抓)
视频机制
worker discover_videos_from_profile 抓号的视频写 videos → 再逐个视频抓评论写 comments(复抓窗口 7d,见 上一页 §02
意向分
/api/cron/analyze 给评论打高意向标签 → 喂给真实产出分(5 维)的"高意向占比/条数"两项
产出分 + tier
5 维质量分实时算 A/B/C/D;按"近 7 天高意向贡献"排 Top → 升 tier1 每小时高频抓(走 scrape-hot),其余 tier0
优胜劣汰
14d 后 buyer% 审计 → 关烂号(is_active=false)把抓取预算集中到好号
回灌
好号的视频 → 做 f2 相关推荐 seed 挖更多同类号(回到"进货");真实 buyer% 反过来校准昵称先验分 → 漏斗自我进化
两套分各管一段、首尾相接:昵称先验分(入库前·定先抓谁)→ 抓 14d → 真实产出分(入库后·定留谁升谁)。先验分的错(误杀软装号)由产出分纠正,纠正结果再回写先验分规则——这就是"用末端高意向产出,反过来决定开头找谁、抓谁"的完整闭环。
机制这批 388 怎么接进去
号源机制388 个 is_active=truesource_accounts,下个整点起被 /api/cron/scrape 自动纳入轮转,先跑 tier0
视频机制worker 逐个抓它们的主页视频 + 评论,写 videos/comments;和老号共用同一 worker(注意单 VM 单浏览器,串行抓)
打分机制攒够评论后自动进 5 维产出分;本批先验分(S/A/B/C)不落库,留在审计文件做事后对照(DB 无先验分字段)
运营触达这些号评论区抓出的高意向业主,进 leads 池 → 运营拉单发 DM/反评(和现有触达闭环无缝)
SECTION 07 ★该不该继续扩号源?—— 三个约束并存(修正版)
⚠️ 自我修正(2026-06-04 晚):本节早版结论是「供给充足、纯触达瓶颈、号源没用」——那是错的。错因:用 comments.status='contacted' 数"已联系",但运营手动发完常漏回标这个字段,导致看着 82% 没碰。改用真实信号(messages.sent_at IS NOT NULL 才算发过)重算后,结论变成下面三个约束并存。

① 真实可 claim 漏斗(按用户去重,绕开 500 cap)

环节说明
高意向 eligible 评论2,316顶层评论、非无关/skipped
→ 独立用户2,143按 douyin_user 去重
− 已真实发过 DM1,330(62%)真实触达其实做了很多
= 可 claim 高意向用户1,522未联系 + 未锁定
其中 近 7d 新鲜175🔴 真正有价值的就这些
其中 陈旧(8d+)1,347无头像命中率随时效暴跌(48h≈0),近死量
新鲜可发 175(2.6 天)
日发 68

有价值的"新鲜"高意向只有 175 个 ≈ 2.6 天的发送量。"22 天库存"是假富裕(1,347 是陈旧死量)。所以新鲜供给是薄的,不是充足——这推翻了早版"纯触达瓶颈"。

② claim 机制把可发 leads 埋在已联系下面 —— "拉不到"的真因

运营拉单走 claim_leads_batch,它在 get_ranked_leads 的排序上扫 --limit × 30 行。但排序把已联系的也排在里面,而最新鲜的高意向恰恰已被先发掉了,全堆在顶部:

拉单深度扫到的可 claim 高意向
--limit=1(扫 top 30)0
--limit=2(扫 top 60)0
--limit=5(扫 top 150)27
--limit=10(扫 top 300)82
--limit=16(扫 top 500,函数硬上限)167

top500 里 468 个高意向,291 个已联系占满顶部 → 小批拉单(--limit 1/2)扫到的全是已联系的,返回 0。这就是"经常拉不到高意向"的真因:不是没 leads,是可发的被埋在已联系下面,且 get_ranked_leads 硬 LIMIT 500

免费先手:在 get_ranked_leads把已联系用户在 LIMIT 500 之前就排除(或加大扫描深度),可立刻让那 175 新鲜 + 全部可 claim 稳定浮上来——零成本、不加号源、直接缓解"拉不到"。比买飞瓜便宜得多。

③ 触达漏斗 —— 仍只用了 54% 安全产能

环节量/天判断
opener/草稿自动生成387过剩,不是瓶颈
实际发出 DM68稳定(5/29–6/4 = 49–82)
风控安全上限(~5 运营号×25)~125🔴 还有近一倍空间闲置

5 个运营手动 ADB/WDA 一条条发,单人 ~14/天 vs 单号安全 cap 25 → 触达确实没满(54%),但它不是唯一瓶颈,新鲜供给同样薄

④ 飞瓜账修正

飞瓜前提结论依据
① 缺号源/新鲜供给△ 半真新鲜高意向确实只 2.6 天量——但先做免费先手(②修 claim cap + 扩采集覆盖)比买飞瓜便宜;且要先确认 1,347 陈旧 leads 是否还值得发
② 同城精筛有用❌ 假客户全国统一价 568元/㎡、leads 散 39 省、无目标城市 → 地区精筛无落点

修正:早版"扩号源/飞瓜全没用"过头了。同城精筛仍无用,但新鲜供给薄是真的——只是买飞瓜应排在"免费修 claim + 提触达 + 扩免费采集覆盖"之后

⑤ 三个杠杆(按性价比排序)

优先级动作为什么
高·免费修 claim:已联系用户在 LIMIT 500 前排除 / 加大扫描深度立刻放出被埋的可发 leads,直接解"拉不到",零成本
触达 68 → ~125(WDA 批量自动化 + 优先发最新鲜)闲置一半安全产能,把新鲜 leads 发出去
免费采集覆盖(反挖/f2/抖音搜索)增新鲜流入新鲜供给 2.6 天薄,需更多 inflow;但走免费渠道
付费飞瓜仅当上面都做完仍缺新鲜、且陈旧 leads 确认无价值时才考虑;同城精筛对本客户无用
一句话(修正版):不是"纯触达瓶颈",是新鲜供给薄(175/2.6天)+ claim 把可发 leads 埋住(小拉单返 0)+ 触达只用 54% 三者并存。先做免费的两件(修 claim cap、提触达),再谈要不要花钱扩源——飞瓜排最后。