以 西安老王聊装修(本地装修号)为例,看这套打分/分级怎么把它从普通号挑成高频好号:
每个号源(我们去抓评论的抖音账号)有一个 0–100 分的质量分,由系统实时算出来(不是人工填的、也不是存死的数字)。5 个维度,权重向「评论质量」倾斜:
| 维度 | 满分 | 怎么给分(大白话) |
|---|---|---|
| 已有视频数 | 15 | 号里有没有货:>50→15 / >10→10 / >0→5 |
| 更新频率 近30天视频数 | 15 | 勤不勤更新:>15→15 / >5→10 / >0→5 |
| 评论总数 | 20 | 有没有人气:>500→20 / >100→15 / >30→10 / >0→5 |
| 高意向占比 | 30 | 评论质量(权重最高):占比% ×6,封顶 30 |
| 高意向条数 | 20 | 真金白银产出:≥30→20 / ≥10→15 / ≥3→10 / ≥1→5 |
按总分定级:
tier(0/1)」是两回事——质量分评"号好不好",tier 决定"多勤去抓"。| tier | 当前数量 | 抓取频率 | 哪些号 |
|---|---|---|---|
| tier 1(高频) | 91 | 每 1 小时轮一次(走 scrape-hot) | 近 7 天高意向贡献 Top 的号(Top50 + 已有)——把最值钱的号优先、抓得最勤 |
| tier 0(常规) | 611 | 约每 3–4 小时轮一次(每小时取 150 个最久没抓的) | 其余全部 active 号 |
→ 质量高 ≠ 一定 tier1:tier1 是按"近 7 天高意向产出"挑的,新号/好号若还没产出数据,会先在 tier0 跑,攒出高意向后再升 tier1。
is_active 开关。active(在抓)= true = 这个号在抓取轮转里、每隔几小时会去抓它的新视频评论;inactive = false = 停用、不再去抓,但历史数据保留(随时能开回来)。下面"筛选"主要就是在调这个开关——把不产出的号关掉,让抓取预算集中在好号上。号池累计导入过 2,653 个号,经过几轮筛选,现在 active 702 个 / inactive 1,951 个(06-04):
org_id=给每个号贴的"这号属于哪个客户"的标签。系统靠它决定谁能看到/抓哪些号。SCRAPE_RECENT_COMMENT_HOURS 的环境变量("机器的设置旋钮"),24 → 168。不动代码、不发版、一行命令在线生效,2 台 worker 滚动重启完毕。Rollback 也是一行:set 回 24。
质量分布(active 号,05-31 快照)—— 八成是 D 级,真正好号集中在少数:
注:A/B/C/D 质量分是按 5 维实时算的,本次刷新未重算分级分布(要复跑全量打分),下面这组是 05-31 快照、量级仍成立;可验证的产出口径见本节末尾「哪些号真产高意向」表(06-04 实数)。
→ A+B(值钱的)≈ 106 个;高意向高度集中:Top50 号贡献 84–88% 的高意向。
| 档 | 数量 | 号源举例(含质量分) |
|---|---|---|
| A | 34 | 装修帮(95) · 海哥—用心讲装修(95) · 小刘厂长美式家具(90) · 奇才木作(90) · 灿哥聊装修(90) |
| B | 72 | 堂堂的新家_(69) · 嘉伟室内设计(67) · 索菲亚设计师_索长(65) · 成都全屋定制工厂-金柏莱(65) |
| C | 23 | 设计师小北(45) · 设计师阿鑫(意式风格)(41) · 天柱华帝厨电(35) · 广佛法柏卡全屋定制工厂(30) |
| D | 492 | 洛阳老范聊装修(25) · 福临美佳全屋定制工厂(25) · 西安艺博匠心全屋定制(25) · 双峰成林木业兔宝宝(25) |
注:D 级里也有"X聊装修"知识号(如洛阳老范),名字像但实际更新/评论产出弱 → 分低;可见名字signature只是入池线索,真产出还得抓了才知道。
每档评分拆解(各取 1 个代表号,看 5 个维度分别得几分、怎么加到总分):
| 维度(满分) | A · 装修帮 | B · 芬德格林门窗 | C · 家吉全屋定制 | D · 乐蜂·唐哥聊装修 |
|---|---|---|---|---|
| 已有视频数 (15) | 34→10 | 15→10 | 21→10 | 13→10 |
| 更新频率·30d (15) | 33→15 | 15→10 | 21→15 | 13→10 |
| 评论总数 (20) | 607→20 | 3→5 | 2→5 | 11→5 |
| 高意向占比 (30) | 8%→30 | 33%→30 | 0%→0 | 0%→0 |
| 高意向条数 (20) | 46→20 | 1→5 | 0→0 | 0→0 |
| 总分 / 级 | 95 · A | 60 · B | 30 · C | 20 · D |
读法:A(装修帮)靠评论多 + 高意向多把"评论总数 20 + 高意向数 20"拉满;B 常是"占比高但量小"(芬德格林占比 33% 但只 1 条高意向);C/D 多半高意向占比和条数都是 0(有视频没转化),分自然低。
这 4 个号的评论区真实长啥样(标签是系统打的真实意向,直观看每档号的评论质量差距):
| 号(档) | 评论区真实样例 |
|---|---|
| A 装修帮 | 「想装修铺位2W够不够,能装什么样的」高100 · 「我下个月交房,200方,预算300万,求好公司」高100 · 「衣服放哪里刷?」低40 · 「能设计吗」无关 781 条评论,高意向密集(含大预算明确客户)→ 满分号 |
| B 芬德格林门窗 | 「怎么卖」高85 · 「无框阳台可以按纱窗不」低58 · 「这样的多少钱一个」无关 仅 5 条评论,占比高但绝对量太小 → B |
| C 家吉全屋定制 | 全程只有 1 条:「你好,需要安装师傅吗?」无关(同行问安装,无效) 基本没人气 → C |
| D 乐蜂·唐哥聊装修 | 「想做全屋定制,要多少钱?」中78 · 其余多为「[赞][赞][赞]」「[玫瑰]」无关 139 条评论但几乎全是表情/玩梗,零高意向 → D |
对比一眼看出:A 级号评论区是"大预算 + 明确找服务",D 级号评论区是"一片点赞表情"。这就是高意向占比/条数把分数拉开的真实原因。
品类分布(active 号,2026-06-04 当前口径):
| 品类 | 数量 | 说明 |
|---|---|---|
| 本地号 | 238 | 本地装修/服务号 |
| 全屋定制 | 189 | 同行 / 全屋定制号 |
| 工厂号 | 124 | B2B,产出低、稀释池子 |
| 知识号 ⭐ | 73 | 「X讲/聊装修」科普号,观众真问问题、高意向密度高 |
| (未分类) | 54 | 名字无明显特征,待定 |
| 品牌号 | 17 | |
| 设计号 | 6 | |
| 平台号 | 1 | 如「一起装修网」(聚合平台,恰是高意向贡献第一) |
实测:哪些号真产高意向(按名下累计高意向评论数 Top,2026-06-04 实库)—— 验证"产出集中 + 升 tier1 抓得对":
| 源号 | 品类 | tier | 名下高意向 |
|---|---|---|---|
| 一起装修网 | 平台号 | tier1 | 126 |
| 小刘厂长美式家具 | 本地号 | tier1 | 97 |
| 西安老王聊装修 | 本地号 | tier1 | 96 |
| 海哥—用心讲装修 | 知识号 | tier1 | 79 |
| 石材橱柜板材批发 | 工厂号 | tier0 | 79 |
| 设计师阿爽 | 知识号 | tier1 | 71 |
| 装修帮 | 知识号 | tier1 | 68 |
| 灿哥聊装修 | 知识号 | tier1 | 64 |
8 个里 7 个是 tier1,印证"按近 7 天高意向贡献升 tier1 高频抓"是对的;品类多样(平台/本地/知识/工厂号都出好号),"石材橱柜板材批发"这种工厂号也能进前列 → 名字品类只是线索,真高产抓了才知道。
| 名字含 | 归类 |
|---|---|
| 讲装修 / 聊装修 / 说装修 / 懂装修 / 装修课堂 / 避坑 | 知识号 |
| 设计师 / 室内设计 | 设计师 |
| 建材 / 瓷砖 / 门窗 / 地板 / 涂料 / 板材 | 材料 |
| 工厂 / 厂家 / 源头 / 批发 | 工厂 |
| 业主 / 我家 / 晒家 / 装修日记 | 业主日记 |
| 旗舰店 / 官方 | 品牌 |
| 全屋定制 / 整装 / 装饰(兜底) | 同行 |
号源不是凭空来的,靠几个渠道往里灌。当前各渠道状态:
| 渠道 | 干什么用 | 怎么拉 | 现状 |
|---|---|---|---|
| 蝉妈妈 第三方抖音数据平台 | 按数据维度精筛号(粉丝/评论/类目反向画像) | 搜关键词→拿作者列表→分享链接解析→批量导入。限流:搜索无限 / 详情 30 次/窗口 | ❌ 双重失效:5/28 关键词矩阵枯竭(拉不出新号)+ 5/29 账号被封 |
| 飞瓜 另一第三方平台 | 同蝉妈妈(备选) | — | ⚪ 未注册(蝉妈妈的潜在替代,还没启用) |
| 抖音搜索 直连抖音网页 | 直接搜关键词找号 | CDP Chrome 搜词→监听搜索接口的作者列表→打分去重→导入。免费、不依赖第三方账号 | ✅ 当前主力(5/30 走通;本周 53 个知识号就走这条)。缺点:半自动、无法像蝉妈妈按数据精筛 |
| 抖音指数 巨量算数升级版(2026-01-01 起) | 验关键词热度(不是抓号,是选词) | 查关键词同比/环比/平均搜索量,判断哪个词值得上号源 | ⚠️ 能用,但只对"话题词"有数据(装修案例/婚房装修);对"X讲装修"这类创作者名字模式词返回无数据,找号别指望它 |
| 优先级 | 动作 | 为什么 | |||||||||||||||||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 高 | 清掉 492 个 D 级死号 | 在烧抓取预算 + 稀释,清了好号抓取频率翻倍 | |||||||||||||||||||||||||||||||||||
| 高 | 评估「首抓评论窗口」从 7 天再放宽到 30 天 |
"首抓" = worker 第一次抓某个新视频时往前看多久。当前 7d,意思是只收过去 7 天内出现的评论。 实验依据:5/31 抽 47 个号 × 各 10 视频 × 共 11,879 条评论,无 cutoff 全捞,看不同 cutoff 各能保住多少评论。三类样本:TierA(已验证的 2 个金号)/ vid_no_cmt(30 个"抓到视频但 0 评论"的疑似死号,最关键的待救组)/ vid_with_cmt(15 个有少量评论的对照组)。
为什么推 30d:① TierA 金号 7d→30d 覆盖率从 45.1% → 94.4%(几乎全保);② 195 个"抓到视频但 0 评论"的疑似死号里,约 50 号(195 × 25.9%)能脱困不再被冤枉;③ 30d → 60d 边际收益骤降(vid_no_cmt 只多救 6.8%),老评论意向衰减大不划算。 暂不立刻动的原因:今天刚改完复抓 7d,先观察几天实际涌入量再拍,避免一次改两个旋钮看不清谁的功劳。 | |||||||||||||||||||||||||||||||||||
| 高 | 评估存量 327 个知识号 → 留真高产、停不产的 | 知识号高意向密度最高,但多数还在 tier0 没产出数据;6-06 起评估(不是"补不足",是"筛出真高产") | |||||||||||||||||||||||||||||||||||
| 中 | 补回"按数据精筛"渠道:注册飞瓜 或 等蝉妈妈解封 | 抖音搜索能找号但筛不细;精筛渠道挂了影响新号质量 | |||||||||||||||||||||||||||||||||||
| 中 | 同名重复号去重 | category 已补全(仅剩 1 个未分类);重复号仍待清 | |||||||||||||||||||||||||||||||||||
| 中 | 补 fan_count(粉丝数半数为空) | profile 抓取没在跑,想按粉丝筛得先有数 |