upio.ai / Akke / 高中低意向打分

高 / 中 / 低意向打分标准 & 演变

Akke 项目 · 2026-05-31 建，数据刷新 2026-06-04 · 「意向」= 一条评论背后的人有多想找装修服务 · 数据为实测快照

00 真实案例 01 四档标准 02 怎么算出分（公式） 03 真实案例 04 无关评论怎么处理 05 演变时间线 06 效果数据 · 下一步

CASE先看一个真实案例 + 它驱动的修复

一条真实评论 「135装这款硬装需要多少钱」：大模型拆维度 → 问购 60 + 具体 25 + 在调研 8 = 93 分 → 高意向，直接成 lead。这是打分顺利的情况。

但第一批跑下来撞了一个 badcase（驱动了关键修复）：像 「这种怎么买？」「怎么联系你」 这类最强买家信号，模型却因为"具体程度不够"把它压到中意向 —— 抽样发现 60%+ 真高意向被误压。修复：加一条代码层"强买家信号兜底" —— 命中"怎么买 / 加微信 / 在哪买 / 能做吗"且是装修话题，就强制拉到高意向，不管模型打多少分。这就是下面 §2 公式里那条特殊规则的由来。先有这个案例，才有这套打分逻辑。

SECTION 01意向四档标准

每条评论先由大模型拆成 3 个维度，算出一个 0–100 分，再按阈值（注：分界线）落到四档。档位决定要不要去私信这个人：

高意向

≥ 80

明确想做/问联系/问价 → 优先私信

中意向

≥ 60

有兴趣在了解 → 池子枯竭时补用

低意向

≥ 30

弱相关 → 一般不碰

无关

< 30

凑热闹/玩梗/同行 → 丢弃

SECTION 02怎么算出分（精确公式）

用的大模型：DeepSeek V4 Flash（284B 参数的 MoE 模型，实际激活 13B；负责把评论拆成下面 3 个维度）。拆完后，分数由代码按固定公式算，不靠模型直接给分（更稳定、可复现）。

得分 = 基础分（类型）+ 加分（具体程度）+ 加分（时效），上限 100：

① 评论类型	基础分	② 具体程度	加分	③ 时效	加分
问购（想买/找服务）	60	具体	+25	近窗（刚发）	+15
问工艺（问知识/做法）	40	一般	+10	在调研	+8
感慨（闲聊/玩梗）	15	模糊	+0	无时间	+0

→ 算完按 高≥80 / 中≥60 / 低≥30 / 其余无关 落档。两个特殊规则：

规则	动作
非业务品类（off_topic，如门窗/家电/数码）	直接 0 分 → 无关，不管说啥
代码层强买家信号兜底：命中「怎么联系/加微信/在哪买/怎么买/能做吗/店在哪/我要一套」且是装修话题	不管模型打多少，强制拉到高意向

为什么要强买家兜底：抽样发现模型的"具体程度"会把「多少钱/怎么联系/能做吗」压低 → 60%+ 真高意向曾被误压到中意向，所以加代码层强行救回。

SECTION 03真实案例（库里实抓，含算分）

下面都是库里真实评论 + 它被打的分（公式可对上）：

高意向 93 「120平一般装多少钱」

问购 60 + 具体 25 + 在调研 8 = 93

高意向 85 「接活吗？家里要装修」

问购 60 + 一般 10 + 近窗 15 = 85

高意向 85 「这种怎么买？」

命中强买家信号「怎么买」→ 代码层强制升高意向

中意向 78 「老王靠谱，来一份[玫瑰]」

问购 60 + 一般 10 + 在调研 8 = 78（够 60 不够 80）

中意向 78 「来帮我家设计一下吧」

问购 60 + 一般 10 + 在调研 8 = 78

低意向 58 「这些配件是主家买还是水电工买」

问工艺 40 + 一般 10 + 在调研 8 = 58（问做法，不是问购）

低意向 58 「求份攻略」

问工艺 40 + 一般 10 + 在调研 8 = 58

无关 15 「可以吃了饭」 / 「[赞][赞][赞]」 / 「[泪奔]外壳做个圈」

感慨 15 + 模糊 0 + 无时间 0 = 15（玩梗/纯表情/跑题）

SECTION 04无关评论怎么处理

装修视频评论区大部分是噪音——纯表情、玩梗、同行、跑题。实测近 24 小时被分析的评论里：

近24h 判为无关

80.0%

4,087 / 5,110 条

近24h 高意向

3.3%

168 条（真正值钱的）

处理方式（三道）：

环节	做法	状态
① 抓取时预过滤	纯表情 / 同行号 / @AI 这类，不送大模型，直接 skip（省成本）	✅ 正常
② 本周一次性大清理（手动）	无关曾累积到峰值 ~30,131 条；本周手动跑清扫脚本，累计删除约 17,725 条	✅ 已执行
③ 每日自动清理	定时任务每天删 `无关` 且 >24h 的（留 24h 安全窗防改判）	⚠️ 配了但失败（删除时 SSL 报错、无重试 → 一条没删），修复中

每日清理：5/31 已查清根因 + 重写脚本（实测秒删 3,504）

之前为什么没生效：脚本每天 09:00 在跑，但删除撞 SSL 协议错且没重试 → 一断就崩、一条没删，待清天天涨（5/29 2,879 → 5/31 5,050）。中间一版加了重试但逐条撞 FK 确认，73 分钟才删 ~1,100，徒劳。
真正卡点：很大比例无关评论被 conversations（对话）表引用——这些评论关联了触达/对话记录，删评论会破坏对话（FK 挡住），本就不该删。
正确解法（已重写脚本）：先把"被对话引用的 comment_id"整集拉下来，内存里 diff 出"可删的"，再 bulk 删——不逐条撞 FK，几秒删完。
5/31 实测最终结果：无关>24h 共 5,107 = 可删 3,504（已秒删） + 对话锁 1,603（关联对话，保留）。清后剩 1,603。
"可删" vs "删不得"啥意思：可删＝这条无关评论没人联系过、无牵无挂，删了不影响别的 → 直接删。删不得（对话锁）＝这条评论背后的人我们之前联系过、建过对话，数据库有保护规则不让删"还被对话挂着的评论"（删了对话就指向空、成坏数据）。即：这些人当初可能被判过有意向、联系了，后来评论被重判无关，但触达记录还在，所以保留是对的。
结论：无关>24h 不会归零——稳定在"对话锁残留（~1,600）+ 持续新老化进来"。每天清掉可删的那批，防止无限膨胀。

全库 31,504 条评论里 无关仍占 55%（17,333 条）——即便天天清，噪音依然是绝对大头。这正说明价值集中在那 7.7% 高意向上，筛得准比抓得多更重要。

SECTION 05从上周一(5/25)到现在的演变

5/26 09:37

意向 prompt v3.2 + 配方系统

把"评分配方"（各档阈值/各类型基础分）做成可一键切换的 5 套（v1~v5），方便试不同高意向池大小；同步改版 /leads 筛选页。

5/26 10:36

v3.3 — 修 3 类误判

prompt 层修正 3 类典型判错，减少明显误标。

5/26 起

代码层「强买家信号强制升高意向」

根因：模型把"怎么联系/在哪买"压低。措施：加确定性规则强行救回 → 找回被误压的 60%+ 真高意向。

5/26 起持续

同行过滤持续补后缀

不断补「聊房/说房/看房」等房产/同行博主特征 → 判无关，减少同行污染高意向池。

5/26–27

阈值/基础分实验（5 套配方）

v1 原版（当前生产）：问购基础 60，高意向 ≥80
v2：阈值降到 70（想把池子做到 1,500–2,000）
v3：问购基础 60→65（更精准、池子收）
v4：问购 60→62（刚好把"问购+一般+在调研"78→80 推过线）
v5：在调研加分 +8→+10（更聚焦"正在装修中"信号）
→ 目前回到 v1（≥80），在"池子够大"和"质量够纯"间取平衡。

SECTION 06当前效果数据 · 下一步

全库 31,504 条评论的档位分布（2026-06-04 实时）：

高 2440 · 7.7%

中 4718 · 15%

低 20.9%

无关 17333 · 55%

档位	数量	占比	用途
高意向	2,440	7.7%	主力私信池
中意向	4,718	15.0%	高意向枯竭时补（score≥75）
低意向	6,577	20.9%	一般不碰
无关	17,333	55.0%	清理（删可删的；对话锁的保留）
未分析	436	1.4%	排队待打分（从 19% 降下来）

⚠️ 诚实标注：上面分布是实测硬数据；但 SECTION 05 里"每次改动的效果"多为设计意图/抽样观察，缺每次改动严格的 before/after 量化对比。要硬数字需对同一批评论跑新旧配方做 A/B 回测（Langfuse Datasets 已有 harness）。

优先级	动作	为什么
高	意向配方 A/B 回测	把"效果"从定性变量化，精确测每次改动的精确率 + 池子大小
中	持续扩强买家信号词 + 同行后缀	这两层兜底，词越全漏判/误判越少
中	意向打分 ↔ 号源打分联动	高意向集中在少数号 → 反哺号源 A/B/C 分级

高 / 中 / 低意向 打分标准 & 演变

高 / 中 / 低意向打分标准 & 演变