upio.ai / Akke / 高中低意向打分

高 / 中 / 低意向 打分标准 & 演变

Akke 项目 · 2026-05-31 建,数据刷新 2026-06-04 · 「意向」= 一条评论背后的人有多想找装修服务 · 数据为实测快照
00 真实案例 01 四档标准 02 怎么算出分(公式) 03 真实案例 04 无关评论怎么处理 05 演变时间线 06 效果数据 · 下一步
CASE先看一个真实案例 + 它驱动的修复

一条真实评论 「135装这款硬装需要多少钱」:大模型拆维度 → 问购 60 + 具体 25 + 在调研 8 = 93 分 → 高意向,直接成 lead。这是打分顺利的情况。

但第一批跑下来撞了一个 badcase(驱动了关键修复):像 「这种怎么买?」「怎么联系你」 这类最强买家信号,模型却因为"具体程度不够"把它压到中意向 —— 抽样发现 60%+ 真高意向被误压。修复:加一条代码层"强买家信号兜底" —— 命中"怎么买 / 加微信 / 在哪买 / 能做吗"且是装修话题,就强制拉到高意向,不管模型打多少分。这就是下面 §2 公式里那条特殊规则的由来。先有这个案例,才有这套打分逻辑。
SECTION 01意向四档标准

每条评论先由大模型拆成 3 个维度,算出一个 0–100 分,再按阈值(注:分界线)落到四档。档位决定要不要去私信这个人:

高意向
≥ 80
明确想做/问联系/问价 → 优先私信
中意向
≥ 60
有兴趣在了解 → 池子枯竭时补用
低意向
≥ 30
弱相关 → 一般不碰
无关
< 30
凑热闹/玩梗/同行 → 丢弃
SECTION 02怎么算出分(精确公式)

用的大模型:DeepSeek V4 Flash(284B 参数的 MoE 模型,实际激活 13B;负责把评论拆成下面 3 个维度)。拆完后,分数由代码按固定公式算,不靠模型直接给分(更稳定、可复现)。

得分 = 基础分(类型)+ 加分(具体程度)+ 加分(时效),上限 100:

① 评论类型基础分② 具体程度加分③ 时效加分
问购(想买/找服务)60具体+25近窗(刚发)+15
问工艺(问知识/做法)40一般+10在调研+8
感慨(闲聊/玩梗)15模糊+0无时间+0

→ 算完按 高≥80 / 中≥60 / 低≥30 / 其余无关 落档。两个特殊规则:

规则动作
非业务品类(off_topic,如门窗/家电/数码)直接 0 分 → 无关,不管说啥
代码层强买家信号兜底:命中「怎么联系/加微信/在哪买/怎么买/能做吗/店在哪/我要一套」且是装修话题不管模型打多少,强制拉到高意向
为什么要强买家兜底:抽样发现模型的"具体程度"会把「多少钱/怎么联系/能做吗」压低 → 60%+ 真高意向曾被误压到中意向,所以加代码层强行救回。
SECTION 03真实案例(库里实抓,含算分)

下面都是库里真实评论 + 它被打的分(公式可对上):

高意向 93 「120平一般装多少钱」
问购 60 + 具体 25 + 在调研 8 = 93
高意向 85 「接活吗?家里要装修」
问购 60 + 一般 10 + 近窗 15 = 85
高意向 85 「这种怎么买?」
命中强买家信号「怎么买」→ 代码层强制升高意向
中意向 78 「老王靠谱,来一份[玫瑰]」
问购 60 + 一般 10 + 在调研 8 = 78(够 60 不够 80)
中意向 78 「来帮我家设计一下吧」
问购 60 + 一般 10 + 在调研 8 = 78
低意向 58 「这些配件是主家买还是水电工买」
问工艺 40 + 一般 10 + 在调研 8 = 58(问做法,不是问购)
低意向 58 「求份攻略」
问工艺 40 + 一般 10 + 在调研 8 = 58
无关 15 「可以吃了饭」 / 「[赞][赞][赞]」 / 「[泪奔]外壳做个圈」
感慨 15 + 模糊 0 + 无时间 0 = 15(玩梗/纯表情/跑题)
SECTION 04无关评论怎么处理

装修视频评论区大部分是噪音——纯表情、玩梗、同行、跑题。实测近 24 小时被分析的评论里:

近24h 判为无关
80.0%
4,087 / 5,110 条
近24h 高意向
3.3%
168 条(真正值钱的)

处理方式(三道)

环节做法状态
① 抓取时预过滤纯表情 / 同行号 / @AI 这类,不送大模型,直接 skip(省成本)✅ 正常
② 本周一次性大清理(手动)无关曾累积到峰值 ~30,131 条;本周手动跑清扫脚本,累计删除约 17,725 条✅ 已执行
③ 每日自动清理定时任务每天删 无关 且 >24h 的(留 24h 安全窗防改判)⚠️ 配了但失败(删除时 SSL 报错、无重试 → 一条没删),修复中
每日清理:5/31 已查清根因 + 重写脚本(实测秒删 3,504)
  • 之前为什么没生效:脚本每天 09:00 在跑,但删除撞 SSL 协议错且没重试 → 一断就崩、一条没删,待清天天涨(5/29 2,879 → 5/31 5,050)。中间一版加了重试但逐条撞 FK 确认,73 分钟才删 ~1,100,徒劳。
  • 真正卡点:很大比例无关评论被 conversations(对话)表引用——这些评论关联了触达/对话记录,删评论会破坏对话(FK 挡住),本就不该删
  • 正确解法(已重写脚本):先把"被对话引用的 comment_id"整集拉下来,内存里 diff 出"可删的",再 bulk 删——不逐条撞 FK,几秒删完
  • 5/31 实测最终结果:无关>24h 共 5,107 = 可删 3,504(已秒删) + 对话锁 1,603(关联对话,保留)。清后剩 1,603。
  • "可删" vs "删不得"啥意思可删=这条无关评论没人联系过、无牵无挂,删了不影响别的 → 直接删。删不得(对话锁)=这条评论背后的人我们之前联系过、建过对话,数据库有保护规则不让删"还被对话挂着的评论"(删了对话就指向空、成坏数据)。即:这些人当初可能被判过有意向、联系了,后来评论被重判无关,但触达记录还在,所以保留是对的。
  • 结论:无关>24h 不会归零——稳定在"对话锁残留(~1,600)+ 持续新老化进来"。每天清掉可删的那批,防止无限膨胀。

全库 31,504 条评论里 无关仍占 55%(17,333 条)——即便天天清,噪音依然是绝对大头。这正说明价值集中在那 7.7% 高意向上,筛得准比抓得多更重要。

SECTION 05从上周一(5/25)到现在的演变
5/26 09:37
意向 prompt v3.2 + 配方系统
把"评分配方"(各档阈值/各类型基础分)做成可一键切换的 5 套(v1~v5),方便试不同高意向池大小;同步改版 /leads 筛选页。
5/26 10:36
v3.3 — 修 3 类误判
prompt 层修正 3 类典型判错,减少明显误标。
5/26 起
代码层「强买家信号强制升高意向」
根因:模型把"怎么联系/在哪买"压低。措施:加确定性规则强行救回 → 找回被误压的 60%+ 真高意向。
5/26 起 持续
同行过滤持续补后缀
不断补「聊房/说房/看房」等房产/同行博主特征 → 判无关,减少同行污染高意向池。
5/26–27
阈值/基础分实验(5 套配方)
v1 原版(当前生产):问购基础 60,高意向 ≥80
v2:阈值降到 70(想把池子做到 1,500–2,000)
v3:问购基础 60→65(更精准、池子收)
v4:问购 60→62(刚好把"问购+一般+在调研"78→80 推过线)
v5:在调研加分 +8→+10(更聚焦"正在装修中"信号)
→ 目前回到 v1(≥80),在"池子够大"和"质量够纯"间取平衡。
SECTION 06当前效果数据 · 下一步

全库 31,504 条评论的档位分布(2026-06-04 实时):

高 2440 · 7.7%
中 4718 · 15%
低 20.9%
无关 17333 · 55%
档位数量占比用途
高意向2,4407.7%主力私信池
中意向4,71815.0%高意向枯竭时补(score≥75)
低意向6,57720.9%一般不碰
无关17,33355.0%清理(删可删的;对话锁的保留)
未分析4361.4%排队待打分(从 19% 降下来)
⚠️ 诚实标注:上面分布是实测硬数据;但 SECTION 05 里"每次改动的效果"多为设计意图/抽样观察,缺每次改动严格的 before/after 量化对比。要硬数字需对同一批评论跑新旧配方做 A/B 回测(Langfuse Datasets 已有 harness)。
优先级动作为什么
意向配方 A/B 回测把"效果"从定性变量化,精确测每次改动的精确率 + 池子大小
持续扩强买家信号词 + 同行后缀这两层兜底,词越全漏判/误判越少
意向打分 ↔ 号源打分联动高意向集中在少数号 → 反哺号源 A/B/C 分级