2 个采集号 + 3 个 DM/RC 号 · 规则量化 / 现状量化 / 下一步建议
| 维度 | 阈值 | 依据 |
|---|---|---|
| 新号(<7 天)24h 评论抓取 | ≤200 条 | Akke newcookie 5/23→5/25 反例:2 天抓 958 条被封 |
| 中号(7-30 天)24h 评论抓取 | ≤500 条 | 完成实名 + 绑手机后缓冲 |
| 老号(>30 天)24h 评论抓取 | ≤1500 条 | 但单源访问间隔仍 ≥30s |
| 同物理设备 / IP 登录采集号数 | ≤2 个 | 多账号同 IP → 「团伙账号违规」 |
| 跨账号切换间隔 | ≥24h | 退出当前号 → 等 24h 再登另一号 |
| 接口频率超限 | HTTP 429 / IP 封禁 | 平台未公布 QPS,实证为准 |
近 7 天评论 INSERT 总量(2 个采集号合计,DB 未按号归属):
| 日 | 评论抓取数 | 说明 |
|---|---|---|
| 5/22 | 941 | 峰值 |
| 5/23 | 545 | newcookie 上线第 1 天 |
| 5/24 | 236 | |
| 5/25 | 177 | newcookie banned |
| 5/26 | 161 | |
| 5/27 | 460 | fanny 上线第 1 天 |
| 5/28(截至现在) | 46 |
单号状态:
| 账号 | 号龄 | 状态 | 当前 24h 抓取(估) | 安全阈值 | 余量 |
|---|---|---|---|---|---|
| 采集号-Local-04211757 | 37 天(老号) | active | 与 fanny 合计 46 | ≤1500 | 远未到 |
| fanny | 2 天(新号) | active | 与 Local 合计 46 | ≤200 | 还在观察窗口 |
worker 同时只用一份 cookie,DB 未记录哪条评论由哪个 cookie 抓的,因此无法按号拆分。
| 维度 | 阈值 | 后果 |
|---|---|---|
| 1h 不同用户 | ≤40 | 超即拦截单条 |
| 1d 不同用户(官方) | ≤100 | 拦截 |
| 单日实操硬上限 | 25-30 条 | 整账号当天阻断(Akke memory 实测) |
| 单用户主动消息 | ≤3 条 | 互关无限制 |
| 60s 同一用户无回复 | ≤5 条 | 触发 10-30min 冷却 |
| 安全间隔节奏 | ≥90s/条 + 有效文本 | 规避拦截 |
| 异常通信模式标 | 1d 80-100 不同用户 + 70% 无回复 | 标记 → 次日成功率 -42% |
| 连续 7 天异常标 | 升级 | 封号(这才是「连续 7 天超 cap」的真实判定) |
| 内容关键词 | 「微信 / vx / 抠抠」零容忍;「加 v」轻度命中 | 拦截或降权 |
| 文案重复率 | ≥80% 几乎 100% 限流 | LLM-gen 不会命中 |
近 7 天 DM 数据(DB messages 表 + 饭粒号 JSON 间隔):
| 账号 | 号龄 | 7d 峰值(用户数) | 距 25-30 红线 | 中位间隔 | <90s 占比 | 风险 |
|---|---|---|---|---|---|---|
| 饭粒(一筑) | 8 天 | 23 (5/27) | 2-7 条 | 277s | 6/21 (29%) | 中(间隔 29% 偏紧) |
| 零星 | 30 天 | 26 (5/27) | 触底线 | 数据缺 | 数据缺 | 高(5/27 已触 25-30 区间) |
| 小文(野荞) | 15 天 | 17 (5/27) | 8 条 | 数据缺 | 数据缺 | 安全 |
野荞和零星的sent_at在 DB 里是 mark-contacted 批量写时间,不反映真实间隔。要量化间隔需修send-one.py把真实 ADB 发送时间写回 JSON 的messaging_account字段。
修正之前的错误:「≥25 条」不是判定阈值,那是单日红线。
正确的判定:连续 7 天命中异常通信模式标(1d 80-100 不同用户 + 70% 无回复)。
Akke 现状:单号 8-26 条 / 8-22 个用户,远未到 80-100 异常标线。零星 5/27 的 26 条踩的是单日实操硬上限红线(25-30),不是「连续 7 天累积」。
| 维度 | 阈值 |
|---|---|
| 单日评论数 | ≤200 |
| 同视频重复评论 | 1 条/视频(违反 = 刷屏) |
| 同模板群发 | >100 次降权 |
| 单日不同视频数 | 无明文,与「群发」相关 |
近 7 天 RC sent 总量(JSON 里 messaging_account 字段全 NULL,无法按号拆):
| 日 | RC 总 sent |
|---|---|
| 5/26 | 13 |
| 5/27 | 15 |
| 5/28(至今) | 2 |
距 200 上限远(1/13)。但有两个监控盲区:
messaging_account → 不知道集中在哪个号| # | 动作 | 量化目标 | 优先级 |
|---|---|---|---|
| 1 | fanny 新号 24h 抓取量封顶 | ≤200 条评论 / 24h,连续 7 天 | 立即 |
| 2 | 零星单日 DM 封顶 | ≤20 条/日(距 25 红线留 5 条 buffer);触 22 当天停 | 立即 |
| 3 | opener 关键词「加 v」改隐性 | 改成「主页找我私聊」/「点头像私我」;推 Langfuse 新版 | 立即 |
| 4 | 饭粒号 ADB 发送间隔强制 ≥120s | 当前中位 277s 安全,但 29% <90s 需消除 | 短期 |
| 5 | send-one.py 写回 messaging_account 字段到 JSON | 补完零星/野荞的间隔可监控性 | 短期 |
| 6 | RC sent 写回 messaging_account | 解锁按号监控 RC 分布 | 短期 |
| 7 | Local-04211757 单源访问间隔强制 ≥30s | 防 IP/接口限流(worker 里加 sleep) | 短期 |
| 8 | 备用号 ≥3 个 + 养号 14 天 | 不同 SIM + 设备 + 住宅 IP | 中期 |
一次性解决:
self_check_failed 17 条流失(≈ 11%)会显著下降改完观察 7 天 self_check_failed 比例,目标 <5%。