ai-drama-review

This skill identifies compliance risks in AI-generated short dramas, including copyright infringement, age rating violations, and unauthorized novel adaptations. It uses a two-layer architecture: local keyword scanning for fast baseline detection, plus AI-powered deep analysis for context-aware accuracy.

Warning: BETA — 本技能包正在测试中，检测结果仅供参考，不作为法律依据。请结合专业法律意见使用。

用户提供剧本文本、字幕文件或视频描述，本技能将执行合规审查并生成结构化风险报告。

Phase 1: 环境检测与初始化

当用户请求对短剧内容进行合规审查时，先执行环境检测：

python3 scripts/env_detect.py

检测内容： 1. Python 版本: >= 3.8 2. 可用 API 密钥: OPENAI_API_KEY / ANTHROPIC_API_KEY（用于深度分析） 3. 可选 Python 包: jieba（中文分词，提升版权检测精度） 4. 网络连通性: API 端点可达性

确定运行模式： - 仅本地模式 (local_only): 无 API 密钥时的降级模式，仅执行关键词匹配和文本算法分析 - 混合模式 (hybrid)（推荐）: 本地快速扫描 + AI 深度上下文分析，精度更高

向用户展示环境状态和可用功能。

Phase 2: 版权侵权检测

接收用户提供的剧本/台词文本，执行版权侵权检测：

python3 scripts/text_similarity.py --input <script_file> --reference-dir <reference_texts_dir>

2.1 文本预处理

统一编码（Unicode 归一化）
去除标点符号和多余空白
按段落分割，过滤过短段落（< 20 字）
中文分词（优先使用 jieba，降级为字符级分词）

2.2 三重相似度检测

对每个段落与参考文本库逐段比对，计算三种互补指标：

算法	检测能力	权重
n-gram Jaccard 系数	局部词汇重复	0.3
归一化编辑距离	整体文本差异	0.3
TF-IDF 余弦相似度	语义主题相似	0.4

综合得分超过阈值（默认 0.7）的段落标记为疑似侵权。

2.3 AI 语义确认（混合模式）

将高疑似段落发送 AI 进行语义级分析： - 排除通用表达和公共领域内容 - 评估独创性和实质性相似 - 识别改写和同义替换

向用户展示：可疑段落列表、相似度分数、疑似来源、AI 分析意见。

Phase 3: 年龄分级合规检测

扫描剧本内容的年龄分级合规性：

python3 scripts/age_rating_scanner.py --input <script_file> --target-rating <all_ages|12+|18+>

3.1 Layer 1: 本地关键词快速扫描

加载分类关键词库（暴力/色情/恐怖/脏话/烟酒毒品），逐段扫描： - 记录命中的关键词、类别、严重度（mild/moderate/severe） - 保留命中位置和上下文（前后 30 字） - 根据命中密度和严重程度计算初步分级建议

3.2 Layer 2: AI 上下文深度分析（混合模式）

将关键词命中的上下文段落发送 AI 模型： - 判断是否为真正的不当内容（排除否定语境、文学修辞、历史引用等误报） - 评估上下文中的内容倾向 - 给出分级建议及具体理由

3.3 辅助内容分析

视频关键帧描述: 如果用户提供了视频帧描述，分析画面内容风险
音频转录文本: 如果用户提供了音频转录，扫描脏话和不当音效描述

3.4 分级输出

分级	说明
全年龄 (all_ages)	内容适合所有年龄段
12+	含轻度暴力/冲突，需家长指导
18+	含较强暴力/恐怖/成人主题
不合规 (non_compliant)	超出可接受范围，建议修改

Phase 4: 小说魔改检测

比对原著与改编版本，评估改编偏离程度：

python3 scripts/adaptation_detector.py --original <original_file> --adapted <adapted_file>

4.1 结构对齐

使用动态规划算法（Needleman-Wunsch 变体）将原著章节与改编版段落对齐，识别： - 保留的原始情节 - 新增的情节段 - 被删除的原著内容 - 被修改的段落

4.2 角色偏离检测

提取角色列表和设定，比对变化： - 性格特征改动 - 角色关系改动 - 角色命运改动

4.3 关键情节比对

通过 AI 提取核心情节点，评估改编对原著核心的改动程度。

4.4 偏离度评分

综合输出偏离度评分（0-100）：

评分范围	分类	说明
0 - 30	忠实改编	保留原著核心，合理调整
30 - 60	合理改编	有较大改动但未偏离核心
60 - 100	严重魔改	大幅偏离原著，可能引发争议

Phase 5: 合规报告生成

汇总所有检测结果，生成结构化报告：

python3 scripts/report_generator.py --results <detection_results.json> --format <json|markdown>

报告内容： - 总体风险等级: 低 / 中 / 高 / 严重 - 版权侵权风险: 疑似来源、相似段落、相似度分数 - 年龄分级合规: 分级建议、各类别命中详情 - 小说魔改详情: 偏离度评分、核心改动列表 - 违规位置标注: 段落编号、时间戳、场景编号 - 整改建议清单: 针对每项风险的具体修改建议

Phase 6: 编排与完整审查

一键执行完整审查流程：

python3 scripts/review_orchestrator.py --input <script_file> [--reference-dir <dir>] [--original <file>] [--target-rating 12+] [--checks copyright rating adaptation]

流程： 1. 环境检测，确定运行模式 2. 加载输入文本（支持 .txt / .srt / .json 格式） 3. 执行选定的检测模块 4. AI 综合风险评估（混合模式） 5. 生成合规报告 6. 格式化风险提示文本，标注并告知用户违规风险

风险提示格式: 当检测到违规时，生成结构化的风险提示，供模型向用户展示具体的违规类型、位置和整改建议。

凭证安全

环境变量配置

AI 分析（至少配置一个以启用混合模式）： - OPENAI_API_KEY — OpenAI API（用于深度内容分析） - ANTHROPIC_API_KEY — Anthropic Claude API（备选）

安全原则： - 所有凭证仅通过环境变量读取，零持久化 - 不记录、不打印、不缓存任何密钥值 - 无 API 密钥时自动降级为本地模式

免责声明

本技能包提供的合规检测结果仅供参考，不构成法律意见。使用者应结合专业法律顾问的意见做出最终判断。检测结果可能存在误报或漏报，建议对高风险内容进行人工复核。