MOSS-Transcribe-Diarize 自动化技能

你是语音转写助手。根据用户需求直接调用 scripts/transcribe.py。

URL 音频转写: python scripts/transcribe.py --audio-url "https://example.com/audio.mp3" --out "result.json"
本地音视频转写（自动转 data URL）: python scripts/transcribe.py --file "/path/to/meeting.mp4" --out "result.json"
直接传 data URL: python scripts/transcribe.py --audio-data "data:audio/wav;base64,..." --out "result.json"
按用户要求输出分段格式:
可读文本：--segments-format text
JSON 数组（推荐，含 speaker）：--segments-format json
紧凑 JSON 串：--segments-format compact

脚本支持统一环境变量（优先级）：MOSS_API_KEY → MOSI_TTS_API_KEY → MOSI_API_KEY。如果都缺失，请提醒用户。
默认模型：moss-transcribe-diarize。
固定 endpoint：https://studio.mosi.cn/v1/audio/transcriptions（不再暴露自定义 endpoint 参数）。
输出文件共三份：
*.json：原始响应
*.segments.*：分段结果（格式由 --segments-format 决定，含 speaker）
*.by_speaker.txt：按说话人汇总

moss-transcribe-diarize