generalrecognition

极速数据通用文字识别（Jisu General Recognition / OCR）

基于通用文字识别 API 的 OpenClaw 技能，可识别一般网络图片中的文字内容，支持中英文与多种外语：

使用前需要在极速数据官网申请通用文字识别服务，文档见：https://www.jisuapi.com/api/generalrecognition/

# Linux / macOS
export JISU_API_KEY="your_appkey_here"

# Windows PowerShell
$env:JISU_API_KEY="your_appkey_here"

脚本文件：skills/generalrecognition/generalrecognition.py

当前脚本只需直接传一段 JSON 参数，对应 /generalrecognition/recognize 接口：

python3 skills/generalrecognition/generalrecognition.py '{"path":"sfz1.jpg","type":"cnen"}'

如果你在前置流程中已经把图片转成了 base64，可以直接通过 pic 传入（注意不要带 data:image/...;base64, 前缀，只要纯 base64 字符串）：

python3 skills/generalrecognition/generalrecognition.py '{
  "pic": "<base64_string>",
  "type": "cnen"
}'

字段名	类型	必填	说明
path	string	二选一	本地图片路径，脚本会自动读取并转为 base64
image	string	二选一	`path` 的别名
file	string	二选一	`path` 的别名
pic	string	二选一	已经是 base64 的图片内容（不带前缀）
type	string	否	文字类型：`cnen/en/fr/pt/de/it/es/ru/jp`，默认 `cnen`

path/image/file 与 pic 至少提供一个；同时存在时优先使用 pic。

接口原始返回示例（参考官网文档）：

{
  "status": 0,
  "msg": "ok",
  "result": [
    "此时此刻我好焦灼!",
    "你别再解释了"
  ]
}

本技能会对返回进行一次轻量封装，统一输出：

{
  "result": [
    "此时此刻我好焦灼!",
    "你别再解释了"
  ]
}

当出现业务错误时（例如图片为空、格式错误、超过大小限制等），则包装为：

{
  "error": "api_error",
  "code": 201,
  "message": "图片为空"
}

网络或解析错误会返回：

{
  "error": "request_failed" | "http_error" | "invalid_json",
  "message": "...",
  "status_code": 500
}

来源于通用文字识别文档：

系统错误码 101–108 与其它极速数据接口一致。

用户上传一张带有文字的截图或照片，要求「帮我把图片里的文字全部提取出来」。
代理将图片保存为本地文件或转为 base64，再调用：python3 skills/generalrecognition/generalrecognition.py '{"path":"image.jpg","type":"cnen"}' 或传入 pic。
从返回的 result 数组中拼接出完整文本（按行合并或按需要格式化），用自然语言回复用户，并根据场景进一步分析或翻译内容。