generalrecognition
v1.0.2使用极速数据通用文字识别 API,将图片中的文字识别为文本,支持中英文及多种外语。
Installation
Please help me install the skill `generalrecognition` from SkillHub official store.
npx skills add jisuapi/generalrecognition
极速数据通用文字识别(Jisu General Recognition / OCR)
基于 通用文字识别 API 的 OpenClaw 技能,可识别一般网络图片中的文字内容,支持中英文与多种外语:
cnen:中英文(默认)en:英语fr:法语pt:葡萄牙语de:德语it:意大利语es:西班牙语ru:俄语jp:日语
使用前需要在极速数据官网申请通用文字识别服务,文档见:https://www.jisuapi.com/api/generalrecognition/
环境变量配置
# Linux / macOS
export JISU_API_KEY="your_appkey_here"
# Windows PowerShell
$env:JISU_API_KEY="your_appkey_here"
脚本路径
脚本文件:skills/generalrecognition/generalrecognition.py
使用方式与请求参数
当前脚本只需直接传一段 JSON 参数,对应 /generalrecognition/recognize 接口:
1. 从本地图片识别(推荐)
python3 skills/generalrecognition/generalrecognition.py '{"path":"sfz1.jpg","type":"cnen"}'
path:本地图片路径(脚本会读取并转为 base64),支持 JPG/PNG 等,单张图片最大约 500K;type:文字类型,默认cnen,可选en/fr/pt/de/it/es/ru/jp。
2. 直接传 base64 图片内容
如果你在前置流程中已经把图片转成了 base64,可以直接通过 pic 传入(注意不要带 data:image/...;base64, 前缀,只要纯 base64 字符串):
python3 skills/generalrecognition/generalrecognition.py '{
"pic": "<base64_string>",
"type": "cnen"
}'
3. 请求参数说明
| 字段名 | 类型 | 必填 | 说明 |
|---|---|---|---|
| path | string | 二选一 | 本地图片路径,脚本会自动读取并转为 base64 |
| image | string | 二选一 | path 的别名 |
| file | string | 二选一 | path 的别名 |
| pic | string | 二选一 | 已经是 base64 的图片内容(不带前缀) |
| type | string | 否 | 文字类型:cnen/en/fr/pt/de/it/es/ru/jp,默认 cnen |
path/image/file 与 pic 至少提供一个;同时存在时优先使用 pic。
返回结果说明
接口原始返回示例(参考官网文档):
{
"status": 0,
"msg": "ok",
"result": [
"此时此刻我好焦灼!",
"你别再解释了"
]
}
本技能会对返回进行一次轻量封装,统一输出:
{
"result": [
"此时此刻我好焦灼!",
"你别再解释了"
]
}
当出现业务错误时(例如图片为空、格式错误、超过大小限制等),则包装为:
{
"error": "api_error",
"code": 201,
"message": "图片为空"
}
网络或解析错误会返回:
{
"error": "request_failed" | "http_error" | "invalid_json",
"message": "...",
"status_code": 500
}
常见错误码
来源于 通用文字识别文档:
| 代号 | 说明 |
|---|---|
| 201 | 图片为空 |
| 202 | 图片格式错误 |
| 204 | 图片大小超过限制 |
| 208 | 识别失败 |
| 210 | 没有信息 |
系统错误码 101–108 与其它极速数据接口一致。
在 OpenClaw 中的推荐用法
- 用户上传一张带有文字的截图或照片,要求「帮我把图片里的文字全部提取出来」。
- 代理将图片保存为本地文件或转为 base64,再调用:
python3 skills/generalrecognition/generalrecognition.py '{"path":"image.jpg","type":"cnen"}'或传入pic。 - 从返回的
result数组中拼接出完整文本(按行合并或按需要格式化),用自然语言回复用户,并根据场景进一步分析或翻译内容。