1. 接口说明

通用文字识别(General words Recognition)基于深度神经网络模型的端到端文字识别系统,将图片(来源如扫描仪或数码相机)中的文字转化为计算机可编码的文字

2. 接口地址

  1. POST http[s]://webapi.xfyun.cn/v1/service/v1/ocr/general HTTP/1.1
  2. Content-Type:application/x-www-form-urlencoded; charset=utf-8

3. 请求参数

在 Http Request Header 中配置授权认证参数,见【接口描述-授权认证】。其中 X-Param 为各配置参数组成的JSON串经BASE64编码之后的字符串,原始JSON串各字段说明如下:

参数类型必须说明示例
languagestring语言,可选值:en(英文),cn|en(中文或中英混合)en
locationstring是否返回文本位置信息,可选值:false(否),true(是),默认为falsetrue

X-Param生成示例:

  1. 原始JSON串:
  2. {
  3. "language": "en",
  4. "location": "false"
  5. }
  6. BASE64编码(即X-Param):
  7. eyJsYW5ndWFnZSI6ImVuIiwibG9jYXRpb24iOiJmYWxzZSJ9

在 Http Request Body 中配置以下参数:

参数类型必须说明示例
imagestring图像数据,base64编码后进行urlencode,要求base64编码和urlencode后大小不超过4M,最短边至少15px,最长边最大4096px,支持jpg/png/bmp格式exSI6ICJlbiIsCgkgICAgInBvc2l0aW9uIjogImZhbHNlIgoJf…

_注:_base64编码后大小会增加约1/3

4. 返回值

返回值为json串,各字段如下:

参数类型说明
codestring结果码(具体见错误码)
datajson详见data说明
descstring描述
sidstring会话ID

其中sid字段主要用于追查问题,如果出现问题,可以提供sid给讯飞技术人员帮助确认问题。

data各字段说明如下:

参数类型说明
block对象数组区域块信息
typestring区域块类型(text-文本,image-图片)
line对象数组行信息
word对象数组字(中文),单词(英文)
contentstring内容
confidencefloat后验概率
location对象位置信息
top_left对象左上角位置信息
right_bottom对象右下角位置信息
xint对应点的横坐标(像素)
yint对应点的纵坐标(像素)

示例如下:

失败:

  1. {
  2. "code": "10106",
  3. "desc": "invalid parameter|invalid X-Appid",
  4. "data": "",
  5. "sid": "wcr0000bb3f@ch3d5c059d83b3477200"
  6. }

成功


含位置信息


  1. {
  2. "code": "0",
  3. "data": {
  4. "block": [
  5. {
  6. "line": [
  7. {
  8. "confidence": 1,
  9. "word": [
  10. {
  11. "content": "I'm",
  12. "location": {
  13. "right_bottom": {
  14. "y": 28,
  15. "x": 18
  16. },
  17. "top_left": {
  18. "y": 0,
  19. "x": 0
  20. }
  21. }
  22. }
  23. ],
  24. "location": {
  25. "right_bottom": {
  26. "y": 28,
  27. "x": 478
  28. },
  29. "top_left": {
  30. "y": 0,
  31. "x": 0
  32. }
  33. }
  34. }
  35. ],
  36. "type": "text"
  37. }
  38. ]
  39. },
  40. "sid": "wcr00000009@ch0fc40d9e4cdf000100",
  41. "desc": "success"
  42. }

不含位置信息


  1. {
  2. "code":"0",
  3. "data":{
  4. "block":[
  5. {
  6. "line":[
  7. {
  8. "confidence":1,
  9. "word":[
  10. {
  11. "content":"I'm"
  12. }
  13. ]
  14. }
  15. ],
  16. "type":"text"
  17. }
  18. ]
  19. },
  20. "sid":"wcr00000008@ch0fc40d9e4c73000100",
  21. "desc":"success"
  22. }

5. 调用示例

印刷文字识别demo go语言

印刷文字识别demo php语言

印刷文字识别demo python3语言

印刷文字识别demo java语言

印刷文字识别demo c#语言

Copyright © iflytek.com 2018 all right reserved,powered by Gitbook该文件修订时间:2019-05-07 07:12:51