package com.ruoyi.wisdomarbitrate.utils; import com.tencentcloudapi.bsca.v20210811.models.LicenseSummary; import com.tencentcloudapi.common.Credential; import com.tencentcloudapi.common.exception.TencentCloudSDKException; import com.tencentcloudapi.common.profile.ClientProfile; import com.tencentcloudapi.common.profile.HttpProfile; import com.tencentcloudapi.ocr.v20181119.OcrClient; import com.tencentcloudapi.ocr.v20181119.models.SmartStructuralOCRV2Request; import com.tencentcloudapi.ocr.v20181119.models.SmartStructuralOCRV2Response; import org.json.JSONArray; import org.json.JSONObject; import java.util.ArrayList; import java.util.List; public class OCRUtils { //API的SecretId private static final String SECRET_ID = "AKIDeEf2A8uX1HSainvvnXAc3X9ZlhtyvkMp"; //API的SecretKey private static final String SECRET_KEY = "QjphKo8zkHZigT8j9PVtFPJyfIvO3d6V"; public static String pdfIdentifyText(String ImageUrl, Integer PageNumber) { try { // 实例化一个认证对象,入参需要传入腾讯云账户 SecretId 和 SecretKey,此处还需注意密钥对的保密 // 代码泄露可能会导致 SecretId 和 SecretKey 泄露,并威胁账号下所有资源的安全性。以下代码示例仅供参考,建议采用更安全的方式来使用密钥,请参见:https://cloud.tencent.com/document/product/1278/85305 // 密钥可前往官网控制台 https://console.cloud.tencent.com/cam/capi 进行获取 Credential cred = new Credential(SECRET_ID, SECRET_KEY); // 实例化一个http选项,可选的,没有特殊需求可以跳过 HttpProfile httpProfile = new HttpProfile(); httpProfile.setEndpoint("ocr.tencentcloudapi.com"); // 实例化一个client选项,可选的,没有特殊需求可以跳过 ClientProfile clientProfile = new ClientProfile(); clientProfile.setHttpProfile(httpProfile); // 实例化要请求产品的client对象,clientProfile是可选的 OcrClient client = new OcrClient(cred, "ap-beijing", clientProfile); // 实例化一个请求对象,每个接口都会对应一个request对象 SmartStructuralOCRV2Request req = new SmartStructuralOCRV2Request(); req.setImageUrl(ImageUrl); req.setIsPdf(true); req.setPdfPageNumber(PageNumber.longValue()); String[] itemNames1 = {"申请人", "统一社会信用代码", "法定代表人", "住所", "联系地址", "委托代理人" , "联系电话", "电子邮件", "被申请人", "居民身份证号码", "住所", "联系电话", "电子邮件", "仲裁请求" , "事实和理由"}; req.setItemNames(itemNames1); // 返回的resp是一个SmartStructuralOCRV2Response的实例,与请求对象对应 SmartStructuralOCRV2Response resp = client.SmartStructuralOCRV2(req); // 输出json格式的字符串回包 System.out.println(SmartStructuralOCRV2Response.toJsonString(resp)); //解析数据 String s = SmartStructuralOCRV2Response.toJsonString(resp); // 解析JSON数据 JSONObject jsonObject = new JSONObject(s); JSONArray structuralList = jsonObject.getJSONArray("StructuralList"); // 遍历StructuralList中的Groups,获取Key对应的AutoName和Value对应的AutoConten StringBuilder stringBuilder = new StringBuilder(); // 创建一个StringBuilder对象 for (int i = 0; i < structuralList.length(); i++) { JSONArray groups = structuralList.getJSONObject(i).getJSONArray("Groups"); for (int j = 0; j < groups.length(); j++) { JSONArray lines = groups.getJSONObject(j).getJSONArray("Lines"); for (int k = 0; k < lines.length(); k++) { JSONObject line = lines.getJSONObject(k); JSONObject key = line.getJSONObject("Key"); JSONObject value = line.getJSONObject("Value"); String autoName = key.getString("AutoName"); String autoContent = value.getString("AutoContent"); String text = autoName + ":" + autoContent; if (stringBuilder.length() > 0) { stringBuilder.append(","); // 在已有内容的情况下添加逗号分隔符 } stringBuilder.append(text); // 拼接当前的字符串 } } } return stringBuilder.toString(); // 获取最终的拼接结果 } catch (TencentCloudSDKException e) { System.out.println(e.toString()); } return null; } public static void main(String[] args) { String input = "申请人:招商银行,住所:上海嘉定区,联系地址:上海徐汇区,法定代表人:招商法人,委托代理人:黄海龙,被申请人:白贵勇,住所:陕西,联系地址:陕西,仲裁请求:仲裁委主任依据《2022年版仲裁规则》第三十一条第(四)项、第三十二条的规定指定白贵勇仲裁员为仲裁庭的仲裁员。本案由白贵勇仲裁员成立仲裁庭进行审理。,事实和理由:(一)申请人的仲裁请求及事实和理由,申请人:债务纠纷"; String[] fields = input.split(","); JSONObject jsonObject = new JSONObject(); // 创建一个空的JSON对象 for (String field : fields) { // 对于每个字段,再按冒号分隔符拆分出键和值 String[] keyValue = field.split(":"); if (keyValue.length == 2) { // 对于合法的键值对,将其添加到JSON对象中 jsonObject.put(keyValue[0], keyValue[1]); } } System.out.println(jsonObject.toString()); } }