Spark Android SDK接入文档

注意：该接口可以正式使用。如您需要申请使用，请点击前往产品页面。

Tips：

计费包含接口的输入和输出内容
1tokens 约等于1.5个中文汉字或者 0.8个英文单词
星火V1.5支持[搜索]内置插件；星火V2.0和V3.0支持[搜索]、[天气]、[日期]、[诗词]、[字词]、[股票]六个内置插件

#1. SDK介绍

Spark SDK提供了一套快速集成星火大模型的工具，让开发者无需关注底层协议细节，提高开发效率。同时，它支持Android、Linux、iOS、Windows多个平台，方便开发者选择最适合自己的平台进行开发。Spark SDK可以帮助企业快速将星火大模型应用到业务场景中，提高效率和竞争力。本文档主要介绍Android平台集成过程。

#2. 兼容性说明

类别	兼容范围
系统	支持armv7和armv8架构，兼容android 5.0及以上版本
开发环境	建议使用Android Studio 进行开发

#3. 授权说明

星火认知大模型授权支持按照tokens授权和设备级授权两种方式。

tokens 授权：授权tokens总量，按照tokens 使用量计费，1 tokens 约等于1.5个中文汉字或者 0.8个英文单词。

设备级授权：授权设备台数和有效期，按照设备指纹计量计费，此方式仅支持定制级客户，如有需要请与开放平台联系。

#4. SDK集成包目录结构

将SDK zip包解压缩，得到如下文件：

├── Demo Spark的使用DEMO，DEMO中已经集成了SDK，您可以参考DEMO，集成SDK。集成前，请先测通DEMO，了解调用原理。
├── ReleaseNotes.txt SDK版本日志
├── SDK Spark SDK
│ └── SparkChain.aar
└── SparkChain LLM Android SDK集成文档.pdf Spark集成指南

#5. 接口调用流程图

#6. SDK工程配置

#6.1 导入SDK库

复制SparkChain.aar到项目的libs目录下，然后在主Module的build.gradle文件中，增加如下配置：

implementation files('libs/SparkChain.aar')

#6.2 配置权限

Spark SDK中使用了如下权限：

权限	使用说明
INTERNET	必须权限，SDK需要访问网络获取结果。
READ_EXTERNAL_STORAGE	必须权限，SDK需要判断日志路径是否存在。
WRITE_EXTERNAL_STORAGE	必须权限，SDK写本地日志需要用到该权限。
MANAGE_EXTERNAL_STORAGE	可选权限，安卓10以上设备用于动态授权弹出授权框需要用到该权限，安卓10以上设备必选。
READ_PHONE_STATE	可选权限，用于获取设备标识。

SDK中已配置如下权限，如部分权限不需要，可通过如下配置去除

<!-- 移除SDK非必须权限示例 -->    
<uses-permission android:name="android.permission.READ_PHONE_STATE" tools:node="remove" />

Android 10.0（API 29）及以上版本需要在application中做如下配置

<application android:requestLegacyExternalStorage="true"/>

#7. 快速集成

#7.1 SDK初始化

*在使用Spark SDK 星火大模型交互功能前，需要首先开通星火大模型授权并获取已开通授权的应用信息***（appId、apiKey、apiSecret）。SDK全局只需要初始化一次。初始化示例如下：

SparkChainConfig config =  SparkChainConfig.builder()
        .appID("$appId")
        .apiKey("$apiKey")
        .apiSecret("$apiSecret");//从平台获取的授权appid，apikey,apisecrety
int ret = SparkChain.getInst().init(getApplicationContext(), config);
Log.d(TAG,"sdk init:"+ret);

初始化参数说明：

参数名	类型	说明	是否必填
appID	String	创建应用后，生成的应用ID	是
apiKey	String	创建应用后，生成的唯一应用标识	是
apiSecret	String	创建应用后，生成的唯一应用秘钥	是
logLevel	int	0：VERBOSE，1：DEBUG，2：INFO，3：WARN，4：ERROR，5：FATAL，100：OFF	否
logPath	String	日志存储路径，设置则会把日志存在该路径下，不设置则会把日志打印在终端上	否
uid	String	用户自定义标识	否

初始化返回值：0：初始化成功，非0：初始化失败，请根据具体返回值参考错误码章节查询原因。

#7.2 配置星火大模型参数

首先需要配置星火大模型的相关参数，示例如下：

LLMConfig llmConfig = LLMConfig.builder();
llmConfig.domain("generalv2");
llmConfig.url("ws(s)://spark-api.xf-yun.com/v2.1/chat");//如果使用generalv2，domain和url都可缺省，SDK默认；如果使用general，url可缺省，SDK会自动补充；如果是其他，则需要设置domain和url。
LLM llm = new LLM(llmConfig);

参数说明：

字段	含义	类型	限制	是否必传
domain	需要使用的领域	String	取值为[general,generalv2]，默认generalv2 general：通用大模型V1.5版本 generalv2：通用大模型V2版本 general和generalv2对应的url不同，需要严格对应。url地址参见下文。	否
url	配置chat服务器域名地址	String	general：ws(s): //spark-api.xf-yun.com/v1.1/chat generalv2：ws(s): //spark-api.xf-yun.com/v2.1/chat generalv3：ws(s): //spark-api.xf-yun.com/v3.1/chat domian 取值为 general或generalv2 时，SDK自动设置url，可缺省。	否
maxToken	回答的tokens的最大长度	int	取值范围1-4096，默认：2048	否
temperature	配置核采样阈值，改变结果的随机程度	float	最小：0, 最大：1，默认：0.5	否
auditing	内容审核的场景策略	String	当前仅支持default	否
topK	配置从k个候选中随机选择⼀个（⾮等概率)	int	取值范围1-6，默认值：4	否
chatID	配置关联会话chat_id标识，需要保障用户下唯一	String		否

#7.3 星火请求调用

当前支持同步调用和异步调用两种方式。用户可以通过run方法或者arun方法向大模型发送问题请求，获取大模型返回结果。run方法、arun方法不支持并发调用。

#7.3.1 同步调用

#7.3.1.1 请求调用

//同步调用
// 第一轮交互，如果不需要交互上下文，均可按照此方式调用
String question1 = "上海有什么景点？";
LLMOutput syncOutput = llm.run(question1);
if(syncOutput.getErrCode() == 0) {
    Log.i(TAG, "同步调用：" +  syncOutput.getRole() + ":" + syncOutput.getContent());
    results = syncOutput.getContent();
}else {
    Log.e(TAG, "同步调用：" +  "errCode" + syncOutput.getErrCode() + " errMsg:" + syncOutput.getErrMsg());
}
 
//第二轮交互 示例带历史上下文的交互
String question2 = "那帮我安排一份旅游计划吧。";
try{
    JSONArray array = new JSONArray();
    JSONObject item_1 = new JSONObject();
    item_1.put("role","user");
    item_1.put("content",question1);
    JSONObject item_2 = new JSONObject();
    item_2.put("role","assistant");
    item_2.put("content",results);
    JSONObject item_3 = new JSONObject();
    item_3.put("role","user");
    item_3.put("content",question2);
    array.put(item_1).put(item_2).put(item_3);
    syncOutput = llm.run(array.toString());
    if(syncOutput.getErrCode() == 0) {
        Log.i(TAG, "同步调用：" +  syncOutput.getRole() + ":" + syncOutput.getContent());
        results = syncOutput.getContent();
    }else {
        Log.e(TAG, "同步调用：" +  "errCode" + syncOutput.getErrCode() + " errMsg:" + syncOutput.getErrMsg());
    }
}catch(Exception e){
    e.printStackTrace();
}

run方法参数说明：

参数名	类型	说明	限制	是否必填
question	String	输入信息文本，包含历史信息	general：4096 tokens generalv2:8192 tokens	是

LLMOutput数据结构说明：

参数	类型	获取方法	说明
errCode	int	getErrCode()	调用结果状态，0：调用成功，非0：调用失败，具体原因请根据返回值参考错误码
errMsg	String	getErrMsg()	调用失败时的错误信息
role	String	getRole()	星火大模型的角色，assistant:：助手，user：用户
content	String	getContent()	调用结果
completionTokens	int	getCompletionTokens()	回答的Token大小
promptTokens	int	getPromptTokens()	包含历史问题的总Tokens大小
totalTokens	int	getTotalTokens()	promptTokens和completionTokens的和，也是本次交互计费的Tokens大小

返回结果参考7.4节响应协议说明。

#7.3.2 异步调用

#7.3.2.1.注册结果监听回调

//异步调用
LLMCallbacks llmCallbacks = new LLMCallbacks() {
    @Override
    public void onLLMResult(LLMResult llmResult, Object usrContext) {
        Log.d(TAG,"异步调用：" +  "onLLMResult:" + " " + llmResult.getRole() + " " + llmResult.getContent());
    }
   
    @Override
    public void onLLMEvent(LLMEvent event, Object usrContext) {
        Log.w(TAG,"onLLMEvent:" + " " + event.getEventID() + " " + event.getEventMsg());
   
    }
   
    @Override
    public void onLLMError(LLMError error, Object usrContext) {
        Log.e(TAG,"onLLMError:" + " " + error.getErrCode() + " " + error.getErrMsg());
    }
};
llm.registerLLMCallbacks(llmCallbacks);

LLMCallbacks数据结构说明：

方法	参数	类型	说明
onLLMResult	result	LLMResult	星火大模型结果实例
usrContext	Object	用户自定义标识
onLLMEvent	event	LLMEvent	调用事件结果实例
usrContext	Object	用户自定义标识
onLLMError	error	LLMError	错误信息结果实例
usrContext	Object	用户自定义标识

LLMResult数据结构说明：

结构类	方法	说明
LLMResult	getRole	星火大模型角色，assistant:：助手，user：用户
getContent	调用结果
getCompletionTokens()	回答的Token大小
getPromptTokens()	包含历史问题的总Tokens大小
getTotalTokens()	promptTokens和completionTokens的和，也是本次交互计费的Tokens大小
getStatus()	返回结果状态，0：start，1：continue，2：end
LLMEvent	getEventID	事件ID，15：建立连接，19：连接断开
getEventMsg	事件信息
LLMError	getErrCode	错误码ID
getErrMsg	错误信息

#7.3.2.2 请求调用

String myContext = "myContext";
//异步调用
// 第一轮交互，如果不需要交互上下文，均可按照此方式调用
String question1 = "上海有什么景点？";
int ret = llm.arun(question1,myContext);
while (!isFinsh){
    try {
        Thread.sleep(100);
    }catch (Exception e){
 
    }
}
Log.d(TAG,"turn1:"+results);
isFinsh = false;
results = "";
//第二轮交互 示例带历史上下文的交互
String question2 = "那帮我安排一份旅游计划吧。";
try{
    JSONArray array = new JSONArray();
    JSONObject item_1 = new JSONObject();
    item_1.put("role","user");
    item_1.put("content",question1);
    JSONObject item_2 = new JSONObject();
    item_2.put("role","assistant");
    item_2.put("content",results);
    JSONObject item_3 = new JSONObject();
    item_3.put("role","user");
    item_3.put("content",question2);
    array.put(item_1).put(item_2).put(item_3);
    ret = llm.arun(array.toString(),myContext);
}catch(Exception e){
    e.printStackTrace();
}
while (!isFinsh){
    try {
        Thread.sleep(100);
    }catch (Exception e){
 
    }
}
Log.d(TAG,"turn2:"+results);

arun方法参数说明：

参数	类型	说明	限制	是否必填
question	String	输入信息文本	general：4096 tokens generalv2：8192 tokens	是
usrTag	Object	用户自定义标识		否

返回结果参考7.4节响应协议说明。

#7.4 响应协议说明

该协议为中间协议，星火大模型是按照此协议格式返回结果。SDK已完成对此协议的解析和封装，获取相应字段方法请查询7.3节LLMOutput和LLMResult的结构说明。

# 接口为流式返回，此示例为最后一次返回结果，开发者需要将接口多次返回的结果进行拼接展示
{
  "header":{
    "code":0,
    "message":"Success",
    "sid":"cht000b2d3c@dx18a980cc0beb894540",
    "status":2
  },
  "payload":{
    "choices":{
      "status":2,
      "seq":9,
      "text":[
        {
          "content":"”",
          "role":"assistant",
          "index":0
        }
      ]
    },
    "usage":{
      "text":{
        "question_tokens":15,
        "prompt_tokens":15,
        "completion_tokens":61,
        "total_tokens":76
      }
    }
  }
}

协议结构说明

字段	含义	类型	说明
header	协议头部	Object	协议头部，用于描述平台特性的参数
payload	响应数据块	Object	数据段，携带响应的数据。

响应参数说明

字段	含义	类型
sid	本次会话的id	String
status	数据状态 0:start，1:continue，2:end	int
seq	数据序号，标明数据为第几块。最小值:0, 最大值:9999999	int
content	文本数据	String
role	星火大模型角色	String
prompt_tokens	包含历史问题的总Tokens大小	int
completion_tokens	回答的Token大小	int
total_tokens	promptTokens和completionTokens的和，也是本次交互计费的Tokens大小	int

#7.5 SDK逆初始化

当SDK需要完整退出时，需调用逆初始化方法释放资源，示例代码如下：

SparkChain.getInst().unInit();

#8. 错误码

错误码包含SDK错误码和云端错误码，SDK错误码用来反馈SDK本地运行时遇到的错误；云端错误码用来反馈星火大模型交互时服务端错误。

#8.1 SDK错误码

错误码	含义	自查指南
0	操作成功
18007	授权应用不匹配（apiKey、apiSecret）	apiKey、apiSecret 配置有误，请核对项目中配置的 apiKey、apiSecret 。
18301	SDK未初始化	在使用大模型前请先初始化 SDK，如果有调用 uninit 方法，再次使用大模型交互时需要重新初始化。
18302	SDK初始化失败	请根据init接口回调中返回的错误码参考此文档做对应检查
18303	SDK 已经初始化	重复初始化导致，使用能力时，SDK 只需要初始化一次，请检查 SDK 初始化逻辑是否存在多次初始化。
18304	不合法参数	请参考demo及集成文档仔细检查所传参数是否正确。
18311	sdk同一能力并发路数超出最大限制
18312	此实例已处在运行态，禁止单实例并发运行
18400	工作目录无写权限	在设置 workDir 时，请确保该工作路径有读写权限。若无法设置读写权限，请修改为有读写权限的工作路径。
18402	文件打开失败	请检查日志中所打印的文件是否存在，以及对应路径下是否有读权限。
18500	未找到该参数 key	请参照demo或集成文档仔细检查参数名拼写
18501	参数范围溢出，不满足约束条件	请根据文档检查调用 SDK 方法时所传参数范围，需要确保所传参数符合协议约束要求
18502	SDK 初始化参数为空	请根据 SDK 集成文档检查 SDK 初始化代码，确保必填参数有值且合法
18503	SDK 初始化参数中 appId 为空	appId 为空值，请在 SDK 初始化时传入正确的 appId 值
18504	SDK 初始化参数中 apiKey为空	apiKey为空值，请在 SDK 初始化时传入正确的 apiKey值
18505	SDK 初始化参数中 apiSecret 为空	apiSecret 为空值，请在 SDK 初始化时传入正确的 apapiSecret 值
18509	必填参数缺失	请参考demo或者文档检查是否漏传必填参数
18700	通用网络错误	请检查网络连接是否正常
18701	网络不通	请检查网络连接是否正常
18702	网关检查不过	检查设备时间是否正确；请检查 SDK 初始化时所传 apiKey、apiScrect 是否正确;
18703	云端响应格式不对	请检查网络是否可以正常访问外网
18705	应用 ApiKey & ApiSecret 校验失败	请检查 apiKey、apiSecret 是否正确
18707	授权已过期	请检查授权期限
18708	无可用授权	没有授权或者授权已满
18712	网络请求 404 错误	请检查网络是否通畅
18713	设备指纹安全等级不匹配	设备指纹安全等级不符合要求
18714	应用信息有误	服务端无法查询到api_key，请检查api_key和api_secret信息是否填写正确
18717	SDK授权不足	授权数量已满
18801	连接建立出错	请检查网络是否通畅
18802	结果等待超时	请检查网络是否通畅
18803	连接状态异常	请检查网络是否通畅
18902	并发超过路数限制	不支持并发
18903	大模型规划步骤为空	请检查请求数据的意图是否明确
18904	插件未找到	请检查是否使用了未存在的插件
18906	与大模型交互次数超限制
18907	运行超限制时长
18908	大模型返回结果格式异常
18951	同一流式大模型会话，禁止并发交互请求
18952	输入文本格式或内容非法

#8.2 服务端错误码

错误码	错误信息
错误码	错误信息
0	成功
10000	升级为ws出现错误
10001	通过ws读取用户的消息出错
10002	通过ws向用户发送消息错
10003	用户的消息格式有错误
10004	用户数据的schema错误
10005	用户参数值有错误
10006	用户并发错误：当前用户已连接，同一用户不能多处同时连接。
10007	用户流量受限：服务正在处理用户当前的问题，需等待处理完成后再发送新的请求。（必须要等大模型完全回复之后，才能发送下一个问题）
10008	服务容量不足，联系工作人员
10009	和引擎建立连接失败
10010	接收引擎数据的错误
10011	发送数据给引擎的错误
10012	引擎内部错误
10013	输入内容审核不通过，涉嫌违规，请重新调整输入内容
10014	输出内容涉及敏感信息，审核不通过，后续结果无法展示给用户
10015	appid在黑名单中
10016	appid授权类的错误。比如：未开通此功能，未开通对应版本，token不足，并发超过授权等等
10017	清除历史失败
10019	表示本次会话内容有涉及违规信息的倾向；建议开发者收到此错误码后给用户一个输入涉及违规的提示
10110	服务忙，请稍后再试
10163	请求引擎的参数异常引擎的schema 检查不通过
10222	引擎网络异常
10907	token数量超过上限。对话历史+问题的字数太多，需要精简输入
11200	授权错误：该appId没有相关功能的授权或者业务量超过限制
11201	授权错误：日流控超限。超过当日最大访问量的限制
11202	授权错误：秒级流控超限。秒级并发超过授权路数限制
11203	授权错误：并发流控超限。并发路数超过授权路数限制

详见服务说明

最后修改时间： 1 年前