短文本相似度
百度 官方文档
短文本相似度计算服务能够提供不同短文本之间相似度的计算,输出的相似度是一个介于0到1之间的实数值,越大则相似度越高。相似度数值建议在一组数据中进行整体比对选用,输出数值越大,则代表语义相似程度相对越高
基本说明:
接口地址:https://aip.baidubce.com/rpc/2.0/nlp/v2/simnet
返回格式:json
请求方式:post
请求示例:https://aip.baidubce.com/rpc/2.0/nlp/v2/simnet?charset=UTF-8&access_token=test
请求参数说明:
名称 类型 必填 说明
text_1 string 必填 待比较文本1(GBK编码),最大512字节
text_2 string 必填 待比较文本2(GBK编码),最大512字节
model string 选填 默认为"BOW",可选"BOW"、"CNN"与"GRNN"
返回参数说明:
名称 类型 说明
log_id uint64 随机数,请求唯一标识码
score float 相似度结果取值(0,1],分数越高说明相似度越高
JSON返回示例:
{
	"log_id": 12345,
	"texts": {
		"text_1": "浙富股份",
		"text_2": "万事通自考网"
	},
	"score": 0.3300237655639648
}
服务级错误码参照
错误码 说明
1 服务器内部错误,请再次请求,如果持续出现此类错误,请通过QQ群(224994340)或工单联系技术支持团队
2 服务暂不可用,请再次请求,如果持续出现此类错误,请通过QQ群(224994340)或工单联系技术支持团队
3 调用的API不存在,请检查后重新尝试
4 集群超限额
6 无权限访问该用户数据
17 每天请求量超限额
18 QPS超限额
19 请求总量超限额
100 包含了无效或错误参数,请检查代码
110 Access Token失效
111 Access token过期
282000 服务器内部错误,请再次请求, 如果持续出现此类错误,请通过QQ群(632426386)或工单联系技术支持团队。
282002 编码错误,请使用GBK编码
282004 请求中包含非法参数,请检查后重新尝试
282008 仅支持GBK和UTF-8,其余为不支持的字符编码,请检查后重新尝试
282130 当前查询无结果返回,出现此问题的原因一般为:参数配置存在问题,请检查后重新尝试
282131 输入长度超限,请查看文档说明
282133 接口参数缺失
282134 输入为空
282300 word不在算法词典中
282301 word_1提交的词汇暂未收录,无法比对相似度
282302 word_2提交的词汇暂未收录,无法比对相似度
282303 word_1和word_2暂未收录,无法比对相似度
完整教学代码示例
小F正在拼命添加中...