闲聊SDK语料获取方法
关于闲聊语料,网上有许多。如chinese_corpus
关于闲聊api,网上有图灵机器人,腾讯智能闲聊,青云客机器人。
以腾讯智能闲聊为例,可以搜索智能闲聊。找到腾讯的网页点进去,用QQ账号登录。然后创建应用,接入智能闲聊,记下APPKEY和APPID
然后复制以下代码(APPKEY和APPID替换成你自己的)
import requests as rq
import time
import random
import string
import urllib
import hashlib
APPKEY = 'xxxxxxxxxxx'
APPID = 123456789
def get_sign(data):
lst = [i[0]+'='+urllib.parse.quote_plus(str(i[1])) for i in data.items()]
params = '&'.join(sorted(lst))
s = params + '&app_key=' + APPKEY
h = hashlib.md5(s.encode('utf8'))
return h.hexdigest().upper()
def chat(question):
url_chat = 'https://api.ai.qq.com/fcgi-bin/nlp/nlp_textchat'
nonce_str = ''.join(random.sample(string.ascii_letters + string.digits, 16))
data = {
'app_id': APPID,
'time_stamp': int(time.time()),
'nonce_str': nonce_str,
'session': '10000',
'question': question,
}
data['sign'] = get_sign(data)
r = rq.post(url_chat, data=data)
answer = r.json()['data']['answer']
return answer
while True:
i = input()
a = chat(i)
print(a)
然后与机器人闲聊,将机器人对话记录写为数据集进行训练