从0到1搭建一个简易的在线客服问答系统(附源码)

前言

首先我们先了解下这个概念,什么叫做问答系统(Question Answering System,简称 QA 系统)? 其实问答系统是一个比较常见的系统,在医疗系统/电商系统/零售业等等行业中都比较常见。通熟点它就是一个话术,这些话术包含了诸多的问题和一系列的答案。比较官方的定义为:是一种高级行式的信息检索系统,它能够十分准确的,并使用较简洁的语言去回答用户所提出的问题。

正文

通过上面的讲解,我相信大家对问答系统有了一定的了解了,那么现在我们就开始从0到1的一个项目实战吧!!!

数据集

这里我们准备了一些数据集,从这些数据集可以看出来,这些数据集是一个key-value形式。当然,我们也可以用其他的数据集,这个自行替换就行。

        "课程是线上课程还是线下课程?": "线上课程为主","课程有助教吗?": "为提高服务效率和质量,课程都配备专业的全职助教。","我没有基础应该从哪个课开始学?": "老师的Python基础集训营非常适合你哦,"
                           "可以在这里学习:http://csdn.com","学习周期是多久?": "如果你没有基础的话两个月可以搞定","课程的学习方式是什么呢?": "无需安装环境,在线直接写代码、看视频、看漫画,趣味性学习","课程的优势是什么呢?": "全网覆盖最全的Python基础知识体系练与学的深度结合,"
                            "每一个知识点都配有练习项目,生动有趣、授课方式多样,视频、文字、图片、在线代码编辑,"
                            "在聊天与娱乐中学习","课程的有效期是多久呢?": "我们把有效期确定为1年,1年内可无限次学习","课程有优惠吗?": "我们定价为开课后是599,现在是针对老学员预售199,开课后恢复原价"

开发环境

这个项目使用的开发语言是Python,以及Flask web框架,使用的开发工具Idea是Pycharm(个人习惯)。因此要搭建此项目请先自己安装好Python以及Flask依赖。

后端项目源码

a) 创建一个问答系统类

        askSystem类包含了字典处理以及余弦相似度计算等方法。

import numpy as np  # 用于 数组转换
import jieba  # 用于中文分词
from sklearn.metrics.pairwise import cosine_similarity   # 机器学习库,这里用于余弦相似度计算
from flask import Flask  # Web 应用框架

class askSystem():
    def __init__(self,corpus):
        self.corpus = corpus

    # 建立词典
    def creat_dic(self):
        all_question = ""
        for question in self.corpus:
            all_question += question
        word_from_question = list(jieba.cut(all_question))
        dictionaries = word_from_question
        print(dictionaries)
        return dictionaries

    # 问题转换为向量
    def transform_vector(self,date,dictionaries):
        vector_list = []
        for wd in dictionaries:
            if wd in list(jieba.cut(date)):
                vector_list.append(1)
            else:
                vector_list.append(0)
        return np.array(vector_list).reshape(1,-1)

    # 余弦相似度计算
    def cosine_simi(self,date1,date2,dictionaries):
        similar_list = cosine_similarity(self.transform_vector(date1,dictionaries),self.transform_vector(date2,dictionaries))
        similar_num = similar_list[0][0]  #相似度
        return similar_num

    def question_for_web(self,user_question,dictionaries):
        question_dict = {}
        similar_list = []
        for key in self.corpus:
            similar_num = self.cosine_simi(user_question,key,dictionaries)
            similar_list.append(similar_num)
            question_dict[similar_num] = self.corpus[key]  # 相似度若相等,因为字典key值不能重复,会导致匹配答案不准确
        if max(similar_list) == 0:
            answer = "这就问题我再想想!"
        else:
            answer = question_dict[max(similar_list)]
        return answer

b) 创建Flask web系统启动类

        启动类包含了web接口,并定义了web系统的端口(port为5000,host为0.0.0.0表示任意主机可访问)等信息,除此之外还有跨域的问题。

from flask import Flask
from flask_cors import CORS
import askSystem
app = Flask(__name__)
CORS(app)  # 解决跨域问题


@app.route('/')
def hello_world():
    return 'Hello World!'


@app.route("/question/<user_question>")
def question_for_web(user_question):
    corpus = {
        "课程是线上课程还是线下课程?": "线上课程为主","我没有基础应该从哪个课开始学?": "老师的Python基础集训营非常适合你哦,"
                           "可以在这里学习:http://csdn.com/","课程有优惠吗?": "我们定价为开课后是599,现在是针对老学员预售199,开课后恢复原价"
    }
    askSys = askSystem.askSystem(corpus)
    answer = askSys.question_for_web(user_question,askSys.creat_dic())
    return answer


if __name__ == '__main__':
    app.run(host='0.0.0.0',port=5000)

前端页面展示

        我们可以自己写一个前端,这个很简单,用Vue去写即可,实在不会,就用vue-template,自己修修改改即可,现在我们来看下效果吧。

 总结

一个简易的问答系统就这样完成了,当然,这个项目还可以进一步完善,比如 将数据存入Elasticsearch,通过它先进行初步的检索,然后再通过这个系统,当然我们也可以用其他的架构实现。如果你对这系统还有其他的疑问,也可以再下面进行留言!!!

原文地址:https://blog.csdn.net/qq_33011831

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


Jinja2:是Python的Web项目中被广泛应用的模板引擎,是由Python实现的模板语言,Jinja2 的作者也是 Flask 的作者。他的设计思想来源于Django的模板引擎,并扩展了其语法和一系列强大的功能,其是Flask内置的模板语言。
Fullcalendar日历使用,包括视图选择、事件插入、编辑事件、事件状态更改、事件添加和删除、事件拖动调整,自定义头部,加入el-popover显示图片、图片预览、添加附件链接等,支持手机显示。
监听QQ消息并不需要我们写代码,因为市面上已经有很多开源QQ机器人框架,在这里我们使用go-cqhttp官方文档:go-cqhttp如果您感兴趣的话,可以阅读一下官方文档,如果不想看,直接看我的文章即可。
【Flask框架】—— 视图和URL总结
python+web+flask轻量级框架的实战小项目。登录功能,后续功能可自行丰富。
有了这个就可以配置可信IP,关键是不需要企业认证,个人信息就可以做。
本专栏是对Flask官方文档中个人博客搭建进行的归纳总结,与官方文档结合事半功倍。 本人经验,学习一门语言或框架时,请首先阅读官方文档。学习完毕后,再看其他相关文章(如本系列文章),才是正确的学习道路。
本专栏是对Flask官方文档中个人博客搭建进行的归纳总结,与官方文档结合事半功倍。基础薄弱的同学请戳Flask官方文档教程 本人经验,学习一门语言或框架时,请首先阅读官方文档。学习完毕后,再看其他相关文章(如本系列文章),才是正确的学习道路。 如果python都完全不熟悉,一定不要着急学习框架,请首先学习python官方文档,一步一个脚印。要不然从入门到放弃是大概率事件。 Python 官方文档教程
快到年末了 相信大家都在忙着处理年末数据 刚好有一个是对超市的商品库存进行分析的学员案例 真的非常简单~
一个简易的问答系统就这样完成了,当然,这个项目还可以进一步完善,比如 将数据存入Elasticsearch,通过它先进行初步的检索,然后再通过这个系统,当然我们也可以用其他的架构实现。如果你对这系统还有其他的疑问,也可以再下面进行留言!!!
#模版继承和页面之间的调用@app.route(&quot;/bl&quot;)def bl(): return render_template(&quot;file_2.html&quot;)主ht
#form表达提交@app.route(&quot;/data&quot;,methods=[&#39;GET&#39;,&#39;POST&#39;]) #methods 让当前路由支持GET 和
#form表达提交@app.route(&quot;/data&quot;,methods=[&#39;GET&#39;,&#39;POST&#39;]) #methods 让当前路由支持GET 和
#session 使用app.secret_key = &quot;dsada12212132dsad1232113&quot;app.config[&#39;PERMANENT_SESSION_LI
#文件上传@app.route(&quot;/file&quot;,methods=[&#39;GET&#39;,&#39;POST&#39;])def file(): if request.meth
#跳转操作:redirect@app.route(&quot;/red&quot;)def red(): return redirect(&quot;/login&quot;)
#session 使用app.secret_key = &quot;dsada12212132dsad1232113&quot;app.config[&#39;PERMANENT_SESSION_LI
@app.route(&quot;/req&quot;,methods=[&#39;GET&#39;,&#39;POST&#39;])def req(): print(request.headers)
#模版继承和页面之间的调用@app.route(&quot;/bl&quot;)def bl(): return render_template(&quot;file_2.html&quot;)主ht
#文件操作:send_file,支持图片 视频 mp3 文本等@app.route(&quot;/img&quot;)def img(): return send_file(&quot;1.jpg&q