基于电影知识图谱的智能问答系统系列章节传送门:
基于电影知识图谱的智能问答系统(一) — Mysql数据准备
基于电影知识图谱的智能问答系统(二) — Neo4j导入CSV文件
基于电影知识图谱的智能问答系统(三) — Spark环境搭建
基于电影知识图谱的智能问答系统(四) — HanLP分词器
基于电影知识图谱的智能问答系统(五) — Spark朴素贝叶斯分类器
基于电影知识图谱的智能问答系统(六) — 问题训练样本集敲定
基于电影知识图谱的智能问答系统(七) — Neo4j语句那点事
番外篇(2022年11月15日16:45:35)
=========================================================================
如果docker官方的镜像中心无法访问(国外的需要墙)下载不了image,可以参考以下的操作来解决:
1、找到“daemon.json”文件;
2、使用vim命令将其打开;
3、添加“{ “registry-mirrors” :[“https://docker.mirrors.ustc.edu.cn”]}”内容;
4、重启docker即可。
=========================================================================
定制了2个docker镜像,分别是带数据的neo4j数据库镜像和带hanlp字典数据及训练样本数据和应用程序的tomcat镜像,如下:
镜像地址:
Docker Hub
https://hub.docker.com/r/appleyk/neo4j-movies
镜像地址:
Docker Hub
https://hub.docker.com/r/appleyk/tomcat8-movies
其中tomcat镜像由于带有hanlp数据部分,所以镜像本身有点大,如果你的docker没有配置镜像加速代理服务的话拉取会很慢,所以在我的阿里云镜像仓库中也推送了一份如下:
阿里云镜像地址:registry.cn-hangzhou.aliyuncs.com/appleyk/tomcat8-movies
拉取方式:
docker pull registry.cn-hangzhou.aliyuncs.com/appleyk/tomcat8-movies:v1.0
使用docker启动neo4j容器效果如下(无需考虑版本和数据导入,只需按配置来即可):
使用docker启动tomcat容器效果如下(无需考虑hanlp数据和训练样本,只需按配置来即可):
GitHub地址:GitHub – kobeyk/Spring-Boot-Neo4j-Movies: SpringBoot集成Neo4j图数据库,利用Spark的朴素贝叶斯分类器实现基于电影知识图谱的智能问答系统。
码云(gitee)地址:Spring-Boot-Neo4j-Movies: SpringBoot集成Neo4j图数据库,利用Spark的朴素贝叶斯分类器实现基于电影知识图谱的智能问答系统。
注意最新代码为分支:v0.1.2
注:本篇不再过多的讲解如何demo实现了,集成也很是简单的,前面几章也已经给本篇做足了铺垫。项目中的代码注释也是非常的详细,最后会附上整个项目的git仓库地址。
一、效果预览
(1)电影简介
前端展示:
后台效果:
(2)电影评分
前端展示:
后台效果:
(3)电影演员列表
前端展示:
后台效果:
(4)演员A和演员B合作过哪些电影
前端展示:
后端效果:
由于章子怡本来是一个完整的人名,但是HanLP分词的时候,却意外的“失手”了,因此导致最后查询无果
我们再换个问题试验一把
后台效果:
(5)某演员出演过那种类型的电影或演过某种类型的电影有哪些
……etc,其余不在做演示,下面直接来看如何利用Spring-Boot搭建我们的智能问答系统
二、项目目录结构图
三、Movie节点类
这里只拿电影信息的节点类来进行演示,比如,movie对应的节点在Java中定义类如下:
package com.appleyk.node;
import java.util.List;
import org.neo4j.ogm.annotation.NodeEntity;
import org.neo4j.ogm.annotation.Relationship;
import com.fasterxml.jackson.annotation.JsonProperty;
@NodeEntity
public class Movie extends BaseEntity{
private Long mid;
private Double rating;
private String releasedate;
private String title;
private String introduction;
@Relationship(type = "is")
@JsonProperty("电影类型")
private List<Genre> genres;
public Movie() {
}
public Long getMid() {
return mid;
}
public void setMid(Long mid) {
this.mid = mid;
}
public Double getRating() {
return rating;
}
public void setRating(Double rating) {
this.rating = rating;
}
public String getReleasedate() {
return releasedate;
}
public void setReleasedate(String releasedate) {
this.releasedate = releasedate;
}
public String getTitle() {
return title;
}
public void setTitle(String title) {
this.title = title;
}
public String getIntroduction() {
return introduction;
}
public void setIntroduction(String introduction) {
this.introduction = introduction;
}
public List<Genre> getGenres() {
return genres;
}
public void setGenres(List<Genre> genres) {
this.genres = genres;
}
}
其中属性和neo4j中的movie节点的属性一一对应
电影信息节点里面带有关系is,对应neo4j中该电影的类型
通过Controller对外提供的查询接口如下:
外部调用效果如下:
四、加载自定义带词性的字典数据
注:不要使用HanLP提供的自定义词典路径,因为这个除了不能随心所欲的定义分词的词性以外,还极容易出现分词紊乱,词性对不上的bug,为了满足我们对专有电影名、电影分数及电影类型词性的定义,我们使用额外加载的方式设置HanLP的自定义分词,application.properties中设置自定义词典的路径如下:
这三个文件的下载地址:自定义词典.zip_免费高速下载|百度网盘-分享无限制
注:也可以根据自己的需求进行设置
五、项目完整地址
GitHub下载地址:Spring-Boot集成Neo4j并利用Spark的朴素贝叶斯分类器实现基于电影知识图谱的智能问答系统
完结!!!
番外篇:如何将项目导入到IDEA并运行测试效果?
(1)IDEA项目结构图(导入pom文件,配置好Maven后如下)
(2)项目配置文件
(3)内嵌html测试前端访问页面
(4)启动项目
(5)浏览器访问主页Index.html