天涯法律网

主页 > 天同诉讼圈 > > 正文

开门大吉郭涛:基于后馈神经网络模型的故意杀人案件分析
2019-09-18 04:16:46 天同诉讼圈

摘 要 故意杀人案件是社会危害性非常严重的刑事案件,研究故意杀人案件的显着性影响特征不仅能为相关职能部门提供合理有效的破案依据,而且能有效的预防和制止犯罪行为的发生,从而保障广大人民群众的生命和财产安全。本文通过结合公安领域案件文本数据的特点,将故意杀人案件卷宗进行数据整理、数据预处理,并基于后馈神经网络模型构建了故意杀人案件的犯罪分析模型,对故意杀人案件的显着性影响特征与微观预测进行了理论检验与实证分析。

关键词 故意杀人 人工神经网络模型 数据挖掘算法模型 后馈神经网络模型

基金项目:1. 2019年度南京森林警察学院中央高校基本科研业务费专项资金项目,LGZD201901,基于故意杀人案件的相关特征与影响因素的实证分析;2. 2018年度公安部科技计划项目公安理论及软科学研究计划,2018LLYJSLGA021,“互联网+”时代下公安机关线上群众工作方法研究。

作者简介:邱明月,南京森林警察学院信息技术学院讲师,博士,研究方向:数据挖掘、公安情报学。

中图分类号:D920.5 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?文献标识码:A ? ? ? ? ? ? ? ? ? ? ? ?DOI:10.19387/j.cnki.1009-0592.2019.03.343

一、背景介绍

在“打防结合,重在预防”的公安职能要求下,相较于案件的侦破,对犯罪的预防显得更为重要和珍贵。在公安大数据时代,数据挖掘算法模型被应用到各个方面,如犯罪地点,犯罪时间,以及犯罪类型等。故意杀人罪作为中国刑法中少数性质罪恶劣的犯罪行为之一,具有主观的,恶性大的,社会危害性严重的暴力犯罪行为等特点。为了维护社会的稳定,保障广大人民群众的生命和财产安全,必须分析研究故意杀人案件的显着特征,从根源上预防与减少故意杀人案件的发案率,以稳定社会秩序。目前,基于故意杀人案件的相关研究方向大体为司法方面的研究,基于数据挖掘的故意杀人案件的微观犯罪预测分析研究很少,本文基于数据挖掘算法对故意杀人案件的显着特征与微观犯罪预测进行分析预测。

人工神经网络模型作为数据挖掘算法中的重要算法模型,通过模拟人类大脑的神经构造而创建,正在被各行各业广泛应用。传统的预测模型基本基于专业经验建立的经验模型,而神经网络等人工智能模型具有自我学习的能力,能够根据大量的样本数据来构建出最适合的模型。所以,本研究选用具有大数据处理能力的、并且能够进行自我学习的人工神经网络等数据挖掘预测模型。在目前关于犯罪预测的数理统计研究方法中,回归分析、灰色系统理论预测法和最优组合预测法等已被学者大量研究应用。本项目通过引用人工神经网络等数据挖掘模型,对故意杀人案件进行分析与预测,来为犯罪预测领域提供新的研究思路与参考。

二、数据预处理

(一)数据来源

本文通过收集江苏省近年发生的38例已破故意杀人案,对故意杀人案件的相关特征与影响因素进行分析。其中,每例卷宗资料包括现场勘验照片、笔录、尸体检验照片、鉴定意见书、侦查终结报告及其他相关检验结果和鉴定意见等。通过搜集每例案件中的接报案情况、犯罪嫌疑人询问笔录、证人询问笔录、法律文书、犯罪现场照片以及尸检照片等案件材料对原始信息进行数据收集。

(二)数据预处理

为了后续对故意杀人案件中的相关特征与影响因素进行有效分析,需要将收集到的原始数据进行数据预处理。本文选取了卷宗中涉及到的46个嫌疑人信息以及38个被害人信息作为基本变量。其中嫌疑人信息包含基本信息、家庭信息、过往信息、犯罪时间、犯罪行为和作案目的。被害人信息包括基本信息、与嫌疑人关系、死亡原因。

三、模型应用

IBM SPSS Modeler包含了很多强大而稳健的数据挖掘分析模型,所以本文选用此软件用来分析故意杀人案件的相关特征与影响因素。根据数据预处理结果,将嫌疑人与被害人的所有变量作为输入变量,是否杀人作为输出变量来筛选与预测故意杀人案件的影响因素。

(一)变量重要性分析

由于输入变量与输出变量均为分类型变量,所以本文采用卡方检验来分析所有输入变量对是否杀人这一输出变量的重要性的排序。本文采用似然比(Likelihood Ratio)卡方,其数学定义为:

其中,f o为观察频数,f e为期望评书。计算得出的似然比卡方的观测值和对应的1-概率P值。当1-概率P值越高,表示输入变量与输出变量之间的相关性越强,输入变量对于输出变量的分析越重要。由表1可知,1-概率P值高于0.9的输入变量有犯罪嫌疑人人数、是否与被害人有关系、有无工作、犯罪时间(日)、是否抽烟。具体每个变量的重要性可以参见表1。当1-概率P值低于0.5时,说明输入变量对于输出变量的重要性很小,这些输入变量不在表1中显示且不进入下一步的模型分析。

(二)后馈神经网络模型

1.模型介绍

如图1所示,本文中的人工神经网络模型分为三层结构,包括:输入层,隐藏层和输出层。本文通过经典的BP(Back Propagation)神经网络算法,即误差反向传播算法的学习过程,建立基于BP的人工神经网络模型来预测故意杀人案件嫌疑人是否杀人。

2.模型的仿真实验结果

神经网络模型参数设定如下:隐藏层的神经元个数为7,最长训练时间为10分钟,学习率为0.1,输入层传递函数为S型正切函数(tansig),隐藏层传递函数为阈值函数(hardlim)。由预测结果可知,基于BP的人工神经网络模型来预测故意杀人案件嫌疑人是否杀人的准确率为94.1%。虽然仿真效果很好,但不排除过度拟合、验证数据量不大等问题。

为了进一步验证,本文采集了15位普通人员的各项指标数据,包括性别、有无婚史、有无子女、有无前科、有无工作、年龄、户籍、民族、文化程度、现住地、是否服兵役、是否赌博、是否拥有代步工具、是否单亲和是否杀人。将上述所有嫌疑人数据与15条新加入数据作为样本,运用基于BP的人工神经网络模型来预测人员犯故意杀人案的概率。仿真结果表明,预测概率高达95.1%,部分预测结果见表2所示,且置信度越高表明预测结果越可靠。

四、结语

本文通过汇总整理故意杀人案件的资料,具体分析故意杀人案件的相关特征以及影响因素。通过数据预处理,将影响杀人的影响因素重要性进行排序。通过影响因素重要性的有效筛选,本文运用后馈神经网络模型对故意杀人案件中嫌疑人是否杀人进行有效预测。为了进一步验证,本文通过加入新数据来预测人员犯故意杀人案的概率,仿真实验结果表明预测概率高达95.1%且结果可信,为故意杀人犯罪预测领域提供新的参考。

参考文献:

[1]李新光. 基于智能优化算法的犯罪预测方法研究.安徽工业大学.2018.

[2]王彬.杀人案件侦查中的大数据运用研究.广西警察学院学报.2017,30(6):26-33.

[3]王彬,刘凤珠.系列杀人案件侦查之大数据方法与运用研究.湖北警官学院学报.2017,30(6):48-56.

[4]于红志,刘凤鑫,邹开其.改进的模糊BP神经网络及在犯罪预测中的应用.辽宁工程技术大学学报(自然科学版).2012,31(2):244-247.

天涯法律网 709彩票开元棋牌 尚格法律人 刑事法律圈 学法网 司考411 景来律师 天同诉讼圈 法信

法律讲堂,尚格法律人,刑事法律圈,学法网,司考411,景来律师,天同诉讼圈,法信