服务热线:15895595058
产品展示 Categories
联系我们 contact us
联系人:
陆先生
手机:
15895595058
电话:
0512-58628685
地址:
张家港市南丰镇
行业新闻
当前位置:主页 > 新闻动态 > 行业新闻 >
病毒识别方法-数控滚圆机滚弧机张家港电动液压
添加时间:2019-07-02
  本文由弯管机张家港弯管机价格网站采集转载中国知网整理! http://www.15895595058.net  随着互联网的爆炸式的发展,计算机病毒也是层出不穷,如何快速的对新增病毒进行响应和查杀也是一个较大的挑战[1]。普通的特征检测方法对于新样本的检测存在滞后性,往往无法有效查杀新增样本。通常的机器学习查杀病毒,则存在特征难以提取,训练集样本不均衡的问题。本文中提出一种方法,通过CNN算法和文件图像化表示算法结合进行病毒扫描的方法。本文中发现,通过CNN,可以有效的提取文件图像化后的特征,达到了自动提取特征的目的。修改了CNN中softmax算法,从而解决了样本不均衡问题 本文由弯管机张家港弯管机价格网站采集转载中国知网整理! http://www.15895595058.net 中很多人已经开始了二进制文件转图的工作[3],一般是通过整体文件转化为图片,然后根据家族进行分类。我们这里的方法,是取了文件256个字节的入口点代码作为图片像素。依然可以有效的区分病毒家族。我们举例几种多态变形家族的例子:Parite家族:图1parite家族病毒不同变种的入口点灰色图Fi家族:图2wannacry病毒家族不同变种的入口点灰色图Fig族:图3Virut感染型病毒家族不同变种的入口点灰色图F通过上面的例子可以看出,二进制转出的图,可以肉眼识别出家族关系和不同家族之前的区别。为了发现更多更深层次的特征关联,我们后面使用CNN进行特征提龋3CNN的应用中的挑战应用CNN去识别分类病毒图像的过程中有几个困难的地方,一个是样本数量不均衡[7,8],一个是需要有监督训练。本文提出:a.采取新的损失函数,来解决样本数量不均衡的问题。b.聚类---打标签---分类的思路来解决监督训练样本数量不够的问题。  本文由弯管机张家港弯管机价格网站
采集
转载中国知网整理! http://www.15895595058.net (1)样本数量不均衡:在我们的训练样本中有着样本不均衡的情况,比如,virut、sality病毒的数量就很多每一类都5w+的数量,而btc.xmr类型病毒数量就会少很多,只有大概80多个。病毒识别方法-数控滚圆机滚弧机张家港电动液压滚圆机滚弧机折弯机在多分类问题中,监督训练样本不够我们通过Kmeans算法,在收集到的海量样本中,同样采用图片作为特征进行聚类,聚类后人工审核打标签,然后将打过标签的样本类型加入训练。流程图如下:图4训练流程图F计于应用这个部分我们讨论应用VGG网络来进行我们的病毒图片分类。(1)网络结构VGGNet[9]是牛津大学计算机视觉组公司的研究员一起研发的的深度卷积神经网络,在ILSVRC2014上取得了第二名的成绩,将Top-5错误率降到7.3%。GGNet探索了卷积神经网络的深度与其性能之间的关系,通过反复堆叠33的小型卷积核和22的最大池化层,VGGNet成功地构筑了16~19层深的卷积神经网络。VGGNet相比之前state-of-the-art的网络结构,错误率大幅下降,并取得了ILSVRC2014比赛分类项目的第2名和定位项目的第1名。同时VGGNet的拓展性很强,迁移到其他图片数据上的泛化性非常好。VGGNet的结构非常简洁,整个网络都使用了同样大小的卷积核尺寸(33)和最大池化尺寸(22)。深度学习中最大的问题是过拟合[10],所以我们每层网络中加入dropout,来避免过拟合。每层网络中的病毒识别方法-数控滚圆机滚弧机张家港电动液压滚圆机滚弧机折弯机  本文由弯管机张家港弯管机价格网站
采集
转载中国知网整理! http://www.15895595058.net