本课题来源于丹东一家的电子商务系统。该公司是一家从事服装、饰品等商品邮购的公司,由于该公司业务的不断扩大,各方面数据的不断增长,原来的系统已经不能满足业务的需要,要求重做该系统。通过我的研究,使企业采取更广泛、更全面的视角,对更长时间内的与商品相关的数据进行有效地组织,从而使得决策者更加深人的了解情况,掌握有价值的信息,对现有的和新产品进行市场细分,并进行销售预测;有利于加强对工艺刚和销售商工想信息的利用。通过我的研究得出的数据挖掘的信息帮助企业发现新的市场机会,对当前快速变化的市场环境做出迅速判断和响应,并利用其中的商业机会,从而帮助决策者提高决策水平,扩大利润。
1.研究内容
本课题主要是围绕商品的管理工作,包括销售管理、库存管理等;在课题研究部分主要研究的是对商品有关数据的数据挖掘技术的应用。
由于此公司在销售模式上的一些特殊性,决定从以下一些方面进行分析和研究,以实现在商品管理部分的功能:(1)对库存商品种类和数量进行分析,找出商品销售规律,从而更好的协调进货。
(2)对已销售商品多维分析:发现商品的颜色、价格、尺码等属性,对商品销售的影响,给进货提供相应数据基础。(3)分析已销售商品,发现关联性,指导在产品目录设计、网站结构设计。(4)对积压/退货商品进行分析,找出积压/退货的原因。(5)对历年同一季别商品的销售数据进行分析,帮助决定该年度类似产品的进货数量。(6)对销售模式进行分析,找出适合的一种或几种销售模式,从而更好的打开销路。
2.研究方案
2.1实现该电子商务系统
(1)构件系统平台:拟采用J2EE平台,spring是一个轻量级的J2EE应用程序框架,实现了IoC模式。它是为了解决企业应用程序开发复杂性而创建的。其优势是:具有良好的设计和分层架构,软件开发人员可以只选择Spring提供的某项技术;它还提供了与其他开源软件的无缝结合,为J2EE应用程序开发提供了继承的框架。
(1) 后台数据库搭建:拟采用SQLSever2000数据库系统。
SQLSever2000数据库管理系统具有很强大的数据管理功能,还提供了很好的数据挖掘方面的功能,支持OLAP,支持分布式数应用。
(2) 编程语言。
2.2建立系统的数据挖掘应用模型
拟采用数据挖掘技术结合数据仓库和联机分析处理技术来构建模型,实现决策支持系统。数据仓库的住的根本目的在于决策的支持。高层的企业决策者、中层的管理者和基层的业务处理者等不同层次的管理人员均可以利用数据仓库进行决策分析,提高管理决策的质量。企业管理人员可以利用数据仓库进行各种管理决策的分析,利用自己所特有的、敏锐的商业洞察力和业务知识从貌似平淡的数据发现众多的商机。数据仓库为管理者利用数据进行管理决策分析挺了极大的便利。
可行性分析:联机分析处理(OLAP)和数据挖掘(DataMining)都是可以做为数据仓库上的数据分析工具,但如果能够使这两类技术一定程度上融合,就会使得分析操作智能化,挖掘操作目标化,从而全面提升商务智能技术的实用价值。具体特性如下:a.联机分析技术可以为数据挖掘提供预期的挖掘对象和目标,避免挖掘的盲目性。b.数据挖掘技术可以使联机分析处理智能化,减少分析人员手工操作的繁杂性,减轻分析人员的负担。
2.3选取的数据挖掘的算法和方法
(1)遗传算法
遗传算法是模拟生物在自然环境中的遗传和进化过程而形成的一种自适应全局优化概率搜索算法。它早由美国密执安大学的Holland教授提出,具有计算简单、优化效果好的特点,它在处理组合优化问题方面也有一定的优势,可用于聚类分析等。
(2) 决策树方法
决策树方法就是利用训练集生成一个测试函数,根据不同取值建立树的分支;在每个分支子集中重复建立下层结点和分支。这样便生成一棵决策树,对决策树进行剪枝处理,后把决策树转化为规则,决策树方法主要用于分类挖掘。
(3) 粗糙集方法
粗糙集理论是波兰PawlakZ教授在提出的一种智能决策分析工具,它是一种刻划不完整性和不确定性的数学工具,它能有效地分析不、不一致、不完整等各种不完备的信息。粗糙集方法被广泛应用干不精 确、不确定、不完全的信息的分类和知识获取。
(4) 神经网络方法
它模拟人脑神经元结构,以MP模型和Hebb规则为基础,建立了三大类多种神经网络模型。a.前馈式网络它以感知机、反向传播模型、函数网络为代表,可用于预测、模式识别等方面。b.反馈式网络它以Hopfield的离散模型和连续模型为代表,分别用于联想和优化计算。c.自组织网络它以ART模型、Koholon模型为代表,用于聚类。