数据挖掘实验报告

时间:2021-10-10 10:51:10 浏览量:

大数据理论与技术读书报告

—-- — -K 最近邻分类算法 指导老师 :

陈 莉

学生姓名

:

李阳帆

学 学

号 号

201531 46 7

专 专

业 :

计算机技术

20 16年 8月 月 31 日

摘 摘

数据挖掘就是机器学习领域内广泛研究得知识领域,就是将人工智能技术与数据库技术紧密结合, 让计算机帮助人 们从庞大得数据中智能地、自动地提取出有价值得知识模式,以满足人们不同应用得需要。

K K 近邻算法(KNN )就是基于统计得分类方法,就是大数据理论与分析得分类算法中比较常用得一种方法。该算法具有直观、无需先验统计知识、无师学习等特点,目前已经成为数据挖掘技术得理论与应用研究方法之一。本文主要研究了 K K

近邻分类算法, 首先简要地介了 绍了数据挖掘中得各种分类算法,详细地阐述了 K 近邻算法得基本在 原理与应用领域,最后在 mat lab 环境里仿真实现,并对实验结果进行分析,提出了改进得方法。

关键词:K

近邻,聚类算法,权重, 复杂度,准确度

1、、引言 ......................................................................................0 2、、义 研究目得与意义误错ﻩ 错误! 未定义书签。

3、、算法想 思想误错ﻩ 错误! 未定义书签。

4、、现 算法实现 1ﻩ4、1

置 参数设置误错ﻩ 错误! 未定义书签。

4、2 集 数据集 1ﻩ4骤 、3实验步骤误错ﻩ 错误! 未定义书签。

4 、4 析 实验结果与分析误错ﻩ 错误! 未定义书签。

5、、思 总结与反思误错ﻩ 错误! 未定义书签。

附件1 1误错ﻩ 错误! 未定义书签。

1、、引言 随着数据库技术得飞速发展,人工智能领域得一个分支—— 机器学习得研究自 20 世纪 50 年代开始以来也取得了很大进展。用数据库管理系统来存储数据,用机器学习得方法来分析数据,挖掘大量数据背后得知识,这两者得结合促成了数据库中得知识发现(Knowledge Discovery in Databases,简记 KDD)得产生,也称作数据挖掘(Data Ming,简记 DM)。

数据挖掘就是信息技术自然演化得结果。信息技术得发展大致可以描述为如下得过程:初期得就是简单得数据收集与数据库得构造;后来发展到对数据得管理,包括:数据存储、检索以及数据库事务处理;再后来发展到对数据得分析与理解, 这时候出现了数据仓库技术与数据挖掘技术。数据挖掘就是涉及数据库与人工智能等学科得一门当前相当活跃得研究领域。

数据挖掘就是机器学习领域内广泛研究得知识领域,就是将人工智能技术与数据库技术紧密结合,让计算机帮助人们从庞大得数据中智能地、自动地抽取出有价值得知识模式,以满足人们不同应用得需要[1].目前,数据挖掘已经成为一个具有迫切实现需要得很有前途得热点研究课题。

2、、研究目得与意义 近邻方法就是在一组历史数据记录中寻找一个或者若干个与当前记录最相似得历史纪录得已知特征值来预测当前记录得未知或遗失特征值[14]。近邻方法就是数据挖掘分类算法中比较常用得一种方法。K 近邻算法(简称 KNN)就是基于统计得分类方法[15]。KNN 分类算法根据待识样本在特征空间中 K 个最近邻样本中得多数样本得类别来进行分类,因此具有直观、无需先验统计知识、无师学习等特点,从而成为非参数分类得一种重要方法。

大多数分类方法就是基于向量空间模型得。当前在分类方法中,对任意两个向量:

x=与存在 3 种最通用得距离度量:欧氏距离、余弦距离[16]与内积[17]。有两种常用得分类策略:一种就是计算待分类向量到所有训练集中得向量间得距离:如 K 近邻选择 K 个距离最小得向量然后进行综合,以决定其类别。另一种就是用训练集中得向量构成类别向量,仅计算待分类向量到所有类别向量得距离,选择一个距离最小得类别向量决定类别得归属。很明显,距离计算在分类中起关键作用。由于以上 3 种距离度量不涉及向量得特征之间得关系,这使得距离得计算不精确,从而影响分类得效果。

3、、算法 思想 K 最近邻(K-Nearest Neighbor,KNN)算法,就是著名得模式识别统计学方法,

在机器学习分类算法中占有相当大得地位.它就是一个理论上比较成熟得方法。既就是最简单得机器学习算法之一,也就是基于实例得学习方法中最基本得,又就是最好得文本分类算法之一.其基本思想就是:假设每一个类包含多个样本数据,而且每个数据都有一个唯一得类标记表示这些样本就是属于哪一个分类, KNN就就是计算每个样本数据到待分类数据得距离,如果一个样本在特征空间中得 k 个最相似(即特征空间中最邻近)得样本中得大多数属于某一个类别,则该样本也属于这个类别。该方法在定类决策上只依据最邻近得一个或者几个样本得类别来决定待分样本所属得类别.K—最临近分类方法存放所有得训练样本,在接受待分类得新样本之前不需构造模型,并且直到新得(未标记得)样本需要分类时才建立分类.K-最临近分类基于类比学习,其训练样本由N维数值属性描述,每个样本代表 N 维空间得一个点。这样,所有训练样本都存放在 N维模式空间中.给定一个未知样本,k—最临近分类法搜索模式空间,找出最接近未知样本得K 个训练样本。这 K 个训练样本就是未知样本得 K 个“近邻”.“临近性”又称为相异度(Dissimilarity),由欧几里德距离定义,其中两个点 X(x 1 ,x 2 ,„x n )与 Y(y 1 ,y 2 ,„yn )得欧几里德距离就是:

未知样本被分配到K个最临近者中最公共得类.在最简单得情况下,也就就是当K=1时,未知样本被指定到模式空间中与之最临近得训练样本得类.4、、算法实现 4、、1 1 参数设置 K 值得设定 K 值设置过小会降低分类精度;若设置过大,且测试样本属于训练集中包含数据较少得类,则会增加噪声,降低分类效果。通常,K值得设定采用交叉检验得方式(以 K=1为基准), 通过查找相关资料,K一般低于训练样本数得平方根,本实验中得训练样本数为 100个,因此选取 k=7。

4 、2 数据集 本文得实验数据采用软木塞得数据集,软木塞得样本可分为三类,分别用1,2,3代表,共 150 个样本,我们选取其中得 100 个样本为训练集,其余得 50 个样本为测试集。每个样本均包含10 维特征,由于用 10 维特征计算量太大,本实验得目得主要就是明白 K-最近邻算法得思想,重点不在计算,因此我们选取其中得两个属性作为

本实验得数据,实验数据得部分截图如图 1 所示。

图 1、部分实验数据

4 、3 实验步骤 第一步,初始化距离为最大值。

第二步,计算未知样本与每个训练样本得距离 dist。

第三步,得到目前 K 个最临近样本中得最大距离 maxdist。

第四步,如果dist小于 maxdist,则将该训练样本作为 K-最近邻样本.第五步,重复步骤 2、3、4,直到未知样本与所有训练样本得距离都算完.第六步,统计K—最近邻样本中每个类标号出现得次数。

第七步,选择出现频率最大得类标号作为未知样本得类标号。

4 、4 实验结果与分析 按照上述实验步骤,在matlab中仿真实现k-近邻分类算法得结果如下图2所示,图中得第一列数据表示样本编号,第二列与第三列表示软如塞数据得两位特征得值,第三列得数字表示本实验得分类结果图,第四列表示样本实际所属类別。

图 3 中列出了详细错误信息.第一行与第一列表示样本类别,第 i 行第 j 列得元素表示第 i类样本被分为第 j 类样本得个数(2≤i,j≤4),第五列表示每类样本分类错误总数,第六列表示错误率。由图中数据易得,本实验得平均正确率为 86、7%。

图 2、7—最近邻分类结果图

图 3、错误统计图

KNN 方法虽然从原理上也依赖于极限定理,但在类别决策时,只与极少量得相邻样本有关。因此,采用这种方法可以较好地避免样本得不平衡问题。另外,由于 KNN方法主要靠周围有限得邻近得样本,而不就是靠判别类域得方法来确定所属类别得,因此对于类域得交叉或重叠较多得待分样本集来说,KNN 方法较其她方法更为适合。

该方法得不足之处就是计算量较大,因为对每一个待分类得文本都要计算它到全体已知样本得距离,才能求得它得 K个最近邻点.目前常用得解决方法就是事先对已知样本点进行剪辑,事先去除对分类作用不大得样本。该算法比较适用于样本容量比较大得类域得自动分类,而那些样本容量较小得类域采用这种算法比较容易产生误分。

5、、总结与反思 模式分类在现实领域有着非常广泛得应用。

K近邻算法就是模式分类算法中一类常用得算法。本文针对传统得 KNN 算法得不足之处,提出了两点改进措施。

1、针对 KNN 算法得计算量大、速度慢得缺点,对训练数据采用了预处理得方法.首先采用某一聚类方法对训练数据进行分类,然后再与 K 近邻方法相结合来判断待测样本得类别。现有得方法都就是经过聚类之后确定类别,按一定得规则挑选出来具有代表性得数据。然后再将这些挑选出来得数据作为训练样本.但这类方法能去除得数据非常有限,因此对计算量大得改进不大,而本文提出得新得算法:在聚类之后,首先计算出来各个类别得中心,然后只需要考虑待测样本与聚类中心得距离就可以.然后再根据最终得到得距离得大小判断该点所属得类别。通过实例验证表明,该方法在算法得时间复杂度方面有一定得改进。

2、关于准确度得问题,我们主要就是舍弃了原来常用得欧式距离得计算公式,主要考虑了属性对分类得影响,在欧式距离得计算中引入了权值.尽管权值得确定在一定程度上增加了计算时间得代价,但就是从改进分类准确率上来说仍然就是必要得,尤其就是在数据中无关属性比较多,传统得分类算法误差较大得情况下学习特征权值尤其适用。权值得确定也已经有了不少得方法,如可以通过神经网络来确定权值等。本文从训练样本出发,逐一统计计算每一个属性对分类结果得影响,根据影响得大小来确定权值。通过实例验证,可知这种方法得到得权值与其她常用得方法相比,在分类准确度方面有一定得提高。

参考文献

[ [1 1] ] 邓箴, , 包宏 、用模拟退火改进得

KNN 分类算法 [J ]。计算机与应用化学,2 010 ,27(3 )

:3 03- - 307.

[2 2 ]郭躬德,黄杰,陈黎飞 、基于

K NN

模型得增量学习算法 [J ]。模式识别与人工智能, 20 10 ,23( 5 ):70 1-7 7 07。

[ 3 ]黄杰,郭躬德,陈黎飞 、增量

K K N N 模型得修剪策略研究[J J ].小型微型计算机系统, 201 1, , 5 (5) :

84 5- 849.

[ [ 4] ] 李欢,焦建民.简化得粒子群优化快速

KNN 分类算法[J J ] 。计算机工程与应用,2 008,4 4(

3 3 2) ) :

57- -5 5 9。

[ [5 5 ]王晓晔, , 王正欧 .K -最近邻分类技术得改进算法[J J ]。电子与信息学报, 2005,27 7 ( 3):4 87 7 — 49 1.

[ 6 ] Gu o

Gongde, W ang Hui, Be ll

D D ,e t al.U sin g K NN model for aut t o ma ti i c

tex t

ca t egori za a t ion [ J ]、Soft

putin g — A F u sion o f

F F oun dat i on, M e thodo lo gi es

and d

A pplicatio n , 200 6, ,1 1 0( 5) :42 2 3- - 430.

[ [7 7 ]余小鹏,周德翼。一种自适应k-最近邻算法得研究 [J]., 计算机应用研究, 2006(2): 7 70 0 -7 7 2。

附件 1:

源代码

KNN、m

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% %

KNN、m

K-最近邻分类算法 % %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% A=x ls rea d('E :\ 上课\机器学习\ 模式识别课件\ 数据\COR K_ STOPPEx RS、xls",2 ); f=zer os(150 ,5) ; f f( :, 1:2 )=A (1 :150, 3:4) ; f1 =A(1 :50 ,3 :4) ; f2= A(51:100 ,3 :4); f3= A( 101:15 0, 3:4); c cl s= zero s(1 50 ,10); o for

i= 1:150

for j =1:1 50

c ls(i ,j )=norm (f(i ,1:2 )-f (j,1 :2));

end end % 对计算出得每个样本与其她 150 个样本( 包括自己)得距离排序,选 K=10 arr ay= zeros(300 ,11 ); f or ii =1:150

[val ue,inde x]=sort(cl s(i i, :));

arra y(2 *ii— 1,:) =val ue(1: 11);

a rray(2 *ii, :) =in dex(1 :1 1); end 类 %对每个样本分类 fo r ii= 1:150

a11=length(f ind(array(2 *i i,: )〈50));

a12=l ength (f ind(arr ay (2*ii ,: )〉50 &a rr ay(2*i i,:)〈100 )); ;

a13=len gth (find (a rray (2 *ii ,:) 〉1 00 &array (2 *i i,:)<15)

0)) ;

if (max(max (a11,a12) ,a13)==a11)

f(ii,3 )=1;

else if (max (max(a11 ,a12) ,a1 3)==a12 )

f (ii,3)=2;

els e

f(i i,3 )=3 ;

end

en d

end % 错误计算 e rro r=ze ro s(3,5 ); for

i=1 :50

if(f (i,3 )= =2 )

error (1 ,2)= error (1,2 )+1 ;

end

if (f(i,3) ==3 )

err or(1 ,3 )= erro r(1 ,3 )+1 ;

end

if(f (5 0+i ,3)==1 )

er ror(2,1 )=erro r(2 ,1)+ 1;

end

if( f(5 0+i, 3)==3 )

err or( 2,3) =e rror(2,3)+1 ;

en d

if (f(100+ i,3)==1)

error (3 ,1)= erro r(3,1)+1;

end

i f(f(100+i, 3)== 2)

er ror (3 ,2)=er ro r(3,2 )+ 1;

end

e nd for

k =1:3 %D 第四列表示错误数 err or(k,4 )=err or (k ,1)+err or(k ,2 )+e rro r( k,3 ); error(k ,5) =err or(k ,4)/50 ; en d

实验三 设计并构造AdventureWorks数据仓库实例

【实验要求】

在SQL Server 平台上,利用AdventureWorks数据库作为商业智能解决方案的数据源,设计并构造数据仓库,建立OLAP和数据挖掘模型,并以输出报表的形式满足决策支持的查询需求。 【实验内容】

步骤1:需求分析:以决策者的视角分析和设计数据仓库的需求; 步骤2:根据所设计的需求,确定本数据仓库的主题和主题与边界; 步骤3:设计并构造逻辑模型;

步骤4:进行数据转换和抽取,建立数据仓库:创建数据源,,建立OLAP和挖掘模型,使用多维数据集进行分析,建立数据挖掘结构和数据挖掘模型,创建报表。 【实验平台】

Win7操作系统,SQL Server 2005 【实验过程】

一、创建 Analysis Services 项目

1.打开 Busine Intelligence Development Studio。

2.在“文件”菜单上,指向“新建”,然后选择“项目”。

3.确保已选中“模板”窗格中的“Analysis Services 项目”。

4.在“名称”框中,将新项目命名为 AdventureWorks。

5.单击“确定”。

二、创建数据库和数据源

1.运行AdventureWorks sql server 2005示例数据库.msi,然后用SQL Server Management Studio 附加数据库AdventureWorks_Data.mdf 。

(1)运行AdventureWorks sql server 2005示例数据库.msi

(2)用SQL Server Management Studio附加数据库AdventureWorks_Data.mdf

2.在解决方案资源管理器中,右键单击“数据源”文件夹,然后选择“新建数据源”。 3.在“欢迎使用数据源向导”页面中,单击“下一步”按钮。

4.在“选择如何定义连接”页上,单击“新建”向 Adventure Works 数据库中添加连接。 5.在“连接管理器”的“提供程序”列表中,选择“本机 OLE DB\\\\SQL Native Client”。 6.在“服务器名称”列表中,键入或选择承载 AdventureWorks 的服务器的名称。 7.在“登录到服务器”组中,选择身份验证方法,并输入凭据。

8.在“选择或输入一个数据库名”列表中,选择 AdventureWorks,然后测试连接。若连接成功,再单击“确定”按钮。

9.单击“下一步”按钮进入向导的下一页。

10.在“模拟信息”页中,选择“使用服务帐户”,再单击“下一步”。 11.请注意,在“完成向导”页中,数据源名称默认为 Adventure Works。

12.单击“完成”。

新的数据源 Adventure Works 将显示在解决方案资源管理器的“数据源”文件夹中。

三、创建数据源视图

1.在解决方案资源管理器中,右键单击“数据源视图”,选择“新建数据源视图”。 系统将打开数据源视图向导。

2.在“欢迎使用数据源视图向导”页上,单击“下一步”。 3.在“选择数据源”页的“关系数据源”下,系统将默认选中您在上一个任务中创建的 Adventure Works DW 数据源。 单击“下一步”。 若要创建新数据源,请单击“新建数据源”,启动数据源向导。

4.在“选择表和视图”页上,选择下列各表,然后单击右箭头键,将这些表包括在新数据源视图中:

5.单击“下一步”。

6.在“完成向导”页上,默认情况下,系统将数据源视图命名为 Adventure Works 。 单击“完成”。

系统将打开数据源视图设计器,显示 Adventure Works 数据源视图。

四、定义维度

1.在解决方案资源管理器中,右键单击“维度”,然后单击“新建维度”。

2.在“欢迎使用维度向导”页上,单击“下一步”。

3.在“选择生成方法”页上,验证是否选择了“使用数据源生成维度”选项,然后单击“下一步”。

4.在“选择数据源视图”页上,验证是否选择了 Adventure Works 数据源视图。

5.在“选择维度类型”列表中,选择“标准维度”。

6.在“选择主维度表”中,点击“下一步”。

7.在“选择维度属性”中,点击“下一步”。

8.在“指定维度类型”中,点击“下一步”。 9.在“定义父子关系”中,点击“下一步”。

10.“检测层次结构”中,点击“下一步”。

11.点击“下一步”,然后点击“完成”。

五、使用多维数据集进行分析

1.在解决方案资源管理器中,右键单击“多维数据集”并选择“新建多维数据集”启动多维数据集向导。

2.在“欢迎使用多维数据集向导”页上,单击“下一步”。 3.在“选择生成方法”页上,确认已选中“使用数据源生成多维数据集”选项,然后单击“下一步”。

4.在“选择数据源视图”页上,点击“下一步”。

5.在“检测事实数据表和维度表”页上,点击“下一步”。

6.在“时间维度表”页上,如下所示。

点击“下一步”。

7.在“查看共享维度”页上,点击“>”,然后“下一步”。

8.在“选择度量值”页上,选择可用度量值。

点击“下一步”。

9.在“检测层级结构”页上,查看结果,点击“下一步”。

10.在“查看新建维度”中,选择新建维度,然后点击“下一步”。

11.在“完成向导”页,多维数据集名称为“Adventure Works”。在“预览”中,可以看到“度量值组”和“维度”。

12.点击“完成”。

13.在多维数据集设计器的工具栏上,将“缩放”级别更改为 50 %,以便更轻松地查看多维数据集内的维度和事实数据表。注意,事实数据表是黄色的,维度表是蓝色的。

14.在“文件”菜单上,单击“全部保存”。

六、创建用于个人客户方案的挖掘结构

1.在解决方案资源管理器中,右键单击“挖掘结构”并选择“新建挖掘结构”启动数据挖掘向导。

2.在“欢迎使用数据挖掘向导”页上,单击“下一步”。

3.在“选择定义方法”页上,确保已选中“从现有关系数据库或数据仓库”,再单击“下一步”。

4.在“创建数据挖掘结构”页的“您要使用何种数据挖掘技术?”下,选择“Microsoft 决策树”。

5.单击“下一步”。

6.在“选择数据源视图”页上,请注意已默认选中 Adventure Works 。在数据源视图中,单击“浏览”查看各表,然后单击“关闭”返回该向导。

7.单击“下一步”。

8.在“指定表类型”页上,选中 vIndividualCustomer 表旁边“事例”列中的复选框,再单击“下一步”。

9.在“指定定型数据”页上,确保已选中 CustomerID 列旁边 Key 列中的复选框。据源视图中的源表表示一个键,则数据挖掘向导将自动选择该列作为模型的键。

10.选中 FirstName和LastName 列旁边的“输入”和“可预测”。

如果数

11.单击“建议”打开“提供相关列建议”对话框。

只要选中至少一个可预测属性,即可启用“建议”按钮。“提供相关列建议”对话框将列出与可预测列关联最密切的列,并按照与可预测属性的相互关系对属性进行排序。值大于 0.05 的列将被自动选中,以包括在模型中。

12.阅读建议,然后单击“取消”忽略建议并保留向导设置的原始值。 15.选中以下各列旁边的“输入”复选框: StateProvinceName MiddleName CountryRegionName

16.单击“下一步”。

17.在“指定列的内容和数据类型”页上,单击“检测”以运行对数值数据进行取样并确定数值列是否包含连续或离散值的算法。例如,某列可包含薪金信息,用以作为连续的实际薪金值,也可包含整数,用以表示离散的编码薪金范围(例如 1 =

18.单击“检测”后,请查看“内容类型”和“数据类型”列中的各项;如有必要,请进行更改,以确保设置与下表所示一致。

通常,向导会检测数值,并分配相应的数值数据类型;但有些情况下,您可能想要将数值作为文本处理。

19.单击“下一步”。

20.在“完成向导”页上的“挖掘结构名称”中,键入Individual Customer。 21.在“挖掘模型名称”中,键入 TM_Decision_Tree。 22.选中“允许钻取”复选框。

23.单击“完成”。

七、挖掘模型和挖掘结构如下图。

八、创建查询

8.1创建预测查询的第一步是选择挖掘模型和输入表。

1.在数据挖掘设计器“挖掘模型预测”选项卡的“挖掘模型”框中,单击“选择模型”。

系统将打开“选择挖掘模型”对话框。

2.在整个树中导航到“个人客户”结构,展开该结构并选择 TM_Decision_Tree,再单击“确定”。

3.在“选择输入表”框中,单击“选择事例表”。 系统将打开“选择表”对话框。

4.在“数据源”中,选择 Adventure Works 。

5.在“表/视图名称”中,选择 Department(HumanResources)表,再单击“确定”。 选择输入表之后,预测查询生成器便会根据各列的名称在挖掘模型和输入表之间创建默认映射。

8.2生成预测查询

1.在“挖掘模型预测”选项卡上的网格内的“源”列中,单击第一个空行中的单元格,然后选择 Department。

2.在 Department 行的“字段”列中,选择 DepartmentID。

3.在“源”列中,单击下一个空行,然后选择 TM_Decision_Tree。 4.在 TM_Decision_Tree 行的“字段”列中,选择 First Name。 这将会输出 Microsoft 决策树模型中作为预测目标的列。

5.在“源”列下,单击下一个空行,然后选择“预测函数”。 6.在“预测函数”行的“字段”列中,选择 PredictProbability。 预测函数提供有关模型如何进行预测的信息。PredictProbability 函数提供有关正确预测的概率信息。您可以在“条件/参数”列中指定预测函数的参数。 7.在 PredictProbability 行的“条件/参数”列中,键入 [TM_Decision_Tree].[Bike Buyer]。 这将指定 PredictProbability 函数的目标列。有关函数的详细信息,请参阅数据挖掘扩展插件 (DMX) 函数参考。

8.3查看结果

1.通过单击“切换到查询设计视图/切换到查询结果视图”按钮(即工具栏上的第一个按钮)旁边的箭头并选择“查询”,可以运行查询。

2.通过点击“单独查询”,结果如下:

【总结】

通过本次实验,我对SQL Server有了更深的了解。知道SQL Server不等于SQL Server Management Studio,还有SQL Server Busine Intelligence Development Studio和其他一些模块。在这次实验中,遇到了一些困难:1.SQL Server 2000和SQL Server 2005有一些不同,利用SQL Server 2000中的Analysis service做完实验二后发现实验三不知道怎么做了,左右通过查找一些资料才解决问题;2.在新建数据源时,在“连接管理器”页上,“测试连接”一直失败,不知道是什么原因,老师给的AdventureWorks sql server 2005示例数据库.msi也一直不知道该怎么用,经过不断尝试才发现原来在运行AdventureWorks sql server 2005示例数据库.msi后会产生一个数据库文件,我们应该利用SQL Server Management Studio把它附加进数据库文件夹下,而且在“连接到服务器”页时,应该注意“服务器类型”、“服务器名称”、“身份验证”等的选择,否则会出错。虽然本次实验中遇到了一些麻烦,耗费了一些时间,但是通过不断尝试、不断努力将问题解决,也是一种很大的收获。

词语活泼,结构完整。

值得花时间读一读!

推荐访问:数据挖掘 实验 报告

《数据挖掘实验报告.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:

文档为doc格式

一键复制全文 下载 投诉