英语翻译数据挖掘是从数据库中发现隐含的、新颖的、对决策有潜在价值的知识和规则的过程,目前已经在许多领域得到了广泛的应用.而聚类分析是数据挖掘领域最为重要的技术之一,聚类分

来源:学生作业帮助网 编辑:作业帮 时间:2024/05/10 13:40:46
英语翻译数据挖掘是从数据库中发现隐含的、新颖的、对决策有潜在价值的知识和规则的过程,目前已经在许多领域得到了广泛的应用.而聚类分析是数据挖掘领域最为重要的技术之一,聚类分

英语翻译数据挖掘是从数据库中发现隐含的、新颖的、对决策有潜在价值的知识和规则的过程,目前已经在许多领域得到了广泛的应用.而聚类分析是数据挖掘领域最为重要的技术之一,聚类分
英语翻译
数据挖掘是从数据库中发现隐含的、新颖的、对决策有潜在价值的知识和规则的过程,目前已经在许多领域得到了广泛的应用.而聚类分析是数据挖掘领域最为重要的技术之一,聚类分析是将物理或抽象对象的集合分成由类似的对象组成的多个簇的过程.通过聚类生成的簇是一组对象的集合,同一个簇中的对象彼此相似,不同簇中的对象相异.而在诸多聚类算法中,K-means聚类算法是最为经典的.
K-means算法是一种典型的基于划分的聚类算法,该算法有着思想简单易行,对大规模数据的挖掘具有高效性和可伸缩性,时间复杂性接近线性等优点.但是该算法也存在缺点:算法对初值敏感;初值采用随机,算法不够稳定;算法易陷入局部极小,并且一般只能发现球状簇;聚类个数K需要预先给定.
本文主要是介绍和分析传统K-means聚类算法并了解K-means聚类算法的优点和缺点,最后对K-means聚类算法进行改进.该改进主要针对K-means聚类算法对初值的依赖性这个特点进行改进.改进主要是通过一些算法进行初始点的选择,这样就克服了K-means算法不稳定等缺点,并能够使聚类结果更加精确.
主要工作内容和研究成果如下:
1.介绍和分析K-means聚类算法的思想,并实现该算法.然后通过一些数据来了解该算法的优缺点.
2.对K-means聚类算法的缺点进行改进,主要针对K-means聚类算法对初值的依赖性这个特点进行改进.采用两种改进方法,第一种借鉴Huffman思想,第二种借鉴贪心算法思想和Kruskal算法的思想.
不要使用google翻译和有道翻译等!

英语翻译数据挖掘是从数据库中发现隐含的、新颖的、对决策有潜在价值的知识和规则的过程,目前已经在许多领域得到了广泛的应用.而聚类分析是数据挖掘领域最为重要的技术之一,聚类分
Data mining from a database found implied, novel, a potential value of decision-making process of the knowledge and rules in many areas, has been widely used. And clustering analysis is the most important data mining field technology of clustering analysis is put physics or abstract collections of objects into the object by similar composed of multiple cluster process. By clustering generated clusters are a group of collections of objects, the object in the same clusters resemble each other, different with different objects in the cluster. And in many clustering algorithms, K - means clustering algorithm is the most classic.
K - means algorithm is a kind of typical clustering algorithm based on division, this algorithm has thought is simple, and the mining of large-scale data with efficiency and scalability, time complexity close to linear, etc. But this algorithm also exists weakness: algorithm of initial sensitive; Using random initial value, the algorithm is not quite stable; Algorithm easily into the local minimum, and only commonly found globular clusters; The cluster number K need to be given.
This paper mainly introduces and analyses tradition K - means clustering algorithms and understand K - means clustering algorithm, and finally the advantages and disadvantages of K - means clustering algorithm was improved. This improvement mainly for K - means clustering algorithm's dependence on initial value this characteristic is improved. Improvement mainly through some algorithm of the initial points, so choose overcomes K - means algorithm unstable, and can make the disadvantages such as clustering results more precise.
Main content and research results are as follows: 1. Introduction and analysis K - means clustering algorithms, and realize the ideological algorithm. Then through some data to understand the advantages and disadvantages of this algorithm.
2. The K - means clustering algorithm improved the shortcomings, mainly for K - means clustering algorithm's dependence on initial value this characteristic is improved. Using the two improved methods for reference, the first kind, the second kind of reference Huffman thought Kruskal algorithm greedy algorithm of thoughts and ideas.

英语翻译数据挖掘是从数据库中发现隐含的、新颖的、对决策有潜在价值的知识和规则的过程,目前已经在许多领域得到了广泛的应用.而聚类分析是数据挖掘领域最为重要的技术之一,聚类分 如何从基因组数据库中挖掘目标基因 数据模式层和实例层分别是什么含义有关数据库和大数据挖掘,数据清洗的方面 数据库管理系统中负责数据模式定义的语言是?A 数据库定义语言 B 数据操纵语言 13下列关于数据库系统的叙述中,正确的是() A 数据库系统中数据的一致性是指数据类型一致 B,数据库系统 html问题请选择 2 3 3 数据是从数据库里读出来的 在页面如何让默认选择显示数据库里读出来那个数据? 数据挖掘中支持向量机的b怎么求得 数据挖掘中分类分析和聚类分析的区别 数据挖掘中分类和回归的区别是什么? 英语翻译IPv6将原包头中次要的且可选的字段移到扩充包头里,且将扩充包头置于ipv6包头的后面.数据库可能是ascii数据的平板数据库也可能是复杂的二叉树结构.不论哪种形式,数据库都是数据 请问数据挖掘的意义 在SAP中,域,数据元素,数据库表这三者之间的关系是怎么样的,实例运用 有关数据库的描述,正确的是()A 是指设计数据库管理系统B 数据库技术的根本目标是要解决数据共享的问题C 数据库系统中,数据的物理结构必须与逻辑结构一致 数据挖掘的工具有那些 知识发现过程有什么 11.下述关于数据库系统的叙述中正确的是______:A、 数据库系统减少了数据冗余 B、 数据库系统避免了一切冗余 C、 数据库系统中数据的一致性是指数据类型的一致 D、 数据库系统比文件系 (18) 下述关于数据库系统的叙述中正确的是______.A. 数据库系统减少了数据冗余B. 数据库系统避免了一切冗余C. 数据库系统中数据的一致性是指数据类型的一致D. 数据库系统比文件系统能管理 数据挖掘中提升度是什么意思? 英语翻译不要机翻的,摘要数据挖掘技术是一种新兴技术,它具有强大的数据处理和分析能力,能挖掘出数据之前的潜在联系和深层次的规则,帮助决策者进行分析.本文通过对数据挖掘技术的介