文章搜索——中国计算机期刊网

网站动态：	中国计算机期刊网介绍欢迎关注中国计算机期刊网微信订阅号！中国计算机期刊网正式发布,欢迎访问! 如何申请成为收录期刊和加盟期刊

排序：相关度 OA 时间被引次数点击次数下载次数共有2019条符合数据挖掘的查询结果，以下是第1-10项搜索用时 56 毫秒

1 [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] 下一页 » 末页»

总被引：289，自引：4，他引：285

因特网目前是一个巨大,分布广泛,全球性的信息服务中心,它涉及新闻,广告,消费信息,金融管理,教育,政府,电子商务和许多其它信息服务,Web包含了丰富和动态的超链接信息,以及Web页面的访问和使用信息,这为数据挖掘提供了丰富的资源,Web挖掘就是从Web活动中抽取感兴趣的潜在有用模… … 相似文献

总被引：203，自引：6，他引：203

本文了基于ＲｏｕｇｈＳｅｔ（ＲＳ）理论数据浓缩的几个问题。相似文献

总被引：107，自引：2，他引：105

随着Ｉｎｔｅｒｎｅｔ应用的逐渐普及,ＷＷＷ已经发展成为一个巨大的的分布式信息空间,为用户提供了一个极用价值的信息源。但因Ｉｎｔｅｒｎｅｔ所固的开放性,动态性与异构性,又使得用户很难准确快捷地从ＷＷＷ上获取所需信息。文中将数据挖掘的思想引信了ＷＷＷ信息处理领域来解决网上信息有效获取… … 相似文献

下载全文 总被引：105，自引：2，他引：105

挖掘最大频繁项目集是多种数据挖掘应用中的关键问题,之前的很多研究都是采用Apriori类的候选项目集生成-检验方法.然而,候选项目集产生的代价是很高的,尤其是在存在大量强模式和/或长模式的时候.提出了一种快速的基于频繁模式树(FP-tree)的最大频繁项目集挖掘DMFIA(dis… … 相似文献

总被引：76，自引：3，他引：76

文本分类是文本挖掘的基础与核心，是近年来数据挖掘和网络挖掘的一个研究热点，在传统的情报检索、网站索引体系结构的建立和Web信息检索等方面占有重要地位，深入分析了一种简单而常用的经典文本分类模型－－向量空间模型（vector space model,VSM)－－的实质，找出了其分类… … 相似文献

总被引：76，自引：0，他引：76

通过对Web服务器日志文件和客户交易数据进行分析,可以发现相似客户群体、相关Web页面和频繁访问路径,提出了一种新颖的Web日志挖掘算法。在该算法中,首先以Web站点URL为行、以UserID为列建立URL－UserID关联矩阵、元素值为用户的访问次数,然后,在列向量进行相似性分… … 相似文献

总被引：69，自引：0，他引：69

WWW以其多媒体的传输及良好的交互性而倍受青睐,虽然近几年来网络速度得到了很大的提高,但是由于接入Internet的用户数量剧增以及Web服务和网络固有的延迟,使得网络越来越拥护,用户的服务质量得不到很好的保证。为此文中提出了一种智能Web预取技术,它能够加快用户浏览Web页面时… … 相似文献

总被引：66，自引：5，他引：61

从空间X中给定一个有限的取样点集(或从数据库中取得有限例子的集合),{x~i}_(i 1)~M,聚类的目标是将数据聚集成类,使得类间的相似性尽量小,而类内的相似性尽量大。分类问题(监督)和聚类问题根本的不同是:分类问题中,我们知道训练例的分类属性值,而在聚类问题中,就需要我们在训… … 相似文献

总被引：64，自引：4，他引：60

作为数据挖掘核心任务之一的关联规则发现已经得到了广泛的研究。而由二元关系导出的概念格则是一种非常有用的形式化工具。它体现了概念内涵和外延的统一,反映了对象和特征间的联系以及概念间的泛化与例化关系,因此非常适于发现数据中潜在的概念。分析了概念格与关联规则提取之间的关系,根据需要对格… … 相似文献

10.

下载全文 总被引：55，自引：0，他引：55

数据的规模越来越大,要求数据挖掘算法有很高的执行效率.基于密度的聚类是聚类分析中的一种,其主要优点是发现任意形状的聚类和对噪音数据不敏感.提出了一种新的基于参考点和密度的CURD(clustering using references and density)聚类算法,其创新点在… … 相似文献

1 [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] 下一页 » 末页»