•   按检索    检索词:    高级检索
     排序:相关度 OA 时间 被引次数 点击次数 下载次数 共有2019条符合数据挖掘的查询结果,以下是第1-10项 搜索用时 56 毫秒
1 [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] 下一页 » 末  页»
1.
  总被引:289,自引:4,他引:285
因特网目前是一个巨大,分布广泛,全球性的信息服务中心,它涉及新闻,广告,消费信息,金融管理,教育,政府,电子商务和许多其它信息服务,Web包含了丰富和动态的超链接信息,以及Web页面的访问和使用信息,这为数据挖掘提供了丰富的资源,Web挖掘就是从Web活动中抽取感兴趣的潜在有用模… …   相似文献
2.
  总被引:203,自引:6,他引:203
本文了基于RoughSet(RS)理论数据浓缩的几个问题。  相似文献
3.
  总被引:107,自引:2,他引:105
随着Internet应用的逐渐普及,WWW已经发展成为一个巨大的的分布式信息空间,为用户提供了一个极用价值的信息源。但因Internet所固的开放性,动态性与异构性,又使得用户很难准确快捷地从WWW上获取所需信息。文中将数据挖掘的思想引信了WWW信息处理领域来解决网上信息有效获取… …   相似文献
4.
下载全文  总被引:105,自引:2,他引:105
挖掘最大频繁项目集是多种数据挖掘应用中的关键问题,之前的很多研究都是采用Apriori类的候选项目集生成-检验方法.然而,候选项目集产生的代价是很高的,尤其是在存在大量强模式和/或长模式的时候.提出了一种快速的基于频繁模式树(FP-tree)的最大频繁项目集挖掘DMFIA(dis… …   相似文献
宋余庆  朱玉全  孙志挥  陈耿 《软件学报》2003,14(9):1586-1592
5.
  总被引:76,自引:3,他引:76
文本分类是文本挖掘的基础与核心,是近年来数据挖掘和网络挖掘的一个研究热点,在传统的情报检索、网站索引体系结构的建立和Web信息检索等方面占有重要地位,深入分析了一种简单而常用的经典文本分类模型--向量空间模型(vector space model,VSM)--的实质,找出了其分类… …   相似文献
6.
  总被引:76,自引:0,他引:76
通过对Web服务器日志文件和客户交易数据进行分析,可以发现相似客户群体、相关Web页面和频繁访问路径,提出了一种新颖的Web日志挖掘算法。在该算法中,首先以Web站点URL为行、以UserID为列建立URL-UserID关联矩阵、元素值为用户的访问次数,然后,在列向量进行相似性分… …   相似文献
7.
  总被引:69,自引:0,他引:69
WWW以其多媒体的传输及良好的交互性而倍受青睐,虽然近几年来网络速度得到了很大的提高,但是由于接入Internet的用户数量剧增以及Web服务和网络固有的延迟,使得网络越来越拥护,用户的服务质量得不到很好的保证。为此文中提出了一种智能Web预取技术,它能够加快用户浏览Web页面时… …   相似文献
8.
  总被引:66,自引:5,他引:61
从空间X中给定一个有限的取样点集(或从数据库中取得有限例子的集合),{x~i}_(i 1)~M,聚类的目标是将数据聚集成类,使得类间的相似性尽量小,而类内的相似性尽量大。分类问题(监督)和聚类问题根本的不同是:分类问题中,我们知道训练例的分类属性值,而在聚类问题中,就需要我们在训… …   相似文献
王实  高文 《计算机科学》2000,27(4):42-45
9.
  总被引:64,自引:4,他引:60
作为数据挖掘核心任务之一的关联规则发现已经得到了广泛的研究。而由二元关系导出的概念格则是一种非常有用的形式化工具。它体现了概念内涵和外延的统一,反映了对象和特征间的联系以及概念间的泛化与例化关系,因此非常适于发现数据中潜在的概念。分析了概念格与关联规则提取之间的关系,根据需要对格… …   相似文献
10.
下载全文  总被引:55,自引:0,他引:55
数据的规模越来越大,要求数据挖掘算法有很高的执行效率.基于密度的聚类是聚类分析中的一种,其主要优点是发现任意形状的聚类和对噪音数据不敏感.提出了一种新的基于参考点和密度的CURD(clustering using references and density)聚类算法,其创新点在… …   相似文献
马帅  王腾蛟  唐世渭  杨冬青  高军 《软件学报》2003,14(6):1089-1095
1 [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] 下一页 » 末  页»