首页 >> 收录期刊 >> 计算机研究与发展 >> 正文
杂志中文名:计算机研究与发展
杂志英文名:Journal of Computer Research and Development
主管单位:中科院出版委员会
主办单位:中国科学院计算技术研究所 中国计算机学会
地址:北京中关村科学院南路6号 北京2704信箱
邮编:100080
电话:010-62620696;62600350;
Email:crad@ict.ac.cn
ISSN:1000-1239
主编:樊建平












Web日志的高效多能挖掘算法
引用本文:宋擒豹,沈钧毅.Web日志的高效多能挖掘算法[J].计算机研究与发展,2001,38(3):328-333.
作者姓名:宋擒豹  沈钧毅
作者单位:西安交通大学计算机科学与技术系
基金项目:国家“八六三”高技术研究发展计划基金资助!(86 3 -3 0 6 -ZD-0 2 -0 2,86 3 -3 0 6 -QN2 0 0 0 -5 )
摘    要:通过对Web服务器日志文件和客户交易数据进行分析,可以发现相似客户群体、相关Web页面和频繁访问路径,提出了一种新颖的Web日志挖掘算法。在该算法中,首先以Web站点URL为行、以UserID为列建立URL-UserID关联矩阵、元素值为用户的访问次数,然后,在列向量进行相似性分析得到相似客户群体,对行向量进行相似性度量获得相关Web页面,对后者再进一步还可以发现频繁访问路径。实验结果表明了算法的有效性。

关 键 词:电子商务  Web  日志挖掘  Internet  数据挖掘  算法
作者简介:宋擒豹 男,1966年生,在职博士研究生,主要研究方向为数据挖掘与知识工程,目前正负责“八六三”项目“数字商品非法复制和扩散监测系统”的研究.近年来,负责和主要参加部级科研项目10余项,获部级科技进步二等奖2项,发表学术论文30篇,翻译专著2部. 沈钧毅 男,1939年生,教授,博士生导师,主要研究方向为数据库理论与应用、数据仓库、数据挖掘和工作流,近年来,先后主持完成“八六三”高技术研究发展计划课题4项,获省部级以上科技进步奖3项,发表学术论文50余篇,出版专著3本.

AN EFFICIENT AND MULTI PURPOSE ALGORITHM FOR MINING WEB LOGS
SONG Qin,Bao and SHEN Jun,Yi.AN EFFICIENT AND MULTI PURPOSE ALGORITHM FOR MINING WEB LOGS[J].Journal of Computer Research and Development,2001,38(3):328-333.
Authors:SONG Qin  Bao  SHEN Jun  Yi
Abstract:Similar customer groups, relevant Web pages, and frequent access paths can be discovered by analyzing of Web log files and customer database. In this paper, novel Web log mining algorithms are presented. First, according to Web site's directed graph defined, a URL UserID relevant matrix is set up, where URL is taken as row and UserID is taken as column, and each element's value of this matrix is the user's hits. Second, similar customer groups are discovered by measuring similarity between column vectors, and relevant Web pages are obtained by measuring similarity between row vectors; frequent access paths can also be discovered by further processing of the latter. Experiments show the effectiveness of the algorithms.
Keywords:customers clustering  Web pages clustering  frequent access paths  Web log mining  E  business  
本文献已被 CNKI 维普 万方数据 等数据库收录!