新闻资讯

NEWS

公司新闻
行业新闻

CRM系统:CRM 中用Apriori 算法评估客户兴趣度

CRM 中用Apriori 算法评估客户兴趣度 王荇李慧 ( 常州工学院计算机信息工程学院" 江苏常州213002) [摘要] Apriori 算法作为一种典型的关联规则算法" 将其应用在CRM 中" 对于促进CRM 进一步向智能化发展" 提升CRM 价值起到非常重要的作用! 文章首先介绍Apriori 算法的基本原则* 方法" 然后介绍兴趣关联规则的概念与实现方法" 最后对 用Apriori 算法评估客户兴趣度进行了探讨! [关键词] Apriori 算法+ 关联规则+ 频繁项集+ 支持度 1 引言 CRM(客户关系管理)是一种以客户为中心的经营策略! 它以 信息技术为手段" 将客户数据作为基础" 通过数据分析技术加强 对客户的了解" 并对CRM 流程进行重新设计! 面对海量的数据 信息" 怎样采用方便有效的手段从中找出有价值的信息" 数据挖 掘作为最有效的手段成为目前热门的话题! 2 Apriori 算法概述 Apriori 算法是一种典型的关联规则算法! Apriori 使用一种称 作逐层搜索的迭代方法" k- 项集用于(k+1)- 项集! 首先" 找出 频繁1- 项集的集合" 该集合记作L1! L1 用作频繁2- 项集的集 合L2" 而L2 用于找L3" 如此下去" 直到不能找到频繁k- 项集! 找到每个Lk 需要一次数据库扫描! 下面介绍发现关联规则的Apriori 算法! 我们引入若干记号" 具有k 个项的项集称为k- 项集" 同时我们称该项集的长度为k! Lk 记由k- 项集构成的集合! 频繁项集的发现方法是一种渐近的 方法! 具体如下# !遍历数据库一次" 记录每个数据项出现次数" 即计算每个 项的支持度" 收集所有支持度不低于用户最低支持度阈值的项" 构成频繁1- 项集的集合L1! "两两连接L1 中的项集" 形成候选2- 项集的集合C2! #再次遍历数据库" 计算C2 中每个候选2- 项集的支持度" 收集所有支持度不低于用户最低支持度阈值的2- 项集构成频繁 2- 项集的集合L2! $通过两两连接L2 中的项集" 形成候选3- 项集的集合C3! %再次遍历数据库" 计算C3 中每个候选3- 项集的支持度" 收集所有支持度不低于用户最低支持度阈值的3- 项集构成频繁 3- 项集的集合L3! 反复执行上述过程" 直到新的候选项集Ck 为 空时停止! 显然" 该方法需要对数据库作多次遍历! 如果频繁项集的长 度最长为P" 就要偏历P 次! 算法高效的关键在于生成较小的候选项集" 也就是尽可能不 生成和计算那些不可能成为频繁项集的候选项集! 为了实现这一 点" Apriori 算法使用了这样一个基本性质" 即一个频繁项集的任 意子集必定也是一个频繁项集! 如何将Apriori 性质用子算法$ 为理解这一点" 必须看看如何 用Lk- 1 找Lk,其步骤由连接和剪枝组成! 2.1 连接步 为找Lk" 通过Lk- 1 与自己连接产生候选k- 项集的集合! 该候选项集的集合称作Ck! 设l1 和l2 是Lk- 1 中的项集" 记号li [j]表示li 的第j 项(例如" l1[k- 2]表示l1 的倒数第3 项)! 为方便计 算" 假定事务或项集中的项按字典次序排序! 执行连接 Lk- 1&Lk- 1,其中Lk- 1 的元素是可连接的" 如果他们前(k- 2)个 项相同! 即Lk- 1 的元素l1 和l2 是可连接的" 如果(l1 [1]= l2 [1]) !(l1 [2]= l2 [2])!%!(l1 [k- 2]= l2 [k- 2])!(l1 [k- 1]= l2 [k- 1])" 条件(l1 [k- 2]< l2 [k- 2])是简单的保证不产生重复! 连接l1 和l2 产 生的结果项集是l1 [1] l1 [2] %l1 [k- 2]l1 [k- 1] l2 [k- 1]! 2.2 剪枝步 Ck 是Lk 的超集" 即是" 它的成员可以是也可以不是频繁的" 但所有的频繁k- 项集都包含在Ck 中! 扫描数据库" 确定Ck 中 每个候选的计数" 从而确定Lk (即根据定义" 计数值不小于最小 支持度计数的所有候选是频繁的" 从而属于Lk)! 然而Ck 可能很 大" 这样所涉及的计算量就很大! 为压缩Ck" 可以用以下办法使 用Apriori 性质" 任何非频繁的(k- 1)- 项集都不可能是频繁k- 项 集的子集! 因此" 如果一个候选k- 项集的(k- 1)- 子集不在Lk- 1 中" 则该候选也不可能是频繁的" 从而可以由Ck 中删除! 3 兴趣关联规则概述 关联规则挖掘技术主要用于从用户访问序列数据库的访问序 列项中挖掘出相应规则! 在WEB 数据挖掘中" 关联规则挖掘就 是挖掘出用户在一个访问期间从服务器上访问的文件/ 页面的联 系" 这些页面之间可能并不存在直接参引关系(Reference)! 站点的设计一般遵循一种分类结构" 即一个页面的子页面的 组织是根据子页面的类别来安排的! 从另一方面来说" 这种结构 也反映了用户的兴趣! 设一个页面中有K个链接" 一个用户对该 页面的这些链接进行访问" 如果他首先访问第i 个" 那么代表了 他对于该链接所达页面的兴趣大于其他链接所达页面" 即 Interes t(i)> Interes t(i& ), i& !=i 式1 兴趣关联规则就是利用客户兴趣的相关性原则" 根据用户已 经或正在浏览的网页推测客户下一步将浏览的网页" 并提前预取 出来" 这将大大加快打开网页的速度" 提高网站的运行效率! 通过兴趣关联规则" 我们可以发现客户浏览网页的相关性" 从而预测用户将浏览的下一个页面" 可以通过提前预取该网页" 大大节约访问时间! 4 Apriori 算法评估客户兴趣度 当客户访问站点时" 通常带有某种喜好" 客户的访问路径中 蕴藏了客户对该站点的兴趣及客户的兴趣转移! Apriori 算法是数 据挖掘关联规则技术中一种发现模式的典型方法! 在一个事务数 据库中" 每一个事务都是一个’ 项’ 的集合! 一个规则由一个前 驱(左手边)和一个后继(右手边)组成! 如果一个客户购买了前驱中 的一个项" 那么它也可能购买后继中的项! 首先构造一个频繁项 的候选集合" 其长度为k" 只要其中一项频繁发生" 那么就从较 小长度的频繁项集中构造一个长度为k+1 的候选集合! 如此反复 迭代" 直到无法构造候选项集! 该规则反应了关联. 强力推荐: 天柏客户关系管理系统 天柏客户关系管理系统(CRM)是一款集专业性、实用性、易用性为一体的纯B/S架构的CRM系统,它基于以客户为中心的协同管理思想和营销理念,围绕客户生命周期的整个过程,针对不同价值的客户实施以客户满意为目标的营销策略,通过企业级协同,有效的“发现、保持和留住客户”,从而达到留住客户、提高销售,实现企业利润最大化的目的。通过对客户进行7P的深入分析,即客户概况分析(Profiling)、客户忠诚度分析(Persistency)、客户利润分析(Profitability)、客户性能分析(Performance)、客户未来分析(Prospecting)、客户产品分析(Product)、客户促销分析(Promotion)以及改善与管理企业销售、营销、客户服务和支持等与客户关系有关的业务流程并提高各个环节的自动化程度,从而帮助企业达到缩短销售周期、降低销售成本、扩大销售量、增加收入与盈利、抢占更多市场份额、寻求新的市场机会和销售渠道,最终从根本上提升企业的核心竞争力,使得企业在当前激烈的竞争环境中立于不败之地。 关键词:CRM,CRM系统,CRM软件,客户关系管理,客户管理软件,客户管理系统,客户关系管理软件,客户关系管理系统