Apriori algorithm是关联规则里一项基本算法。是由Rakesh Agrawal和Ramakrishnan Srikant两位在1994年提出的布尔关联规则的频繁项集挖掘算法(详情:Fast Algorithms for Mining Association Rules)。算法的名字是因为算法基于先验知识(prior knowledge).根据前一次找到的频繁项来生成本次的频繁项。关联规则的目的在于在一个数据集中找出项之间的关系,也称之为购物蓝分析 (market basket analysis)。例如,购买佳能的顾客,有70%的可能也会买在一个月之类买HP打印机。这其中最有名的例子就是”尿布和啤酒“的故事了。
在上一篇文章中谈到了我碰到的关于python里a+=b和a=a+b问题。在知乎上也问了这个问题,看了各位大侠的解释,现在似乎明白了,得赶紧记下来总结下,不然以后又忘了。
在看apriori的算法,决定自己练练手,写写代码。最近又在学python,所以准备用python实现。其中一个子过程是要求候选项Ck的k项子集。在这个求子集的方法中遇到了问题了,并且很神奇。最开始一直找不到问题所在,当单步调试发现问题所在之处时却倍感神奇。下面用代码示例来说明下这个问题的神奇之处。
前面说已经开是学习python了,然后随便看了下语法,就看到了OO了。结果发现这个__init__()和__new__()方法才有些神奇。引用官方API的解释
说学python已经好久了,这两天终于看了下。最开始还是别人推荐的简明python教程:chm版本下载,在线版本,这个版本是2.x版本滴了,机子上装了3.2的,难怪自己开始想打印hello world都不行。因为教程里说的是,直接print ‘hello world’,结果提示语法错误。后来才知道,print在3.x版本里面已经是一个函数,应该用print(‘hello world!’)这样才可以,我就说怎么连hello world都不行。该教程的英文版本滴可以参考这里。
在WordPress上写博客,网速不理想的情况下,上传图片的时候会很慢,并且需要一张一张添加图片。之前写过怎么用word07快速发布Wordpress博客 ,因为现在用的XP系统(另外的一个WIN7系统里装的office07),里面没装word07,是用的office03,写一篇含有截图较多的博客,就不是很方便。WPS有个插件说可以发布博客(有时候XP也得打开下docx之类的,so该系统里就装了个wps),结果试了试,又不行。后来据说Windows live writer可以,就试了试。安装了下writer(比较小),没有装office07及以上滴童鞋推荐使用。