前面说了windows命令行使用libsvm,现在需要用python去调用。一种方法是用python去进行系统调用windows的exe程序。另外一种方法就是通过libsvm的python接口去调用。这里说的是第二种方法,即通过调用libsvm的python接口。

搜索SVM入门,收录排名最前的应该就是这几篇文章了:SVM 入门资料。具体什么原理貌似挺高深的,我也没怎么去看其中的原理。这里我说的LibSvm就是SVM其中一个解决方案的软件包。

这两天都用了下ubuntu写代码,记得以前好像不是那么容易使eclipse和windows下的workspace同步的,得需要一些配置才可以。现在把它写下来备份一下。

上次装了ubuntu(3个系统,windows xp,64-位win7,ubuntu)后好久没用了。今天突然跟google一样抽风进去看看,才发现,原来我的ubuntu下有那么多启动项。(又查了下图中的PAE//Physical Address Extension,效果是使32位系统用4g内存)

还是用之前在深圳实习时候办的联通3g卡号。资费也还好,但苦逼的是整天来自10010100、10010998、10010755等等几个号码的垃圾短信。整天都推荐什么热点应用啊,热点咨询免费推荐啊,什么精彩视频推荐啊等等。谁稀罕啊……不采用什么dataming技术也就算了,也不让用户可定制下什么内容推荐等等,反正就是所有的信息都push给你,你要也得要,不要也得要。网上一搜,大家都一样的骂声。看看吧。。。

上次不知道是谁问我有否考虑把博客迁移到github上,今天无意间又碰到了关于这个问题,于是就试了试。用github首先得安装SCM工具Git,还记得上一次接触Git,还是在上软件配置管理课的时候讲软件配置管理工具时遇到的,有关git的教程,这个讲得比较好Git中文教程

中南大学数学科学与计算技术学院2008级本科生-刘嘉忆(本名刘路),太牛X了,牛B得一发不可收拾啊。转载下http://hn.rednet.cn/c/2012/03/20/2555600.htm

      序列数据是非常重要的一种,在很多领域里面都频繁出现,例如:医药,商业,财政,客户行为,教育,安全等等。相关研究可以大致将序列数据的挖掘分为两类,发现序列模式和挖掘周期模式。Agrawal 等人[1]首次提出了挖掘频繁序列模式,利用支持度的概念来发现频繁模式,AprioriALL算法也是一种基于Apriori性质的算法,采用逐层搜索的算法来挖掘模式。这篇论文本身还讲了另外基于Apriori的变种序列模式挖掘算法,AprioriSome和DynamicSome。下面将根据这篇论文和结合自己的理解来说明下AprioriAll算法。总体来说,自我感觉这个AprioriAll算法相当于利用了两次前面提到的Apriori算法,中间包含一个频繁项的映射Map。区别在于其支持度的定义有所区分:本文所述的序列模式的支持度是指支持某特定某次的custom数量,而前面提到的关联规则Apriori算法中的支持度是在项集的交易数量上(就是下面的baskets数量)。

tanglei
码农 @ 宜信大数据创新中心, 毕业于CSU && THU, 曾工作于腾讯 && 友盟.   MORE
标签云