数据大神这次会押谁?丨数据工匠简报(10.17)

Blog Picture

本周简报将带大家走近两次成功预测美国大选结果的数据大神Nate Silver,看看这个被媒体誉为“算法之神”的男人是如何实现精准预测的。上个月智能聊天机器人 Google Assistant 正式亮相,人们对他的评价如何呢?也让我们一探究竟。另外我们还向大家推荐了一片关于搜索引擎优化的有趣教程,希望大家喜欢。

由 Editor 于 2016 年 10 月 17 日 发布在 数据科学 栏目
阅读全文

短文本主题建模方法

Blog Picture

许多数据分析应用都会涉及到从短文本中提取出潜在的主题,比如微博、短信、日志文件或者评论数据。一方面,提取出潜在的主题有助于下一步的分析,比如情感评分或者文本分类模型。另一方面,短文本数据存在一定的特殊性,我们无法直接用传统的主题模型算法来处理它。

由 Editor 于 2016 年 10 月 13 日 发布在 数据科学 栏目
阅读全文

数据崇拜:记亚马逊实体书店一行丨数析工匠简报(10.10)

Blog Picture

大数据时代的浪潮将如何冲刷当今的实体书店行业?一篇短文带领大家感受一下Amazon的线下数据销售模式。贝耶斯流派如何解读我们日常生活中的不确定性?几个生动的案例也许能够告诉你。另外,本周简报还向大家介绍了一门新语言Elrang,一起看看吧。

由 Editor 于 2016 年 10 月 10 日 发布在 数据科学 栏目
阅读全文

机器学习通用框架

Blog Picture

每个数据科学家每天都要处理成吨的数据,而他们60%~70%的时间都在进行数据清洗和数据格式调整,将原始数据转变为可以用机器学习所识别的形式。

由 Editor 于 2016 年 10 月 09 日 发布在 数据科学 栏目
阅读全文

机器学习系列---Logistic回归:我看你像谁 (下篇)

Blog Picture

书接上回,在我们有了最小二乘法与极大似然估计做基础之后,这样我们就做好了Logistic回归的准备,渐渐的进入到我们的主题Logistic回归。 很多都属于分类的问题了,邮件(垃圾邮件/非垃圾邮件),肿瘤(良性/恶性)。二分类问题,可以用如下形式来定义它: y∈{0,1},其中0属于负例,1属于正例。 现在来构造一种状态,一个向量来代表肿瘤(良性/恶性)和肿瘤大小的关系。

由 Editor 于 2016 年 09 月 29 日 发布在 数据科学 栏目
阅读全文