男人≈机器人？王思聪抽奖，和你需要了解的算法真相

在微博世界里，2018年无疑是王思聪年。
然而，击碎微博的，有可能也是王思聪。

简而言之，王思聪IG夺冠庆祝抽奖在11月11日开奖了，细心网友发现中奖的113人里，只有一个人微博用户标记为男生，其余全部都是女生。

还不止，这个唯一标记为男性的微博用户，平时的微博画风也是很妹子的。

同时，这113个用户里，有78%使用的是苹果手机。

结果令人震惊，网友们开始推测微博抽奖平台是否隐藏着什么规则。

于是，有聪明的网友做了一个试验，试图用微博自己的规则来证明自己的漏洞：

用微博抽奖平台发起抽奖，鼓励大家转发，建议用户记住转发时已有的转发数量；
在转发达到一个确定数字时开奖，设置中奖人数>转发人数，理论上转发全员皆可中奖；
如果并非如此，那么不言自明。

果然结果不出意料。1.5万人转发，开奖人数为2万，理论上应该是全员中奖，但最终开出来结果中奖者是9413人。

不仅如此，网友们还发现，最近的大型抽奖活动，中奖者也都为女性：

苏宁手机抽15人，15女0男
天猫抽10人清空购物车，10女0男
IG夺冠抽113人，112女1男
天猫锦鲤，女
中国锦鲤，女

对此，新浪微博CEO王高飞（@来去之间）的解释是，为了避免抽到中奖机器人，会对用户进行一个辨别，平时只转发不原创，不爱发图，不活跃的，等等等等，会被认为是疑似机器人，也就被筛出去了…

所以照新浪的说法，喜欢默默潜水，偶尔转发、活跃度不高的的用户，其中包括众多男性用户，就被这样所谓“降权”了。

网友很愤怒，出于对公平和透明的失望和价值观的破碎。

我认为，这样一件事情其实并不仅仅简单地归结于不公平，或者是利润为先价值观。我们需要了解的是，算法在解决越来越多难题的同时，也接管了人类让渡的部分裁判权。

美国的数据科学家凯西·奥尼尔在自己的一次TED演讲中，非常清晰地聚焦并坦陈了隐藏在算法的秘密。

（数据科学家，mathbabe.org的博主。博士毕业于哈佛大学，主修数学专业。）

算法无处不在

算法将人群区分开来，简单来说分为成功者和失败者，更复杂的就是深度的细分。在这样一种区分下，“成功者”得到好处，也许是一个更好的工作机会，或者是一个很好的会员优惠计划；而“失败者”可能一无所获，甚至连面试的机会都没有，或者要为保险付出更多的保费。

凯西称之为“不理解的秘密公式”。

（天猫88VIP计划，淘气值1000分以上可以88元购买，而不到的用户需要付出10倍的价格）

算法并不神秘，我们每一个人都常常在生活中用到它。大家熟悉的统筹法，其实也是一种算法的应用，只是我们没有把它写成书面的代码而已。

基本上，建立算法需要两个元素：

数据，例如过去发生的事情
对于“成功“的定义，即你希望得到的东西和实现的目标

通过观察和学习，你能够更加理解算法，找出与成功相关的因素。关键在于，当你在负责这样一件事情的时候，你就可以让自己的意见变得重要。也就是说，你定义了“成功”。

算法是嵌在代码中的观点

了解这一点，就理解了微博抽奖本身运用了算法来筛选并给部分用户降权，是内部权衡了让商家使用抽奖（不能每次抽奖都出现一堆僵尸号）和公平（每个用户的权重一致，无论是不是僵尸号）的结果。

这个观点与很多人对算法的看法不同。

大家通常会认为算法是客观、真实和科学的，因为数据是客观的。但大家没有意识到的是，规则在对数据的结果起作用。

凯西把它称之为，为了让你信任和恐惧算法的营销手段。

为什么对算法既信任又恐惧，因为人们信任和恐惧数学。因此，当对数据盲目信任时，结果就有可能出现错误。凯西举了一个例子，用来说明这一点。

2011年，美国一位被学校和学生都予以好评的老师沙拉·委索奇被解雇了。原因是它任教班级的阅读和数学成绩没有实现预期增长。而得出这个结论的，是一个叫做“IMPACT”的教师评价系统。

这个系统是华盛顿特区从2007年开始使用的，目的是用来进行教育改革，它通过琳琅满目的指标和一个极其复杂的回归方程，组成一个“增值模型”，自动为每位教师打分并决定其命运。

更加糟糕的是，纽约邮报提出了“信息自由法”的要求，得到所有老师的名字与他们的分数，并且他们以羞辱老师的方式发表了这些数据。

当得知这件事情后，凯西想去试图分析这个公式，但她发现居然没有人有权利获得这个公式。然而，一个名叫加里.鲁宾斯坦的聪明人，从纽约时报的数据中找出了665个教师，将他们的得分做成图表，得出了以下的样子：

（如果没有人解释，这看上去更像是一个随机数生成器，但它的确是被使用并且决定了很多人的命运。）

所以，算法是一种工具，它在使用的时候不可避免地被加入了观点和态度，如果轻率、盲目地、或者是利益驱使地运用算法，不会让事情变得公平，它只会重复过去的做法和规律，然后让现状自动化。

偏见可以被注入算法中

我们都是有偏见的，无论是性别、年龄、种族、地域、财富…不管是否承认，都或多或少地存在于我们对一件事情或者一个人的判断中。对此社会学家已经做了大量的试验证明了这一点。

我们这样就不难了解，微博在筛选中奖用户的时候，已经把“合格”、“有效”的定义写进了规则中。这个定义是谁来规定的？也许是通过记录用户行为、也许是分析购买记录、也许是参考第三方资料，但无论怎样，它肯定是带有一定倾向的结果。这本身就是一个私有公司为了经营目的建立的私有算法。

算法整个远比这些说的要复杂得多。但当你参与到了其中，例如你参与到了微博抽奖平台的某一次抽奖中，你就已经进入到了它制定的规则环境里。网友们被伤害了感情，因为这种筛选方式如果放在现实中，就是一种赤裸裸地舞弊，而在线上，它穿上了一件不透明的外衣。

算法创造者的责任

我们生活在这样一个越来越依赖“算法”的时代，它的应用在诸多领域极大地推动着人类社会的进步。因此，我们更加需要富有社会责任感的企业，认真地考虑算法的长期结果和正在产生的反馈循环。

往小的方面说，我们在线上媒体上的浏览记录，将影响着接下来我们看到的些什么，因为我们的“兴趣”在不停地被分析中，这些依赖并不会引起非常大的危机。

但当涉及到重大的事件，我们期望的是具有社会责任感的企业和数据科学家们，不应该成为真相的仲裁者，而应该成为大社会中所发生的道德讨论的翻译者。

而其余的我们，需要更主动地去了解世界发生了什么，主动问责，而不是被动地接受。

以及，学好数学。

更多有价值的资讯，欢迎关注远韬科技。

远韬科技——致力于数字化转型和品牌价值传递

我们坚信

Value shall be paid for

我们希望

与用心做产品、认真树品牌的企业同行和共赢