Breezedeus

算法优化世界

一个PPT:关于语言模型的压缩方法

PPT免费下载地址。 这个ppt来自于我最近的一次分享,主要介绍了语言模型里常用的各种压缩方法,如剪枝、量化和最新的随机化方法等等,希望对一些朋友有所帮助。

一个PPT:关于概率分布、最大似然估计(MLE)和最大后验估计(MAP)

PPT免费下载地址。 这个ppt来源于我的一次分享,主要目的是希望用简单易懂的方法引入一些统计和机器学习里常用的概念,所以里面讲的东西都很基础。 主要内容为:利用掷硬币和掷骰子介绍了一些常用的分布,并且从中引入了最大似然估计(MLE)、最大后验估计(MAP)以及共轭先验的概念;最后详细介绍了正态分布的各种性质,以及与之相关的中心极限定理。

Bagging, Boosting & Random Forests

这几种技术通常对高度非线性的模型(如树)比较管用,对线性模型可能无效。 Bagging(bootstrap aggregation的缩写)的本质想法是平均很多有噪音但无偏的模型,以便达到降低模型方差的作用。所以bagging技术比较适合用于树模型。利用Bagging技术最终获得的模型,其偏差与单个模型(identically distributed,简记为i.d.)的偏差相同。 ...

《Head First Data Analysis》笔记

第一章:数据分析介绍 数据分析的基本四步骤: 定义(Define):定义你的问题。只有在明确你的问题后,你才有方向指导你分析数据。如果你不清楚你的问题,你应该让你的客户帮助你进一步明晰问题。 拆解(Disassemble):把你的问题和数据拆解称多个小块。当你明确了你的问题后,你应该把这个问题拆解成多个可解决的小问题,然后通过逐个解决小问题以便最终解决你的大问题。把原始问题拆解...

设计模式汇总

蝇量(Flyweight)模式: 当一个应用中需要某个类的很多实例,而这些实例能被同一方法控制时,我们可以使用蝇量模式。它将许多“虚拟”对象的状态集中管理,可以减少运行时对象实例的个数,节省内存。但缺点是,一旦你实现了它,单个的逻辑实例将无法拥有独立而不同的行为。 适配器(Adapter)模式: 当程序中需要的接口与我们实现的类的接口不一致时,为了避免修改已有程序,我们可以把实现的类适配成...

Google.cn淡出历史舞台

今天的 google.cn 已经实质性不存在了,它已经变成了 google.com.hk 。

为什么镜子会使人左右颠倒,却不会上下颠倒?

先看看上面的那幅镜子图,其中有个明显的错误,你能找出来吗? 再来看看这篇文章题目里的问题。这个问题在网上很多地方都被讨论过,我看到的常见的解释有: 人的眼睛是左右对称的; 人是左右对称的。 首先肯定不是因为人的眼睛是左右对称的,因为你遮住一只眼睛看镜子里还是那个你。第二个解释也只是说到了皮毛,而不是本质。 题目中的问题本身提得就有问题。镜子其实压根就不会什么左右颠倒,...

《资本传奇•徐新》随记

花旗银行前亚太地区总裁夏宝罗给出的一个融资的先后次序,让创业者自己掂量:”融资的次序很重要,第一阶段一定是自有资金。你认为这么好,自己都不肯掏钱,别人怎么肯相信你,这是第一点。第二点你要先有成功的迹象,人家是跟你共赢,不是跟你共输,所以你要先做出成绩来,这是第一阶段。第二阶段,找战略合作伙伴。这时候如果找风险投资人或者银行,他们都不会理你,因为还没有成绩拿出来,没有成绩就是高风险。所以这时需...

说说中国的计划生育政策

现在很多农村的生育政策是这样的:如果第一胎是男孩,则不准再生;如果第一胎是女孩,则可以再生第二胎;如果第二胎是男孩,则不准再生,反之则可以再生第三胎;此规矩一直继续下去,直到总共生了n个孩子(很多地方n=3),则不论第n个孩子是男是女,都不允许再生。 以前一直觉得这种政策会让女孩的出生人数高于男孩(可能我自己就希望事实是这样),后来看了一道google的题目才知道这种直觉是错误的。如果假设...