数据科学 – 二项分类法 (binary classification) 在数据科学分析中的应用

数据科学今年来变成越来越热的一个,最近在研究如何在产品开发中运用数据分析,这篇文章主要分享一些我的理解,希望有些实际意义。

图1被称为大数据的文氏图,总结了做数据科学分析需要的技能集合。这张图表面上看起来很容易懂,一个好的数据科学分析要求个人或者团队必须得有三个方面的技能:统计学知识,程序开发能力,行(专)业知识。但是深挖一些,为什么统计学和开发结合就变成机器学习,统计学和专业知识结合就变成传统研究方式,专业知识和编程能力的结合是危险区域,而为什么所谓的“数据科学”需要三者兼备本文主要用具体的例子对这几个知识技能之间的关系做一个解释。

数据科学

图1:数据分析文氏图

统计学在数据分析中的应用

统计学的知识是做数据分析不可缺少的一部分。大部分的知识可能很多人已经还给大学老师了,我在这里举出一个例子关于如何运用统计理论做数据分析,希望能够唤起一些兴趣。

我的例子当中用到的理论有二项分类法(binary classification)和混淆矩阵,名字听起来很厉害,慢慢看,其实很简单,我们说故事,尽量不提公式。

1940年秋到1941年中,作为闪电战的一部分,大量德国战机对英国进行轰炸。在20世纪40年代初,雷达仍是一个正在研发中的绝密技术。英国空军必须基于当时粗糙的雷达信号来做决策以决定是否派战斗机升空拦截德国轰炸机。当时雷达屏幕上的一个模糊点可能是横跨英吉利海峡的轰炸机,可能是随机噪声,也许是一群海鸥,也可能什么都没有。那些决策的人面临的第一大难题:to防or not to防是个深奥的哲学问题,深奥的哲学问题通常都可以由简单地数学问题来解决,这时候二项分类法正式踏上舞台。用白话说,做决策的人只有两种可能得决定可以做:拦截,不拦截。决定拦截,有很大的可能会浪费宝贵的油和各种资源,对本来就紧张的资源雪上加霜;决定不拦截,可能的代价是德军的飞机可能在完全无防守的状态下长驱直入,造成大量的伤亡和损失。人们需要做的是根据雷达的图像和历史数据找出一个决定是否升空拦截的最有效的算法,使得决策的结果损失最小化。

对于雷达上显示的模糊点,我们想知道的是这个点是轰炸机或者不是轰炸机两种可能,让我们暂且把这两个可能性命名为a) 轰炸机和 b) 海鸥。

我们做出的决策也有两种可能:c) 拦截, d) 不拦截。

这时候就出现了四种可能得结果:e)轰炸机来了决策拦截,简称来拦;f)轰炸机来了决策不拦截,简称来却不拦;g)轰炸机没来决策拦截,简称不来却拦,h)轰炸机没有来决策不拦截,简称不来不拦。如表1所示。其中单次事件后果最严重的可能是f,而如果g的数量如果太大也会造成巨大的损失,我们的目的是在这二者之间找一个平衡点来做出最佳决策。

表1

表1 轰炸机和海鸥决策表

如果我们能准确预测轰炸机,那么结果则不是e就是h,那是完美的世界。

面对一个不完美的世界,我们应该如何决策使得综合损失最小?

考虑两种极限情况:

1)我们升空拦截所有可疑的点,那么我们就完全排除了来却不拦的灾难性后果,代价则是大量的虚耗

2)我们完全不管所有可疑的点,我们就完全排除了不来却拦的可能性,代价是可能被炸翻

我们知道,在雷达显示图像中,图像的面积越大,那么它是飞机的可能性越大。这给了我们把这个问题量化的机会。

假设出现20次可疑图像,我们可以把图像按照面积大小排序,见表2。假设有三个是轰炸机(标记成红色),剩下17个不是轰炸机。

Screen Shot 2016-01-14 at 17.55.56

表2:雷达图面积大小排序和轰炸机的数量

在表2中,我们可以做几个试验,1)如果阈值定在90,那我们将会被无防备轰炸2次,错报2次,2)如果阈值定在80,那我们将会被无防备轰炸1次,错报4次,3)如果阈值定在75,则是0次无防备轰炸,错报5次。4)如果阈值定在60,则是0次无防备轰炸,错报9次。如表三所示

Screen Shot 2016-01-14 at 19.32.28

现在我们的问题缩小到如何找出合适的阈值判断是非决定升空拦截,如果单次来却不拦事件和不来却拦的损失是相同的,换句话说,如果一次无防备轰炸跟一次拦截海鸥行动造成的损失是一样的,那么我们自然是选取e跟h合起来最大的数,但是很明显被炸一次和飞机出去遛个弯儿造成的损失是不同的,而这个损失的数额则大致可以通过历史数据来得出被炸一次损失多少钱和飞一次要花多少钱。假设单次来却不拦损失1千万英镑,单次不来却拦损失400万。

至此,设定阈值后,我们知道了计算总的损失需要的四个数据,f)来却不拦次数,g)不来却拦次数,i)单次来却不拦损失, j)单次不来却拦损失。总损失除以事件发生的总次数(20次),就可以算出每个阈值设定造成的总的损失,我们需要做的就是找出这个损失的最小值。在设置成某个阈值的情况下,每次事件的平均损失计算。

平均损失= (f * i + g * j)/20

在前面的三个实验中:

1)阈值90,平均损失=(2*10,000,000 + 2* 4,000,000)/20= 140万

2)阈值80,平均损失=(1*10,000,000 + 4* 4,000,000)/20= 130万

3)阈值75,平均损失=(0*10,000,000 + 5* 4,000,000)/20= 100万

4)阈值60,平均损失=(0*10,000,000 + 9* 4,000,000)/20= 180万

总结一下概念:二项分类系统要求决策的条件是可分等级排序的,通过我们就可以决定一个阈值。所有阈值和阈值之上的事件我们称之为确定的事件,阈值之下的事件成为否定的事件,阈值的决定取决于总开销。

二项分类法中,在选取不同阈值的时候会对混沌矩阵里面各种不同的数值产生影响,我们一方面可以通过调整阈值了解最后的损失是多少,另一方面可以通过调整损失来选择阈值。我们决定阈值大小的基本数学需求就是让事件e)和 h)在四种可能情况中占的比例尽量的大,有个名字叫做ROC曲线(Receiver operating characteristic). 理解了这个基本原理,在各种不同的运用下,我们就可以用各种数学工具来调整系统的各个参数来达到最终的目的。

说完了故事,来看看这个理论在实际中的应用。

首先来看看专业知识+统计学的组合,在医学上人们常常通过检查血液中某项物质含量的指标来诊断患者是否可能患有某种疾病,唐氏综合症为例,技术是无法100%诊断胎儿是否患有该疾病。

1)根据历史数据我们可以知道某个地区患病的比例,2010年的数据,全球唐氏综合症患病概率大约是1/1000

2)我们大致知道血液中某项物质含量的指标越高,得病的可能性越大,如果我们队10000人进行采样,然后按照该物质含量进行排序,我们可以决定从哪一个含量标准开始我们分类为有风险建议用更精密手段检查,假定这个数字是1800

3)根据我们选择的阈值1800,1万人当中我们宣布1800人有风险,8200人无风险。

4)通过更精密的手段检查的时候确定1800人当中有9人时真的阳性。表4是各个数据的综合

5)这里我们同样可以估计每次发生两种错误的风险,运用前文中轰炸机和海鸥的方法来计算总成本和平均成本来确定应该把阈值定在哪里。

这个检测中我们找出了十个患病者当中的9个,这个测试并不算太优秀,也不算太差。这个数值是已知会得病的情况下,该测试者被查出来是阳性的概率,P(阳性|患病)=90%, 混淆矩阵里面叫真阳性率(true positive rate)。然而这个数据可能是医生关心的事情,个人感兴趣的是当被诊断出来是有风险的时候,有多大患病的概率,也就是P(患病|有风险) = 9/1800=0.5%,另一个对于个人有意义的数据是P(阴性|无风险) =8109/8200=98.9%. 对于医生来说,阈值的选择就会影响他告诉首测者根据历史经验受测者根据结果判断得病的概率。

而这个计算可以用简单地贝叶斯分类得出结论,这里不展开说了,大致就是如果知道事件B的发生导致事件A的发生的概率,那么我们就可以算出当事件A发生时事件B发生的概率。数学公式推导如图2所示。

这一套二项分类法几乎可以运用于所有数据分析领域应用。了解了这个统计学原理,我们就可以来看看第二个组合,统计学+程序开发能力,就形成了现代的机器学习(machine learning). 这个部分下次补上。

由于统计学很多理论是反直观的,没有统计学理论做基础,行业知识+程序开发能力的组合则是一个极端危险危险区域,常常会在数据分析上出根本性的错误。

稍微提一下我们如何使用编程+统计+行业知识做数据分析,我们在开发一套线上系统用于招聘过程的筛选,

1)每个通过这个系统的人系统会根据测试的结果和其他多方位信息综合打分,这个分数是可排序的,我们选择一个阈值来决定是让一个人走到下一步

2)招聘的流程最后的步骤会决定那些人可以获得职位。

第一个分类:系统决定某一个人是否合格,第二个分类:某一个人是否被录取。

通过多次对比两组数据我们可以预测出我们系统准确判断的概率,我们系统开发feature的改动是否能提高准确率,降低开销。

关于这部分,有时间展开细说。

关于佛教

#读书笔记#人类简史#关于佛教# 人不分男女老幼,不仅时常受到战争和瘟疫等灾难袭击,还无法免于种种焦虑、沮丧和不满的情绪,似乎这一切都是人生难以避免的事。人类追求财富和权力,获得知识和财富,生儿育女,建起宫殿和房屋。但不论取得多少成就,却仍然无法满足。穷人梦想着要变富,有一百万的想要两百万,有两百万的想要一千万。而且就算真的有钱了、有名了,他们还是不满意,还是有无尽的烦恼和忧虑,无法从生老病死中解脱。至死,一切如梦幻泡影消失,生命就像是毫无意义的追寻。然而,这个轮回该怎样才能跳出?
一切苦难并非来自噩运、社会不公或是神祇的任性,而是出于每个人自己心中的思想模式。

释迦牟尼认为,人遇到事情通常就会产生欲念,而欲念总是会造成不满。遇到不喜欢的事,就想躲开;遇到喜欢的事,就想维持并增加这份愉快。但正因如此,人心就永远不满、永远不安。这点在碰上不悦的时候格外明显,像是感觉疼痛的时候,只要疼痛持续,我们就一直感到不满,用尽办法想要解决。然而,就算是遇上欢乐的事,我们也从不会真正满足,而是一直担心这种欢乐终将结束或是无法再持续或增强。有些人多年来一直在寻找爱情,但等到真的找着了爱情,却还是不满足。有的开始整天担心对方可能会离开;有的又觉得自己太过屈就,应该再找更好的人。(而且,我们也都认识某些人,又担心别人离开,又觉得自己屈就)。

虽然上天可以赐雨,社会机制可以提供公平正义和卫生保健,有好的运气就可以变成百万富翁,但不论如何,我们的基本心态都不会改变。因此,就算是最伟大的国王也无法避免焦虑,得不断逃避着悲伤和痛苦,也总是想要追寻更多的快乐。

释迦牟尼找到一种方法可以跳出这种恶性循环。在事物带来快乐或痛苦的时候,重点是要看清事物的本质,而不是着重在它带来的感受,于是就能不再为此所困。虽然感受悲伤,但不要希望悲伤结束,于是虽然仍有悲伤,也能不再为此而困。即使仍然悲伤,也是一种丰硕的经验。虽然感受快乐,但不要希望快乐继续,于是虽然仍有快乐,也能不失去心中的平静。

但要怎样才能让心里接受事物的本质,而放下种种欲求,知道苦即为苦、乐即为乐?释迦牟尼制定一套冥想的技巧,能够训练心灵感受事物的本质而排除种种欲求。通过训练,心灵专注在“我现在是什么感受?”,而不是问:“为什么是我?”这种境界很难达到,但并非不可能。

释迦牟尼将冥想落实在各种道德规范上,好让信众更能专注在实际的感受,而不会落入各种欲求和幻想之中。他要求信众不杀生、不邪淫、不偷盗,因为这些作为一定会让欲望如野火燎原,而一心追求权力、感官享受或财富。等到这些火焰彻底扑灭,原本的欲求就换成了圆满和寂静,称为涅槃(梵文的原义就是“熄灭”)。达到涅槃,也就是解脱了所有苦痛,能够无比清晰地感受身边的现实,没有什么幻想和幻象。虽然人们很有可能还是会遇到苦痛,但苦痛已经不再能影响他们。毕竟,无欲则无苦。

根据佛教经典,释迦牟尼本人就达到了涅槃,从痛苦中完全解脱。而在这之后他就被称为“佛陀”,意为“觉悟者”。接着,佛陀一生前往各地普传佛法,希望让所有人离苦得乐。佛陀的教诲一言以蔽之:痛苦来自欲望;要从痛苦中解脱,就要放下欲望;而要放下欲望,就必须训练心智,体验事物的本质。

对佛教徒来说,这条“佛法”就是举世皆同的自然法则,“痛苦来自欲望”这件事举世皆同,就像在现代物理里E总是等于MC²。所以,所谓的“佛教徒”,就是相信这条法则,将这条法则落实在一切日常活动中的人。另一方面,是不是信仰某个神灵,对他们来说就不是那么重要。一神论宗教的最高原则是:唯一真神确实存在,那么他想从我这里要什么呢?佛教的最高原则,则是:痛苦确实存在,我该如何逃离呢?

佛教并不否认有神祇存在,认为他们有强大的神通,能够带来降雨和胜利,然而神祇对于“由欲得苦”这条法则并无能为力。如果能够无欲无求,任何神祇都无法让人感到痛苦。相对而言,如果人有了欲望,任何神祇也无法拯救他脱离痛苦。

但也如同一神论的宗教,佛教这种前现代的自然法则宗教还是无法摆脱神祇崇拜。佛教告诉信众,他们应该不断追求达到涅槃境界,不要为了名利停下脚步。然而,99%的佛教徒都无法达到这个境界,而且就算他们一心希望最后能达到这个目标,日常生活里多半都还是追求着世俗的成就。于是,佛教徒还是崇拜着各种神祇,像是在印度的佛教徒拜着印度的神,西藏的佛教徒拜着本教(Bon)的神,日本的佛教徒也拜着神道教的神。

此外,佛教的几个教派也随着时间发展出满天诸佛菩萨。诸佛菩萨是人也非人,他们已经能够达到涅槃、解脱痛苦,但为了解脱和帮助还在轮回中的芸芸众生,倒驾慈航重入世间。所以,佛教徒崇拜的并不是神祇,而是这些已经开悟而尚未成佛的人,除了希望他们协助达到涅槃的境界,也希望他们帮忙处理一些世俗的问题。于是,我们就看到整个东亚有许多佛菩萨得负责降雨、医病,甚至还得保佑杀敌求胜,而信众也虔心祈祷,为他们焚香,献上各色鲜花、稻米和甜品。

宇宙和原子

#学习笔记# 古希腊的哲学家的水平实在是屌炸天,记录两个例子来。第一个问题貌似小时候从我爸那儿听得印象深刻,第二个思考间接让我搞懂了原子弹的原理。具体描述一下,普拉图的一个不是那么出名的同事叫艾尔库塔斯(Archytas)用一个比喻思考宇宙究竟是无限还是有限,一个拿着长矛的勇士,站在宇宙的“边界”,掷出他的长矛,你觉得长矛会怎样?是继续无限飞下去,还是会碰到一个边界?边界的外面又是什么?包含这个边界的容器是什么?从他的逻辑出发考虑,艾尔库塔斯认为宇宙是没有无限的。这个思考对于现代人来讲似乎是家常便饭,2500年前的人的思维能到这种高度不是很惊人么。

再来说第二个思考,和对宇宙边界的思考类似,德谟克利特(Democritus)做了一个相反方向的思考。他提出如果有一把极其锋利的刀,把石头切开成小石头,更小的石头,直到变成沙子。他无法物理上继续试验继续切下去,但是思想上却可以把虚拟的试验继续下去,继续切下去会怎样?对于德谟克利特,这个思想试验只有两个结果,要么你可以无限的把石头切成更小的物质,要么你会达到一个看不见的,不可分割的最基础的本源,德谟克利特认为后者比较符合逻辑,他把这种想象中的东西称为原子(atom)。他甚至还独立分出了气味之类的东西不是由原子决定的,而是另一种属性。这种纯凭逻辑思维加上想象和推导,能够在人类证明原子存在两千年前就作出判断的能力,实在是惊人的很。

我稍微把这个思想试验(thought experiment)拓展了一下,如果硬切原子会怎么样,我猜弹性(抗力)会很大,我脑子中浮现的其实是做得很筋道的撒尿牛丸或者福州鱼丸用筷子硬夹丸子飞起来的画面,哈哈哈。言归正传,也就是说如果硬切,不管成功与否,应该都能产生大量的能量。于是我怀着对现代科技的期望,是不是有一把特别牛逼的刀可以做成这件事满足我的想象。搜了cut atom in half (把原子切成两半),你猜结果出来是什么,原!子!弹!哈哈哈哈哈。

再进一步研究了一下原子弹,链式反应的核裂变制造出来的,通俗的话说就是通过各种手段让原子核产生多米诺骨牌式的持续分裂释放能量,可是限制是只能用比较重的原子(化学术语叫高原子序数)的天生就带有裂变性质的原子来做原料,就是传说中的钚(plutonium),就是电影里各种大魔王爱偷的原材料。

再然后我的好奇心并没有得到满足,想如果硬要分裂不带天生裂变属性的原子会是啥结果,结果就发现氢弹了,哈哈哈。氢原子这么轻的东西需要极大的能量才能对原子结构做出任何改变,那么大的能量从哪儿来?你猜那帮小聪明们是怎么做到的?Bingo!用一个小型原子弹包在外面引爆,就可以引起氢原子的变化,aka氢弹。这个过程人类尚未能控制,于是与核裂变区分,叫做核聚变,也就是太阳工作的原理。氢弹的威力有多大?同质量的氢弹爆炸效果(TNT当量)几乎是原子弹的1000倍以上。从此人类有了自我毁灭的可能性,科~科。

话说我看历史书也能联系到原子弹的原理,真是一个奇怪的思想过程啊。

So, they were strikingly modern

in their views of space and time. They were also asking profound questions,

and two examples will give a sense of this. Plato had a colleague called Archytas. Archytas wondered about the universe. Was it finite or infinite? It’s a dichotomy and it’s very profound. In the analogy he used, he imagined there is a warrior, a spear carrier, who went to the edge of the universe as far as they could travel, and hurled their spear. What do you imagine Archytas said should happen? Should the spear travel forever, and into what? Or will the spear hit a boundary or a barrier or the limit, and then what is that substance, and what’s beyond that substance? So in this logic, Archytas knew that if there was a boundary, or a barrier, or a container, then something

has to contain the container. And so, in his logic, it was more rational to imagine that the universe was infinite. And so in Greek philosophy, at the time, the dominant idea was of an infinite universe.

A hundred or so years later, Democritus made an analogous thought experiment, this time going in the downward direction. He imagined a sharp knife in a stone. You cut the stone into smaller and smaller pebbles until it becomes a grain of sand, and then perhaps you can’t do the experiment,

but you imagine cutting it in half and half and half again, until it’s almost too small to see on the tip of your finger. Now you can’t do the experiment but the thought experiment continues, and how does it end? To Democritus there are only two outcomes. Either you reach a fundamental, invisible,

indivisible object, he called it an atom, or you carry on the process forever generating infinitely small sub-units, and to him it was apart logically that an infinite progression would continue, and so he imagined an indivisible element called an atom. He hypothesized atoms and also inferred that the properties of normal material like its texture, or its smell, or its taste would be secondary properties not held by the individual atoms themselves. Another strikingly modern idea, 2000 years before we had the ability to prove that atoms exist.

运动中如何补充水分

跟能量补充一样,补充水分的最高水平(目标)是让体内的水分和各种电解质保持在一个稳定的水平。换句话说,补充水分和电解质既不能不足,也不能过量,要使得总体上保持摄入略大于消耗量。

听起来很简单,不是么?如果我消耗了2升水,补两升就好了。虽然简单,还是有个坑哦。这个坑就是这两升不能一次补,为了让体内水分和电解质保持稳定状态,假设从事2小时的运动,则应该尽量让这两升尽量平均分配到2个小时中去。

总结成一句话就是摄入必须大于消耗的前提下,使用少量,多次,提前的方法。

后面详解一些理论部分,如果没耐心,记住上面一句话就差不多了。

1)如何确定你需要多少水

每个人的需求是不太一样的,每种运动的需求也是不太一样的,另外天气和环境不同也有较大差别。

有个大致的计算公式,每消耗1卡的热量至少需要1毫升水,在湿热地区,可以随意加到1.5ml/cal. 根据自己的身体也可以往上调整。

用我自己举例,平地跑10公里,大致消耗800-900卡热量,那我至少需要补充800-900毫升的水。

2)如何分配800 ml 水

在开跑之前先喝50-100ml,然后差不多每10分钟补充150ml左右。

人感到口渴时,其实已经轻度脱水,对普通人的运动能力已经造成轻微影响,所以尽量不要等到口渴再喝水

3)失水的级别

轻度脱水:失水量为总体重2%,血容量减少,轻微影响运动能力。症状:口干舌燥,尿量减少,食欲下降。

中度脱水:失水4%,对运动能力有较大影响。症状:免费包括所有轻度脱水症状,附加心率加快,血压下降,体温升高。

重度脱水:失水6%,严重影响运动能力。症状:免费包括所有轻中度脱水症状,附加肌肉抽搐,烦躁不安,甚至出现幻觉。(好像信用卡等级= =*

但是,总是有个但是,跟其他能力一样,对缺水的程度的耐受水平也是可以训练的。高水平的训练可以使很多运动员在失水5%的情况下依然保持几乎不受影响的运动能力。

4)失水的类型

失水有三种类型,等渗性失水,低渗性失水,高渗性失水。学术名记不住就别记了,但是有必要了解一下区别。

等渗:失水和失电解质(主要是钠)的比例相同,细胞内几乎不变,细胞外液(主要是血液,还有血管和细胞间的组织液)减少,细胞内外渗透压正常。

低渗:失电解质比例大于失水。汗液的主要来源是组织液[1],而组织液主要来源是毛细血管中的血液,因此流汗首先影响到的是细胞外液。当身体失去的电解质比例大于水,由于渗透原理,细胞外将会向细胞内运送水分,来平衡细胞内外渗透压。有趣的是如果不是严重失水,低渗性失水由于细胞内不缺水,细胞并不会向大脑发出缺水信号,人并不会感到明显口渴,但是会头晕。

高渗:失水比例大于失电解质。与低渗相反,细胞内会像细胞外输送水分来保持渗透压平衡,人体会出现明显的口干舌燥,嘴唇干裂,严重的会休克。

了解了这个知识时候就要在补水上加一点:不要只喝白水,要注意电解质的平衡。

一些冷知识:

人不吃东西可以活很久,不喝水很容易就挂了。当人体的脂肪和糖全消耗完,蛋白质减少50%时,依然可以存活,失水超过20%就挂了。

人体的供能系统效率并不高,输出的能量只有25%用于做机械功,75%则转化成热能。在距离运动时,必须把多余的热能排出体外以维持体温。

皮肤每蒸发1升汗,带走575卡热量。正常成人一般每天摄入量在1.5 – 2L之间。

[1]All about sweat

和弦的构造

上了三周berkelee的吉他课,感觉收获也太大了,今晚2小时时间,居然把吉他的和弦给弄懂了。
以前说到诶你这个XX和弦,大部分时候是装逼用的可能,今天居然把困惑了几十年的事情给弄明白了,开心。

西方音乐的基础理论大致基于半音,全音,和弦,八度等单位,大致的分类逃不出这几样东西。
首先解释8度的概念:物理解释:每升高一个八度,声音的频率加倍。
每一个八度由12个半音组成,7个全音组成,7个全音的一种表现方式是中国音乐课教的 1 2 3 4 5 6 7 (do re mi fa so la si do),学术上成为唱名。顾名思义,每一个全音应该是2个半音,而一个八度有7个全音却只有12个半音,说明全音其中有两个距离只有一个半音,那就是7个音里面听起来有点儿怪怪并且容易走调的fa和si.

因为结构过于简单,唱名在乐器演奏中基本上用不到,与之相对的,流行音乐中,一般以音名的英文字母来表示音高,就是ABCDEFG,而在7个音中,C一般被认为是最稳定的音,所以最常见的相对音阶1234567一般是CDEFGAB, 也就是说F和C只比E和B高了一个半音。

和弦可以理解为是比全音更高的一个单位。

和弦分很多种,这里只解释一下吉他最常用大三和弦(trichord major),同时演奏三个和谐的音高发出的声音就是和弦,和弦根据它的根音(root sound)来命名,根音一般是演奏和弦的第一个音,例如吉他的低C是在5弦3品。
而对于大调三和弦的定义是:第一个音是根音,第二个音是根音加四个半音(也就是第五个半音),第三个音是根音加上七个半音(也就是第八个半音)。用C大调来举例,C+4半音=E,C+7半音=G,那么吉他的一个C大调就是CEG。由于吉他的六根弦一般可以实现两个八度,所以常见的是把吉他6根弦上所有的CEG都找出来就是一个吉他的全C大调。这里的所有CEG是只针对基本位置(base position),就是吉他的前四品。为什么是前四品,因为人只有四个能用来按所有弦的手指。

下图是一个常见和弦的按弦位置,图中1,2,3只是代表第一,二,三根按弦的手指,依次是食指,中指,拇指。让我们来看看吉他C大调的按弦图,从根音所在的第五根线到第一根弦依次为C, E, G (open), high C, high E. 有时候也会把第六根弦low E加进C和弦,因为E也是C大调三和弦中允许的音,但是如果要强调C和弦的根音,那就可以只弹第五根到第一根弦。如果有兴趣,可以自行Google一下转位(inversion)的概念,吉他一般有个第一转位和第二转位。

下图可以再看一个例子,D大调,第四弦是open D, D+4= F#, D+7=A, 那么D大调就是 D F# A 的循环。图中可以看出D大调可以从第五根弦开始弹,或者如果为了突出根音D,就从第四根弦开始谈。我们可以看出从第五根线到第一根弦依次为:A D A D F#

总结:所有的大调和弦都是以0,0+4,0+7这种规律来计算的 (假设0是根音),那么问题来了,如何确定根音+4和+7分别是多少?后面给了一张很有用的图,可以称之为吉他的半音轮(half step wheel),注意半音轮的断句在半音-轮。半音轮这张图看起来比较复杂,实际非常简单,其实就是之前讲过的,B和E没有升调(sharp),或者换个说法,C和F没有降调(flat)。长远来看,只要你记住了半音轮,加上0, 0+4,0+7,你就可以随意地构造和弦。

再提一下小调三和弦:弄清了大调,小调的规律很简单了,在大调的第一个音和第三个音不变,把第二个音变成0+3,而不是0+4,就变成小调了。 距离,D小调应该是DFA的循环,见下图D minor。

从音质看,总体上大调比较欢乐,小调比较悲伤,这里就不展开了。

L5_open_chord_assignment
常见和弦按法
L03_H-Wheel
半音轮 (half step wheel)

Bartending的基础技能 – 吧台工具

之前几篇关于bartending的写得有深,其实更应该被称为mixology,今天来写写bartending的基础。

上图是一个标准的Gin & Tonic, 在图里面,bartending的几个要素基本上都能看出来:制作方法(mixing method), 酒杯 (serving glass), 冰(ice),装饰(garnish)。再加上一个吧台工具(bar tools),这五个部分每个开一篇,这一系列就可以把bartending的基本要素写完。

吧台工具

工欲善其事,必先利其器,第一部分先讲酒吧的吧台上需要用到的工具。

2013-08-07 11.47.51

上图基本上涵盖了所有酒吧的吧台需要的工具,下面一个一个介绍。

酒嘴(Pouring spout):  酒嘴装在酒瓶上可以在倒酒时不用量杯就可以精确地控制倒出来的量,就是所谓的free pour。好的bartender一般free pour的准确率在95%以上。有些国家甚至有相关法律规定,例如在挪威,如果某个酒吧的酒保不使用量杯,警察会随机抽查,例如要一个4 cl,如果酒保不能精确地倒出4 cl,那酒吧就会被罚款,严重的甚至可以勒令停业。

pouring spout

吧勺( bar spoon):  酒吧的勺子一般是长柄的,头上一般带个小头有捣碎功能,可以用来搅拌或者碾压混合某些不太大的东西。另外吧勺在做分层鸡尾酒的时候是一个很重要的工具。

bar spoon

量杯 (measuring glass): 一般是圆柱形的量杯,大多数以厘升(cl)为单位。还有一种两头分别是两种不同容量的量杯叫做jigger, 一般是一头4cl, 一头2cl,有的是3/5, jigger主要是为了在倒酒的时候不用眼睛去看,倒满了就是想要的体积。

jigger

搅拌棍 (muddler): 搅拌棍主要用来搅拌,碾压。其实在调酒过程中碾压的功能比搅拌更常用,例如Mojito或者Caipirinha之类的。

muddler

过滤器(strainer): 过滤器是一个筛子状金属滤网,主要用来过滤冰碴和调酒过程中混进去的果肉和其他杂质。滤网有粗眼的和细眼的(fine strainer). 对于不加冰的酒,一般需要用到fine strainer. 粗眼的一种是给shaker用的,另一种是给stirring drink用的。

Boston shaker strainer
fine strainer
stirring drink strainer
stirring drink strainer

波士顿摇酒器(Boston shaker): 由两部分组成,下面是一个金属杯子,上面是一个玻璃或者塑料杯。合起来就叫做Boston shaker。如果没有过滤器,一般常用的一个手法是摇好之后玻璃杯和金属杯之间弄个小缝也可以倒。我认识的大部分bartender比较爱用Boston shaker,用起来方便。

boston shaker
Boston shaker

鸡尾酒摇酒器 (Cocktail shaker): 由三部分组成,金属杯子,一个带滤网的头部,还有一个盖子。对普通人来说应该是比较容易用的摇酒器,但是用起来不方便,在摇久了之后很容易头部打不开。

cocktail shaker

搅拌机(blender): 可以用来打冰碴,做冰饮(frozen drinks)的时候用。例如Daiquiri和Margarita都可以做成frozen版本的。

碎冰机(ice crusher): 用来把冰块打成碎冰,如果吧台没有备有现成的碎冰,那么在做mojito之类的鸡尾酒的时候就需要先碎冰。

碎冰机 (ice crusher)

吧台刀 (bar knife): 其实就是小水果刀。

擦丝刀 (Zester): 可以把柑橘属的各种水果擦丝削皮,一般用来做garnish。

zester

下一篇讲鸡尾酒装饰(garnish).

Kebnekaise Classic (KebClassic)登山滑雪赛

Kebnekaise Classic是以瑞典最高峰Kebnekaise命名的比赛,包括高山组和登山滑雪组两个项目,男子组,女子组和男女混合组三个组别,每年4月份在瑞典拉普兰德地区的Kebnekaise山举行,整个赛程都在北极圈内。

几年前冬季在爬Kebnekaise得时候碰巧碰到比赛正在进行,所以其实是想参加挺久了,但是由于各种原因一直错过,这一届的比赛不出意外应该可以参加了。

比赛路线:

高山组和登山滑雪组路线稍微有些不同。高山组的路线技术性稍微强一些,海拔上升也相对多一些,东线有些需要via ferrata上升的路线,大段需要冰川结组保护,总共需要穿过8个冰川。KC是一个2天的比赛,滑雪组第一天上升1800米,第二天上升1450米,高山组第一天上升2700米,第二天上升2800米。

下图是一个滑雪组比赛路线图,红圈是第一日的路线,总共设有六个检查点;蓝三角是第二日的路线,总共设有5个检查点。第一天的比赛起点设在Björling冰川的东面,折向西,滑下南壁,上升至Tolpagorni (图中是萨米拼法Duolbagorni),往东滑下山谷到达STF木屋,再上升到第六点结束。第二天的起点在第一天的终点处,路线多在kebnekaise的东面,略陡。雪况如何现在不太好判断,之前的经验那个季节总体上是顶上硬壳雪比较多,冰川的部分硬冰和大坑多一些,下了冰川粉雪比较多,由于不可能用Huascaran参赛,用Broad peak粉雪的部分估计会痛苦一些,也能滑,今年再去练练用小板滑粉雪技术。

11年在Tolpagorni前。

这个比赛必须组队,最多三人,最少两人,可以性别混合,现在还是独自一人,还需要找合适的队友参赛。

 

Music production

作为一个学过通信工程,对音乐感兴趣,又对录音器材稍微有些涉猎的同学,Berklee开的这门music production的课程上起来觉得太如鱼得水了。

第一课从声音的传播开始说,振幅,频率,然后提了一下录音的基本要点,最后过了一下整个录音系统:麦克风(类型,频率,指向性,摆放位置),线材,平衡和增益,音频接口板,AD/DA转换,拾音器。一下又把整个知识体系连成一片了。

整体来讲,录音是一个输入,混合,输出的过程。

输入是把各种音源加到一起输入到系统中。我们听到的一首完整的歌曲一般由人声和伴奏组成,人声可能又可以分成主音和和声。伴奏的部分就复杂了,可能有各种乐器的声音,电子合成的声音。这些各个小部分在录音中一般称为声音轨道,简称音轨。现代的乐曲的复杂度可能达到数十甚至上百个音轨。

把这些独自收录的音轨合在一起是混合的过程,这一点上跟你在KTV唱歌区别不太大。从录音的角度来看,这个步骤首先要做的是确保各个音源的平衡,强音源和弱音源在混合之前需要根据需求进行平衡。

下图是一个GarageBand的音轨,人声位于第四轨,剩下是伴奏中的各种组成部分。网上找到的伴奏相当于是除了人声之外的虽有其他轨道的混合。

从信号转换的角度来看,录音过程大致是一个从模拟信号转换到数字信号再转换为模拟信号的过程的过程,当然现在很多在混音的第一步直接用现成的数字信号声音。所谓的模拟信号就是咱们人耳朵听到的信号,例如吉他或者钢琴弹奏发出的声音,而电脑对这种信号是无法理解的,而我们需要靠电脑的帮助才能完成各种声音的混合,于是这一步就需要把模拟信号转换成电脑可以理解的数字信号,就是传说中的0和1. 这个转换过程是怎样进行的呢?模拟信号是连续的,而数字信号是离散的(不连续的),那么转换过程中就需要对连续信号进行采样,当采样的数量足够大时,数字信号就可以对模拟信号进行完整的映射。这里就出现一个咱们常见的采样率的概念,例如每一秒的声音(连续)信号,我可以把他平均分成100个点,那么采样率就是100点/秒。工程学上用赫兹定义采样率。那么高音质的代表CD的标准采样率44.1kHz/s是如何计算出来的呢?这个是结合了人耳朵能听到的极限频率范围和香农采样定理(Nyquist–Shannon sampling theorem)计算出来的,绝大多数的人的耳朵能听到的频率范围在20-22000Hz之间,而根据香农的采样定理,做到44.1khz就足够满足一个从模拟到数字的完整映射。用白话说科学真的不是一件太容易的事情,哈。

 

 

关于诺贝尔和平奖

17岁的姑娘马拉拉获得诺贝尔和平奖,引发很多讨论,有一些想法,不吐不快。

什么是诺贝尔和平奖?

假设个人对世界和平的贡献可以量化,贡献绝对值最多的人并不是诺贝尔和平奖想要找的。换句话说诺贝尔和平奖不是根据个人对世界和平作出贡献的绝对量化来颁发的。从本质上来说和平奖是一个“市场推广”工具,一个用来推广颁奖委员会从他们的角度出发想让世界关注的话题。而今年(2014)他们想要让世界关注的点恰好是“女性”,“儿童”, “安全”,“塔利班政权”。举个例子,因为马拉拉获奖本身就是个集聚传播价值的新闻,在看到这个新闻的时候,你可能会顺便搜索一下马拉拉到底是谁,各大媒体都会或多或少做一些相关的背景介绍,于是和马拉拉相关的这些和平奖委员会想让你们关注的话题就会被推送到你的世界,媒体就是这么神奇。我在写,你现在在看,就是这个新闻价值的最好体现。

然后再来看看和平奖的评选机制,获奖人由挪威诺贝尔和平奖评选委员会提名和决定,这个委员会由5个人组成,而这5个人全部都是挪威人, 都是挪威国会议员,并且由挪威国会全权任命[1]。由于高度的同质性,这个委员会天生就不是用来反应全世界人民的意志的,而我们当然也无权以反应全世界人民意志来要求他们。另外由于参与评选的全部都是政客,并且是高度同质性的政客,奖项本身天生带有很强的政治出发点和背景。例如跟巴以冲突相关的获奖者可能就有10多个。

和平奖很多时候的着眼点并不仅仅在过去,还在于未来。在话题受到关注的同时,对未来产生的影响多半就会比较大。例如奥巴马的获奖就是个典型的例子,我都把奖颁给你了,你是不是得对得对和平多做点儿贡献。当然,很多时候人家根本不甩你委员会。

其他的诺贝尔奖

个人认为科学类的诺贝尔奖的意义远超过和平奖,但是对于评选过程一样有较强的主观性,而主观性又根据不可量化程度依次递增。

关于今年的和平奖

马拉拉个人对于世界和平做出的贡献可能并不比任何在世界各地从事维和,慈善,环保的人大。但是如果我们理解诺贝尔奖并不是给给世界和平绝对贡献最大的人,对于整个结果的理解也就容易的多。刨去颁奖委员会的背景,诺贝尔和平奖是一个在某个时间点聚焦大众目光的超级工具。