胡思乱写

之前被Google+的一些功能吓到了,Nexu里的照片居然自动发布在网上,一度被惊吓。后来发现要点击分享别人才能看得见的。但是那些circle来circle去的东西还是定位太不清晰,还是一种工程师的思维。

一直认为不可能有人能什么都做的。没有定位就等于什么都没有。现下流行的几个社交网络,FB, Linkedin, Twitter, 还有我用得比较少的ASW(a small world),各自都有很清晰的定位。

这几个SNS的功能和群体交集有一些,但是区分度还是很高的。Linkedin的定位是所有的professional contacts,我就永远不会在linkedin上面放一些像FB一样的照片。在FB上得尽量都是一定程度上称得上朋友的,纯business的 contact尽量不加,倒不是有什么见不得人的,只是觉得哪天大家穿得人模狗样的在meeting的时候忽然脑子里冒出对方在趴体中的猛照会觉得很尴尬,呵呵。

twitter主要的群体完全在美国,美国之外的人用twitter的是少之又少。

这三个大的社交网络国内都有copycat版本。人人和优仕比起FB和Linkedin还是有一定的差距,而微博我觉得做得比twitter要好了。

ASW是一个很牛逼的网络,朋友圈子里update的status都是“哎呀,最近看到一艘新的Yacht好喜欢,现在把旧的卖了有人要么”这种status update,呵呵。不过ASW组织的趴体都赞到爆。国内前一阵有人做了一个P1.cn, 照着stureplan.se + sns的模式建的,有点儿ASW的意思,但是用户群体不在一个级别上。

记得校内刚创建的时候看到WX到处各个校园跑推广,05年那会儿见到WX觉得是个nerd。当时对entrepreneurship这件事情认识还是很懵懂,或者说是完全没有概念的,虽然那时年少激情四射,呵呵。WX的几个copy的几个东西在他自己手上一个成功的都没有,个人认为很大程度上是因为那个时候国内还是缺少像Sean Parker和Peter Thiel这样的人物,也缺少像Palo Alto这样的地方。在PA的街头你能嗅到一种创业的味道,所有的人有着一种疯狂的信念。据说这十数年来PA的那条街上累积的VC的投资就有30+billion USD。现在也不见得就有这样的人物了,但是渐渐有李开复这样的人冒出来,加上国家的政策配合。会过一些国内的那些科技园和孵化器的老总,那些政策真是会让人流口水,呵呵。但是氛围确实还是有较大的进步的空间。但是长期下去,只要坚持这个政策,总有一天咱们也会走出一条自己的路的。

Cardinality

在ERP, DW里都出现了cardinality这个单词,REA model里的cardinality是已经弄懂了,可是DW里的cardinality又让人如此迷惑,上wiki查了一下,是一大堆关于数学的东西,而且是玄之又玄的无穷理论,提到了Finite, countable and uncountable sets的概念,其中的countable infinite和incountable infinite很是赞。可是看完了还是云山雾罩。定理是清楚了,可是怎么用还是迷糊,于是搜了下baidu,发现一篇未名的帖子,甚好,甚强巨^^
北大果然高手如云。。。
 
 
 
发信人: newforest (木遥·最后一眼), 信区: Reader
标 题: 长度是怎样炼成的?——无穷、测度及其他 (1)
发信站: 北大未名站 (2006年02月06日15:22:42 星期一)
 
长度是怎样炼成的?

应小乐之请写的一个东西,其目的是为了回答以下问题:

点没有长度和面积,为什么由点组成的线和面会具有长度和面积?
“长度”“面积”这些词汇究竟是在怎样的意义上被使用的?
有的时候我们把点的长度叫做零,有的时候叫做无穷小,这两个称呼是不是都有道理?
无穷个零相加是不是还得零?(其实和第一个问题是一个意思,无穷个点怎么加成线段的?)
等等等等。

当然,小乐的问题是着眼于哲学,而我的回答将会着眼于数学,——我不是学哲学的,但是大概也知道在哲学上这些词汇常常导致混乱的争论,比如芝诺悖论之类。幸运的是,早在一百年前,通过一大批杰出的数学家的努力,以上这些问题已经被精确地给出了解答,这就是在数学中被称为“测度论”的一套理论体系。这里“精确”的意思是说,这套理论体系完全基于形式逻辑,而且只采用了非常少的公理(下面会陈述之),从而,在这套理论中不存在任何模糊或者逻辑上模棱两可之处(除了几个需要加以特别说明的地方=_=!)。换句话说,我们不仅可以认为数学家能够确定无疑的回答以上这些问题,而且可以认为人类在今天能够确定无疑的回答以上这些问题(在承认那些公理的前提下)。

不幸的是,这一断言几乎必然会遭到哲学家的反对。一方面是因为哲学家们倾向于每个人自己创造一组定义,——从我在未名哲学版见过的一系列关于芝诺悖论的讨论来看,这样的结果是所有的论述最终都流于自说自话。另一方面大概也因为学术壁垒的缘故,哲学家们大概从来也没有了解过数学家们已经在此问题上做出过的卓越工作,(确实,很多细节是过于数学化了一点……)。有鉴于此,我答应小乐以尽可能通俗的方式(在不损害准确性的前提下)大致介绍一下测度论的内容。我想在这个版面上大概还会有不少别的朋友对此感兴趣吧。

下面正式开始。

一、关于无穷

当我们使用“无穷”这个词的时候,我们必须时刻谨记,这个词有两种截然不同的意义——不,我这里说的不是亚里士多德关于实无穷和潜无穷的那些绕口令,而是某些重要得多的本质问题,对他们的清晰阐释开始于伟大的德国数学家康托Georg Cantor (1845-1918):当我们说一个集合有无穷多个元素的时候,我们必须指明这里的无穷是哪一种,是“可数无穷”还是“不可数无穷”。虽然都是无穷集合,但是它们会体现出截然不同的性质。

为了说明这一问题,我们引进集合的“势(cardinality)”的概念。简单说来,势就是集合的元素的个数。一个集合有三个元素,我们就称其势为3。两个集合如果元素个数相等,我们就称它们为等势的。——很显然,要判断两个集合是不是等势,只需要看这两个集合之间能不能建立起元素的一一对应即可,如果可以的话,我们就说这两个集合的元素是一样多的。

到这里为止都显得很简单。可是最有趣的部分马上就要出现了:康托指出,不但对于有限个元素的集合我们可以讨论它们的势,对于无穷个元素的集合,我们同样可以讨论它们之间是否等势。换句话说,我们可以讨论两个无穷集合的元素是不是一样多!

之所以如此,是因为集合之间的“一一对应”本质上只是个数学概念,是可以被精确研究的对象(请回忆高中数学课本关于映射的那一章)。从而,随便拿两个集合来,它们之间是否能建立一一对应只是数学上的问题而已。

以下是一些最基本也是最著名的例子和命题,请尽量耐心的阅读。所有这些陈述都是可以基于最简单的形式逻辑给出严格证明的,证明可以在参考文献[1]上查到:

·每一个集合都和它自身等势。

注:废话。

·全体正整数的集合和全体正偶数的集合等势。

注:这是第一个有趣然而迷惑人的结果。我们等于是在说:一个集合可以和它的一部分一样多!——但是这并不是一个悖论。我们通常觉得一个集合不能和它的一部分一样多只是针对有限集合而言的,本来就没人说过无限集合不能和它的一部分一样多,只是有时候大家会不自觉地有这个误解而已。

·全体正整数的集合和全体有理数的集合等势。(什么是有理数来着?查书去!)

注:这是在数学上很重要的一个例子,说明一个实数中的稠密集可以和一个离散集等势,不过大家看到这里大概已经开始打瞌睡了……跳过这个例子!

·全体正整数的集合和全体实数的集合不等势。

注:睁大眼睛,迄今为止最重要的一句话出现了!你永远不可能在全体正整数的集合和全体实数的集合之间建立起一一对应来。对这个陈述的证明是数学上最有趣也最迷人的证明之一,可惜的是篇幅所限我不能在这里证明给大家看。那么只讨论结论好了:并不是所有的无穷集合都是等势的,有一些无穷集合比另一些无穷集合的元素更多,换句话说,无穷之间也是有大小的。

·任给一个无穷集合,我们都能够造出一个集合包含它,而且和它不等势。

注:换句话说,无穷和无穷相比,没有最大,只有更大。——但是请注意,虽然我们能够造出越来越大的无穷集合,但是我们并不真正对那些太大的无穷感兴趣,因为和这个世界没什么关系。

·如果两个集合都和第三个集合等势,那么它们彼此也等势。

注:好像也是废话,但是它引出了下面的重要陈述。

· 有很多集合都和全体正整数的集合等势,从而它们彼此也等势,我们称所有这样的集合为“可数无穷的(countably infinite)”。有很多无穷集合比全体正整数的集合的势更大,我们称所有这样的集合为不可数无穷的(uncountably infinite)。但是,不存在无穷集合的势比全体正整数的集合的势更小。

注:我们待会儿再来讨论为什么起这么两个名字。前面的例子告诉我们,全体正偶数的集合是可数无穷的,全体有理数的集合是可数无穷的,但是全体实数的集合是不可数无穷的。

·在不可数无穷集合中间,有些集合是和全体实数的集合等势的,这些集合被称为“连续统(continuum)”

注:好了,现在我们对全体无穷集合建立了一个简单的分类。最小的一类称为可数无穷集。剩下的都叫不可数无穷集。不可数无穷集里面又有特殊的一类叫作连续统,剩下当然还有一些非连续统的不可数无穷集,但是它们几乎和真实世界没有任何关系,所以忽略之。(有人不愿意忽略它们,非要去研究里面的一些麻烦的问题,于是产生了数学中间最让人头晕的一部分结论,比如什么哥德尔不完全性定理之类……这个定理偏偏还特别著名,很多人都问过我它究竟说的是啥。相信我,你不可能弄明白的。)

也就是说,我们真正关心的是两类特殊的无穷集合,一类称为可数无穷集,一类称为连续统。所有的可数无穷集彼此等势,所有的连续统彼此等势,但是任何可数无穷集和连续统之间不等势,后者总是更大一些……真绕嘴阿。

下面是一些可数无穷集和连续统的例子:

可数无穷集

自然数集,整数集,有理数集。(基本上,如果你在平面上或者直线上随手点无穷个点,并且这些点彼此都不挨着,那么它们的总数就是可数无穷的。但是也存在一些不这么简单的可数无穷集。)

连续统:

实数集,直线上点的个数,平面上点的个数,一个正方形里点的个数,或者简而言之,一切几何对象里的点的个数都是连续统。(这里一个常常被人提到的推论就是直线上的点和平面上的点一样多,——都是连续统那么多。其实证明很简单,但是一言难尽,请查书去。)

好了,现在我们可以讨论这两个名字是怎么来的了。请注意,所有的可数无穷集都是可以和正整数建立起一一对应的,这是什么意思呢?这意味着,我们可以把一个可数无穷集中的每个元素都对应到一个正整数,这相当于给他们编了号码,从而我们可以去数它们(这就是可数这个词的来历)。也就是说,我们可以按照1号、2 号、3号这么一直数下去,虽然总数是无穷的,但是只要我们在理论上一直数完所有的自然数,我们就能真正数遍这个集合的所有元素(至少在想像里是这样)。

而连续统集合却不是这样。一个直线上的点是连续统,这就是说,无论怎么巧妙的给这些点编号,我们都是不可能给所有的点都编上号码然后一个一个的数下去把它们都数完的。它们是“不可数”的。

有人会说,这不是自欺欺人么?反正都是无穷个,反正事实上总也不可能数得完,那么在理论上区分“想像中数得完”和“想像中也数不完”有什么实际意义呢?

有的。正是这一点微妙的差别,使得有些事情我们能够对可数集去做却不能对连续统集合去做,也正是这一点差别,促成了从没有大小的点到有大小的直线和平面之间的巨大的飞跃。

 
另附上一些基本概念阐述 from wiki
 

In mathematics, the cardinality of a set is a measure of the "number of elements of the set". There are two approaches to cardinality – one which compares sets directly using bijections and injections, and another which uses cardinal numbers.

Comparing sets

Two sets A and B have the same cardinality if there exists a bijection, that is, an injective and surjective function, from A to B. For example, the set E = {2, 4, 6, …} of positive even numbers has the same cardinality as the set N = {1, 2, 3, …} of natural numbers, since the function f(n) = 2n is a bijection from N to E.

A set A has cardinality greater than or equal to the cardinality of B if there exists an injective function from B into A. The set A has cardinality strictly greater than the cardinality of B if A has cardinality greater than or equal to the cardinality of B, but A and B do not have the same cardinality. In other words, if there is an injective function from B to A, but no bijective function from B to A. For example, the set R of all real numbers has cardinality strictly greater than the cardinality of the set N of all natural numbers, because the inclusion map i : NR is injective, but it can be shown that there does not exist a bijective function from N to R.

[edit] Finite, countable and uncountable sets

If the axiom of choice holds, the law of trichotomy holds for cardinality. Thus we can make the following definitions:

  • Any set X with cardinality less than that of the natural numbers (|X| < |N|) is said to be a finite set.
  • Any set X that has the same cardinality as the set of the natural numbers (|X| = |N| = ) is said to be a countably infinite set.
  • Any set X with cardinality greater than that of the natural numbers (|X| > |N|, for example |R| = > |N|) is said to be uncountable.

[edit] Infinite sets

Our intuition gained from finite sets breaks down when dealing with infinite sets. In the late nineteenth century Georg Cantor, Gottlob Frege, Richard Dedekind and others rejected the view of Galileo (which derived from Euclid) that the whole cannot be the same size as the part. One example of this is Hilbert’s paradox of the Grand Hotel.

Dedekind simply defined an infinite set as one having the same size as at least one of its "proper" parts; this notion of infinity is called Dedekind infinite.

Cantor introduced the above-mentioned cardinal numbers, and showed that some infinite sets are greater than others. The smallest infinite cardinality is that of the natural numbers ().

[edit] Cardinality of the continuum

One of Cantor’s most important results was that the cardinality of the continuum () is greater than that of the natural numbers (); that is, there are more real numbers R than whole numbers N. Namely, Cantor showed that (see Cantor’s diagonal argument).

The continuum hypothesis states that there is no cardinal number between the cardinality of the reals and the cardinality of the natural numbers, that is, . However, this hypothesis can neither be proved nor disproved within the widely accepted ZFC axiomatic set theory, if ZFC is consistent.

Cardinal arithmetic can be used to show not only that the number of points in a real number line is equal to the number of points in any segment of that line, but that this is equal to the number of points on a plane and, indeed, in any finite-dimensional space. These results are highly counterintuitive, because they imply that there exist proper subsets and proper supersets of an infinite set S that have the same size as S, although S contains elements that do not belong to its subsets, and the supersets of S contain elements that are not included in it.

The first of these results is apparent by considering, for instance, the tangent function, which provides a one-to-one correspondence between the interval [-0.5π, 0.5π] and R (see also Hilbert’s paradox of the Grand Hotel).

The second result was first demonstrated by Cantor in 1878, but it became more apparent in 1890, when Giuseppe Peano introduced the space-filling curves, curved lines that twist and turn enough to fill the whole of any square, or cube, or hypercube, or finite-dimensional space. These curves are not a direct proof that a line has the same number of points as a finite-dimensional space, but they can be easily used to obtain such a proof.

The cardinal equality c2 = c can be demonstrated using cardinal arithmetic: This argument is a condensed version of the notion of interleaving two binary sequences: let be the binary expansion of x and let be the binary expansion of y. Then , the interleaving of the binary expansions, is a well-defined function when x and y have unique binary expansions. Only countably many reals have non-unique binary expansions.

Cantor’s generalized diagonal argument shows that which implies . Here denotes the power set of , the set of all subsets of , and denotes the set of functions from to . Furthermore .

总之就是很牛。。。

交换机,集线器和路由器的区别

首先说HUB,也就是集线器。它的作用可以简单的理解为将一些机器连接起来组成一个局域网。而交换机(又名交换式集线器)作用与集线器大体相同。但是两者在性能上有区别:集线器采用的式共享带宽的工作方式,而交换机是独享带宽。这样在机器很多或数据量很大时,两者将会有比较明显的。而路由器与以上两者有明显区别,它的作用在于连接不同的网段并且找到网络中数据传输最合适的路径 ,可以说一般情况下个人用户需求不大。路由器是产生于交换机之后,就像交换机产生于集线器之后,所以路由器与交换机也有一定联系,并不是完全独立的两种设备。路由器主要克服了交换机不能路由转发数据包的不足。

总的来说,路由器与交换机的主要区别体现在以下几个方面:

(1)工作层次不同

最初的的交换机是工作在OSI/RM开放体系结构的数据链路层,也就是第二层,而路由器一开始就设计工作在OSI模型的网络层。由于交换机工作在OSI的第二层(数据链路层),所以它的工作原理比较简单,而路由器工作在OSI的第三层(网络层),可以得到更多的协议信息,路由器可以做出更加智能的转发决策。

(2)数据转发所依据的对象不同

交换机是利用物理地址或者说MAC地址来确定转发数据的目的地址。而路由器则是利用不同网络的ID号(即IP地址)来确定数据转发的地址。IP地址是在软件中实现的,描述的是设备所在的网络,有时这些第三层的地址也称为协议地址或者网络地址。MAC地址通常是硬件自带的,由网卡生产商来分配的,而且已经固化到了网卡中去,一般来说是不可更改的。而IP地址则通常由网络管理员或系统自动分配。

(3)传统的交换机只能分割冲突域,不能分割广播域;而路由器可以分割广播域

由交换机连接的网段仍属于同一个广播域,广播数据包会在交换机连接的所有网段上传播,在某些情况下会导致通信拥挤和安全漏洞。连接到路由器上的网段会被分配成不同的广播域,广播数据不会穿过路由器。虽然第三层以上交换机具有VLAN功能,也可以分割广播域,但是各子广播域之间是不能通信交流的,它们之间的交流仍然需要路由器。

(4)路由器提供了防火墙的服务

路由器仅仅转发特定地址的数据包,不传送不支持路由协议的数据包传送和未知目标网络数据包的传送,从而可以防止广播风暴。

交换机一般用于LAN-WAN的连接,交换机归于网桥,是数据链路层的设备,有些交换机也可实现第三层的交换。 路由器用于WAN-WAN之间的连接,可以解决异性网络之间转发分组,作用于网络层。他们只是从一条线路上接受输入分组,然后向另一条线路转发。这两条线路可能分属于不同的网络,并采用不同协议。相比较而言,路由器的功能较交换机要强大,但速度相对也慢,价格昂贵,第三层交换机既有交换机线速转发报文能力,又有路由器良好的控制功能,因此得以广泛应用。

目前个人比较多宽带接入方式就是ADSL,因此笔者就ADSL的接入来简单的说明一下。现在购买的ADSL猫大多具有路由功能(很多的时候厂家在出厂时将路由功能屏蔽了,因为电信安装时大多是不启用路由功能的,启用DHCP。打开ADSL的路由功能),如果个人上网或少数几台通过ADSL本身就可以了,如果电脑比较多你只需要再购买一个或多个集线器或者交换机。考虑到如今集线器与交换机的 价格相差十分小,不是特殊的原因,请购买一个交换机。不必去追求高价,因为如今产品同质化十分严重,我最便宜的交换机现在没有任 何问题。给你一个参考报价,建议你购买一个8口的,以满足扩充需求,一般的价格100元左右。接上交换机,所有电脑再接到交换机上就行了。余下所要做的事情就只有把各个机器的网线插入交换机的接口,将猫的网线插入uplink接口。然后设置路由功能,DHCP等, 就可以共享上网了。

看完以上的解说读者应该对交换机、集线器、路由器有了一些了解,目前的使用主要还是以交换机、路由器的组合使用为主,具体的组合方式可根据具体的网络情况和需求来确定

 
老师要求找的材料,哈哈,其实自己对这个也只有个模糊的印象,看了这文章相对清楚不少^^
 

Google搜索在工作上的应用技巧

来自:月光博客
Google良好的搜索和易用性已经得到了广大网友的欢迎,但是除了我们经常使用的Google网站、图像和新闻搜索之外,它还有很多其他搜索功能和搜索技巧。如果我们也能充分利用,必将带来更大的便利。这里我介绍几个很有用的搜索技巧,在平时搜索中可以结合使用。
  一、限定搜索范围的技巧
  1、文件类型
  有时候我们可能不需要搜索网页文件或者图片,我们可能想要搜索其他类型的问题,比如文档文件(Word,Excel,PPT),Flash文件,甚至是Google地图文件,我们都可以使用“filetype”功能来实现。
  比如我想搜索一篇关于最新加密技术的Word论文,使用Google搜索“filetype:doc 加密技术 ”即可得到大量相关信息。我想搜索关于中国的Google Earth卫星图片,那么就在Google中搜索“filetype:kmz china”即可。
  2、指定网站
  有时我们进行网页搜索,想要在某一个指定的网站内搜索感兴趣的内容,这时候我们可以使用“site”功能来限定搜索的网站。
  比如,我想在新浪网上搜索关于世界杯赛程的消息,只需要用Google搜索“site:sina.com.cn 世界杯赛程”即可得到结果。
  如果你想把搜索结果限制在大学的网站之中,可以使用“site:.edu 关键词”。
  通过限定搜索范围的方法,我们可以更快更准确的搜索到我们想要的东西。
  3、其他限定搜索方法
  intitle:搜索关键词(intitle:关键字)只搜索网页标题含有关键词的页面。
  inurl:搜索关键词(intitle:关键字)只搜索网页链接含有关键词的页面。
  intext:搜索关键词(intext:关键字)只搜索网页body标签中的文本含有关键词的页面。
  二、写作辅助小工具
  Google有一些小工具,为我们的日常工作学习提供了很多方便之处。
  1、翻译工具
  Google本身带有中英文翻译的功能,只需输入一个关键词(“翻译”或“fy”任选其一)和要查的中(英)文单词,Google会直接显示您要查的单词的英文(或中文)翻译。
  比如我们想要翻译“香蕉”这个词为英文,那么只需要在Google中搜索“翻译 香蕉”或者“fy 香蕉”,返回的第一条记录就是翻译的结果。同样,我们搜索“fy banana”可以得到这个单词的中文翻译。
  2、学术词典工具
  我们有时候想要知道一个具体词汇的定义,可以使用“翻译”或“define”,接着键入一个空格,然后键入您需要其定义的词。
  比如,我们想要知道氨基酸是什么意思,只需要在Google中搜索“定义 氨基酸”,就可以找到氨基酸的定义。
  三、改进工作效率
  做为一个公司员工,每天都要关注自己公司和竞争对手的最新消息,怎么才能在最短的时间内获得最多的信息呢?Google可以帮助你。
  Google 快讯是Google的新闻定制自动发送,用户可以定制自己需要的内容,Google会在设定的时间内(即时、每天、每周)给用户发送Google最新搜索到的新闻文章,非常方便,我们就可以用这个功能来跟踪自己公司和竞争对手的最新消息。
  例如我是一家做搜索的开发公司,我需要每天关注自己的竞争对手,因此我只要登录:http://www.google.com/alerts?hl=zh-CN,然后在“搜索字词”中输入“Google”,“频率”为每天,即可每天收到关于Google的最新消息,同样在“搜索字词”中输入“百度”,可以获得百度的最新消息。
  当然,搜索关键字不只是公司,开动我们的脑筋,我们可以用这个工具跟踪任何信息,比如输入某个名人的名字,可以追踪这个名人的最新消息和新闻,搜索某个行业名称,可以追踪这个行业的相关新闻,搜索某个新闻事件,可以得到这个事件的最新报道。
  因此,我们只要灵活掌握和运行Google的搜索技巧,那会给自己的工作和学习带来相当大的提升,使得自己的事业能够更上一层楼。