技术元素-技术元素-5

技术元素-5

待M相关部门刚刚公布了一种描绘学科之间关系的新方法，它描绘的是点击而非链接。这个程序通过读取提供在线文献M务(现今最受欢迎的获取文献的方式) 的服务器根目录，记录下研究人员从一篇文献跳到另一篇文献的点击过程。随后通过绘制这些点击过程（这次绘制包含了 10亿个点击过程）来厘清文献间由用户激发出的关系。下面是一张最新的科学知识联系图：矿t un两举生产伊99t*?Dx ‘ ?v农掣?丄阁注：科学知识联系图?。按照这篇文章作者们的观点，与引文分析法相比，点击流的优点在于它能给出引文的实时图景，且范围更大。他们着重指出：“已记录的文献间相互点击量已远多于现有文献引用量。”我一直在思考谷歌以及搜索引擎的未来。很显然，互联网上点击量多于链接量。也就是说，相比于做链接，人们更常做的是直接点击。然而，就我所知， PR值以及其他的搜索索引排名算法主要还是依据权重链接的数量。将大众在网站中点击的智慧包含进来不是更好吗？如果把点击流和链接图相结合会怎样？我想谷歌是不是已经这么做了？现在如此多的网站都在运行谷歌的ADsense (和 Analytics)分析软件，谷歌应该知道人们点击一个页面的频率以及人们从何处点击到这个页面，现在点击在PR排名中究竟起作用了没有？我从谷歌一名副总裁IP儿得到了对于我的问题的答复：“搜索质量是基于PR 值和‘信息检索得分’（IR)的综合得分，而IR分值则考虑了点击（和用户感兴趣的其■标)。”换句话说，没错，谷歌的确将点击纳入了其创造知识图景的过程之中。点击量将会继续领先链接量，因此我期望未来越来越多的互联网结构会依靠点击而非链接来决定。2009年3月16日①此图的清晰版和相关文献可参考以下网站：http ： //g/articfe/lnfo ： doi/10.1371 /ne.0004803NO SEARCH NEUTRALITY, PLEASE 拜托，搜索中立不可能要做到公平，一直是件难事。在许多人能做出多种选择的体系中，公平通常不可能实现。肯尼斯?阿罗（Kenneth Arrow )是诺贝尔经济学奖得主，他提出了阿罗不可能定理（Airow Paradox),即，排名投票系统本质上不可能做到公平。更准确地说，这条定理是指，如果一个投票系统试图对三个或以上的候选人进行排名，就不可能同时优化投票公平性的不同方面。这有点像老话说的 “快，便宜，好一两个任意挑”，因为无法同时满足全部三项。从数学角度来看，对三个以上候选人进行排序时，无论是确保每张投票都有相同的权重，或保证每个结果都有相等的出现机会，还是釆用其他公正排名的标准，都必然会对公平的某些方面造成损害。每一种搜索算法也是在进行排序选择，对于它所排序的一些信息来源来说，同样自来就不公平。无论是哪个搜索引擎，Bing也好，Ask也罢，抑或谷歌乃至还未发明出来的搜索引擎，返回的排序结果不可能满足公平的所有维度。在某些方面它有所偏倚，就像投票系统会偏向某些方向一样。尽管如此，我们仍然想要公平和中立。在当今生活中，搜索既是一个不可或缺的服务，也是一个非常大的业务领域。新闻、商务和个人身份都经由搜索引擎过滤，自由原则也要间接通过搜索引擎来体现。搜索引擎的权力可能被滥用。这在中国已经发生，而我们也能够在理论上想象这种可能。如果一个搜索算法本身就是有偏好的，那么是否有办法能让它变得更中立呢？有许许多多的人都对谷歌的搜索弓I擎霸主地位感到不安。他们看到了搜索弓I 擎的偏见本质。其中有些是商人，他们的生计受到谷歌算法的影响；还有一些是关注谷歌主导地位的活动家、权威人士或学者。詹姆斯?格里梅尔曼（James Grimmelmann)在一篇很长、很清晰（以及非常具有质疑精神)的科技论文中，对关于建立搜索引擎“中立性”这一问题的最好论点进行了整理。他将这些论点精炼成了8个建议性搜索中立原则：1.平等性（Equality):搜索引擎根本不应区分对待各个网站。2.客观性（Objectivity):搜索结果有正确与钱误之分，搜索引擎应该只返回正确的结果。3.倾向性（Bias):搜索引擎不应歪曲信息图景。4.流量原則（Traffic):依靠访客浏览量生存的网站不应被搜索釘擎排除。5.相关性（Relevance):搜索结果应最大限度满足用户的需求。6.自身利益（Seft-imerest):搜索引擎不应利用自身利益谋利。7.透明原則（Transparency):搜索引擎应该公开其网页排名的算法。8.控制原則（Manipulation)：搜索引擎应只根据一般规則对网站进行排名，而不应依据个人标准将网站排名升级和降级。在我看来，这些要求似乎非常合理。接着，格里梅尔曼抛出了他的反驳论点可以想见，这八条原則都不可能成为健全的搜索监管的基础。他更进一步阐述表示:虽然搜索中立的各原則并不一致，但这并不表示搜索引擎有权无视反垄断、知识产权和隱私保护或其他法律，杨行无阻。搜索引擎有能力做出卑劣的行径：据《商业周刊》妝4)报道，中国搜索引擎百度公然对网站进行勒索，如果企业不买百度的广告，它便把企业网站的排名降级。搜索引擎能做出什么可怕的事情，不乏恐怖先例。我的看法就是，目前所提出的搜索中立可行性很低，并很可能使情况变得更糟。从其对搜索中立的定义上看，它没有实现自己的初衷。接着，他逐一驳斥了上述每一条原则，我在这里进行了总结：1.平等性——“谷歌当然会对不同网站区别对待——正因此，我们才去使用它。系统性地偏好某些类型的内容，对于搜索引擎来说并非缺陷——而是其意义之所在2.客观性——不存在客观性。“搜索引擎用户形形色色。他们抱着非常个人的髙语境目标。一种搜索结果不可能放之四海而皆准……谁能说雅虎就是对的，谷歌就是错的？那同样也可以认为谷歌的低排名是对的，雅虎的高排名有问题。”3.倾向性——整个网络就是有所偏倚的。“搜索引擎优化，互链作坊①(Link Farm),垃圾博客评论，黑客攻击一你能想得出，就有人做得出，且都假以提高搜索排名之名。一个完全无形的搜索引擎，不引入新的价值观或自己的偏见，那么它也只会复制网络本身所潜藏的倾向性：极度商业化，垃圾信息多得吓人。4.流量原则——网站无权过问流量或排名如果搜索引擎认为某个网站对用户来说不可取，那么它就可以改变这个网站的排名。“搜索引擎的主观性意味着，不同搜索引擎的结果经常会彼此相左，这也意味着，同一个搜索引擎的结果也会随时间变化而不同。”5.相关性——搜索引擎通过主观选择提髙返回结果对于用户的相关性，它们并非根据网站的偏好，而是在搜索引擎认为用户想要什么的基础上，降低或提高网站排名。“搜索引擎争相向用户提供相关的搜索结果；搜索引擎之所以存在，只是因为它们能够提供有偏好的搜索结果。”离开用户范畴，相关性便难以定义，更难以检验，而且毫无用处。6.自身利益——为自身利益影响搜索结果，这倒很有可能存在；有时确实会发生。垄断性的假公济私行为也非常可能发生。“搜索引擎批评家认为，搜索引擎应该披露与排名决定有关的商业关系。这是一个标准而明智的政策回应。” 但是格里梅尔曼表示，“这并非中立性原则，也不是仅存在于搜索业务领域；这只是完善的法律规范的自然施行。”7.透明原则——出发点是好的，但执行起来问题多多。如果箅法完全透明，就会被垃圾信息制作者利用，甚至出现更糟的可能，捜索引擎也就形同虚设 To如果针对他们透明开放，而他们不大可能快速调整以保护创新。“一切都取决于监管机构对搜索算法中小细节的意义的评估能力o而从监管机构和法院其他数字技术领域的监管历史记录来看，搜索引擎自行评估的前景并不乐观。”8.控制原则一似乎是坏事，但“所有搜索引擎都被控制着，而且越巧妙越好。”人们所担心的实际上是“人为操纵”或人工干预，或特殊待遇。“谷歌非常不愿意透露自己是否或何时会针对个体修改排名。”垃圾邮件发送者应该受到 “特殊待遇”吗？ “完全禁止本地操作会妨碍搜索引擎迅速关闭漏洞并惩治利用漏洞的人。”总之，格里梅尔曼称，搜索引擎也存在不可能定理。搜索引擎更重视用户而非网站，这对于一些网站来说，可能显得不公平。搜索中立的争论中有一点非常正确：搜索关乎用户自主权。与任何其他通信技术相比，一个好的搜索引擎对用户的利益更敏感……搜索中立的争论中提出了一个正确的问题——结构性力量是否会削弱搜索引擎提升用户自主权的能力？——搜索中立拥护者更关注对网站的保护，而非对用户的保护。然而令人不安的是，网站通常并非用户朋友。有时候他们是用户的朋友，但更多时候它们只是需要访问者，并愿意不择手段留住他们。谷歌并不中立。它也永远不会中立，Bing和其他任何搜索引擎也一样。只要谷歌仍然把用户置于排名网站的商业利益之上，只要谷歌在有利于用户的_ 上合麵求自身的商业利益，那么其^中立性就会让搜索引擎和用户皆大欢喜。2011年4月12曰①互链作坊(LinkFarm)：通过创建一^堆砌大量链接而没有实质内容的网页，这些链接彼此互链或指向特定网站，以增加被链接网站的外部链接数置，由此欺骗搜索弓丨擎蜘蛛程序，为目标网站获得更高的链接广度，从而提升搜索引擎排名。②詹姆斯?格里梅尔曼的原文将受到搜索引擎排名的网站与实体企业相类比，并举例：一些曼哈顿居民会乘坐宜家（IKEA)的免费班车前往宜家布鲁克林店，并在宜家附近的快餐餐车买东西吃。但如果宜家停运这条班车线路或者迁移店址，那么这些餐车店主也无权抱怨。搜素引擎就相当于宜家，网站则相当于这些快餐店。THE GOOGLE WAY OF SCIENCE 谷歌式科学一个巨大的以PB级计数的信息数据库曙光般的出现，足以改变我们学习的方式。科研工作的传统方式需要构造一个符合已有数据的假说，或者依靠这个假说来寻找新数据。现在这个数据库里有大量观测数据，为了让我们能够展开下阶段的观测，什么理论能充分地解释它们呢？可被证实的是，数量惊人的数据足以跳过理论部分进行预测观察。谷歌是首先注意到这一现象的。以谷歌的拼写检查为例，当你用谷歌搜索的过程中出现拼写错误时，它会给出拼写正确的搜索建议。谷歌是如何知道你要写什么词并预测其正确拼写方式的呢？这并不是因为它有正确拼写的理论或掌握了拼写规则，事实上，谷歌对拼写规则一无所知。相反，谷歌运行的是一个非常庞大的数据库，该数据库显示的是任何单词的给定拼写观测数据，这些数据记载了诸如多少人在想说“yes”的时候意图拼写字母“y”之类的数据。谷歌的拼写引擎完全由这些数据点而非英文的正确拼写概念构成，这也是同一系统可以纠正任何语种拼写锴误的原因。事实上，这个通过研究海量数据的理念被谷歌运用在了其翻译项目中。通过匹配大量人工翻译材料，谷歌翻译可以进行英译法、德译汉。例如，在训练其法英翻译引擎时，谷歌录入了大量英法双语版的加拿大文件。谷歌翻译引擎没有语言理论知识，尤其是法语，也没有人工智能翻译，相反，它们有的是不计其数的数据点，这些数据点聚集了各语言之间由此及彼的数据链接。一旦你调整好这个翻译系统，它就可以将一种语言翻译为另一种语言，而且翻译效果还不错一虽然还没到翻译家的水平，但起码也能翻出要点。当你访问一个中文网站的时候，你能知道在英文中它大概是什么意思。谷歌研发负责人彼得?诺维格（Peter Norvig)曾经对我吹嘘道：“我们中文翻译引擎的相关工作人员中，没有一个会说中文。”整个翻译工作与中文理论和对中文的理解毫无关联，重要的只有数据。（如果有人在找希尔勒的“中文房间”（Chinese room)的反证，这里就有一个。)如果你可以学会如何拼写一种语言，却对其拼写规则和语法一无所知;如果你能学会如何翻译几种语言，却缺乏所译语种语法的理论和概念；那么，在这种缺乏理论的情况下，你还能学会什么呢？在本月《连线》杂志的封面文章中，克里斯?安德森探索了这样的想法：也许你可以在对理论一无所知的情况下搞科学。在当下的世界中，大量的数据和应用数学取代了能够旅加的其他每种工具。涵盖了从语言学到社会学的一切人类行为理论。忘记那些分类学、本体论和心理学吧，谁知道人为什么在做他们所做的事情呢？重点在于他们在做这些事情，而且我们可以以前所未有的高准确度追踪和测量它们。在教据面前，那些数字自己会说话。以PB计數的数据允许我们放言：“我们已经掌握了足够的关联。”我们可以伴止寻找模型，我们可以直接分析數据而不必再假设它显示些什么，我们可以把数字投入世界上最大的计算机群，让统计概算去发现其中科学不能发现的模式。这个观测可能有点道理。许多科学，诸如天文学、物理学、基因组学、语言学和地质学，目前都生成了极其庞大的数据组和稳定的、以PB计的数据流，未来十年间它们将以EB计数。使用老式的“机器学习能力”，计算机可以在数据的海洋中提取各种模式，而人类却没有任何在其中检测模式的能力，而这些模式正是关联。这些观测也许能引起关联，也许并不能，但我们可以从中学到新东西。因此，虽然没有遵从传统方式，但它们能够胜任科学所做的事情。安德森的上述建议实际上意在表明足够关联的有效性。关联同样适用于医疗保健，大量诊治是建立在相关方法之上的。医生可能无法确定或理解患者致病的真正原因，但他（她）能够正确推测病因并治疗病症。这样的做法科学吗？你可以解决问题，但如果你没有建模的话，人们还能寄希望于这种解决问题的方式吗？上述问题的答案我们尚不知晓。这种方法的科技术语是“数据密集型可扩展运算”（DISC)，还可以用其他术语表述为“网格数据结构”或“千兆级数据密集型运算”。这些技术的重点在运算的数据密集型本质，而非集群计算本身。在线业内人士称此种研究方法为“分析法”，诸如谷歌、IBM、雅虎这样的云计算公司及部分高校已经就此方法组建了工作室进行研讨，这些技术先锋试图从根本上利用云计算或统一体机器来进行大规模科研。目前在用的工具多为大规模并行软件平台，包括像MapRednce和Hadoop,它们可以进行廉价存储，且拥有庞大集群的数据中心。到目前为止，除基因组学之外，很少有科学家采用这些新工具。NSF的集群探索计划的意图在于把那些拥有大型数据基础驱动观测的科学家，与那些具有计算机联网或云计算相关知识和专长的计算机科学家相匹配。我的猜测是，这种新兴方法在科学方法的演进过程中将是一种额外工具。它并不会取代任何现有方法（不好意思，科学是永无止尽的），但它必将推动建立理论导向的科学。让我们把这种数据密集型解决问题的方法称为“相关性分析”。我认为克里斯?安德森将其论题命名为“理论的终点”是在浪费一个独一无二的机会，因为“理论的终点”是个否定概念，是某物的缺失。相反，这应该是某物的开始，当你用一个正面的名字命名某物的时候，这也是一个加速其面世的机会。一个非否定的命名将有益于阐明论题。我建议将之命名为“相关性分析”，它比“没有理论”要好，因为我也不能完全肯定这些相关系统不需要模型。我觉得在系统中有个新兴的、无意识的隐含模型，它会生成答案。即便谷歌中文房间的英语工作人员中，没有一个人知道任何中文理论，我们也仍然认为其中是含有理论因素的。模型可能超越系统创造者的认知和理解，而且既然它在运行，那也就没有究其根本的必要。它就在那里，用一种我们无法企及的水平运行着。模型的“隐形”与其运作毫无关联。它并非理论的终点，而是我们已知理论的终点。作为对克里斯?安德森文章的回应，乔治?戴森的表述可能更为清晰：长久以来，我们一直沉迷于这样一个观点，即人类大脑在某种程度上包含着现实世界的“模型”，一旦类似“模型”被编入人工智能，它将拥有同样功能。“模型”是什么？它包含两个要素：1)能运转的物；2)我们能理解的物。不管是GenBank还是谷歌，这些大型的、分散式的、PB级的创造，都正在试图用运转得还不错、但我们不必了解的方式把握着现实世界。就算把大脑拆到神经元都不剩，我们也找不到“模型”到底在哪。即便如此，真正的人工智能也将应运而生。它并不需要诛源不断的模型或智力理轮现实世界已经解决这些问題了。在任何可能的定义下，“超维”（或类似凯文的“统一体机器”之类的东西）正在开始思考，尽管这既不意味着它在以我们的思维方式进行思考，也不等于我们能够理解它的思维方式。克里斯?安德森暗示的是，能够从事科学（以及杰出的商业）的人，将不仅能够直接读懂自然，同时还能找出路径读懂超维。集中成千上万的数据点，用统一体机器运算并给出相关答案，乔治?戴森所建议的这种新方法不单可用于科研，同时也可被视为与新型科学家沟通的方法^这些新型科学家可以在我们无法掌控的超计数学领域的抽象水平上创建模型。迄今为止，相关性分析或者谷歌式科学主要被应用于诸如语言翻译、市场行销之类拥有庞大数据的领域，我们的集体在线生活正是这无法计算的数据的来源。随着我们对自然的观察和测量达到全天候，随着各种传感器和探头的激增和实时监测的展开，科学也将进入超计数学领域，并可被相关性分析的新工具轻而易举地处理。在这个新领域中，我们会得到一些我们不理解但可解决问题的答案——这些答案是局部认知吗？抑或是一种不同的认知？也许“认知”和“结果”都高估了数字科学。传言巴勃罗?毕加索（Pablo Picasso)曾这样说过：“计算机的问题在于它只给你结果。”这些数据驱动的庞大关联系统会给出很多结果——当然它们都是好的~但这也是它们唯一能给我们的东西。“给我们好答案”正是超级电脑所做的事情。在云计算的未来世界，完美的答案将成为一种商品，而问些好问题则成为非数字科学的唯一价值。2008年6月28曰UPCREATION 上行创造上行仓!l造（upcreation)是我创造的术语，用于描述宇宙中复杂结构奇特、深奥而又神秘的呈现方式。我所说的复杂结构是指星系、恒星、行星、生命、脱氧核糖核酸（DNA)、白蚁穴土丘、热带雨林、人类心智，还有.互联网。这些复杂事物倾向于以我们宽泛地称为自组织的方式从更简单的系统（气体云、分子池、通信节点）中“涌现”出来。但在合适的环境下，自组织往往也能理所当然地被称为自我创造。不依靠外界因素，各个组成部分凝聚成一个新组织，引入一个此前从未有过的“涌现”层级或自我。因为复杂事物新的涌现层级包含而不是破坏了先前的“低”层级组织，我把这种更髙层级的自我创造称为“上行创造”。一组实体把自己提升到一个新实体的新组织层级。从这个角度看，脱氧核糖核酸化学“上行创造” 了生命，生命又上行创造心智，而心智则可能上行创造出超级心智。上行创造也以较小的增量进行：蜜蜂上行创造蜂巢，原生生物上行创造多细胞组织，珊瑚上行创造珊糊礁，顾客上行创造市场，网络冲浪者上行创造谷歌的PageRank算法然而，尽管过去这种涌现通常以一种近于被动的方式“发生”，我们人类还是希望能够让它根据指令恰好出现。我们想上行创造人工心智和人工生命。然而，结果令我们大失所望，上行创造非常难以模仿。出于某些目的，比如在电脑中创造类人的人工智能，将一个系统的复杂性提升一个级别，到目前为止完全失败。困难的很大一部分原因在于，我们并不怎么了解涌现期间究竟发生了什么。创造一个新层级意味着什么？我们如何识别出一个层级？它的前提又是什么？这些问题都很古老，范围也很大。复杂性的弧线延伸到宇宙学?领域，贯穿整个生物世界，并延伸到技术领域。如果我们理解了上行创造的动力学，我们就能更好地运用技术更经常地进行上行创造。或者至少我们能够为其预备前提条件。但是科学还没有关于上行创造的能全面应用于宇宙学、生物学、人类学、进化、计算机科学或数学的可靠理论。只有二十几种来自不同科学领域的专业理论在上行创造的不同方面有所斩获。下面的列表是统一上行创造学的第一步。我从化学、物理学、生物学、宇宙学、数学、社会学、哲学和计算机科学领域借用了这些思想。每一个概念都完全适用于一个狭窄的调查区间。但是我还是被其反复出现的主题和并行概念所迷住，我相信所有这些概念都是为了达到一个相似目标：解释上行创造的发生原理。我在此把它们集中起来，目的是表明，就像盲人摸象一样，它们都在描述同一种现象。上测造学金发姑娘状态一如果系统的物理参数在一个非常狭窄的区间外发生变化，这个上行创造系统可能会崩溃。许多创造性力量运行在一个合适的临界值上，不能太多，也不能太少。相变)②m,这是一^帮助追踪和筐理个人健康数据的网站。LIFELOGGING, AN INEVITABILITY 记录生命日志，一种必然趋势记录生命日志的目标是：把一个人生命中所有的信息记录和归档。这包括所有的文字、所有的视觉信息、所有的音频、所有接触过的媒体活动，以及一个人身体的传感器上所获得的全部生命数据。归档和保存这些信息对生命日志记录者本身是有好处的，并且他（她）可以自行控制，来决定多大程度上与别人分享这些信息。至少对于某些人来说，某种形式上事无巨细的全部记录是不可避免的；对于其他人来说，部分记录和部分回忆看起来也是不可避免的。我们都倾向于把我们生活中越来越多的东西记录下来。生命日志记录的极端形式现在看起来还有些疯狂。如果你认真地记录生命，你需要用微型相机来记录你看到的一切，从早到晚，你的计算机需要保存你的每一个操作，所有的电子邮件、电话和谈话都被保存并且彼此关联；你还需要追踪自己身处何处，你身上装着几十个纳米传感器记录着你的生命体怔。然而，你可能是唯——个看到所有这些信息的人。这有点像疯狂的自我监控。记录你生命中每一刻的技术细节现在已经完全可行了。十年后，它也会很便宜。但是，它带来的社会、法律、道德和文化后果，是扭曲的、怪异的、不可预知的、彻底的、有争议的，并且还有些惊心动魄。一份生命日志将提供如下好处：?生命体征的全天候监测，如体温、心率、血压以及生物药品是否留存。这些數据可以充当一种预警系统，并作为诊断疾病和开具药物处方的个人数据库。?你见过的人、你有过的谈话、你去过的地方、你参加的活动的数字记忆。这些记忆能够被搜索、检索和共享。?你的工作和娱乐、你的工作习惯的完整归档。对你一举一动进行深入比较分析，可以协助提高你的工作效率、创造力和消费力。?一个组织、塑造和“读取”自己生活的方式。如果这种生命日志在某种程度上被共享，这些信息存档可以被利用来帮助他人的工作，扩大社会交往，并且在生物领域，共享医疗记录可以迅速推进新药的发现。截至2007年，数十人已经尝试使用过生命日志。上世纪80年代中期，我遇到了特德?尼尔森（Ted Nelson),他是我遇到的第一个使用生命日志的人。他记录自己的每次谈话，无论身在何处，无论谈话是否重要。据我所知，他的存档从来没有人访问过，甚至包括他自己。在20世纪90年代，麻省理工学院的史蒂夫?曼（Steve Mann)为自己装上了头戴摄像头，并用录像带来记录他的日常生活。但因为有一个摄像头半遮住了他的脸，人们在他周围很难保持自然。微软研究院的戈登?贝尔（Gordon Bell)从20_开始已经记录了他工作和生活的方方面面，迄今已经阵。他这个实验项目叫做“我的生活片段”（My Life Bits)。贝尔在他的脖子上戴了一个特殊的照相机一SenseCam0数码相机。这个相机可以检测到人身体发出的热量，一旦有人靠近，就把这个人拍摄下来。或者如果它检测到光线有变化，也会把新到的地方抓拍下来。贝尔会记录并且保存他每次的电脑击键、每封电子邮件、每一次电话交谈笔录、每次面对面交谈，当然也包括他拍的每张照片、他看的每部电影、他访问的每个网站、他电脑上的每个窗口以及这些窗口打开了多长时间~他把他所能够记录的任何_都——记录下来。在过去两年，哥伦比亚大学电子工程系的副教授丹尼尔? P.W. ?埃利斯 (Daniel P.W. Ellis),用音频的方式（音频版本的生命日志）记录了他的生活。(一张DVD光盘可以装下2周的生活中的声音。）麻省理工学院媒体实验室的亚历克斯?彭特兰（Alex Pentland)建造了一个“社会视界”，他记录了81个志愿者连续9个月的行踪，并且追踪了他们对话的样式。（简而言之，他们发现，如果你观察人们在城市里生活和工作的方式，你会发现很难将这个行为方式，同部落放牧和觅食行为区分开来。)在麻省理工学院读书的时候，布拉德?利罗德（Bradley Rhodes)发明了一个“追忆代理人”，它“关注你键入的一切。每隔几秒钟就会检査硬盘驱动器，看它是否能找到任何相关的信息。如果它找到了，就会在屏幕的角落显示相关文档中的一两行内容提醒你。”那么，生命日志记录工作做得如何呢？记者克莱夫?汤普逊（Clive Thompson)参观了戈登?贝尔的“我的生活片段”实验室，并且待了一段时间。他为《快公司》杂志撰写了一篇报告，很好地说明了记录生命曰志是什么感觉。尽管有很多机器的部件，M尔的虚拟记忆和我想象的并不完全一样。当我最初听到他的工作，我希望他能让我精神一振，我希望他就像某种把自己改装成半个机器人的学者一样，在回忆中大获全胜……可是现在“我的生活片段”非常庞大，它面临了信息管理的一个经典问题：搜索极其困难。贝尔经常发现自己在信息的丛林中迷失。他想查找一封电子邮件，但是却找不到。他想查找一个文件，但怎么也找不到。我们在旧金山吃午饭的时候，他告诉我他艮喜欢一篇关于保罗?克鲁格曼②的专栏文章，我让他找给我看。这个过程就像拔牙一般：在“我的生活片段”里查找“保罗?克鲁格曼”，找到了几十篇专栏文章，贝尔却无法从这些结果里筛选出他说的那篇文幸。当我问他要一位同事的电话录音，他又遇到一个程序错误：他可以找到的文件的名称，但点击它时，數据竟“玩忽职守”不翼而飞。“这个该死的电话录音到底在哪里？ ”他嘟囔着，不停敲击着键盘。“要么什么也找不到，要么找到的东西太多了！ ”2006年的冬天，斯科特?卡尔森（Scott Carlson )在（高等教育纪事》(Chronicle of Higher Education )上发表了他用数字音頻磁带记录生活的实验。"我的妻子也是一名记者，实验的第一个星期，她禁止我在家中录音，因为她说我表现得就像我“在舞台上表演” 一样。我也注意到了这点。我从来没有其正忘掉录音机的存在，时不时的，我会感觉到自己说话有所异样，好像我在对人群说话一样。我有意识地田避说一些可能被视为政治上不正确或彻头彻尾很荒唐的东西。有时候这样的话还是扰口而出，并且被我的扩展存储器记录下来。”克莱夫?汤普逊在文章里继续写道:在2004年春天，贝尔的同事吉姆?格默尔（JimGcmmell)去失了自己的一部分记忆。这位微软的高级研究员建有自己的“我的生活片段”教据库，像贝尔一样，他用大量的电子邮件、上网记录和图片填满了自己的數据库。但是有一天，格默尔的硬盘驱动器崩潰了，他已经有4个月没有备份。当他恢复运行“我的生活片段”的时候，他的记忆中的滿洞已经很明显了，这让他更加痛苦。他在进行某个項目的工作时，依稀记得一些重要的网站或文件，然后开始努力查找，才发现那段时间里的文件都丢失了。“这就像我的回忆被盧了，”他说，他惊讶地意识到这个“备份的大脑”对他来说不再是个新奇的玩意儿，而是他的心理棄覌的一个常规的组成部分。“我意识到，我现在有些依箱它了。这就像我依賴开车和使用抽水马桶一样。”记录生命日志还没有准备好迎来黄金时期。今天，记录生命日志的工具还很少见。你现在还买不到微软的SenseCam。但有一个很烂的Web 2.0诺基亚网站叫Lifelog,不过这仅仅是一个花哨的博客网站。还有一个有趣的应用叫TimeSnapper,每隔几分钟会为你的电脑截屏，并允许你快速查看一周精选。你可以把网站、电子邮件、备忘录、PDF文件和其他数字文件扔进 DEVONthink,这是一个电子联想记忆应用软件，但信息的输入需要很多精力。谷歌的免费邮箱Gmail承诺了永久保存电子邮件，这是消费者现在实际使用的最接近生命曰志记录的工具了。在2007年3月号的（科学美国人杂志上，戈登?贝另一项技术挑战将是确保用户的数字文件存储在数十年后仍然能够打开。我们已经遇到了很多我们无法打开文件的情况，因为这些文件的格式已经过时了。数字档案馆将不断把资料转換成最新格式的文件，在某些情况下，他们可能需要运行旧格式模拟器来检索数据。一个小的行业可能因此出现，只是为了不会因为格式演进而丢失信息。尽管如此，首先需要关注的还是如何读取、检索和使用这个巨大的、由你生活产生的数据海洋——我说的是，非常巨大。有一个解决方案我觉得非常合理，但是在生命日志记录的讨论中却不常被提到。1?年前，计算机科学家大卫?盖勒特纳（David Gelertner)为日益增长的个人数据设想了一个新的组织比喻。生活日志记录不应该以对话框和窗口的形式表现出来，而更应该用生活的记录、时间轴、按时间顺序记录一个人生活。“我们希望从人造信息的存储方案变成一种更为自然的储存方案。像时间轴表、年表、日记、日刊、剪贴簿这样的观念，更古老、更自然。比起电子文件夹上下分层的观念，这种观念更植根于人类文化和历史。”盖勒特纳把他这种新视角叫做生活流。有一段时间，他领导了一家叫镜技术 (Mirror Technologies)的创业公司，这个软件的测试版曾可以下载，但现在好像下载不到了。然而，他的想法仍然是合理的，在我看来，这也是最有可能成为生命日志记录的模式。在Sim公司的计算机记者对他的采访中，他阐发道：我可以这么想象，把我生命中的所有电子信息都收集成束，这就相当于一个流动着的信息流。每一个电子文件：电子邮件、照片、草稿、网址、音频、视頻、日历或地址，等等。生命是时间中的一系列事件，是一个有着过去、现在和未来的时间线。你生活的事件、记录这些事件的记忆，并不是分成一个一个包裒分门别类放到文件夹里或者放在作了标记的鞋盒里。信息束把所有类型的文件都放在一个（可以聚焦的）束里。这样的话，如果再次问道：“我把那条信息放在哪儿了？ ”，那么只有一个确切的答案：它在我的信息束里。信息流有过去、现在和未来。未来流入现在再浼入过去。如果我在信息浼的“未来”部分，设置了一个预约或提醒，最终它会自动流到现在，我会注意到它，并且被提醒；它们接着流向“过去”，成为永久的、可搜索的、可浏览的存档的一部分。当我获得一条新的“现实生活”信息（相对于电子信息来说）个阳光明媚的午后在红鹦鹉餐厅外面与掩丽莎的对话的记忆——我不需要为这段记忆命名，也不需要把它放在一个目录里。我可以使用记忆里的任何东西作为检索关键词。（当我想起了梅丽莎、或者阳光明媚的午后的红鹦鹉餐厅，我就会记起这件事情。）同理，对于电子信息，我也不应该专门去为它命名，或者把它放在一个文件夹里，我应该可以使用任何东西作为关键字来检索到它。我们认为未来用户将不再在意操作系统或电脑；他们只会在意自己和其他人的信息流。我可以随意调整我的信息流。不管我身处何处，都可以使用我的信息流。我可以把别人的信息流和我的信息流混合在一起——只要我有权跟使用其它人的信息流。我自己的个人信息流，我电子化了的生命故事，也可以和别的信息流混合在一起—— 我参与的群体和组织的信息流。最终，像是报纸和杂志之类的信息流也混合到了我的信息流之中。只要观察这些信息流的流动，我就可以知道我自己的生活，我所属的组织的生活，以及新闻，等等。—旦记录生命日志变得普及，一个非常有趣的时代将被开启。一系列法_ 文化的困境也会立刻随之浮现。?你生活的哪一部分是别人的隐私？?用你大脑记住一个场景与用相机记录的有什么不同？?政府能够调取你的生命日志吗？?可以重现全部回忆，这一点公平吗？?我可以收回和你的某段谈话吗？?如果有一个字与记录不同，它算是谎言吗？?我们的生物记忆有多么精确？?没有你孩子的“许可”，你可以记录他们的生命日志吗？对许多怀疑论者来说，生命日志的记录会遭遇社会的挑战，这会让它注定只被很少部分人使用，甚至会受到全面禁止。他们不希望有无处不在的生命日志记录，一旦他们看到记录生命日志，他们会比任何人都觉得它行不通。在釆访斯科特?卡尔森（Scott Carlson)的时候，用音频记录生命日志的丹尼尔? P.W. ?埃利斯承认你知道，我得到的反应大多是相当强烈，而且大多比较否定。和我讨论过的人中大约有50%立即表达了否定的反应，他们却往往很难真正解释反对的原因。记忆已经可以记录他们所说的话了，现在有一些东西可以更详细地记录他们所说的话，这一点让他们有一种强烈的直觉想要抗拒。”我相信，我们会设定一些社会规范来进行引导，什么时候生命H志记录是合适的，什么时候是不合适的。但对大部分情况来说，全面的记录将会变得很普遍，就像现在的文本一样普遍。它将会是无处不在的，我们甚至不会注意到它——除非在它消失的时候。2007年2月21曰①微软英国剑桥研究院开发的HSenseCam”是一台具有超广角鱼眼镜头的全自动拍摄的数码相机，使用者可以选择每三十秒自拍一张，或者通过内置的光热传感器，在环境有所变化时再进行拍摄。②保罗?克鲁格曼(PaulKrugman)美国经济学家，普林斯顿大学教授，《组约时报》专栏作家， 2008年诺贝尔经济学奖获得者。THE ART OF ENDLESS UPGRADES 无尽升级的艺术刚结婚的时候我和妻子搬入了现在这套房子，那时候我得对这房子进行一系列的填嵌工作。我找了些在地铁里宣传说能保证20年不漏水的硅质填嵌材料。当时我想，这事还是划算的，起码我以后再也不用干这活儿了。20年以后怎么样呢？那些硅质填嵌材料眼看着就磨损碎裂甚至脱落了。我这才意识到，20年听起来再长远，它也并不等于永恒。现在我快60岁了，我可以察觉此生很多看似持久事物的衰败，出人意料的东西包括沥青、铁器或者石头，它们都不能永存。我们可以想到的那些最持久的东西，甚至我们脚下的地球，在这60年间都发生了明显的变化。我家房后的小山慢慢滑到了房侧，百年以后树根将拱毁地基。你很快就会意识到制造长存千年之物的尝试是不可能完成的，因为那需要持续不断地使用各种秩序和能量，以与破坏已造之物的日常熵数相抗衡。上述问题我思考了整整60年，但最近我顿悟了：所有事物无一例外地需要附加能量和秩序来维持自身。活物如是，那些诸如石碑、铁柱、铜管、碎石路甚至一张纸这样的无生命体也一样，如果缺乏关注、维修以及追加的额外保养，它们都将无法长久地存在。生命即维护。一直以来，最让我吃惊的是软件所需的纯维修董。维持一个网站或一个软件程序的正常运转就像维护一艘在海上运行的游艇，它所需要的关注就像一个无止尽的黑洞。我差不多可以理解机械设备运行一段时间后必须熄火的原因：水汽会使金属生镑，空气会氧化设备表膜，润滑油也会蒸发……所有这些都需要检修。但我从来没有想过无形世界的位次也要降格。突破什么？显然，突破一切。这里有个给年轻人的消息：垃圾秘密聚积，薯片悄悄变软，程序暗中崩溃。这些事情都是自发的，与你毫无关联。接下来出现的是来自那些不断变化的数字景观的突袭。当你周围所有的东西都在升级，都在尝试新行为、寻找新漏洞的时候，这就给网站和必要的维护造成了巨大的压力~电许你并不想升级，但你又必须得这么做，因为你周围的一切都在升级。像军备竞赛似的升级波及到我们的私人生活。它完全改变了我对于升级的态度：过去我总是心不甘情不愿地挨到最后一分钟才升级——东西还能用的时候为什么要升级？这个态度带来的麻烦大家都很熟悉：你刚升级好这个，突然发现那个东西也得升级，然后这事就变得没完没了，小范围的微调就能极具破坏性。但随着我们个人科技越发复杂、越发互相依附、越来越像一个个人生态系统，拖延升级就越发具有破坏性。因此，现在我把升级当成一种维护，这么做是为了生存下来。未来的科技生活将是一系列无休止的升级。期待将生命消耗在升级中是一种生活技能，学校应该专门开班授课。事实上，我个人就十分乐意学习如何更好地自行维护我的数字生态系统。一定会有能使我们更好地升级数字生活的禅艺的。2011年4月16日RADICAL OPTIMISM 极端乐观主义我是这个世界上活着的最乐观的人之一。我真心相信每天世界在很多方面都在变得更好。不过昨天晚上我参加了一个宴会，竟然遇到了一个比我更加极端乐观的人。看来在乐观这个问题上，我还有空间可以成长！马特?里德雷（Matt Ridley )在“恒今基金会”的长线思考论坛上做了一个题为“深度乐观主义”的演讲。在最近出版的《理性乐观派》这本书里，他分析说，人类的文化不是由语言活动创造的（常规都这么认为），而是由思想的交流创造的。这个理论有些道理，但并不弹眼落睛。里德雷有一个更大的论题，比这个更加激进也更掷地有声，他认为进步是真实的、持续的、到处如此，而且近期来看，进步是无限的。换句话说，文明作为一个整体正在（并且已经）经历了真实的进步，在很多维度上都是如此，不仅仅是特权阶级，大多数人都在经历着进步。而且这样的好事没有丝毫要停下来的迹象。并不只是物质财富在不断增长。我认为，里德雷主要的贡献和深刻见解在于，人类生活的软性维度上，我们也可以看到确凿无疑的进步。我们变得更健康、更干净、更聪明、更善良、更快乐以及更平和。不是“也许”或者“差不多”，而是确凿无疑。他有数据来支持每个方面的结论。我正巧也赞同他的观点，我在自己的研究里也得出类似的结论。我原本猜想里德雷一直就是一个乐观主义者，但是他说，并不是。在20世纪80年代和90年代早期，他是一个典形的忧天悯人的环保主义者。之后作为一个记者，他幵始查阅很多资料，他开始怀疑所谓即将来临的“世界末日”①（Armageddon )。他也阅读了朱利安?西蒙（Julian Simon)的《终极资源》（Ultimate Resource )。这本书为里德雷的质疑提供了一个框架。(西蒙认为所有的物质资源都是可以替代的。当资源开始耗尽或者制造成本变得昂贵时，我们会找到替代品。唯一不可替代的资源——所谓终极的资源是人类的智慧。智慧越多越好。)在“深度乐观主义”的演讲中，里德雷用一个案例全方位解说了进步，他的案例条理清晰、完整并且全面到让人惊讶。里德雷找了一个最容易具象理解的衡量标准：获得固定收益所需要花费的工作时间每年都在变少。比方说，夜晚1小时的人工照明。1800年的时候，一般要劳动6个小时才能买得起可以用1小时的蜡烛，所以劳动人民很少会去购买。到了 1880年，需要工作15分钟才能买得起点1个小时灯所需要的煤油。1950年，8秒钟的工作就可以支付一个电灯1个小时所需要的电力。1997年，只需要半秒种——一眨眼工夫——的工作，就可以让一盏荧光灯亮上一个小时。除了里德雷之外，还有其他一些极端乐观主义者也传布着“进步是真实” 的讯息，比如已故的朱利安?西蒙自己或者雷?库兹韦尔和比约恩?朗伯格 (Bjorn Lomborg )0但是里德雷不像库兹韦尔那样“技术近视”，库兹韦尔主要关注技术的发展，里德雷并没有流露出他这种“技术奇点论式<2)”的狂喜。比起西蒙，里德雷能在更多领域中拿出更多坚实的证据来证实进步的存在。虽然我承认朗伯格也比较严谨，但是我认为里德雷比朗伯格预想并且承认了更多已知的问题。里德雷还有一种记者的才能，他把一个极端的想法（“所有的东西都随着时间不断变得更好。”)表述得让普通的西方人都觉得很有道理。你也许不会完全认同他，但是你至少可以接触一下他的想法。关于进步的好消息在很多地方都可以看到，但是我们常常没有留意到。《纽约时报》曾经刊登过一个关于进步的图表，这个图表来自经济学家査尔斯?肯尼（Charles Kenny )，他最近出版了一本新书《变得更好》（及e“er )。在《外交政策》(Fore/gw/^/icy)杂志的一篇文章中肯尼写道，事情从未像现在那么好，他并不是在开玩笑：虽然有很多问題，但是21世纪的前10年事实上是人类历史上最好的时期。比起以前任何时候，更多的人都过着更好、更健康、更和平、更繁荣的生活。1990年，差不多有一半的世界人口生活费低于每天1美元。到了2007年，这个比例缩减到了28%，现在这个比例还会ISH氐。发展中国家营养不良的人口比例从1970年的34%降低到2008年的17%,虽然这段时间同时也是全球食品价格的高点。农业生产力也是如此，持续攀高：从2000年到2008年，发展中国家的谷物产量埽速差不多是人口增速的两倍。像津巴布韦这样的地方还是面临饥荒，但是几亿的人口每天都能吃到更多东西一并且能吃得更好。武装冲突的數量及其死亡率在冷战结束后持续隊低。世界范围来看，从2000年到2008年战争伤亡降低了40%。在撒哈拉沙漢以南的非洲地区，2000年大约有46000人死于战火，2008年这一数字减少到了6000。军费开支占国内生产总值的比例大概只有1990年水平的一半。在欧洲，最近被划分成两个武装阵营，每年的军备预算从1988年的7440亿美元降低到2009年的4240亿美元。我们并没有更早的统计资料，所以并不能确定无疑地说这是史上最和平的十年，但从人均暴力死亡数这个标准来看，最近十年的确是过去50年中最低的。如果你可以选择生活在历史上的某个时期，那么21世纪的最初这十年无疑是最好的选择。更多人的生活都比以前有更多自由，并且更安全、更长寿、更富有。现在，几十亿人还可以在Twitter上面发布好消息。还有一些极端乐观主义的要点并没有在里德雷的演讲里提到，但他在书和谈话当中进行了强调：1)乐观主义不是单纯基于乐观情绪（里德雷说他并不是情鑰上的乐现)。它是，