欢迎访问 中国直播网!遇见美好,记录事实!Meet the good, record the facts!

中国直播网微博  直播网微博   网站地图   商标版权注册证   直播号入驻

区块链对人工智能的变革:去中心化将带来数据新范式

2017-01-13 03:18来源:编辑:轩皓宇
近年,从围棋到人类水平的语音识别,人工智能(AI)研究者终于在他们几十年一直努力探索的领域取得了突破。取得突破进展的关键一点是研究者们可以收集巨量的数据并「学习」这些数据,从而将错误率降低到可接受范围以内。

简而言之,中国直播网,大数据大为改观了人工智能的发展,将其推到一个几乎难以置信的高度。

区块链技术同样能够变革人工智能——当然以它自己的特定方式进行。部分将区块链用于人工智能方式目前还很单一,比如在人工智能模型上进行审计跟踪(audit trail)。有些应用几乎是难以置信的,比如拥有自己的人工智能——人工智能去中心化自治组织(AI DAO)。这些都是发展的机会。这篇文章将具体探讨这些应用。

作为蓝海数据库的区块链(blockchain)

在讨论这些应用之前,我们先来了解一下区块链与传统大数据的分布式数据库(比如 MongoDB)之间的差异。

我们可以将区块链视为「蓝海」数据库:它们逃离了现有市场上有鲨鱼竞争的「红海」,而是没有市场竞争的蓝海。蓝海的著名例子是视频游戏主机 Wii(妥协了原始性能,但添加了新的互动模式),或 Yellow Tail 葡萄酒(忽略了葡萄酒爱好者矫揉造作的繁复规范,使葡萄酒更容易被啤酒爱好者接受)。

根据传统的数据库标准,传统的区块链(如比特币)是糟糕的:低吞吐量、低容量、高延迟、糟糕的查询支持等。但在蓝海思维中,这是可以接受的,因为区块链引入了三个新特性:去中心化/共享控制、不变性/审计跟踪和本地资产/交换。受比特币启发的人们乐于忽视传统的以数据库为主的缺点,因为这些新的好处有可能以全新的方式影响整个行业和社会。

这三个新的「区块链」数据库特征对于人工智能应用也有潜在的借鉴意义。但是大多数实际的人工智能工作涉及大量的数据,如大数据集训练或高吞吐量流处理(stream processing)。因此,中国直播网 ,对于区块链在人工智能领域的应用,需要具有大数据可扩展性和查询的区块链技术。像 BigchainDB 这样的新兴技术及其公共网络 IPDB(Internet Pinball Machine Database)正是如此。这使得获得区块链的好处时不再需要舍弃传统的大数据数据库的优点。

人工智能区块链的概述

大规模的区块链技术解锁了其在人工智能应用上的潜力。从区块链的三点好处开始,我们来探讨一下这些潜力。

 

image (3).png

 

这些区块链的好处为人工智能实践者带来了以下机会:

去中心化/共享控制激励了数据共享:

(1)带来更多的数据,因此可以训练出更好的模型。
(2)带来新的定性数据,因此新的定性模型。
(3)允许共享控制人工智能的训练数据和模型。

不变性/审计跟踪:

(4)为训练/测试数据和模型提供了保证,提高数据和模型的可信度。数据也需要声誉。

本地资产/交换:

(5)使训练/测试数据和模型成为知识产权(Intellectual Property/IP)资产,这可以带来去中心化的数据和模型交换。能更好地控制数据的上游使用。

还有一个机会:(6)人工智能与区块链解锁人工智能去中心化自治组织(AI DAO/Decentralized Autonomous Organizations)的可能性。这些人工智能可以积累财富。在很大程度上,它们就是软件即服务(Software-as-a-Service)。

区块链还可以以更多的方式帮助人工智能。反过来,人工智能可以有许多方法帮助区块链,如挖掘区块链数据(例如 Silk Road 调查)。这是另外的讨论话题: )

许多这些机会是关于人工智能与数据的特殊关系。让我们先来探讨一下。在此之后,我们将更详细地探讨区块链在人工智能领域的应用。

人工智能 & 数据

在这里,我将描述现代人工智能为了产生好的结果是怎样利用大量数据的。(虽然不总是这样,但它很常见并值得描述。)

「传统」人工智能 & 数据的历史

当我在 90 年代开始做人工智能研究时,一个典型的方法是:

找到一个固定的数据集(通常很小)。
设计一种算法来提高性能,例如为支持向量机分类器设计一个新的核函数,以提高 AUC 值。
在会议或期刊上发表该算法。「最小可发表的改进程度」只需要相对提高 10%,只要你的算法本身足够花哨。如果你的提高程度在 2 倍-10 倍 之间,你可以发表到该领域最好的期刊了,特别是如果算法真的很花哨(复杂)的话。

如果这听起来很学术,那是因为它本身就很学术。大多数人工智能工作仍然在学术界,虽然有实际的应用场景。在我的经验中,许多人工智能子领域中都是这样的,包括神经网络、模糊系统(fuzzy system)、进化计算(evolutionary computation),甚至不那么人工智能的技术,如非线性规划或凸优化。

在我第一篇发表的论文《Genetic Programming with Least Squares for Fast, Precise Modeling of Polynomial Time Series》(1997)中,我自豪地展示了我新发明的算法与最先进的神经网络、遗传编程等相比在最小的固定数据集上有最好的结果。

走向现代人工智能 & 数据

但是,世界变化了。2001 年,微软研究人员 Banko 和 Brill 发表了一篇有着显著成果的论文。首先,他们描述了大多数自然语言处理领域的工作基于小于 100 万字的小数据集上的情况。在这种情况下,对于旧/无聊/不那么花哨的算法,错误率为 25%,如朴素贝叶斯(Naive Bayes)和感知器(Perceptron),而花哨的较新的基于记忆的算法(memory-based algorithms)实现了 19%的错误率。这是下面最左边的四个数据点。

 

image (4).png

 

到目前为止,还没有什么让人惊讶的。但是,Banko 和 Brill 揭示了一些不同寻常的东西:当你添加更多的数据——不仅仅是一点数据,而是多达数倍的数据——并保持算法相同,那么错误率会持续下降很多。到数据集大到三个数量级时,误差小于 5%。在许多领域,这是 18%到 5%之间的差异,但是只有后者对于实际应用是足够好的。

此外,最好的算法是最简单的;最糟糕的算法是最花哨的。来自 20 世纪 50 年代的无聊的感知器算法正在击败最先进的技术。

现代人工智能 & 数据

Banko 和 Brill 并不是唯一发现这个规律的人。例如,在 2007 年,谷歌研究人员 Halevy、Norvig 和 Pereira 发表了一篇文章,显示数据可以如何「不合理地有效」跨越许多人工智能领域。

 

image (5).png

 

这就像原子弹一样冲击了人工智能领域。

数据才是关键!

#p#分页标题#e#

于是收集更多的数据的竞赛开始了。需要大量的努力才能获得好数据。如果你有资源,就可以得到数据。有时甚至可以锁定数据。在这个新世界里,数据是壕沟,人工智能算法是一种商品。出于这些原因,「更多数据」是谷歌、Facebook 等公司的关键。

「越多数据,越多财富」——每个人

一旦你了解这些动态,具体行动就有了简单的解释。谷歌收购卫星成像公司不是因为它喜欢卫星图像;而谷歌又开放了 TensorFlow。

深度学习直接适用于这种情境:如果给定一个足够大的数据集,它能弄清楚如何获取相互影响和潜在变量。有趣的是,如果给予相同的大规模数据集,来自上世纪 80 年代的反向传播神经网络有时能与最新的技术媲美。参考论文《Deep Big Simple Neural Nets Excel on Handwritten Digit Recognition》。所以说数据才是关键。

作为一个人工智能研究员我自己成熟的年龄是类似的。当我遇到现实世界的问题时,我学会了如何吞下我的骄傲,放弃「炫酷」的算法,仅仅满足能够解决手头上问题,并学会了热爱数据和规模。我们将重心从自动化的创意设计转向了「无聊」的参数优化;同时当用户要求我们从 10 个变量增加到 1000 和变量时,我们在匆忙应对中变得不那么无聊——我的第一家公司 ADA(1998–2004)的情况就是这样。我们将重心从华丽的建模方法转移到超级简单但可完全扩展的机器学习算法(如 FFX);当用户要求从 100 个变量增加到 100000 个,从 100 亿蒙特卡洛样本增加到 10 亿(有效样本),我们同样不无聊——这发生在我的第二家公司 Solido(2004—至今)。即使是我第三家也是目前的公司的产品 BigchainDB,也体现了对规模的需要(2013—至今)。扩展功能,扩大规模。

特别声明:本文为中国直播网直播号作者或机构上传并发布,仅代表该作者或机构观点,不代表中国直播网的观点或立场,中国直播网仅提供信息发布平台。
       版权声明:版权归著作权人,转载仅限于传递更多信息,如来源标注错误侵害了您的权利,请来邮件通知删除,一起成长谢谢
       欢迎加入:直播号,开启无限创作!一个敢纰漏真实事件,说真话的创作分享平台,一个原则:只要真实,不怕事大,有线索就报料吧!申请直播号请用电脑访问https://zbh.zhibotv.com.cn。    

标签:
相关资讯
热门频道

热门标签

CopyRight 2014-2024 中国直播网(直播网)ZhiBoTv.Com.Cn(中國直播網有限公司)| 本站取得授权享有第17448205号“直播网”商标注册证 | 中国直播网投稿公邮:news@newsgo.com

直播网网站所登载资讯、图集、视频等内容,版权归直播号自媒体平台原作者或投稿人所有,投稿视为本站原创首发,刊发或转载仅限传播目的非本网观点,未经授权请勿转载或商业用途。

特别声明:中国直播网仅提供平台运营服务,不提供任何上传发布服务,中国直播网尊重知识产权保护,侵权反馈:fawu@newsgo.com 直播网撤稿函下载 如有侵权请来邮告知,我们收到后会尽快处理答复。 Powered by EyouCms 备案号:吉ICP备2023004346号-1