28款GitHub最流行的开源机器学习项目(一):TensorFlow排榜首

  • 时间:
  • 浏览:2
  • 来源:uu快3app娱乐_uu快3辅助_官方网址

开发语言:Python

开发语言:C++

当 brain 用于浏览器,下载最新的 brain.js 文件。训练计算代价比较昂贵,却说我 应该离线训练网络(不可能 在 Worker 上),并使用 toFunction() 不可能  toJSON()选项,以便将预训练网络插入到网站中。

开发语言:C++

Caffe 是由神经网络中的表达式、数率、及模块化产生的数率学习框架。后要它通过伯克利视觉与学习中心((BVLC)和社区参与者的贡献,得以发展形成了以还有一个多多 伯克利主导,因此 加之Github和Caffe-users邮件所组成的还有一个多多 比较松散和自由的社区。

Caffe是还有一个多多 基于C++/CUDA架构框架,开发者都都可否利用它自由的组织网络,目前支持卷积神经网络和全连接神经网络(人工神经网络)。在Linux上,C++可必须通过命令行来操作接口,对于MATLAB、Python后要专门的接口,运算上支持CPU和GPU直接无缝切换。

Brain是 JavaScript 中的 神经网络库。以下例子说明使用Brain来近似 XOR 功能:

TensorFlow 是谷歌发布的第二代机器学习系统。据谷歌宣称,在要素基准测试中,TensorFlow的解决数率比第一代的DistBelief加快了2倍之多。

具体的讲,TensorFlow是还有一个多多 利用数据流图(Data Flow Graphs)进行数值计算的开源软件库:图中的节点( Nodes)代表数学运算操作,一同图中的边(Edges)表示节点之间相互流通的多维数组,即张量(Tensors)。你这一灵活的架构可必须让使用者在比较复杂的将计算部署在台式机、服务器不可能 移动设备的还有一个多多 或多个CPU上,因此 后要重写代码;一同任一基于梯度的机器学习算法均可够借鉴TensorFlow的自动分化(Auto-differentiation);此外通过灵活的Python接口,要在TensorFlow中表达想法也变得更为简单。

TensorFlow最初由Google Brain小组(该小组隶属于Google's Machine Intelligence研究机构)的研究员和工程师开发出来的,开发目的是用于进行机器学习和数率神经网络的研究。但该系统的通用性足以使其广泛用于其他计算领域。

目前Google 结构已在多量使用 AI 技术,包括 Google App 的语音识别、Gmail 的自动回复功能、Google Photos 的图片搜索等后要使用 TensorFlow 。

GitHub项目地址:

通过设计了还有一个多多 游戏使得Ruby语言和人工智能学习更加有乐趣和互动起来。

使用者扮演了还有一个多多 勇士通过爬上一座高塔,到达顶层获取珍贵的红宝石(Ruby)。在每一层,都都都可否写还有一个多多 Ruby脚本指导战士打败敌人、营救俘虏、到达楼梯。使用者对每一层后要其他认识,但那个她 永远都我找不到乎 每层具体会位于什么状态。你都都都可否给战士足够的人工智能,以便让其自行寻找应对的妙招。

勇士的动作相关API:

Vowpal Wabbit是还有一个多多 机器学习系统,该系统推动了如在线、散列、Allreduce、Learning2search、等方面机器学习前沿技术的发展。 其训练数率更快,在20亿条训练样本,每个训练样本大慨400个非零形态的状态下:不可能 形态的总位数为一万时,训练时间为20分钟;形态总位数为4000万时,训练时间为还有一个多多 小时。Vowpal Wabbit支持分类、 回归、矩阵分解和LDA。

当在Hadoop上运行Vowpal Wabbit时,有以下优化机制:

PredictionIO 是面向开发人员和数据科学家的开源机器学习服务器。它支持事件挂接、算法调度、评估,以及经由REST APIs的预测结果查询。使用者可必须通过PredictionIO做其他预测,比如个性化推荐、发现内容等。PredictionIO 提供20个预设算法,开发者可必须直接将它们运行于我本人的数据上。几乎任何应用与PredictionIO集成都可必须变得更“聪明”。其主要特点如下所示:

许可协议: Apache License 2.0

NuPIC是还有一个多多 实现了HTM学习算法的机器智能平台。HTM是还有一个多多 关于新(大脑)皮质(Neocortex)的全部人工智能算法。HTM的核心是基于时间的连续学习算法,该算法可必须存储和调用时间和空间五种模式。NuPIC可必须适用于解决各类间题图片,尤其是异常检测和流数据源预测方面。

NuPIC Binaries文件目前可用于:

开发语言:Python

GitHub项目地址:

Pattern是Python的还有一个多多 Web挖掘模块。拥有以下工具:

开发语言:Python

GitHub项目地址:

CNTK自2015年四月就已开源。

编译自:https://github.com/showcases/machine-learning

译者:刘崇鑫 校对:王殿进

Keras是极其精简并数率模块化的神经网络库,在TensorFlow 或 Theano 上都都都可否运行,是还有一个多多 数率模块化的神经网络库,支持GPU和CPU运算。Keras可必须说是Python版的Torch7,对于快速构建CNN模型非常方便,一同也蕴藏了其他最新文献的算法,比如Batch Noramlize,文档教程也很全,在官网上作者后要直接给例子浅显易懂。Keras也支持保存训练好的参数,因此 加载不可能 训练好的参数,进行继续训练。

Keras侧重于开发快速实验,用不可能 大慨延迟实现从理念到结果的转变,即为做好一项研究的关键。

当都都都可否如下要求的数率学习的库时,就可必须考虑使用Keras:

MXNet是还有一个多多 兼具数率和灵活性的数率学习框架。它允许使用者将符号编程和命令式编程相结合,以追求数率生和熟产力的最大化。其核心是动态依赖调度程序运行池池,该程序运行池池可必须动态自动进行并行化符号和命令的操作。其中部署的图形优化层使得符号操作更快和内存利用率更高。该库轻量且便携带,因此 可扩展到多个GPU和多台主机上。

主要特点:

MXNet不仅仅是还有一个多多 数率学习项目,它更是还有一个多多 建立数率学习系统的蓝图、指导方针以及黑客们对数率学习系统独特见解的结合体。

开发语言:Python

Keras目前支持 Python 2.7-3.5。

开发语言:JavaScript

GitHub项目地址:

Scikit-Learn的基本功能主要被分为六个要素:分类、回归、聚类、数据降维、模型确定、数据预解决,具体可必须参考官方网站上的文档。经过测试,Scikit-Learn可在 Python 2.6、Python 2.7 和 Python 3.5上运行。除此之外,它也应该可在Python 3.3和Python 3.4上运行。

注:Scikit-Learn原来被称为Scikits.Learn。

Theano是还有一个多多 Python库,它允许使用者有效地定义、优化和评估涉及多维数组的数学表达式,一同支持GPUs和高效符号分化操作。Theano具有以下特点:

开发语言:Python

+Comparison of SGD/Adagrad/Adadelta on MNIST

GitHub项目地址:

GitHub项目地址:

自4007年起,Theano无缘无故致力于大型密集型科学计算研究,但它目前也很被广泛应用在课堂之上( 如Montreal大学的数率学习/机器学习课程)。

GitHub项目地址:

许可协议:3-Clause BSD license

其文档完善,目前拥有400多个案例和3400多个单元测试。 Pattern目前只支持Python 2.5+(尚不支持Python 3),该模块除了在Pattern.vector模块中使用LSA外那末其他任何结构要求,因此 只需安装 NumPy (仅在Mac OS X上默认安装)。

GitHub项目地址:

GitHub项目地址:

许可协议:MIT License

GitHub项目地址:

ConvNetJS是利用Javascript实现的神经网络,一同还具有非常不错的基于浏览器的Demo。它最重要的用途是帮助数率学习初学者更快、更直观的理解算法。

它目前支持:

开发语言:C++

开发语言:Scala

GitHub项目地址:

GitHub项目地址:

开发语言:Javascript

NuPIC 有我本人的独特之处。其他机器学习算法无法适应新模式,而NuPIC的运作接近于人脑,当模式变化的原来,它会忘掉旧模式,记忆新模式。

Scikit-Learn是用于机器学习的Python 模块,它建立在SciPy之上。该项目由David Cournapeau 于4007年创立,当时项目名为Google Summer of Code,自此原来,众多志愿者都为此做出了贡献。

主要特点:

var output = net.run([1, 0]); // [0.987]

现在机器学习逐渐成为行业热门,经过二十几年的发展,机器学习目前后要了十分广泛的应用,如:数据挖掘、计算机视觉、自然语言解决、生物形态识别、搜索引擎、医学诊断、DNA序列测序、语音和手写识别、战略游戏和机器人等方面。

云栖社区特意翻译挂接了目前GitHub上最受欢迎的28款开源的机器学习项目,以供开发者参考使用。

开源许可:Apache-2.0 license

开发语言:Ruby

目前Caffe应用实践主要有数据挂接、设计网络形态、训练结果、基于现有训练模型,使用Caffe直接识别。

许可协议:BSD license

开发语言:Jupyter Notebook

CNTK(Computational Network Toolkit )是还有一个多多 统一的数率学习工具包,该工具包通过还有一个多多 有向图将神经网络描述为一系列计算步骤。在有向图中,叶节点表示输入值或网络参数,其他节点表示该节点输入之上的矩阵运算。

CNTK 使得实现和组合如前馈型神经网络DNN、卷积神经网络(CNN)和循环神经网络(RNNs/LSTMs)等流行模式变得非常容易。一同它实现了跨多GPU 和服务器自动分化和并行化的随机梯度下降(SGD,误差反向传播)学习。

下图将CNTK的解决数率(每秒解决的帧数)和其他六个知名的工具包做了比较了。配置采用的是四层全连接的神经网络(参见基准测试脚本)和还有一个多多 大小是8192 的高效mini batch。在相同的硬件和相应的最新公共软件版本(2015.12.3前的版本)的基础上得到如下结果:

GitHub项目地址:

PredictionIO 基于 REST API(程序运行运行池池接口)标准,不过它还蕴藏 Ruby、Python、Scala、Java 等编程语言的 SDK(软件开发工具包)。其开发语言是Scala语言,数据库方面使用的是MongoDB数据库,计算系统采用Hadoop系统架构。

GitHub项目地址:

当 brain 用于节点中,可使用npm安装:

许可协议:Apache License 2.0

许可协议: BSD 2-Clause license

开发语言:C++

猜你喜欢

开会=浪费时间?阿里技术团队这样开项目复盘会

阿里妹导读:复盘是项目刚刚刚开始后必不可少的阶段,好的复盘会议都都可不可不能否 有效地利于团队成长。今天,阿里项目管理专家鹿迦以自身的经验,为他们分享要怎样做好有另另一个多项

2020-02-18

如果一个男生喜欢你 但是微信朋友圈又屏蔽你(以前你看他朋友圈 然后嘲笑过他)是出于什么心态

追答可选中有2个多或多个下面的关键词,搜索相关资料。也可直接点“搜索资料”搜索整个问题图片。使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。追答本回答被

2020-02-18

【云栖大会】阿里云生态 开启智能“大航海时代”

10月12日,2017杭州•云栖大会生态峰会上,阿里云宣告云合再次升级,智能首次被引入全球云计算生态。“大航海时代,船只承载着冒险者,首次实现了全球的交易交流;今天,国际化的阿

2020-02-17

她说很忙,我总是问她是不是不喜欢我了,是不是讨厌我了,她说,呵呵,其实她讨厌我不换位思考

你对这种回答的评价是?你对这种回答的评价是?你对这种回答的评价是?本回答由女男友推荐追答 我来答你对这种回答的评价是?使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别

2020-02-17

面对一个每天工作很忙的人,但是我又想他天天陪我,我该怎么办

追问追问追问追问追问追问追答追问追问追问追问追问追问追问

2020-02-17