fly63前端网

www.fly63.com

首页文章资源工具教程 栏目
  • 关于我们
  • 网站投稿
  • 赞助一下
搜索

在线工具_工作生活好帮手

打造各种简单、易用、便捷的在线工具,网友无需注册和下载安装即可使用

点击查看

关闭

提交网站

Keras
分享
复制链接
新浪微博
QQ 好友

扫一扫分享

网站地址:https://keras.io
网站描述:Python版本的TensorFlow深度学习API

Keras 是一个用 Python 编写的高级神经网络 api,它能够以 TensorFlow, CNTK, 或者 Theano 作为后端运行。Keras 的开发重点是支持快速的实验。能够以最小的时延把你的想法转换为实验结果,是做好研究的关键。

如果你在以下情况下需要深度学习库,请使用 Keras:

  • 允许简单而快速的原型设计(由于用户友好,高度模块化,可扩展性)。
  • 同时支持卷积神经网络和循环神经网络,以及两者的组合。
  • 在 CPU 和 GPU 上无缝运行。
中文学习文档:https://keras-zh.readthedocs.io/


多后端 Keras 和 tf.keras:

目前,我们推荐使用 TensorFlow 后端的 Keras 用户切换至 TensorFlow 2.0 的 tf.keras。 tf.keras 具有更好的维护,并且更好地集成了 TensorFlow 功能(eager执行,分布式支持及其他)。

Keras 2.2.5 是最后一个实现 2.2.* API 的 Keras 版本。它是最后一个仅支持 TensorFlow 1(以及 Theano 和 CNTK)的版本。

Keras 的当前版本是 2.3.0,它对 API 做了重大的调整,并且添加了 TensorFlow 2.0 的支持。2.3.0 将会是最后一个多后端 Keras 主版本。多后端 Keras 已被 tf.keras 取代。

多后端 Keras 中存在的错误修复仅会持续到 2020 年 4 月(作为次要版本的一部分)。


指导原则

用户友好。 Keras 是为人类而不是为机器设计的 API。它把用户体验放在首要和中心位置。Keras 遵循减少认知困难的最佳实践:它提供一致且简单的 API,将常见用例所需的用户操作数量降至最低,并且在用户错误时提供清晰和可操作的反馈。

模块化。 模型被理解为由独立的、完全可配置的模块构成的序列或图。这些模块可以以尽可能少的限制组装在一起。特别是神经网络层、损失函数、优化器、初始化方法、激活函数、正则化方法,它们都是可以结合起来构建新模型的模块。

易扩展性。 新的模块是很容易添加的(作为新的类和函数),现有的模块已经提供了充足的示例。由于能够轻松地创建可以提高表现力的新模块,Keras 更加适合高级研究。

基于 Python 实现。 Keras 没有特定格式的单独配置文件。模型定义在 Python 代码中,这些代码紧凑,易于调试,并且易于扩展。


快速开始:30 秒上手 Keras

Keras 的核心数据结构是 model,一种组织网络层的方式。最简单的模型是 Sequential 顺序模型,它由多个网络层线性堆叠。对于更复杂的结构,你应该使用 Keras 函数式 API,它允许构建任意的神经网络图。

Sequential 模型如下所示:

from keras.models import Sequential

model = Sequential()

可以简单地使用 .add() 来堆叠模型:

from keras.layers import Dense

model.add(Dense(units=64, activation='relu', input_dim=100))
model.add(Dense(units=10, activation='softmax'))

在完成了模型的构建后, 可以使用 .compile() 来配置学习过程:

model.compile(loss='categorical_crossentropy',
              optimizer='sgd',
              metrics=['accuracy'])

如果需要,你还可以进一步地配置你的优化器。Keras 的核心原则是使事情变得相当简单,同时又允许用户在需要的时候能够进行完全的控制(终极的控制是源代码的易扩展性)。

model.compile(loss=keras.losses.categorical_crossentropy,
              optimizer=keras.optimizers.SGD(lr=0.01, momentum=0.9, nesterov=True))

现在,你可以批量地在训练数据上进行迭代了:

# x_train 和 y_train 是 Numpy 数组 -- 就像在 Scikit-Learn API 中一样。
model.fit(x_train, y_train, epochs=5, batch_size=32)

或者,你可以手动地将批次的数据提供给模型:

model.train_on_batch(x_batch, y_batch)

只需一行代码就能评估模型性能:

loss_and_metrics = model.evaluate(x_test, y_test, batch_size=128)

或者对新的数据生成预测:

classes = model.predict(x_test, batch_size=128)

构建一个问答系统,一个图像分类模型,一个神经图灵机,或者其他的任何模型,就是这么的快。深度学习背后的思想很简单,那么它们的实现又何必要那么痛苦呢?

链接: https://fly63.com/nav/4003

more>>
相关栏目
文心一言
百度研发的知识增强大语言模型
官网
Bard
Google 推出的一款对话式 AI 工具
官网
讯飞星火
科大讯飞推出的新一代认知智能大模型
官网
Gemini
谷歌发布最新人工智能模型
官网
盘古大模型
华为盘古大模型,重塑千行百业
官网
豆包AI
字节跳动旗下 AI 智能助手
官网
Anthropic Claude
Anthropic发布的与ChatGPT竞争的聊天机器人
官网
Adobe Firefly
Adobe最新推出的AI图像生成和编辑工具
官网
Midjourney
一款AI绘画工具
官网
LLaMA
Meta(Facebook)推出的AI大语言模型
点击进入GitHub
AI提示语
AI提示指令,让生产力加倍!
官网
百川智能
汇聚世界知识,创作妙笔生花
官网
通义千问
一个不断进化的AI大模型
官网
Ollama
本地便捷部署和运行大型语言模型LLM框架
官网GitHub
DeepSeek
幻方量化公司旗下的开源大模型平台
官网GitHub
火山写作
字节跳动推出的一款AI智能写作服务
官网

手机预览