► 代码示例

代码示例

我们的代码示例简短（代码少于 300 行），重点演示了垂直领域的深度学习工作流程。

我们所有的示例都以 Jupyter notebook 的形式编写，可以在 Google Colab 中一键运行。Google Colab 是一种托管的 notebook 环境，无需设置即可在云端运行，并包含 GPU 和 TPU 运行时。

★

= 优秀入门示例

V3

= Keras 3 示例

计算机视觉

图像分类

从头开始进行图像分类

简单的 MNIST 卷积网络

使用 EfficientNet 进行微调的图像分类

使用 Vision Transformer 进行图像分类

使用基于注意力的深度多示例学习进行分类

使用现代 MLP 模型进行图像分类

用于图像分类的移动友好型 Transformer 模型

在 TPU 上进行肺炎分类

紧凑型卷积 Transformer

使用 ConvMixer 进行图像分类

使用 EANet（外部注意力 Transformer）进行图像分类

内卷神经网络

使用 Perceiver 进行图像分类

使用 Reptile 进行少样本学习

使用 SimCLR 对比预训练的半监督图像分类

使用 Swin Transformer 进行图像分类

在小型数据集上训练 Vision Transformer

无注意力的 Vision Transformer

使用全局上下文 Vision Transformer 进行图像分类

当循环遇到 Transformer

使用 BigTransfer (BiT) 进行图像分类

图像分割

使用 U-Net 类似架构进行图像分割

使用 DeepLabV3+ 进行多类别语义分割

使用 BASNet 进行高精度边界分割

使用可组合的全卷积网络进行图像分割

目标检测

使用 RetinaNet 进行目标检测

使用迁移学习进行关键点检测

使用 Vision Transformer 进行目标检测

3D

从 CT 扫描进行 3D 图像分类

单目深度估计

使用 NeRF 进行 3D 体积渲染

使用 PointNet 进行点云分割

OCR

用于读取验证码的 OCR 模型

图像增强

用于图像去噪的卷积自编码器

使用 MIRNet 进行低光照图像增强

使用高效亚像素 CNN 进行图像超分辨率

用于单图像超分辨率的增强深度残差网络

用于低光照图像增强的 Zero-DCE

数据增强

用于图像分类的 CutMix 数据增强

用于图像分类的 MixUp 增强

用于图像分类以提高鲁棒性的 RandAugment

图像&文本

图像字幕生成

使用双编码器进行自然语言图像搜索

视觉模型可解释性

可视化卷积网络学习的内容

使用 Integrated Gradients 进行模型可解释性分析

研究 Vision Transformer 表示

Grad-CAM 类别激活可视化

图像相似度搜索

近似重复图像搜索

语义图像聚类

使用孪生网络和对比损失进行图像相似度估计

使用孪生网络和三元组损失进行图像相似度估计

用于图像相似度搜索的度量学习

使用 TensorFlow Similarity 进行图像相似度搜索的度量学习

使用 NNCLR 进行自监督对比学习

视频

使用 CNN-RNN 架构进行视频分类

使用卷积 LSTM 进行下一帧视频预测

使用 Transformer 进行视频分类

视频 Vision Transformer

性能技巧

梯度中心化以获得更好的训练性能

在 Vision Transformer 中学习分词

FixRes：修正训练测试分辨率差异

带有 LayerScale 的类别注意力图像 Transformer

使用聚合注意力增强卷积网络

学习调整大小

其他

使用 AdaMatch 进行半监督和域适应

用于对比 SSL 的 Barlow Twins

有监督的一致性训练

蒸馏 Vision Transformer

焦点调制：自注意力的替代方案

使用前向-前向算法进行图像分类

使用自编码器进行掩码图像建模

使用 🤗Transformers 的 Segment Anything Model

使用 SegFormer 和 Hugging Face Transformers 进行语义分割

使用 SimSiam 进行自监督对比学习

有监督对比学习

使用 YOLOV8 和 KerasCV 进行高效目标检测

自然语言处理

文本分类

从头开始进行文本分类

使用主动学习进行评论分类

使用 FNet 进行文本分类

大规模多标签文本分类

使用 Transformer 进行文本分类

使用 Switch Transformer 进行文本分类

使用决策森林和预训练嵌入进行文本分类

使用预训练词嵌入

在 IMDB 上使用双向 LSTM

使用 KerasHub 和 tf.distribute 进行数据并行训练

机器翻译

使用 KerasHub 进行英西翻译

使用序列到序列 Transformer 进行英西翻译

字符级循环序列到序列模型

蕴含预测

多模态蕴含

命名实体识别

使用 Transformer 进行命名实体识别

序列到序列

使用 BERT 进行文本提取

用于执行数字相加的序列到序列学习

文本相似度搜索

使用 KerasHub 进行语义相似度

使用 BERT 进行语义相似度

使用孪生 RoBERTa 网络进行句子嵌入

语言建模

使用 BERT 进行端到端掩码语言建模

使用 BART 进行抽象式文本摘要

使用 Hugging Face Transformers 预训练 BERT

参数高效微调

使用 LoRA 对 GPT-2 进行参数高效微调

其他

使用迁移学习进行多项选择任务

使用 Hugging Face Transformers 进行问答

使用 Hugging Face Transformers 进行抽象式摘要

结构化数据

结构化数据分类

使用 FeatureSpace 进行结构化数据分类

FeatureSpace 高级用例

不平衡分类：信用卡欺诈检测

从头开始进行结构化数据分类

使用 Wide、Deep 和 Cross 网络进行结构化数据学习

使用门控残差和变量选择网络进行分类

使用 TensorFlow 决策森林进行分类

使用神经决策森林进行分类

使用 TabTransformer 进行结构化数据学习

结构化数据回归

用于客户生命周期价值的深度学习

推荐

用于电影推荐的协同过滤

基于 Transformer 的推荐系统

其他

使用门控残差和变量选择网络并进行超参数调优的分类

时间序列

时间序列分类

从头开始进行时间序列分类

使用 Transformer 模型进行时间序列分类

用于动作识别的脑电图信号分类

用于支付卡欺诈检测的事件分类

异常检测

使用自编码器进行时间序列异常检测

时间序列预测

使用图神经网络和 LSTM 进行交通预测

用于天气预测的时间序列预测

其他

用于脑机接口的脑电图信号分类

生成式深度学习

图像生成

去噪扩散隐式模型

使用 Stable Diffusion 3 漫步潜在空间

去噪扩散概率模型

通过 Textual Inversion 教 StableDiffusion 新概念

微调 Stable Diffusion

变分自编码器

覆盖 Model.train_step 的 GAN

覆盖 Model.train_step 的 WGAN-GP

使用自适应判别器增强的数据高效 GAN

用于条件图像生成的 GauGAN

使用 StyleGAN 生成人脸图像

向量量化变分自编码器

使用 Stable Diffusion 漫步潜在空间

风格迁移

神经风格迁移

使用 AdaIN 的神经风格迁移

文本生成

使用 KerasHub 的 GPT2 文本生成

使用 KerasHub 从头开始进行 GPT 文本生成

使用微型 GPT 进行文本生成

使用 LSTM 进行字符级文本生成

使用 FNet 进行文本生成

音频生成

使用 Transformer 模型生成音乐

图生成

使用 VAE 生成药物分子

使用 R-GCN 和 WGAN-GP 生成小分子图

其他

使用 Real NVP 进行密度估计

音频数据

人声分离

使用编码器-解码器架构进行人声分离

语音识别

使用 Transformer 进行自动语音识别

其他

使用 CTC 进行自动语音识别

使用特征匹配的基于 MelGAN 的频谱图反演

说话人识别

使用 STFTSpectrogram 层进行音频分类

使用迁移学习进行英语说话人发音识别

使用 Hugging Face Transformers 进行音频分类

强化学习

Actor Critic 方法

近端策略优化

用于 Atari Breakout 的深度 Q-学习

深度确定性策略梯度 (DDPG)

图数据

用于节点分类的图注意力网络 (GAT)

使用图神经网络进行节点分类

用于分子属性预测的消息传递神经网络 (MPNN)

使用 node2vec 进行图表示学习

Keras 快速技巧

Keras 使用技巧

使用 LoRA 和 QLoRA 对 Gemma 进行参数高效微调

使用简单 Transformer 模型进行 Float8 训练和推理

Keras 调试技巧

自定义 Conv2D 层的卷积操作

训练器模式

端点层模式

Keras 模型中的可复现性

使用 TensorFlow NumPy 编写 Keras 模型

简单自定义层示例：Antirectifier

使用函数式子类化打包 Keras 模型以进行广泛分发

服务

使用 TFServing 为 TensorFlow 模型提供服务

ML 最佳实践

估算模型训练所需的样本量

用于推荐系统的内存高效嵌入

创建 TFRecords

其他

使用混合密度网络近似非函数映射

概率贝叶斯神经网络

知识蒸馏技巧

在 Keras 回调中评估和导出 scikit-learn 指标

如何在 TFRecord 文件上训练 Keras 模型

添加新的代码示例

我们欢迎新的代码示例！以下是我们的规则

代码应少于 300 行（注释长度不限）。
应演示现代 Keras 的最佳实践。
主题应与上面列出的所有示例有本质区别。
应有详尽的文档&注释。

新的示例通过 Pull Request 添加到 keras.io 代码库。必须提交遵循特定格式的 .py 文件。这些文件通常由 Jupyter notebook 生成。请参阅tutobooks 文档了解更多详细信息。

如果您想将 Keras 2 示例转换为 Keras 3，请向 keras.io 代码库提交一个 Pull Request。

代码示例

添加新的代码示例