Skip to content

Latest commit

 

History

History
executable file
·
229 lines (157 loc) · 13.7 KB

release.md

File metadata and controls

executable file
·
229 lines (157 loc) · 13.7 KB

Release Note

v2.3.0

[1、Support text-to-image domain model]

  • Add five text-to-image domain models based on disco diffusion, in which three models are for English and two for Chinese. Especially, Chinese text-to-image model disco_diffusion_ernievil_base is based on Baidu ERNIE-ViL,welcome to experience.

【2、Support Wenxin large models API】

  • Add api call for ERNIE-ViLG model, which supports text-to-image task。
  • Add api call for ERNIE 3.0 Zeus model, which supports applications such as writing essays, summarization, couplets, question answering, writing novels and completing text.

v2.1.0

[ 1. Improvements]

  • Add supports for five new models, including two high-precision semantic segmentation models based on VOC dataset and three voice classification models.
  • Enforce the transfer learning capabilities for image semantic segmentation, text semantic matching and voice classification on related datasets.

[ 2. Upgrades of deployment capabilities]

  • Add the export function APIs for two kinds of model formats, i.,e, ONNX and PaddleInference.
  • Important Open-Source Ecological Cooperation: add the support for BentoML, which is a cloud native framework for serving deployment. Users can easily serve pre-trained models from PaddleHub by following the [Tutorial notebooks](https:// github.com/PaddlePaddle/PaddleHub/tree/release/v2.1/demo/serving/BentoML). Also, see this announcement and Release note from BentoML. (Many thanks to @parano @cqvu @deehrlic for contributing this feature in PaddleHub)

[ 3. Bug fixes ]

  • #7da1230 Fixed the problem that the model cannot resume training if metrics is not recorded.
  • #b0b3144 Fixed the problem that the thread did not exit normally when the evaluation process was abnormal.
  • #30aace4 Improve the model installation process.

v2.0.0

  • 发布 2.0版本,全面迁移动态图编程模式,模型开发调试更加方便,finetune接口更加灵活易用。
  • 视觉类任务迁移学习能力全面升级,支持图像分类、图像着色、风格迁移等多种任务。
  • BERT、ERNIE、RoBERTa等Transformer类模型升级至动态图,支持文本分类、序列标注的Fine-Tune能力。
  • 新增词向量模型61个,其中包含中文模型51个,英文模型10个。
  • 优化服务化部署Serving能力,支持多卡预测、自动负载均衡,性能大幅度提升。
  • 新增自动数据增强能力Auto Augment,能高效地搜索适合数据集的数据增强策略组合。

v2.0.0-beta1

  • BERT、ERNIE、RoBERTa等Transformer类模型升级至动态图,增加文本分类的Fine-Tune能力
  • 修复部分已知问题

v2.0.0-beta0

  • 全面迁移动态图编程模式,模型开发调试更加方便,finetune接口更加灵活易用。
  • 优化服务化部署Serving能力,支持多卡预测、自动负载均衡,性能大幅度提升。
  • 视觉类迁移学习能力全面升级,支持图像分类图像着色风格迁移等多种视觉任务。

v1.8.1

v1.8.0

  • 预训练模型丰富,一键完成更多
    • 文本生成』新增基于ERNIE-tiny和ERNIE-gen的对联和写诗生成模型,支持一键自动写诗和对对联。
    • 词法分析』新增jieba的paddle模式切词模型,可一键完成中文分词、关键词抽取等功能。
    • 语义表示』新增基于网页、小说、新闻三类大规模文本数据的LDA主题模型及其语义相似度计算接口。
  • Fine-tune API升级,提升灵活性并支持更多任务
    • 新增Tokenizer API,支持更加灵活的切词、切字模式和自定义切词工具拓展。
    • 新增文本生成任务,支持Seq2Seq任务的Fine-tuning。
    • 新增文本匹配任务,支持PointwisePairwise两种文本匹配训练模式,更便捷完成语义匹配任务。

v1.7.0

  • 丰富预训练模型,提升应用性

  • Fine-tune API升级

    • 文本分类任务新增6个预置网络,包括CNN, BOW, LSTM, BiLSTM, DPCNN等
    • 使用VisualDL可视化训练评估性能数据

v1.6.2

  • 修复图像分类在windows下运行错误

v1.6.1

  • 修复windows下安装PaddleHub缺失config.json文件

v1.6.0

  • NLP Module全面升级,提升应用性和灵活性

    • lac、senta系列(bow、cnn、bilstm、gru、lstm)、simnet_bow、porn_detection系列(cnn、gru、lstm)升级高性能预测,性能提升高达50%
    • ERNIE、BERT、RoBERTa等Transformer类语义模型新增获取预训练embedding接口get_embedding,方便接入下游任务,提升应用性
    • 新增RoBERTa通过模型结构压缩得到的3层Transformer模型rbt3rbtl3
  • Task predict接口增加高性能预测模式accelerate_mode,性能提升高达90%

  • PaddleHub Module创建流程开放,支持Fine-tune模型转化,全面提升应用性和灵活性

  • PaddleHub Serving优化启动方式,支持更加灵活的参数配置

v1.5.2

  • 优化pyramidbox_lite_server_mask、pyramidbox_lite_mobile_mask模型的服务化部署性能

v1.5.1

  • 修复加载module缺少cache目录的问题

v1.5.0

  • 升级PaddleHub Serving,提升性能和易用性

    • 新增文本Embedding服务Bert Service, 轻松获取文本embedding;
      • 代码精短,易于使用。服务端/客户端一行命令即可获取文本embedding;
      • 更高性能,更高效率。通过Paddle AnalysisPredictor API优化计算图,提升速度减小显存占用
      • 随"机"应变,灵活扩展。根据机器资源和实际需求可灵活增加服务端数量,支持多显卡多模型计算任务
    • 优化并发方式,多核环境中使用多线程并发提高整体QPS
  • 优化PaddleHub迁移学习组网Task功能,提升易用性

    • 增加Hook机制,支持修改Task内置方法
    • 增加colorlog,支持日志彩色显示
    • 改用save_inference_model接口保存模型,方便模型部署
    • 优化predict接口,增加return_result参数,方便用户直接获取预测结果
  • 优化PaddleHub Dataset基类,加载自定义数据代码更少、更简单

v1.4.1

  • 修复利用Transformer类模型完成序列标注任务适配paddle1.6版本的问题
  • Windows下兼容性提升为python >= 3.6

v1.4.0

  • 新增预训练模型ERNIE tiny
  • 新增数据集:INEWS、BQ、DRCD、CMRC2018、THUCNEWS,支持ChineseGLUE(CLUE)V0 所有任务
  • 修复module与PaddlePaddle版本兼容性问题
  • 优化Hub Serving启动过程和模型加载流程,提高服务响应速度

v1.3.0

  • 新增PaddleHub Serving服务部署
    • 新增hub serving命令,支持一键启动Module预测服务部署
  • 新增预训练模型:
    • roberta_wwm_ext_chinese_L-24_H-1024_A-16
    • roberta_wwm_ext_chinese_L-12_H-768_A-12
    • bert_wwm_ext_chinese_L-12_H-768_A-12
    • bert_wwm_chinese_L-12_H-768_A-12
  • AutoDL Finetuner优化使用体验
    • 支持通过接口方式回传模型性能
    • 可视化效果优化,支持多trail效果显示

v1.2.1

  • 新增超参优化Auto Fine-tune,实现给定超参搜索空间,PaddleHub自动给出较佳的超参组合
    • 支持两种超参优化算法:HAZero和PSHE2
    • 支持两种评估方式:FullTrail和PopulationBased
  • 新增Fine-tune优化策略ULMFiT,包括以下三种设置
    • Slanted triangular learning rates:学习率先线性增加后缓慢降低
    • Discriminative fine-tuning:将计算图划分为n段,不同的段设置不同学习率
    • Gradual unfreezing:根据计算图的拓扑结构逐层unfreezing
  • 新增支持用户自定义PaddleHub配置,包括
    • 预训练模型管理服务器地址
    • 日志记录级别
  • Fine-tune API升级,灵活性与易用性提升
    • 新增阅读理解Fine-tune任务回归Fine-tune任务
    • 新增多指标评测
    • 优化predict接口
    • 可视化工具支持使用tensorboard

v1.1.2

  • PaddleHub支持修改预训练模型存放路径${HUB_HOME}

v1.1.1

  • PaddleHub支持离线运行
  • 修复python2安装PaddleHub失败问题

v1.1.0

  • PaddleHub 新增预训练模型ERNIE 2.0
    • 升级Reader, 支持自动传送数据给Ernie 1.0/2.0
    • 新增数据集GLUE(MRPC、QQP、SST-2、CoLA、QNLI、RTE、MNLI)

v1.0.1

  • 安装模型时自动选择与paddlepaddle版本适配的模型

v1.0.0

  • 全新发布PaddleHub官网,易用性全面提升

    • 新增网站 https://www.paddlepaddle.org.cn/hub 包含PaddlePaddle生态的预训练模型使用介绍
    • 迁移学习Demo接入AI Studio与AI Book,无需安装即可快速体验
  • 新增29个预训练模型,覆盖文本、图像、视频三大领域;目前官方提供40个预训练模型

    • CV预训练模型:
      • 新增图像分类预训练模型11个:SE_ResNeXt, GoogleNet, ShuffleNet等
      • 新增目标检测模型Faster-RCNN和YOLOv3
      • 新增图像生成模型CycleGAN
      • 新增人脸检测模型Pyramidbox
      • 新增视频分类模型4个: TSN, TSM, StNet, Non-Local
    • NLP预训练模型
      • 新增语义模型ELMo
      • 新增情感分析模型5个: Senta-BOW, Senta-CNN, Senta-GRNN, , Senta-LSTM, EmoTect
      • 新增中文语义相似度分析模型SimNet
      • 升级LAC词法分析模型,新增词典干预功能,支持用户自定义分词
  • Fine-tune API升级,灵活性与性能全面提升

    • 支持多卡并行、PyReader多线程IO,Fine-tune速度提升60%
    • 简化finetune、evaluate、predict等使用逻辑,提升易用性
    • 增加事件回调功能,方便用户快速实现自定义迁移学习任务
    • 新增多标签分类Fine-tune任务

v0.5.0

正式发布PaddleHub预训练模型管理工具,旨在帮助用户更高效的管理模型并开展迁移学习的工作。

预训练模型管理: 通过hub命令行可完成PaddlePaddle生态的预训练模型下载、搜索、版本管理等功能。

命令行一键使用: 无需代码,通过命令行即可直接使用预训练模型进行预测,快速调研训练模型效果。目前版本支持以下模型:词法分析LAC;情感分析Senta;目标检测SSD;图像分类ResNet, MobileNet, NASNet等。

迁移学习: 提供了基于预训练模型的Fine-tune API,用户通过少量代码即可完成迁移学习,包括BERT/ERNIE文本分类、序列标注、图像分类迁移等。