Skip to content

Latest commit

 

History

History
115 lines (86 loc) · 2.89 KB

README_zh_CN.md

File metadata and controls

115 lines (86 loc) · 2.89 KB

Cooka

Python Versions Downloads PyPI Version

文档 | English

Cooka是一个轻量级、可视化的自动机器学习工具,可以通过Web UI管理数据集和设计建模实验, 并使用DeepTablesHyperGBM 执行,从而自动进行特征工程、算法超参数调优和神经网络架构搜索。

DataCanvas AutoML Toolkit

功能概览

通过Cooka提供的Web UI可以:

  • 添加、分析数据集
  • 设计建模实验
  • 查看实验过程和结果
  • 使用模型
  • 建模过程导出成Jupyter Notebook

Web页面截图:

建模支持的算法有:

  • XGBoost
  • LightGBM
  • Catboost

建模支持的神经网络有:

  • WideDeep
  • DeepFM
  • xDeepFM
  • AutoInt
  • DCN
  • FGCNN
  • FiBiNet
  • PNN
  • AFM
  • ...

搜索支持的算法有:

  • 强化学习
  • 蒙特卡洛树搜索
  • ...

支持由scikit-learnfeaturetools 提供的特征工程:

  • 缩放

    • StandardScaler
    • MinMaxScaler
    • RobustScaler
    • MaxAbsScaler
    • Normalizer
  • 编码

    • LabelEncoder
    • OneHotEncoder
    • OrdinalEncoder
  • 离散化

    • KBinsDiscretizer
    • Binarizer
  • 降维

    • PCA
  • 特征衍生

    • featuretools
  • 缺失值填充

    • SimpleImputer

还以可以通过扩展搜索空间支持更多的特征工程方法和建模算法。

安装

通过pip安装

需要python版本不低于3.6,从PYPI中安装Cooka:

pip install --upgrade pip
pip install cooka

启动Web服务:

cooka server

然后使用浏览器访问http://<your_ip:8000>来使用Cooka。

Cooka配置文件默认在~/.config/cooka/cooka.py,生成配置文件模板:

mkdir -p ~/.config/cooka/
cooka generate-config > ~/.config/cooka/cooka.py

使用Docker部署Cooka

docker run -ti -p 8888:8888 -p 8000:8000 -p 9001:9001 -e COOKA_NOTEBOOK_PORTAL=http://<your_ip>:8888 datacanvas/cooka:latest

然后使用浏览器访问http://<your_ip:8000>来使用Cooka。

DataCanvas

Cooka is an open source project created by DataCanvas.