大模型法律项目开发

本项目主要研究大模型在单独的法律数据集上的效果，现在支持belle和chatglm相关的模型训练，预测，验证和在线部署，另外增加爬虫代码，langchain，结合数据库预测等功能。

因为设备的原因，本研究仅限制在了6B以下的模型。

主要实验的模型包括chatllma, bloomz, chatGLM。

chatllma和bloomz相关模型（包括lora）可以在belle文件夹内参考readme进行训练和预测

chatglm相关实验（包括ptuning算法）可以在ptuning文件夹参考readme进行训练和预测

WebScraper文件夹是相关法律内容的爬虫代码，可以直接从定制的网页爬取法律数据集。

chatglm-web可以支持模型的在线部署，先启动run_backend.sh加载模型和启动服务，后启动run_frontend.sh开启前端页面。

langchain-ChatGLM项目支持利用数据库和大模型的结合预测方式。

一些实验结论

Name		Name	Last commit message	Last commit date
Latest commit History 41 Commits
.github/workflows		.github/workflows
.idea		.idea
WebScraper		WebScraper
belle		belle
chatglm-web		chatglm-web
langchain-ChatGLM		langchain-ChatGLM
ptuning		ptuning
vscode_setting_example		vscode_setting_example
.clang-format		.clang-format
.gitignore		.gitignore
.pre-commit-config.yaml		.pre-commit-config.yaml
.pylintrc		.pylintrc
.style.yapf		.style.yapf
CONTRIBUTE.md		CONTRIBUTE.md
LICENSE		LICENSE
README.md		README.md
requirement.txt		requirement.txt
requirement_dev.txt		requirement_dev.txt