Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

如何构建训练集 How to create training dataset #113

Open
venshow-w opened this issue Oct 17, 2024 · 4 comments
Open

如何构建训练集 How to create training dataset #113

venshow-w opened this issue Oct 17, 2024 · 4 comments

Comments

@venshow-w
Copy link

您好,非常感谢分享你们的工作,我有几个关于训练集构建的问题:

  1. 我在论文上看到除了目标区域的mask之外,还会额外随机mask部分区域,请问这个随机mask区域的text怎么做的呢?是在每次迭代中都随机mask还是先预处理生成一批随机mask的数据,然后训练时读取这个数据?
  2. 每次读取的mask是只有一个封闭区域吗?或者说是针对单个目标物体吗?如果是多个目标物体应该怎么构建这个数据集?多目标物体的mask和局部文本位置怎么对应呢?
  3. 可以不可以分享几例你们的训练集?不用全部的,只需几个例子就可以,或者数据集构建的说明
    感谢!
    期待您的回复
@zengyh1900
Copy link
Collaborator

hi @venshow-w

  1. 随机 mask 的数据是想让模型根据图片已知的内容来推断被mask的内容,所以不需要text; 为了训练稳定,会有一定概率用图像的caption; 随机mask可以在线随机生成,也可以提前生成然后训练时候读取,随机生成有现成的方法;
  2. 针对单个物体的 object inpainting 是只考虑了 instance mask 也就是单个实例的;多个实例本工作暂不考虑;你也可以先测试看看是否现有模型能否支持一次inpaint多个实例

比如 训练 P_obj 的数据:
AP_obj_BP_obj_t1 0_a_boy_and_a_girl_standing_in_front_of_a_door

训练 P_shape
AP_shape_BP_ctxt_t0 8932504462075447_a_woman_in_a_white_dress_is_standing_next_to_a_wom

训练 outpainting 就是随机四边有mask
AP_ctxt_BP_ctxt_t1 0_null

@zqlsnr
Copy link

zqlsnr commented Oct 21, 2024

@zengyh1900 嗨,您好!请问您的意思是不管是inpainting还是outpainting,随机mask构造训练数据,训练时需要图像和图像mask对,都不需要用到text了吗?

@zengyh1900
Copy link
Collaborator

hi @zqlsnr

  1. 我们的目标是这样的。我们认为随机构造mask的时候,更希望模型能根据没有被遮挡的内容来进行补全,所以训练的时候不加文本的。
  2. 但是为了稳定的训练和保留一定的能用文本指引的能力,训练的时候这部分是有一定概率用上image caption 的。

@zengyh1900 zengyh1900 changed the title 如何构建训练集 如何构建训练集 How to create training dataset Oct 25, 2024
@yanxirao
Copy link

@venshow-w @yeluoo @zengyh1900 大佬我建了一个PPT finetune交流群,大佬能加群,相互交流一下,有些数据处理方式,观看代码,咱们也猜不出来,大家可以一起分享经验,少走一些弯路。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

4 participants