-
Notifications
You must be signed in to change notification settings - Fork 29
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
heLlo ,非常棒的工作 有些问题想请教下 #5
Comments
hi感谢提问,
|
感谢您的回复,1.2.3 是近期看了国内外都在做强化学习的后训练,我觉得这个GUI AGENTS同理,所以也稍微看了下REFT、webrl的相关ORM、 PRM的方法, 推理增强可能是非常适合这种产生多trace的任务,想请教下目前这个gui agents模型训练的后续提升方式是否就是这种技术路线? 4. 额外想问下 目前glm的、deepmind一些相关的web use\computer use claude,开源的 \showui、 agvius\的demo方案,我都接触了下 我感觉这块实际落地商用可用性还不够,是否还是聚焦于某些场景和选定的UI界面 做优化,最小化任务去落地?咱们有没有联系方式 或者群,另外window上运行有个大小写问题 提了个PR 可以看下 |
|
好的 如果有技术交流群 就太好了 又几个小问题 |
|
1.COT的强化 是否指在通过在模型输入和输出格式在SFT中训练体现?
2. 类似之前autoweb WEBL的强化学习后训练后续会有这块工作分享吗?
3. 用PRM-PPO是否后续GUI AGENT或者VLM LLM的唯一途径?
4. 会开源数据集 和PT的训练细节吗?
The text was updated successfully, but these errors were encountered: