-
Notifications
You must be signed in to change notification settings - Fork 3k
PaddleNLP 快乐开源活动 (2025 H1) 🎉 #9763
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Labels
others
unknown issue type
Comments
【报名】:1-2 |
【报名】:5 |
【报名】:27 |
【报名】:26 |
This was referenced Apr 11, 2025
【报名】:6-8 |
【报名】:18、19 |
This was referenced Apr 16, 2025
【报名】:17 |
【报名】:9 |
【报名】:10-16 |
【报名】:20、21、29 |
【报名】:33 |
【报名】:1-4 |
【报名】:30-32 |
【报名】:24 |
【报名】:7、8 |
This was referenced Apr 23, 2025
This was referenced Apr 23, 2025
Merged
【报名】:22 |
【报名】:23、25 |
This was referenced Apr 24, 2025
目前PIR任务12、14由于版本变化已经不在dev分支;任务11、17由于版本变更部分云端依赖文件有变动;10、16模型导出代码暂时无法正常运行。 |
【报名】:6 |
This was referenced Apr 25, 2025
【报名】:1 |
【报名】:2、3、4 |
This was referenced May 18, 2025
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
Uh oh!
There was an error while loading. Please reload this page.
问题描述
📣PaddleNLP 快乐开源活动
旨在鼓励更多的开发者参与到飞桨大模型套件的开源建设中,帮助社区修复 bug 或贡献 feature,共建飞桨。
🔥热身任务
跑通 Qwen2 的训练流程,通过完成本任务,可以收获如何进行大语言模型预训练和微调,也可以快速上手PaddleNLP。
🌈命题任务
命题任务是我们总结整理大模型套件的需求得出,每个任务上标注了任务难度,大家可以选择参与。欢迎对这些需求感兴趣的开发者参与到这些任务的开发✌️✌️。在开发过程中,你能进行包括任务分解、代码撰写等工作,还会有飞桨的研发全程和你一起解决可能遇到的问题。还等什么,快来参与吧。🎉🎉
认领方式
请大家以 comment 的形式认领任务,如:
【报名】:1、3、12-13
多个任务之间需要使用中文顿号分隔,报名多个连续任务可用横线表示,如 2-5
PR 提交格式:在 PR 的标题中以【PaddleNLP No.xxx】开头,注明任务编号
任务列表
mentor:@DrownFish19 @ZHUI
大语言模型训练
当前训练文档从资深开发者角度出发,说明了如何使用paddlenlp进行训练,但是还缺少详细说明。快乐开源以新手视角重新审视文档,希望结合数据制作、模型训练和参数调优等方面详细介绍说明如何上手paddlenlp。不用担心自己没有经验,我们欢迎所有开发者前来体验,如果有任何问题欢迎提出issue(24小时内回复)。
验收标准:在星河平台(aistudio)构建训练文档后,导出notebook为markdown格式,上传至PaddleNLP/llm/docs/目录。(导出后显示细节可能存在差异,请检查修改)
@HangFu7
@Echo-Nie
@HangFu7
@hanlintang
@hanlintang
@hanlintang
小模型Paddle 高扩展中间表示PIR适配
飞桨框架3.0 Beta 版本延续了2.x版本动静统一、训推一体的设计理念,其开发接口全面兼容2.x版本。这意味着,使用2.x版本开发的代码,在绝大多数情况下无需修改,即可直接在3.x版本上运行。其中高扩展中间表示PIR(Paddle Intermediate Representation)作为升级功能点之一,支撑着动转静、自动微分、自动并行、组合算子、图优化等多项技术,并广泛应用于分布式训练、模型压缩、推理部署等场景。通过PIR提供的DRR(Declarative Rewrite Rule)机制,Pass的开发成本可以降低60%。我们对超过900个模型配置进行了测试,结果显示,在使用PIR后,推理的整体性能提升了超过10%。但是当前小模型适配PIR的并没有全部验证修改,亟需开发者参与适配。
任务要求:修复特定模型或特定任务,完成PIR模型动转静验证,并在CI运行脚本(scripts/regression/ci_case.sh)增加对应的测试用例。
修改示范:
@hanlintang
@Echo-Nie
@Echo-Nie
slm/examples/machine_translationslm/examples/model_compression/pp-minilmslm/examples/question_generation/unimo-textslm/examples/text_correction/ernie-cscslm/examples/text_summarization/unimo-textslm/examples/text_to_knowledge/nptag看板信息
统计信息
The text was updated successfully, but these errors were encountered: