【启航计划】PaddlePaddle PHI算子库CUDA Kernel规范化

## 背景
飞桨在3.1 版本推出了 **类 CUDA 硬件接入方案**。该方案在 [Custom Device硬件接入方案](https://www.paddlepaddle.org.cn/documentation/docs/zh/develop/dev_guides/custom_device_docs/custom_device_overview_cn.html) 的基础上进行了升级，最大的特点是可以 **复用飞桨 PHI 算子库中的大量 CUDA Kernel**。 当前此方案已经成功接入**沐曦(metax_gpu)**和**天数智芯(iluvatar_gpu)**。

然而，目前PHI 算子库中的部分 CUDA Kernel 并未考虑被其他模块复用的情况，导致出现以下问题： 部分 Kernel 缺少函数声明，类 CUDA 硬件在复用时不得不直接 `#include` **`.cu` 源文件**，这不符合代码规范。 

因此，本次活动旨在对 PHI算子库的 CUDA Kernel 进行规范化修复： 
- 在Paddle仓库中为缺少头文件的 Kernel 新增对应声明文件（`.h`）； 
- 修复 PaddleCustomDevice 仓库中错误的 `#include cu` 用法，改为 `#include` 正确的头文件。

---

## 涉及范围
- **涉及仓库** 
 1. [Paddle](https://github.com/PaddlePaddle/Paddle) 
 2. [PaddleCustomDevice](https://github.com/PaddlePaddle/PaddleCustomDevice) 


- **影响文件** 
 在 **PaddleCustomDevice 仓** 中，所有被 `#include` 到注册文件中的算子 Kernel `.cu` 源文件，共 **136 个**。 
 具体文件列表见下方表格： 

## 任务
**修复目标** 
 1. 在 **PaddlePaddle 仓库** 中为缺少声明的 Kernel **新增头文件**；
 2. 在 **PaddleCustomDevice 仓库** 中修改错误的 `#include *.cu`，改为 `#include` 新增的头文件，同时把Kernel的实现代码正确的添加到CMakelists编译列表中。需要修改的代码只出现在`backends/metax_gpu`和`backends/iluvatar_gpu`这两个目录下。
 
| 序号 | 文件名称 | 认领人 / 状态 / PR号 |
|------|-------------------------------|--------------------|
| 1 | paddle/phi/kernels/fusion/gpu/distributed_fused_lamb_init_kernel.cu | @Le-soleile <img src="https://img.shields.io/badge/状态-提交PR-F39C12" /> [#2004](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2004) @YqGe585 <img src="https://img.shields.io/badge/状态-报名-2ECC71" /> | 
| 2 | paddle/phi/kernels/fusion/gpu/fused_bias_act_kernel.cu | @Le-soleile <img src="https://img.shields.io/badge/状态-部分完成-FFC0CB" /> [#75506](https://github.com/PaddlePaddle/Paddle/pull/75506) [#2004](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2004) | 
| 3 | paddle/phi/kernels/fusion/gpu/fused_bias_dropout_residual_layer_norm_grad_kernel.cu | @wanglezz <img src="https://img.shields.io/badge/状态-完成任务-9B59B6" /> [#75601](https://github.com/PaddlePaddle/Paddle/pull/75601) [#2090](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2090) | 
| 4 | paddle/phi/kernels/fusion/gpu/fused_bias_dropout_residual_layer_norm_kernel.cu | @wanglezz <img src="https://img.shields.io/badge/状态-完成任务-9B59B6" /> [#75625](https://github.com/PaddlePaddle/Paddle/pull/75625) [#2090](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2090) | 
| 5 | paddle/phi/kernels/fusion/gpu/fused_embedding_eltwise_layernorm_kernel.cu | @wanglezz <img src="https://img.shields.io/badge/状态-完成任务-9B59B6" /> [#75626](https://github.com/PaddlePaddle/Paddle/pull/75626) [#2090](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2090) | 
| 6 | paddle/phi/kernels/fusion/gpu/fused_layernorm_kernel.cu | @WanRui37 <img src="https://img.shields.io/badge/状态-部分完成-FFC0CB" /> [#75532](https://github.com/PaddlePaddle/Paddle/pull/75532) | 
| 7 | paddle/phi/kernels/fusion/gpu/fused_seqpool_cvm_grad_kernel.cu | @SpongeBob0318 <img src="https://img.shields.io/badge/状态-完成任务-9B59B6" /> [#75531](https://github.com/PaddlePaddle/Paddle/pull/75531) [#75536](https://github.com/PaddlePaddle/Paddle/pull/75536) [#2007](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2007) [#2008](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2008) | 
| 8 | paddle/phi/kernels/fusion/gpu/fused_seqpool_cvm_kernel.cu | @SpongeBob0318 <img src="https://img.shields.io/badge/状态-完成任务-9B59B6" /> [#75537](https://github.com/PaddlePaddle/Paddle/pull/75537) [#2009](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2009) | 
| 9 | paddle/phi/kernels/fusion/gpu/fused_softmax_mask_grad_kernel.cu | @SpongeBob0318 <img src="https://img.shields.io/badge/状态-完成任务-9B59B6" /> [#75538](https://github.com/PaddlePaddle/Paddle/pull/75538) [#2010](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2010) | 
| 10 | paddle/phi/kernels/fusion/gpu/fused_softmax_mask_kernel.cu | @youge325 <img src="https://img.shields.io/badge/状态-完成任务-9B59B6" /> [#75655](https://github.com/PaddlePaddle/Paddle/pull/75655) [#2072](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2072) | 
| 11 | paddle/phi/kernels/fusion/gpu/fused_softmax_mask_upper_triangle_kernel.cu | | 
| 12 | paddle/phi/kernels/fusion/gpu/fused_stack_transpose_quant_kernel.cu | @youge325 <img src="https://img.shields.io/badge/状态-完成任务-9B59B6" /> [#75658](https://github.com/PaddlePaddle/Paddle/pull/75658) [#2045](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2045) | 
| 13 | paddle/phi/kernels/fusion/gpu/fused_transpose_split_quant_kernel.cu | @SpongeBob0318 <img src="https://img.shields.io/badge/状态-完成任务-9B59B6" /> [#75539](https://github.com/PaddlePaddle/Paddle/pull/75539) [#2011](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2011) | 
| 14 | paddle/phi/kernels/fusion/gpu/fused_transpose_wlch_split_quant_kernel.cu | @SpongeBob0318 <img src="https://img.shields.io/badge/状态-完成任务-9B59B6" /> [#75540](https://github.com/PaddlePaddle/Paddle/pull/75540) [#2012](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2012) | 
| 15 | paddle/phi/kernels/fusion/gpu/fusion_group_kernel.cu | @SpongeBob0318 <img src="https://img.shields.io/badge/状态-完成任务-9B59B6" /> [#75541](https://github.com/PaddlePaddle/Paddle/pull/75541) [#2013](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2013) | 
| 16 | paddle/phi/kernels/fusion/gpu/masked_multihead_attention_kernel.cu | @Le-soleile <img src="https://img.shields.io/badge/状态-完成任务-9B59B6" /> [#75706](https://github.com/PaddlePaddle/Paddle/pull/75706) [#2100](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2100) | 
| 17 | paddle/phi/kernels/fusion/gpu/qkv_unpack_mha_kernel.cu | @Le-soleile <img src="https://img.shields.io/badge/状态-完成任务-9B59B6" /> [#75707](https://github.com/PaddlePaddle/Paddle/pull/75707) [#2100](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2100) | 
| 18 | paddle/phi/kernels/fusion/gpu/skip_layernorm_kernel.cu | @SpongeBob0318 <img src="https://img.shields.io/badge/状态-完成任务-9B59B6" /> [#75542](https://github.com/PaddlePaddle/Paddle/pull/75542) [#2014](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2014) | 
| 19 | paddle/phi/kernels/gpu/affine_channel_grad_kernel.cu | @SpongeBob0318 <img src="https://img.shields.io/badge/状态-完成任务-9B59B6" /> [#75543](https://github.com/PaddlePaddle/Paddle/pull/75543) [#2015](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2015) [#2025](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2025) [#2029](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2029) | 
| 20 | paddle/phi/kernels/gpu/affine_channel_kernel.cu | @SpongeBob0318 <img src="https://img.shields.io/badge/状态-完成任务-9B59B6" /> [#75545](https://github.com/PaddlePaddle/Paddle/pull/75545) [#2016](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2016) | 
| 21 | paddle/phi/kernels/gpu/ap_facade_kernel.cu | @youge325 <img src="https://img.shields.io/badge/状态-完成任务-9B59B6" /> [#75659](https://github.com/PaddlePaddle/Paddle/pull/75659) [#2046](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2046) @Echo-Nie <img src="https://img.shields.io/badge/状态-提交PR-F39C12" /> [#75657](https://github.com/PaddlePaddle/Paddle/pull/75657) [#2043](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2043) | 
| 22 | paddle/phi/kernels/gpu/ap_trivial_fusion_begin_kernel.cu | @youge325 <img src="https://img.shields.io/badge/状态-完成任务-9B59B6" /> [#75660](https://github.com/PaddlePaddle/Paddle/pull/75660) [#2073](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2073) | 
| 23 | paddle/phi/kernels/gpu/ap_trivial_fusion_end_kernel.cu | @youge325 <img src="https://img.shields.io/badge/状态-完成任务-9B59B6" /> [#75661](https://github.com/PaddlePaddle/Paddle/pull/75661) [#2092](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2092) | 
| 24 | paddle/phi/kernels/gpu/ap_variadic_kernel.cu | @youge325 <img src="https://img.shields.io/badge/状态-完成任务-9B59B6" /> [#75662](https://github.com/PaddlePaddle/Paddle/pull/75662) [#2093](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2093) | 
| 25 | paddle/phi/kernels/gpu/argsort_grad_kernel.cu | @Patrisam <img src="https://img.shields.io/badge/状态-提交PR-F39C12" /> [#2169](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2169) | 
| 26 | paddle/phi/kernels/gpu/barrier_kernel.cu | @youge325 <img src="https://img.shields.io/badge/状态-完成任务-9B59B6" /> [#75663](https://github.com/PaddlePaddle/Paddle/pull/75663) [#2094](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2094) | 
| 27 | paddle/phi/kernels/gpu/bce_loss_grad_kernel.cu | @Luxorion-12 <img src="https://img.shields.io/badge/状态-报名-2ECC71" /> | 
| 28 | paddle/phi/kernels/gpu/bce_loss_kernel.cu | @tjujingzong <img src="https://img.shields.io/badge/状态-提交PR-F39C12" /> [#2123](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2123) | 
| 29 | paddle/phi/kernels/gpu/binomial_kernel.cu | @tjujingzong <img src="https://img.shields.io/badge/状态-提交PR-F39C12" /> [#2123](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2123) | 
| 30 | paddle/phi/kernels/gpu/bmm_grad_kernel.cu | @tjujingzong <img src="https://img.shields.io/badge/状态-提交PR-F39C12" /> [#2123](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2123) | 
| 31 | paddle/phi/kernels/gpu/bmm_kernel.cu | @tjujingzong <img src="https://img.shields.io/badge/状态-提交PR-F39C12" /> [#2123](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2123) | 
| 32 | paddle/phi/kernels/gpu/box_clip_kernel.cu | @algorithm1832 <img src="https://img.shields.io/badge/状态-完成任务-9B59B6" /> [#75592](https://github.com/PaddlePaddle/Paddle/pull/75592) [#2021](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2021) | 
| 33 | paddle/phi/kernels/gpu/c_concat_kernel.cu | @algorithm1832 <img src="https://img.shields.io/badge/状态-完成任务-9B59B6" /> [#75648](https://github.com/PaddlePaddle/Paddle/pull/75648) [#2052](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2052) | 
| 34 | paddle/phi/kernels/gpu/c_embedding_grad_kernel.cu | @algorithm1832 <img src="https://img.shields.io/badge/状态-完成任务-9B59B6" /> [#2036](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2036) | 
| 35 | paddle/phi/kernels/gpu/c_scatter_kernel.cu | @algorithm1832 <img src="https://img.shields.io/badge/状态-完成任务-9B59B6" /> [#75653](https://github.com/PaddlePaddle/Paddle/pull/75653) [#2059](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2059) | 
| 36 | paddle/phi/kernels/gpu/c_softmax_with_cross_entropy_grad_kernel.cu | @youge325 <img src="https://img.shields.io/badge/状态-完成任务-9B59B6" /> [#75664](https://github.com/PaddlePaddle/Paddle/pull/75664) [#2095](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2095) | 
| 37 | paddle/phi/kernels/gpu/cast_kernel.cu | @Patrisam <img src="https://img.shields.io/badge/状态-提交PR-F39C12" /> [#2153](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2153) | 
| 38 | paddle/phi/kernels/gpu/class_center_sample_kernel.cu | @Patrisam <img src="https://img.shields.io/badge/状态-部分完成-FFC0CB" /> [#76374](https://github.com/PaddlePaddle/Paddle/pull/76374) [#2168](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2168) | 
| 39 | paddle/phi/kernels/gpu/collect_fpn_proposals_kernel.cu | @youge325 <img src="https://img.shields.io/badge/状态-完成任务-9B59B6" /> [#75665](https://github.com/PaddlePaddle/Paddle/pull/75665) [#2096](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2096) | 
| 40 | paddle/phi/kernels/gpu/comm_init_all_kernel.cu | @youge325 <img src="https://img.shields.io/badge/状态-完成任务-9B59B6" /> [#75666](https://github.com/PaddlePaddle/Paddle/pull/75666) [#2097](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2097) | 
| 41 | paddle/phi/kernels/gpu/complex_kernel.cu | | 
| 42 | paddle/phi/kernels/gpu/correlation_grad_kernel.cu | @tjujingzong <img src="https://img.shields.io/badge/状态-完成任务-9B59B6" /> [#75633](https://github.com/PaddlePaddle/Paddle/pull/75633) [#2047](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2047) | 
| 43 | paddle/phi/kernels/gpu/correlation_kernel.cu | @youge325 <img src="https://img.shields.io/badge/状态-完成任务-9B59B6" /> [#75667](https://github.com/PaddlePaddle/Paddle/pull/75667) [#2098](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2098) | 
| 44 | paddle/phi/kernels/gpu/ctc_align_kernel.cu | | 
| 45 | paddle/phi/kernels/gpu/cvm_grad_kernel.cu | @Le-soleile <img src="https://img.shields.io/badge/状态-完成任务-9B59B6" /> [#75704](https://github.com/PaddlePaddle/Paddle/pull/75704) [#2100](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2100) | 
| 46 | paddle/phi/kernels/gpu/cvm_kernel.cu | @Le-soleile <img src="https://img.shields.io/badge/状态-完成任务-9B59B6" /> [#75703](https://github.com/PaddlePaddle/Paddle/pull/75703) [#2100](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2100) | 
| 47 | paddle/phi/kernels/gpu/deformable_conv_grad_kernel.cu | @123wjr <img src="https://img.shields.io/badge/状态-提交PR-F39C12" /> [#2178](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2178) | 
| 48 | paddle/phi/kernels/gpu/deformable_conv_kernel.cu | @123wjr <img src="https://img.shields.io/badge/状态-提交PR-F39C12" /> [#2178](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2178) | 
| 49 | paddle/phi/kernels/gpu/elementwise_grad_kernel.cu | @LiaoYFBH <img src="https://img.shields.io/badge/状态-完成任务-9B59B6" /> [#2129](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2129) [#2155](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2155) | 
| 50 | paddle/phi/kernels/gpu/embedding_with_scaled_gradient_grad_kernel.cu | @LiaoYFBH <img src="https://img.shields.io/badge/状态-完成任务-9B59B6" /> [#2150](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2150) @metax666 <img src="https://img.shields.io/badge/状态-完成任务-9B59B6" /> [#2174](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2174) | 
| 51 | paddle/phi/kernels/gpu/exponential_kernel.cu | @LiaoYFBH <img src="https://img.shields.io/badge/状态-报名-2ECC71" /> | 
| 52 | paddle/phi/kernels/gpu/flip_kernel.cu | @LiaoYFBH <img src="https://img.shields.io/badge/状态-报名-2ECC71" /> | 
| 53 | paddle/phi/kernels/gpu/fused_token_prune_kernel.cu | @Le-soleile <img src="https://img.shields.io/badge/状态-完成任务-9B59B6" /> [#75701](https://github.com/PaddlePaddle/Paddle/pull/75701) [#2100](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2100) | 
| 54 | paddle/phi/kernels/gpu/gather_grad_kernel.cu | @liangqi520 <img src="https://img.shields.io/badge/状态-报名-2ECC71" /> | 
| 55 | paddle/phi/kernels/gpu/gelu_grad_kernel.cu | @Patrisam <img src="https://img.shields.io/badge/状态-提交PR-F39C12" /> [#2170](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2170) | 
| 56 | paddle/phi/kernels/gpu/global_gather_kernel.cu | @Le-soleile <img src="https://img.shields.io/badge/状态-部分完成-FFC0CB" /> [#75700](https://github.com/PaddlePaddle/Paddle/pull/75700) [#2142](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2142) | 
| 57 | paddle/phi/kernels/gpu/global_scatter_kernel.cu | @Le-soleile <img src="https://img.shields.io/badge/状态-部分完成-FFC0CB" /> [#75699](https://github.com/PaddlePaddle/Paddle/pull/75699) [#2142](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2142) | 
| 58 | paddle/phi/kernels/gpu/group_norm_grad_kernel.cu | | 
| 59 | paddle/phi/kernels/gpu/group_norm_kernel.cu | | 
| 60 | paddle/phi/kernels/gpu/gru_kernel.cu | @algorithm1832 <img src="https://img.shields.io/badge/状态-完成任务-9B59B6" /> [#75845](https://github.com/PaddlePaddle/Paddle/pull/75845) [#2126](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2126) | 
| 61 | paddle/phi/kernels/gpu/index_add_grad_kernel.cu | @algorithm1832 <img src="https://img.shields.io/badge/状态-完成任务-9B59B6" /> [#2068](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2068) [#2071](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2071) | 
| 62 | paddle/phi/kernels/gpu/interpolate_grad_kernel.cu | @algorithm1832 <img src="https://img.shields.io/badge/状态-完成任务-9B59B6" /> [#75974](https://github.com/PaddlePaddle/Paddle/pull/75974) [#2127](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2127) | 
| 63 | paddle/phi/kernels/gpu/interpolate_kernel.cu | @algorithm1832 <img src="https://img.shields.io/badge/状态-部分完成-FFC0CB" /> [#76261](https://github.com/PaddlePaddle/Paddle/pull/76261) [#2163](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2163) | 
| 64 | paddle/phi/kernels/gpu/kldiv_loss_grad_kernel.cu | @algorithm1832 <img src="https://img.shields.io/badge/状态-完成任务-9B59B6" /> [#2117](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2117) | 
| 65 | paddle/phi/kernels/gpu/kldiv_loss_kernel.cu | | 
| 66 | paddle/phi/kernels/gpu/l1_norm_grad_kernel.cu | @Le-soleile <img src="https://img.shields.io/badge/状态-部分完成-FFC0CB" /> [#75647](https://github.com/PaddlePaddle/Paddle/pull/75647) [#2142](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2142) | 
| 67 | paddle/phi/kernels/gpu/l1_norm_kernel.cu | | 
| 68 | paddle/phi/kernels/gpu/label_smooth_grad_kernel.cu | | 
| 69 | paddle/phi/kernels/gpu/label_smooth_kernel.cu | | 
| 70 | paddle/phi/kernels/gpu/lamb_kernel.cu | | 
| 71 | paddle/phi/kernels/gpu/lgamma_kernel.cu | | 
| 72 | paddle/phi/kernels/gpu/log_softmax_grad_kernel.cu | | 
| 73 | paddle/phi/kernels/gpu/logsumexp_kernel.cu | | 
| 74 | paddle/phi/kernels/gpu/lookup_table_grad_kernel.cu | @Le-soleile <img src="https://img.shields.io/badge/状态-部分完成-FFC0CB" /> [#75645](https://github.com/PaddlePaddle/Paddle/pull/75645) [#2142](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2142) | 
| 75 | paddle/phi/kernels/gpu/lookup_table_kernel.cu | @Le-soleile <img src="https://img.shields.io/badge/状态-部分完成-FFC0CB" /> [#75645](https://github.com/PaddlePaddle/Paddle/pull/75645) [#2142](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2142) | 
| 76 | paddle/phi/kernels/gpu/lu_solve_kernel.cu | @ChenMiaoi <img src="https://img.shields.io/badge/状态-报名-2ECC71" /> | 
| 77 | paddle/phi/kernels/gpu/margin_cross_entropy_kernel.cu | @ChenMiaoi <img src="https://img.shields.io/badge/状态-报名-2ECC71" /> | 
| 78 | paddle/phi/kernels/gpu/matrix_power_grad_kernel.cu | @ChenMiaoi <img src="https://img.shields.io/badge/状态-报名-2ECC71" /> | 
| 79 | paddle/phi/kernels/gpu/matrix_power_kernel.cu | @ChenMiaoi <img src="https://img.shields.io/badge/状态-报名-2ECC71" /> | 
| 80 | paddle/phi/kernels/gpu/mean_all_grad_kernel.cu | @Patrisam <img src="https://img.shields.io/badge/状态-提交PR-F39C12" /> [#2171](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2171) | 
| 81 | paddle/phi/kernels/gpu/moe_unpermute_kernel.cu | @Le-soleile <img src="https://img.shields.io/badge/状态-部分完成-FFC0CB" /> [#75644](https://github.com/PaddlePaddle/Paddle/pull/75644) [#2142](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2142) | 
| 82 | paddle/phi/kernels/gpu/momentum_kernel.cu | | 
| 83 | paddle/phi/kernels/gpu/mp_allreduce_sum_kernel.cu | @fsylmxx <img src="https://img.shields.io/badge/状态-报名-2ECC71" /> | 
| 84 | paddle/phi/kernels/gpu/multiclass_nms3_kernel.cu | @fsylmxx <img src="https://img.shields.io/badge/状态-报名-2ECC71" /> | 
| 85 | paddle/phi/kernels/gpu/multiplex_grad_kernel.cu | @fsylmxx <img src="https://img.shields.io/badge/状态-报名-2ECC71" /> | 
| 86 | paddle/phi/kernels/gpu/nonzero_kernel.cu | | 
| 87 | paddle/phi/kernels/gpu/pad3d_kernel.cu | | 
| 88 | paddle/phi/kernels/gpu/partial_allgather_kernel.cu | @Le-soleile <img src="https://img.shields.io/badge/状态-部分完成-FFC0CB" /> [#75643](https://github.com/PaddlePaddle/Paddle/pull/75643) [#2142](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2142) | 
| 89 | paddle/phi/kernels/gpu/partial_concat_grad_kernel.cu | @Le-soleile <img src="https://img.shields.io/badge/状态-部分完成-FFC0CB" /> [#75642](https://github.com/PaddlePaddle/Paddle/pull/75642) [#2142](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2142) | 
| 90 | paddle/phi/kernels/gpu/partial_concat_kernel.cu | | 
| 91 | paddle/phi/kernels/gpu/partial_recv_kernel.cu | @Le-soleile <img src="https://img.shields.io/badge/状态-部分完成-FFC0CB" /> [#75641](https://github.com/PaddlePaddle/Paddle/pull/75641) [#2142](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2142) | 
| 92 | paddle/phi/kernels/gpu/partial_send_kernel.cu | @Le-soleile <img src="https://img.shields.io/badge/状态-部分完成-FFC0CB" /> [#75640](https://github.com/PaddlePaddle/Paddle/pull/75640) [#2142](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2142) | 
| 93 | paddle/phi/kernels/gpu/psroi_pool_grad_kernel.cu | @xxiu1 <img src="https://img.shields.io/badge/状态-完成任务-9B59B6" /> [#75938](https://github.com/PaddlePaddle/Paddle/pull/75938) [#2088](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2088) | 
| 94 | paddle/phi/kernels/gpu/quantize_linear_kernel.cu | | 
| 95 | paddle/phi/kernels/gpu/reduce_kernel.cu | | 
| 96 | paddle/phi/kernels/gpu/repeat_interleave_grad_kernel.cu | | 
| 97 | paddle/phi/kernels/gpu/repeat_interleave_kernel.cu | | 
| 98 | paddle/phi/kernels/gpu/rmsprop_kernel.cu | | 
| 99 | paddle/phi/kernels/gpu/roi_align_grad_kernel.cu | | 
| 100 | paddle/phi/kernels/gpu/roi_align_kernel.cu | @Le-soleile <img src="https://img.shields.io/badge/状态-完成任务-9B59B6" /> [#2005](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2005) | 
| 101 | paddle/phi/kernels/gpu/row_conv_grad_kernel.cu | @Le-soleile <img src="https://img.shields.io/badge/状态-部分完成-FFC0CB" /> [#75554](https://github.com/PaddlePaddle/Paddle/pull/75554) [#2142](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2142) | 
| 102 | paddle/phi/kernels/gpu/row_conv_kernel.cu | @Le-soleile <img src="https://img.shields.io/badge/状态-部分完成-FFC0CB" /> [#75562](https://github.com/PaddlePaddle/Paddle/pull/75562) [#2142](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2142) | 
| 103 | paddle/phi/kernels/gpu/seed_kernel.cu | @Le-soleile <img src="https://img.shields.io/badge/状态-部分完成-FFC0CB" /> [#75577](https://github.com/PaddlePaddle/Paddle/pull/75577) [#2142](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2142) | 
| 104 | paddle/phi/kernels/gpu/sequence_expand_kernel.cu | @Le-soleile <img src="https://img.shields.io/badge/状态-部分完成-FFC0CB" /> [#75578](https://github.com/PaddlePaddle/Paddle/pull/75578) [#2142](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2142) | 
| 105 | paddle/phi/kernels/gpu/set_value_kernel.cu | @Le-soleile <img src="https://img.shields.io/badge/状态-完成任务-9B59B6" /> [#2018](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2018) | 
| 106 | paddle/phi/kernels/gpu/shuffle_channel_grad_kernel.cu | @Le-soleile <img src="https://img.shields.io/badge/状态-部分完成-FFC0CB" /> [#75580](https://github.com/PaddlePaddle/Paddle/pull/75580) [#2142](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2142) | 
| 107 | paddle/phi/kernels/gpu/shuffle_channel_kernel.cu | @Le-soleile <img src="https://img.shields.io/badge/状态-部分完成-FFC0CB" /> [#2020](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2020) [#75608](https://github.com/PaddlePaddle/Paddle/pull/75608) [#2142](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2142) | 
| 108 | paddle/phi/kernels/gpu/soft_relu_grad_kernel.cu | @Le-soleile <img src="https://img.shields.io/badge/状态-部分完成-FFC0CB" /> [#75581](https://github.com/PaddlePaddle/Paddle/pull/75581) [#2142](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2142) | 
| 109 | paddle/phi/kernels/gpu/spectral_norm_grad_kernel.cu | @Le-soleile <img src="https://img.shields.io/badge/状态-完成任务-9B59B6" /> [#2027](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2027) | 
| 110 | paddle/phi/kernels/gpu/spectral_norm_kernel.cu | @Le-soleile <img src="https://img.shields.io/badge/状态-完成任务-9B59B6" /> [#2028](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2028) | 
| 111 | paddle/phi/kernels/gpu/stack_grad_kernel.cu | | 
| 112 | paddle/phi/kernels/gpu/stft_grad_kernel.cu | @Le-soleile <img src="https://img.shields.io/badge/状态-部分完成-FFC0CB" /> [#75614](https://github.com/PaddlePaddle/Paddle/pull/75614) [#2142](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2142) | 
| 113 | paddle/phi/kernels/gpu/sync_batch_norm_grad_kernel.cu | | 
| 114 | paddle/phi/kernels/gpu/top_k_kernel.cu | | 
| 115 | paddle/phi/kernels/gpu/uniform_random_batch_size_like_kernel.cu | @Le-soleile <img src="https://img.shields.io/badge/状态-部分完成-FFC0CB" /> [#75615](https://github.com/PaddlePaddle/Paddle/pull/75615) [#2142](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2142) | 
| 116 | paddle/phi/kernels/gpu/weighted_sample_neighbors_kernel.cu | | 
| 117 | paddle/phi/kernels/gpu/yolo_box_head_kernel.cu | @Le-soleile <img src="https://img.shields.io/badge/状态-部分完成-FFC0CB" /> [#75616](https://github.com/PaddlePaddle/Paddle/pull/75616) [#2142](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2142) | 
| 118 | paddle/phi/kernels/gpu/yolo_box_post_kernel.cu | @Le-soleile <img src="https://img.shields.io/badge/状态-部分完成-FFC0CB" /> [#75636](https://github.com/PaddlePaddle/Paddle/pull/75636) [#2142](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2142) | 
| 119 | paddle/phi/kernels/kps/elementwise_kernel.cu | | 
| 120 | paddle/phi/kernels/legacy/gpu/cal_aux_loss_grad_kernel.cu | @Le-soleile <img src="https://img.shields.io/badge/状态-部分完成-FFC0CB" /> [#75637](https://github.com/PaddlePaddle/Paddle/pull/75637) [#2142](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2142) | 
| 121 | paddle/phi/kernels/legacy/gpu/cal_aux_loss_kernel.cu | @Le-soleile <img src="https://img.shields.io/badge/状态-部分完成-FFC0CB" /> [#75639](https://github.com/PaddlePaddle/Paddle/pull/75639) [#2142](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2142) | 
| 122 | paddle/phi/kernels/legacy/gpu/expand_modality_expert_id_kernel.cu | @Le-soleile <img src="https://img.shields.io/badge/状态-部分完成-FFC0CB" /> [#75708](https://github.com/PaddlePaddle/Paddle/pull/75708) [#2142](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2142) | 
| 123 | paddle/phi/kernels/legacy/gpu/ext_build_src_rank_and_local_expert_id_kernel.cu | @Le-soleile <img src="https://img.shields.io/badge/状态-部分完成-FFC0CB" /> [#75709](https://github.com/PaddlePaddle/Paddle/pull/75709) [#2142](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2142) | 
| 124 | paddle/phi/kernels/legacy/gpu/fp8_quant_blockwise_kernel.cu | @Le-soleile <img src="https://img.shields.io/badge/状态-部分完成-FFC0CB" /> [#75710](https://github.com/PaddlePaddle/Paddle/pull/75710) [#2142](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2142) | 
| 125 | paddle/phi/kernels/legacy/gpu/int_bincount.cu | | 
| 126 | paddle/phi/kernels/legacy/gpu/layer_norm_cuda_kernel.cu | | 
| 127 | paddle/phi/kernels/legacy/gpu/moe_combine_grad_kernel.cu | | 
| 128 | paddle/phi/kernels/legacy/gpu/moe_combine_kernel.cu | | 
| 129 | paddle/phi/kernels/legacy/gpu/moe_combine_no_weight_kernel.cu | | 
| 130 | paddle/phi/kernels/legacy/gpu/moe_gate_dispatch_grad_kernel.cu | | 
| 131 | paddle/phi/kernels/legacy/gpu/moe_gate_dispatch_kernel.cu | | 
| 132 | paddle/phi/kernels/legacy/gpu/moe_gate_dispatch_permute_grad_kernel.cu | @Le-soleile <img src="https://img.shields.io/badge/状态-部分完成-FFC0CB" /> [#75711](https://github.com/PaddlePaddle/Paddle/pull/75711) [#2142](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2142) | 
| 133 | paddle/phi/kernels/legacy/gpu/moe_gate_dispatch_permute_kernel.cu | @Le-soleile <img src="https://img.shields.io/badge/状态-部分完成-FFC0CB" /> [#75713](https://github.com/PaddlePaddle/Paddle/pull/75713) [#2142](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2142) | 
| 134 | paddle/phi/kernels/legacy/gpu/moe_ops_partial_nosoftmaxtopk_grad_kernel.cu | @Le-soleile <img src="https://img.shields.io/badge/状态-部分完成-FFC0CB" /> [#75714](https://github.com/PaddlePaddle/Paddle/pull/75714) [#2142](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2142) | 
| 135 | paddle/phi/kernels/legacy/gpu/moe_ops_partial_nosoftmaxtopk_kernel.cu | @Le-soleile <img src="https://img.shields.io/badge/状态-部分完成-FFC0CB" /> [#75715](https://github.com/PaddlePaddle/Paddle/pull/75715) [#2142](https://github.com/PaddlePaddle/PaddleCustomDevice/pull/2142) | 
| 136 | paddle/phi/kernels/legacy/kps/compare_kernel.cu | | 

---

## 示例修复&代码提交方式

请参考 https://github.com/PaddlePaddle/Paddle/issues/75226#issuecomment-3283605020


## 认领方式

请大家以 comment 的形式认领任务，如：

```
【报名】：1、3、2-3
```

- 多个任务之间需要使用**中文顿号**分隔，报名多个连续任务可用横线表示，如 1-2 
- PR 提交格式：
 - 两个仓库分别提交 PR，Paddle 的 PR 合入后，再提交 PaddleCustomDevice 的 PR 
 - 两个仓库的 PR 标题均以 **【CUDA Kernel No.xxx】** 开头，注明任务编号
 - Paddle 仓库的 PR 标题以 **`-part`** 结尾
---

## 看板信息 
| 任务方向 | 任务数量 | 提交作品 / 任务认领 | 提交率 | 完成 | 完成率 |
| :----: | :----: | :----: | :----: | :----: | :----: |
| CUDA Kernel规范化 | 136 | 89 / 100 | 65.44% | 44 | 32.35% |
#####

## 统计信息 
> 排名不分先后 @wanglezz (3) @SpongeBob0318 (9) @youge325 (11) @Le-soleile (9) @algorithm1832 (8) @tjujingzong (1) @LiaoYFBH (2) @xxiu1 (1) 
#####

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

【启航计划】PaddlePaddle PHI算子库CUDA Kernel规范化 #75226

背景

涉及范围

任务

示例修复&代码提交方式

认领方式

看板信息

统计信息

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

序号	文件名称	认领人 / 状态 / PR号
1	paddle/phi/kernels/fusion/gpu/distributed_fused_lamb_init_kernel.cu	@Le-soleile #2004 @YqGe585
2	paddle/phi/kernels/fusion/gpu/fused_bias_act_kernel.cu	@Le-soleile #75506 #2004
3	paddle/phi/kernels/fusion/gpu/fused_bias_dropout_residual_layer_norm_grad_kernel.cu	@wanglezz #75601 #2090
4	paddle/phi/kernels/fusion/gpu/fused_bias_dropout_residual_layer_norm_kernel.cu	@wanglezz #75625 #2090
5	paddle/phi/kernels/fusion/gpu/fused_embedding_eltwise_layernorm_kernel.cu	@wanglezz #75626 #2090
6	paddle/phi/kernels/fusion/gpu/fused_layernorm_kernel.cu	@WanRui37 #75532
7	paddle/phi/kernels/fusion/gpu/fused_seqpool_cvm_grad_kernel.cu	@SpongeBob0318 #75531 #75536 #2007 #2008
8	paddle/phi/kernels/fusion/gpu/fused_seqpool_cvm_kernel.cu	@SpongeBob0318 #75537 #2009
9	paddle/phi/kernels/fusion/gpu/fused_softmax_mask_grad_kernel.cu	@SpongeBob0318 #75538 #2010
10	paddle/phi/kernels/fusion/gpu/fused_softmax_mask_kernel.cu	@youge325 #75655 #2072
11	paddle/phi/kernels/fusion/gpu/fused_softmax_mask_upper_triangle_kernel.cu
12	paddle/phi/kernels/fusion/gpu/fused_stack_transpose_quant_kernel.cu	@youge325 #75658 #2045
13	paddle/phi/kernels/fusion/gpu/fused_transpose_split_quant_kernel.cu	@SpongeBob0318 #75539 #2011
14	paddle/phi/kernels/fusion/gpu/fused_transpose_wlch_split_quant_kernel.cu	@SpongeBob0318 #75540 #2012
15	paddle/phi/kernels/fusion/gpu/fusion_group_kernel.cu	@SpongeBob0318 #75541 #2013
16	paddle/phi/kernels/fusion/gpu/masked_multihead_attention_kernel.cu	@Le-soleile #75706 #2100
17	paddle/phi/kernels/fusion/gpu/qkv_unpack_mha_kernel.cu	@Le-soleile #75707 #2100
18	paddle/phi/kernels/fusion/gpu/skip_layernorm_kernel.cu	@SpongeBob0318 #75542 #2014
19	paddle/phi/kernels/gpu/affine_channel_grad_kernel.cu	@SpongeBob0318 #75543 #2015 #2025 #2029
20	paddle/phi/kernels/gpu/affine_channel_kernel.cu	@SpongeBob0318 #75545 #2016
21	paddle/phi/kernels/gpu/ap_facade_kernel.cu	@youge325 #75659 #2046 @Echo-Nie #75657 #2043
22	paddle/phi/kernels/gpu/ap_trivial_fusion_begin_kernel.cu	@youge325 #75660 #2073
23	paddle/phi/kernels/gpu/ap_trivial_fusion_end_kernel.cu	@youge325 #75661 #2092
24	paddle/phi/kernels/gpu/ap_variadic_kernel.cu	@youge325 #75662 #2093
25	paddle/phi/kernels/gpu/argsort_grad_kernel.cu	@Patrisam #2169
26	paddle/phi/kernels/gpu/barrier_kernel.cu	@youge325 #75663 #2094
27	paddle/phi/kernels/gpu/bce_loss_grad_kernel.cu	@Luxorion-12
28	paddle/phi/kernels/gpu/bce_loss_kernel.cu	@tjujingzong #2123
29	paddle/phi/kernels/gpu/binomial_kernel.cu	@tjujingzong #2123
30	paddle/phi/kernels/gpu/bmm_grad_kernel.cu	@tjujingzong #2123
31	paddle/phi/kernels/gpu/bmm_kernel.cu	@tjujingzong #2123
32	paddle/phi/kernels/gpu/box_clip_kernel.cu	@algorithm1832 #75592 #2021
33	paddle/phi/kernels/gpu/c_concat_kernel.cu	@algorithm1832 #75648 #2052
34	paddle/phi/kernels/gpu/c_embedding_grad_kernel.cu	@algorithm1832 #2036
35	paddle/phi/kernels/gpu/c_scatter_kernel.cu	@algorithm1832 #75653 #2059
36	paddle/phi/kernels/gpu/c_softmax_with_cross_entropy_grad_kernel.cu	@youge325 #75664 #2095
37	paddle/phi/kernels/gpu/cast_kernel.cu	@Patrisam #2153
38	paddle/phi/kernels/gpu/class_center_sample_kernel.cu	@Patrisam #76374 #2168
39	paddle/phi/kernels/gpu/collect_fpn_proposals_kernel.cu	@youge325 #75665 #2096
40	paddle/phi/kernels/gpu/comm_init_all_kernel.cu	@youge325 #75666 #2097
41	paddle/phi/kernels/gpu/complex_kernel.cu
42	paddle/phi/kernels/gpu/correlation_grad_kernel.cu	@tjujingzong #75633 #2047
43	paddle/phi/kernels/gpu/correlation_kernel.cu	@youge325 #75667 #2098
44	paddle/phi/kernels/gpu/ctc_align_kernel.cu
45	paddle/phi/kernels/gpu/cvm_grad_kernel.cu	@Le-soleile #75704 #2100
46	paddle/phi/kernels/gpu/cvm_kernel.cu	@Le-soleile #75703 #2100
47	paddle/phi/kernels/gpu/deformable_conv_grad_kernel.cu	@123wjr #2178
48	paddle/phi/kernels/gpu/deformable_conv_kernel.cu	@123wjr #2178
49	paddle/phi/kernels/gpu/elementwise_grad_kernel.cu	@LiaoYFBH #2129 #2155
50	paddle/phi/kernels/gpu/embedding_with_scaled_gradient_grad_kernel.cu	@LiaoYFBH #2150 @metax666 #2174
51	paddle/phi/kernels/gpu/exponential_kernel.cu	@LiaoYFBH
52	paddle/phi/kernels/gpu/flip_kernel.cu	@LiaoYFBH
53	paddle/phi/kernels/gpu/fused_token_prune_kernel.cu	@Le-soleile #75701 #2100
54	paddle/phi/kernels/gpu/gather_grad_kernel.cu	@liangqi520
55	paddle/phi/kernels/gpu/gelu_grad_kernel.cu	@Patrisam #2170
56	paddle/phi/kernels/gpu/global_gather_kernel.cu	@Le-soleile #75700 #2142
57	paddle/phi/kernels/gpu/global_scatter_kernel.cu	@Le-soleile #75699 #2142
58	paddle/phi/kernels/gpu/group_norm_grad_kernel.cu
59	paddle/phi/kernels/gpu/group_norm_kernel.cu
60	paddle/phi/kernels/gpu/gru_kernel.cu	@algorithm1832 #75845 #2126
61	paddle/phi/kernels/gpu/index_add_grad_kernel.cu	@algorithm1832 #2068 #2071
62	paddle/phi/kernels/gpu/interpolate_grad_kernel.cu	@algorithm1832 #75974 #2127
63	paddle/phi/kernels/gpu/interpolate_kernel.cu	@algorithm1832 #76261 #2163
64	paddle/phi/kernels/gpu/kldiv_loss_grad_kernel.cu	@algorithm1832 #2117
65	paddle/phi/kernels/gpu/kldiv_loss_kernel.cu
66	paddle/phi/kernels/gpu/l1_norm_grad_kernel.cu	@Le-soleile #75647 #2142
67	paddle/phi/kernels/gpu/l1_norm_kernel.cu
68	paddle/phi/kernels/gpu/label_smooth_grad_kernel.cu
69	paddle/phi/kernels/gpu/label_smooth_kernel.cu
70	paddle/phi/kernels/gpu/lamb_kernel.cu
71	paddle/phi/kernels/gpu/lgamma_kernel.cu
72	paddle/phi/kernels/gpu/log_softmax_grad_kernel.cu
73	paddle/phi/kernels/gpu/logsumexp_kernel.cu
74	paddle/phi/kernels/gpu/lookup_table_grad_kernel.cu	@Le-soleile #75645 #2142
75	paddle/phi/kernels/gpu/lookup_table_kernel.cu	@Le-soleile #75645 #2142
76	paddle/phi/kernels/gpu/lu_solve_kernel.cu	@ChenMiaoi
77	paddle/phi/kernels/gpu/margin_cross_entropy_kernel.cu	@ChenMiaoi
78	paddle/phi/kernels/gpu/matrix_power_grad_kernel.cu	@ChenMiaoi
79	paddle/phi/kernels/gpu/matrix_power_kernel.cu	@ChenMiaoi
80	paddle/phi/kernels/gpu/mean_all_grad_kernel.cu	@Patrisam #2171
81	paddle/phi/kernels/gpu/moe_unpermute_kernel.cu	@Le-soleile #75644 #2142
82	paddle/phi/kernels/gpu/momentum_kernel.cu
83	paddle/phi/kernels/gpu/mp_allreduce_sum_kernel.cu	@fsylmxx
84	paddle/phi/kernels/gpu/multiclass_nms3_kernel.cu	@fsylmxx
85	paddle/phi/kernels/gpu/multiplex_grad_kernel.cu	@fsylmxx
86	paddle/phi/kernels/gpu/nonzero_kernel.cu
87	paddle/phi/kernels/gpu/pad3d_kernel.cu
88	paddle/phi/kernels/gpu/partial_allgather_kernel.cu	@Le-soleile #75643 #2142
89	paddle/phi/kernels/gpu/partial_concat_grad_kernel.cu	@Le-soleile #75642 #2142
90	paddle/phi/kernels/gpu/partial_concat_kernel.cu
91	paddle/phi/kernels/gpu/partial_recv_kernel.cu	@Le-soleile #75641 #2142
92	paddle/phi/kernels/gpu/partial_send_kernel.cu	@Le-soleile #75640 #2142
93	paddle/phi/kernels/gpu/psroi_pool_grad_kernel.cu	@xxiu1 #75938 #2088
94	paddle/phi/kernels/gpu/quantize_linear_kernel.cu
95	paddle/phi/kernels/gpu/reduce_kernel.cu
96	paddle/phi/kernels/gpu/repeat_interleave_grad_kernel.cu
97	paddle/phi/kernels/gpu/repeat_interleave_kernel.cu
98	paddle/phi/kernels/gpu/rmsprop_kernel.cu
99	paddle/phi/kernels/gpu/roi_align_grad_kernel.cu
100	paddle/phi/kernels/gpu/roi_align_kernel.cu	@Le-soleile #2005
101	paddle/phi/kernels/gpu/row_conv_grad_kernel.cu	@Le-soleile #75554 #2142
102	paddle/phi/kernels/gpu/row_conv_kernel.cu	@Le-soleile #75562 #2142
103	paddle/phi/kernels/gpu/seed_kernel.cu	@Le-soleile #75577 #2142
104	paddle/phi/kernels/gpu/sequence_expand_kernel.cu	@Le-soleile #75578 #2142
105	paddle/phi/kernels/gpu/set_value_kernel.cu	@Le-soleile #2018
106	paddle/phi/kernels/gpu/shuffle_channel_grad_kernel.cu	@Le-soleile #75580 #2142
107	paddle/phi/kernels/gpu/shuffle_channel_kernel.cu	@Le-soleile #2020 #75608 #2142
108	paddle/phi/kernels/gpu/soft_relu_grad_kernel.cu	@Le-soleile #75581 #2142
109	paddle/phi/kernels/gpu/spectral_norm_grad_kernel.cu	@Le-soleile #2027
110	paddle/phi/kernels/gpu/spectral_norm_kernel.cu	@Le-soleile #2028
111	paddle/phi/kernels/gpu/stack_grad_kernel.cu
112	paddle/phi/kernels/gpu/stft_grad_kernel.cu	@Le-soleile #75614 #2142
113	paddle/phi/kernels/gpu/sync_batch_norm_grad_kernel.cu
114	paddle/phi/kernels/gpu/top_k_kernel.cu
115	paddle/phi/kernels/gpu/uniform_random_batch_size_like_kernel.cu	@Le-soleile #75615 #2142
116	paddle/phi/kernels/gpu/weighted_sample_neighbors_kernel.cu
117	paddle/phi/kernels/gpu/yolo_box_head_kernel.cu	@Le-soleile #75616 #2142
118	paddle/phi/kernels/gpu/yolo_box_post_kernel.cu	@Le-soleile #75636 #2142
119	paddle/phi/kernels/kps/elementwise_kernel.cu
120	paddle/phi/kernels/legacy/gpu/cal_aux_loss_grad_kernel.cu	@Le-soleile #75637 #2142
121	paddle/phi/kernels/legacy/gpu/cal_aux_loss_kernel.cu	@Le-soleile #75639 #2142
122	paddle/phi/kernels/legacy/gpu/expand_modality_expert_id_kernel.cu	@Le-soleile #75708 #2142
123	paddle/phi/kernels/legacy/gpu/ext_build_src_rank_and_local_expert_id_kernel.cu	@Le-soleile #75709 #2142
124	paddle/phi/kernels/legacy/gpu/fp8_quant_blockwise_kernel.cu	@Le-soleile #75710 #2142
125	paddle/phi/kernels/legacy/gpu/int_bincount.cu
126	paddle/phi/kernels/legacy/gpu/layer_norm_cuda_kernel.cu
127	paddle/phi/kernels/legacy/gpu/moe_combine_grad_kernel.cu
128	paddle/phi/kernels/legacy/gpu/moe_combine_kernel.cu
129	paddle/phi/kernels/legacy/gpu/moe_combine_no_weight_kernel.cu
130	paddle/phi/kernels/legacy/gpu/moe_gate_dispatch_grad_kernel.cu
131	paddle/phi/kernels/legacy/gpu/moe_gate_dispatch_kernel.cu
132	paddle/phi/kernels/legacy/gpu/moe_gate_dispatch_permute_grad_kernel.cu	@Le-soleile #75711 #2142
133	paddle/phi/kernels/legacy/gpu/moe_gate_dispatch_permute_kernel.cu	@Le-soleile #75713 #2142
134	paddle/phi/kernels/legacy/gpu/moe_ops_partial_nosoftmaxtopk_grad_kernel.cu	@Le-soleile #75714 #2142
135	paddle/phi/kernels/legacy/gpu/moe_ops_partial_nosoftmaxtopk_kernel.cu	@Le-soleile #75715 #2142
136	paddle/phi/kernels/legacy/kps/compare_kernel.cu

【启航计划】PaddlePaddle PHI算子库CUDA Kernel规范化 #75226

Description

背景

涉及范围

任务

示例修复&代码提交方式

认领方式

看板信息

统计信息

Metadata

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Issue actions