**Describe the feature** 期望视觉模块可以支持gradient_checkpointing **Additional context** 目前视觉模块可以支持gradient_checkpointing不支持gradient_checkpointing, 开启视觉模块微调之后显存溢出