Skip to content

Awesome-LLM: a curated list of Large Language Model.🔥 大型语言模型(LLM)已经席卷了 全球,不再局限于 NLP 或 AI 社区。这里整理了一些关于大型语言模型,特别是与 ChatGPT 相关的研究论文,涵盖了 LLM 训练框架、部署工具、课程与教程,以及所有公开的 LLM 检查点和 API。

License

Notifications You must be signed in to change notification settings

XiaomingX/awesome-llm

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

2 Commits
 
 
 
 
 
 

Repository files navigation

Awesome LLM (大型语言模型)

🔥 大型语言模型(LLM)已经席卷了 全球,不再局限于 NLP 或 AI 社区。这里整理了一些关于大型语言模型,特别是与 ChatGPT 相关的研究论文,涵盖了 LLM 训练框架、部署工具、课程与教程,以及所有公开的 LLM 检查点和 API。

热门 LLM 项目

  • Deep-Live-Cam - 只需一张图片即可实现实时换脸和一键视频深度伪造(未经过滤)。
  • MiniCPM-V 2.6 - 一款可以在手机上使用的 GPT-4V 级别的 MLLM,支持单图、多图和视频处理。
  • GPT-SoVITS - 只需 1 分钟的语音数据,就能训练出优秀的语音合成模型!(少样本语音克隆)。

重要论文里程碑

日期 关键词 机构 论文
2017-06 Transformers Google Attention Is All You Need
2018-06 GPT 1.0 OpenAI Improving Language Understanding by Generative Pre-Training
2018-10 BERT Google BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding
2019-02 GPT 2.0 OpenAI Language Models are Unsupervised Multitask Learners
2019-09 Megatron-LM NVIDIA Megatron-LM: Training Multi-Billion Parameter Language Models Using Model Parallelism
2019-10 T5 Google Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer
2020-01 Scaling Law OpenAI Scaling Laws for Neural Language Models
2020-05 GPT 3.0 OpenAI Language models are few-shot learners
2021-01 Switch Transformers Google Switch Transformers: Scaling to Trillion Parameter Models with Simple and Efficient Sparsity
2021-08 Codex OpenAI Evaluating Large Language Models Trained on Code
2021-08 Foundation Models Stanford On the Opportunities and Risks of Foundation Models
2021-09 FLAN Google Finetuned Language Models are Zero-Shot Learners
2021-10 T0 HuggingFace Multitask Prompted Training Enables Zero-Shot Task Generalization
2021-12 GLaM Google GLaM: Efficient Scaling of Language Models with Mixture-of-Experts
2022-01 COT Google Chain-of-Thought Prompting Elicits Reasoning in Large Language Models
2022-01 LaMDA Google LaMDA: Language Models for Dialog Applications
2022-04 PaLM Google PaLM: Scaling Language Modeling with Pathways
2022-05 OPT Meta OPT: Open Pre-trained Transformer Language Models
2022-06 Emergent Abilities Google Emergent Abilities of Large Language Models
2022-10 Flan-T5/PaLM Google Scaling Instruction-Finetuned Language Models
2022-11 BLOOM BigScience BLOOM: A 176B-Parameter Open-Access Multilingual Language Model
2022-12 OPT-IML Meta OPT-IML: Scaling Language Model Instruction Meta Learning through the Lens of Generalization
2023-01 Flan 2022 Collection Google The Flan Collection: Designing Data and Methods for Effective Instruction Tuning
2023-02 LLaMA Meta LLaMA: Open and Efficient Foundation Language Models
2023-03 PaLM-E Google PaLM-E: An Embodied Multimodal Language Model
2023-03 GPT 4 OpenAI GPT-4 Technical Report
2023-05 PaLM 2 Google PaLM 2 Technical Report
2023-07 LLaMA2 Meta Llama 2: Open Foundation and Fine-Tuned Chat Models
2023-12 Mamba CMU&Princeton Mamba: Linear-Time Sequence Modeling with Selective State Spaces
2024-01 DeepSeek-v2 DeepSeek DeepSeek-V2: A Strong, Economical, and Efficient Mixture-of-Experts Language Model
2024-05 Mamba2 CMU&Princeton Transformers are SSMs: Generalized Models and Efficient Algorithms Through Structured State Space Duality

其他相关论文

如果你对大语言模型(LLM)领域感兴趣,可以参考上面列出的里程碑论文,帮助你了解其发展历程和前沿动态。然而,每个方向的LLM都有其独特的见解和贡献,这些对全面理解该领域至关重要。以下是一些子领域的详细论文列表,供你参考:

大型语言模型(LLM)排行榜

以下是一些评估大型语言模型性能的排行榜平台和基准,涵盖了不同领域和任务,供开发者和研究者参考:

  • Chatbot Arena Leaderboard - Hugging Face平台,通过匿名和随机对战的方式,评估大型语言模型(LLMs)在聊天中的表现。
  • Open LLM Leaderboard - Hugging Face平台,专门跟踪、排名和评估发布的LLMs和聊天机器人。
  • Chinese Large Model Leaderboard - 中文LLM排行榜,专门评估中文大型语言模型。
  • CompassRank - CompassRank平台,评估语言和视觉模型的表现,提供一个全面、公正的行业参考。
  • InfiBench - InfiBench平台,专注于评估大型语言模型在解决实际编程问题上的能力。
  • LawBench - 法律领域评测平台,评估LLMs在法律领域的表现。
  • MathEval - MathEval平台,评估大型语言模型在数学领域的能力,涵盖20个领域和近30,000个数学问题。
  • MixEval - MixEval平台,基于真实数据的动态评测平台,评估LLMs在混合任务中的表现,运行高效、成本低。
  • SuperBench - SuperBench平台,一个综合性评测平台,评估LLMs在自然语言理解、推理和泛化等任务上的表现。
  • OlympicArena - 学术领域评测平台,涵盖数学、物理、化学、生物学等多个学科。
  • We-Math - We-Math平台,评估大型多模态模型在数学推理上的能力。

开源大语言模型 (LLM)

Meta

Mistral AI

Google

Apple

Microsoft

Cohere

DeepSeek

Alibaba

Baichuan

Nvidia

Zhipu AI

Stability AI

DataBricks

上海人工智能实验室

LLM 数据

LLM 评估工具

LLM训练框架

  • DeepSpeed - 一款深度学习优化库,旨在简化分布式训练和推理,提高效率和效果。
  • Megatron-DeepSpeed - NVIDIA Megatron-LM的DeepSpeed版本,增强了对MoE模型训练、课程学习、3D并行等特性的支持。
  • torchtune - PyTorch原生库,用于对大规模语言模型(LLM)进行微调。
  • NeMo Framework - NVIDIA推出的生成式AI框架,支持LLM、语音识别(ASR)、文本到语音(TTS)等多个领域的研究。
  • Megatron-LM - 进行大规模Transformer模型训练的研究框架。
  • Colossal-AI - 让大型AI模型训练变得更便宜、更高效、更易访问。
  • BMTrain - 高效的大型模型训练框架。
  • Mesh TensorFlow - 提供便捷的模型并行化训练方案。
  • GPT-NeoX - 基于DeepSpeed库的GPU并行自回归Transformer模型实现。

LLM部署

参考:llm-inference-solutions

  • SGLang - 高效的LLM和视觉语言模型推理框架。
  • vLLM - 高吞吐、低内存消耗的LLM推理和服务引擎。
  • TGI - Hugging Face推出的LLM部署和服务工具包。
  • exllama - 为量化权重的Llama模型提供的更高效内存版本。
  • FastChat - 支持多种模型的分布式LLM服务系统,提供Web UI和OpenAI兼容的RESTful API。
  • LangChain - 用于构建基于LLM的应用的Python/JavaScript库,支持通过组合模型实现复杂应用。

LLM应用

  • MLflow - 开源机器学习生命周期管理平台,支持实验跟踪、模型评估和部署。
  • YiVal - 开源的GenAI-Ops工具,用于调优和评估LLM模型的提示、配置及模型参数。
  • LangChain - 用于构建LLM链式应用的流行Python库。
  • Prompttools - 用于测试和评估模型、向量数据库及提示的开源工具集。
  • Weights & Biases - 用于跟踪模型训练和提示优化实验的商业工具。

LLM教程与课程

LLM书籍推荐

LLM相关思考

其他资源

  • Arize-Phoenix - 用于机器学习可观察性的开源工具,支持在你的笔记本环境中运行并调整LLM、计算机视觉(CV)和表格数据模型。
  • Emergent Mind - 最新的AI新闻,由GPT-4解析和解释。
  • ShareGPT - 一键分享你与ChatGPT的对话。
  • 主要LLM及数据可用性 - 主要LLM模型的概览及其数据可用性。
  • 500+最佳AI工具
  • Cohere Summarize Beta - Cohere推出的文本摘要API。
  • chatgpt-wrapper - 一个开源的Python API和CLI工具,用于与ChatGPT交互。
  • Open-evals - 用于不同语言模型评估的扩展框架。
  • Cursor - 一个强大的AI工具,用于编写、编辑和讨论代码。
  • AutoGPT - 一个展示GPT-4功能的开源应用。
  • OpenAGI - 当LLM遇到领域专家时。
  • EasyEdit - 一个易于使用的框架,用于编辑大型语言模型。
  • chatgpt-shroud - 一个Chrome扩展,用于保护用户隐私,允许轻松隐藏和显示ChatGPT聊天记录。适合屏幕共享时使用。

About

Awesome-LLM: a curated list of Large Language Model.🔥 大型语言模型(LLM)已经席卷了 全球,不再局限于 NLP 或 AI 社区。这里整理了一些关于大型语言模型,特别是与 ChatGPT 相关的研究论文,涵盖了 LLM 训练框架、部署工具、课程与教程,以及所有公开的 LLM 检查点和 API。

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published