Awesome LLM (大型语言模型)

🔥 大型语言模型（LLM）已经席卷了全球，不再局限于 NLP 或 AI 社区。这里整理了一些关于大型语言模型，特别是与 ChatGPT 相关的研究论文，涵盖了 LLM 训练框架、部署工具、课程与教程，以及所有公开的 LLM 检查点和 API。

重要论文里程碑

日期	关键词	机构	论文
2017-06	Transformers	Google	Attention Is All You Need
2018-06	GPT 1.0	OpenAI	Improving Language Understanding by Generative Pre-Training
2018-10	BERT	Google	BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding
2019-02	GPT 2.0	OpenAI	Language Models are Unsupervised Multitask Learners
2019-09	Megatron-LM	NVIDIA	Megatron-LM: Training Multi-Billion Parameter Language Models Using Model Parallelism
2019-10	T5	Google	Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer
2020-01	Scaling Law	OpenAI	Scaling Laws for Neural Language Models
2020-05	GPT 3.0	OpenAI	Language models are few-shot learners
2021-01	Switch Transformers	Google	Switch Transformers: Scaling to Trillion Parameter Models with Simple and Efficient Sparsity
2021-08	Codex	OpenAI	Evaluating Large Language Models Trained on Code
2021-08	Foundation Models	Stanford	On the Opportunities and Risks of Foundation Models
2021-09	FLAN	Google	Finetuned Language Models are Zero-Shot Learners
2021-10	T0	HuggingFace	Multitask Prompted Training Enables Zero-Shot Task Generalization
2021-12	GLaM	Google	GLaM: Efficient Scaling of Language Models with Mixture-of-Experts
2022-01	COT	Google	Chain-of-Thought Prompting Elicits Reasoning in Large Language Models
2022-01	LaMDA	Google	LaMDA: Language Models for Dialog Applications
2022-04	PaLM	Google	PaLM: Scaling Language Modeling with Pathways
2022-05	OPT	Meta	OPT: Open Pre-trained Transformer Language Models
2022-06	Emergent Abilities	Google	Emergent Abilities of Large Language Models
2022-10	Flan-T5/PaLM	Google	Scaling Instruction-Finetuned Language Models
2022-11	BLOOM	BigScience	BLOOM: A 176B-Parameter Open-Access Multilingual Language Model
2022-12	OPT-IML	Meta	OPT-IML: Scaling Language Model Instruction Meta Learning through the Lens of Generalization
2023-01	Flan 2022 Collection	Google	The Flan Collection: Designing Data and Methods for Effective Instruction Tuning
2023-02	LLaMA	Meta	LLaMA: Open and Efficient Foundation Language Models
2023-03	PaLM-E	Google	PaLM-E: An Embodied Multimodal Language Model
2023-03	GPT 4	OpenAI	GPT-4 Technical Report
2023-05	PaLM 2	Google	PaLM 2 Technical Report
2023-07	LLaMA2	Meta	Llama 2: Open Foundation and Fine-Tuned Chat Models
2023-12	Mamba	CMU&Princeton	Mamba: Linear-Time Sequence Modeling with Selective State Spaces
2024-01	DeepSeek-v2	DeepSeek	DeepSeek-V2: A Strong, Economical, and Efficient Mixture-of-Experts Language Model
2024-05	Mamba2	CMU&Princeton	Transformers are SSMs: Generalized Models and Efficient Algorithms Through Structured State Space Duality

其他相关论文

如果你对大语言模型（LLM）领域感兴趣，可以参考上面列出的里程碑论文，帮助你了解其发展历程和前沿动态。然而，每个方向的LLM都有其独特的见解和贡献，这些对全面理解该领域至关重要。以下是一些子领域的详细论文列表，供你参考：

LLM幻觉论文汇总 - 收集关于LLM幻觉的相关论文。
LLM幻觉检测论文汇总 - 收集LLM幻觉检测的相关研究论文。
LLM实用指南 - 精选的LLM实用资源列表。
ChatGPT提示语合集 - 收集用于ChatGPT模型的提示语示例。
中文ChatGPT提示语合集 - 适用于ChatGPT的中文提示语示例。
ChatGPT资源合集 - 收集有关ChatGPT和GPT-3的资源。
思维链（Chain-of-Thought）论文汇总 - 涵盖“思维链提示引发LLM推理”相关研究。
深度推理提示语合集 - 介绍如何使用提示语引导LLM进行可靠推理和决策。
指令调优论文合集 - 包含“自然指令”（ACL 2022）、“FLAN”（ICLR 2022）和“T0”（ICLR 2022）等指令调优相关论文。
LLM阅读清单 - 大语言模型相关论文和资源汇总。
语言模型推理研究 - 语言模型推理相关的论文和资源合集。
思维链推理平台 - 衡量LLM推理性能的相关资源。
GPT资源合集 - 与GPT、ChatGPT、OpenAI、LLM相关的优质项目和资源。
GPT-3资源合集 - 收集关于OpenAI GPT-3 API的演示和文章。
LLM人类偏好数据集合集 - 供LLM指令调优、强化学习（RLHF）和评估使用的人类偏好数据集。
RWKV教程 - RWKV学习相关材料和教程。
大语言模型编辑论文汇总 - 关于大语言模型编辑的论文和资源合集。
LLM安全资源合集 - 与LLM安全相关的工具、文档和项目资源。
LLM与人类对齐研究资源汇总 - 关于大语言模型与人类对齐的论文和资源集合。
代码LLM资源合集 - 收集与代码LLM相关的研究和资源。
LLM压缩论文合集 - 关于LLM压缩的研究论文和工具。
LLM系统研究论文合集 - 研究LLM系统的相关论文集合。
LLM应用WebApp资源合集 - 收集开源并积极维护的LLM应用Web应用。
日本语LLM资源汇总 - 日本语LLM的概览。
LLM在医疗中的应用论文汇总 - 关注LLM在医学领域应用的相关论文。
LLM推理论文合集 - 以推理为主题的LLM相关论文汇总。
3D世界中的LLM研究资源 - 研究3D世界中多模态大语言模型的论文和资源合集。
LLM训练数据集合集 - 专为聊天机器人训练设计的LLM数据集，包含数据集链接、大小、语言、用途和简要描述。
中文LLM资源合集 - 汇总开源中文大语言模型，包括小规模、可私有化部署、训练成本较低的模型及其应用、数据集和教程等。
LLM优化任务研究合集 - 探索LLM在优化任务中的应用，收集相关研究论文。
语言模型分析论文合集 - 聚焦于语言模型的理论和实证分析，涉及学习动态、表现力、可解释性、泛化能力等议题。

大型语言模型（LLM）排行榜

以下是一些评估大型语言模型性能的排行榜平台和基准，涵盖了不同领域和任务，供开发者和研究者参考：

Chatbot Arena Leaderboard - Hugging Face平台，通过匿名和随机对战的方式，评估大型语言模型（LLMs）在聊天中的表现。
Open LLM Leaderboard - Hugging Face平台，专门跟踪、排名和评估发布的LLMs和聊天机器人。
Chinese Large Model Leaderboard - 中文LLM排行榜，专门评估中文大型语言模型。
CompassRank - CompassRank平台，评估语言和视觉模型的表现，提供一个全面、公正的行业参考。
InfiBench - InfiBench平台，专注于评估大型语言模型在解决实际编程问题上的能力。
LawBench - 法律领域评测平台，评估LLMs在法律领域的表现。
MathEval - MathEval平台，评估大型语言模型在数学领域的能力，涵盖20个领域和近30,000个数学问题。
MixEval - MixEval平台，基于真实数据的动态评测平台，评估LLMs在混合任务中的表现，运行高效、成本低。
SuperBench - SuperBench平台，一个综合性评测平台，评估LLMs在自然语言理解、推理和泛化等任务上的表现。
OlympicArena - 学术领域评测平台，涵盖数学、物理、化学、生物学等多个学科。
We-Math - We-Math平台，评估大型多模态模型在数学推理上的能力。

开源大语言模型 (LLM)

Mistral AI

Google

LLM 数据

LLMDataHub
IBM 数据预处理工具包 - 高效处理非结构化数据的开源工具包。

LLM 评估工具

LLM训练框架

DeepSpeed - 一款深度学习优化库，旨在简化分布式训练和推理，提高效率和效果。
Megatron-DeepSpeed - NVIDIA Megatron-LM的DeepSpeed版本，增强了对MoE模型训练、课程学习、3D并行等特性的支持。
torchtune - PyTorch原生库，用于对大规模语言模型（LLM）进行微调。
NeMo Framework - NVIDIA推出的生成式AI框架，支持LLM、语音识别（ASR）、文本到语音（TTS）等多个领域的研究。
Megatron-LM - 进行大规模Transformer模型训练的研究框架。
Colossal-AI - 让大型AI模型训练变得更便宜、更高效、更易访问。
BMTrain - 高效的大型模型训练框架。
Mesh TensorFlow - 提供便捷的模型并行化训练方案。
GPT-NeoX - 基于DeepSpeed库的GPU并行自回归Transformer模型实现。

LLM部署

参考：llm-inference-solutions

SGLang - 高效的LLM和视觉语言模型推理框架。
vLLM - 高吞吐、低内存消耗的LLM推理和服务引擎。
TGI - Hugging Face推出的LLM部署和服务工具包。
exllama - 为量化权重的Llama模型提供的更高效内存版本。
FastChat - 支持多种模型的分布式LLM服务系统，提供Web UI和OpenAI兼容的RESTful API。
LangChain - 用于构建基于LLM的应用的Python/JavaScript库，支持通过组合模型实现复杂应用。

LLM应用

MLflow - 开源机器学习生命周期管理平台，支持实验跟踪、模型评估和部署。
YiVal - 开源的GenAI-Ops工具，用于调优和评估LLM模型的提示、配置及模型参数。
LangChain - 用于构建LLM链式应用的流行Python库。
Prompttools - 用于测试和评估模型、向量数据库及提示的开源工具集。
Weights & Biases - 用于跟踪模型训练和提示优化实验的商业工具。

LLM教程与课程

LLM课程 - 带有路线图和Colab笔记本，帮助你深入了解大型语言模型（LLM）。
UWaterloo CS 886 - 探索基础模型的最新进展。
CS25-Transformers United - 斯坦福大学的Transformers课程。
ChatGPT提示工程 - 专为开发者设计的ChatGPT提示工程课程。
普林斯顿大学：理解大型语言模型 - 普林斯顿大学关于大型语言模型的课程。
CS324 - 大型语言模型 - 斯坦福大学的LLM课程。
GPT状态分析 - 了解GPT模型的最新发展。
构建GPT：从零开始的代码实现 - 一部详尽的GPT从零实现教程。
BPE最简实现 - 介绍常用于LLM标记化的字节对编码（BPE）算法。
femtoGPT - 使用纯Rust实现的最简生成预训练变换器（GPT）。
Neurips2022：基础模型的鲁棒性 - 讨论基础模型的稳定性和鲁棒性。
ICML2022：大模型时代的技术与系统 - 探索大模型的训练与应用。
GPT60行代码实现 - 用60行NumPy代码实现一个简单的GPT。

LLM书籍推荐

《LangChain与生成式AI》 - 本书展示如何使用Python、ChatGPT及其他LLM构建生成式AI应用，并附带GitHub代码。
《从零开始构建大型语言模型》 - 详细指导如何构建一个可用的LLM。
《构建GPT：如何工作》 - 从零开始讲解如何编写一个生成预训练变换器（GPT）。
《大型语言模型实战》 - 一本详细的图解书籍，带你深入了解大型语言模型及其应用。

LLM相关思考

其他资源

Arize-Phoenix - 用于机器学习可观察性的开源工具，支持在你的笔记本环境中运行并调整LLM、计算机视觉（CV）和表格数据模型。
Emergent Mind - 最新的AI新闻，由GPT-4解析和解释。
ShareGPT - 一键分享你与ChatGPT的对话。
主要LLM及数据可用性 - 主要LLM模型的概览及其数据可用性。
500+最佳AI工具
Cohere Summarize Beta - Cohere推出的文本摘要API。
chatgpt-wrapper - 一个开源的Python API和CLI工具，用于与ChatGPT交互。
Open-evals - 用于不同语言模型评估的扩展框架。
Cursor - 一个强大的AI工具，用于编写、编辑和讨论代码。
AutoGPT - 一个展示GPT-4功能的开源应用。
OpenAGI - 当LLM遇到领域专家时。
EasyEdit - 一个易于使用的框架，用于编辑大型语言模型。
chatgpt-shroud - 一个Chrome扩展，用于保护用户隐私，允许轻松隐藏和显示ChatGPT聊天记录。适合屏幕共享时使用。

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Awesome LLM (大型语言模型)

热门 LLM 项目

重要论文里程碑

其他相关论文

大型语言模型（LLM）排行榜

开源大语言模型 (LLM)

Meta

Mistral AI

Google

Apple

Microsoft

Cohere

DeepSeek

Alibaba

Baichuan

Nvidia

Zhipu AI

Stability AI

DataBricks

上海人工智能实验室

LLM 数据

LLM 评估工具

LLM训练框架

LLM部署

LLM应用

LLM教程与课程

LLM书籍推荐

LLM相关思考

其他资源

About

Uh oh!

Releases

Packages

License

XiaomingX/awesome-llm

Folders and files

Latest commit

History

Repository files navigation

Awesome LLM (大型语言模型)

热门 LLM 项目

重要论文里程碑

其他相关论文

大型语言模型（LLM）排行榜

开源大语言模型 (LLM)

Meta

Mistral AI

Google

Apple

Microsoft

Cohere

DeepSeek

Alibaba

Baichuan

Nvidia

Zhipu AI

Stability AI

DataBricks

上海人工智能实验室

LLM 数据

LLM 评估工具

LLM训练框架

LLM部署

LLM应用

LLM教程与课程

LLM书籍推荐

LLM相关思考

其他资源

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Packages