要说现在最热门的技术,可谓非大模型莫属!不少小伙伴都想要学习大模型技术,转战AI领域,以适应未来的大趋势,寻求更有前景的发展~~
然而,在学习大模型技术这条道路上,却不知道如何进行系统的学习,所以本期书单就为大家奉献一场AI大模型的饕餮盛宴,从大模型理论基础到大模型工具应用,构建自己的LLM应用程序……
应有尽有,如果你是AI小白,想要从入门开始学起,或者想要了解AI未来的发展趋势,也有相应的图书哦~~
这些 LLM大模型书 有些已经帮大家打包好PDF了!扫描即可拿到 ↓↓↓↓

张奇,桂韬,郑锐,黄萱菁 著
解码大语言模型奥秘,引领机器智能新时代
详细介绍构建LLM的四个主要阶段:预训练、有监督微调、奖励建模和强化学习
解读ChatGPT背后的核心技术
配全书PPT课件

为了使更多的自然语言处理研究人员和对大语言模型感兴趣的读者能够快速了解大模型的理论基础,并开展大模型实践,复旦大学张奇教授团队结合他们在自然语言处理领域的研究经验,以及分布式系统和并行计算的教学经验,在大模型实践和理论研究的过程中,历时8个月完成本书的撰写。希望这本书能够帮助读者快速入门大模型的研究和应用,并解决相关技术问题。
本书详细介绍了构建大语言模型的四个主要阶段:预训练、有监督微调、奖励建模和强化学习。每个阶段都有算法、代码、数据、难点及实践经验的详细讨论。
本书以大语言模型的基础理论开篇,探讨了大语言模型预训练数据的构建方法,以及大语言模型如何理解并服从人类指令,介绍了大语言模型的应用和评估方法,为读者提供了更全面的视野。
本书旨在为对大语言模型感兴趣的读者提供入门指南,也可作为高年级本科生和研究生自然语言处理相关课程的补充教材!
杨青 编著
揭开LLM的神秘面纱,解读其机理和工程实践,手把手教你训练7B LLM

本书用10 章对大语言模型进行全面且深入的介绍。首先对大语言模型的基本概念进行介绍。其次,从大语言模型的基础技术、预训练数据构建、预训练技术等方面展开讨论,帮助读者深入了解大语言模型的构建和训练过程。
然后,详细介绍有监督微调和强化对齐等技术,以及如何评估大语言模型的性能。介绍提示工程和工程实践等方面的内容,帮助读者了解大语言模型的应用和实际操作过程。最后,介绍如何从零开始微调大语言模型,辅以代码示例,帮助读者更好地应用这些技术。
通过阅读本书,读者可以获得全面且深入的大语言模型的知识框架。无论您是研究人员、工程师,还是产品经理,都能从中获得有价值的知识。
万俊 著
大语言模型的应用与二次开发
探索智能前沿,驾驭模型力量,对人工智能或编程技术小白读者友好
技术点包含提示工程、长短期记忆、GPTs、Agent系统、微调与安全技术、GPT-4V与Gemini、尺度定律与压缩即智能等

本书是一本对人工智能小白读者非常友好的大语言模型应用指南,有两大特点:一是以通俗易懂的方式解释复杂概念,通过实例和案例讲解大语言模型的工作原理和工作流程、基本使用方法,包括大语言模型常用的三种交互格式、提示工程、工作记忆与长短期记忆,以及外部工具等,使读者能够全面了解和掌握这一先进技术的应用和二次开发;二是紧跟当前大语言模型技术的更新动态,介绍GPTs的创建,以GPT-4V和Gemini为例讲述多模态模型的应用,还包括无梯度优化、自主Agent系统、大语言模型微调、RAG框架微调、大语言模型安全技术等。
无论是学术研究者、工程师,还是对大语言模型感兴趣的普通读者,都可以通过本书获得大语言模型的前沿研究成果、技术进展和应用案例,从而更好地应用大语言模型解决实际问题。
彭勇,彭旋,郑志军,茹炳晟 著
读懂ChatGPT的核心技术、GPT的进化史和创新点
详述多模态大模型的核心技术和应用场景
让中小公司可以从0到1部署多模态大模型,打开通往通用人工智能的大门

本书详细介绍了大语言模型和多模态大模型的发展历史、技术原理和亮点、主要的开源框架、配套工具、部署细则和实战案例。为了让读者更好地进行大模型的应用实战,本书还详细介绍了使用大模型为商业赋能的3个应用案例。期望本书能够帮助读者打开通往大模型尤其是多模态大模型的学习、实战和商业成功之路。
杨灵,张至隆,张文涛,崔斌 著
本书作者团队来自著名学府,且与国际知名研究机构、院校有众多交流,其提供的内容具有权威性,并获得众多专家、学者认可
本书从理论和实践两个方面进行了细致介绍。阅读本书的读者,即可获得学术收益,又可进行实践应用
为方便进行理论实践,本书提供了可配套运行的代码文件,读者可以进行下载

本书深入浅出地介绍了扩散模型的知识,案例丰富,讲解细致。第1章介绍AIGC与相关技术,第2章从三个视角介绍扩散模型的基本理论、算法,此外介绍了扩散模型的神经网络架构和代码实现。
第3章、第4章、第5章分别从高效采样、似然优化、数据结构三个方面系统介绍了扩散模型的特点,以及后续的改进工作。第6章讨论了扩散模型与其他生成模型的关联,包括变分自编码器、生成对抗网络、归一化流、自回归模型和基于能量的模型。第7章介绍了扩散模型的应用,包括计算机视觉、自然语言处理、时间数据建模、多模态学习、鲁棒学习和跨学科应用。第8章讨论了扩散模型的未来,以及与GPT和大模型的关联。
本书适合高等院校计算机科学、人工智能和医学、生物学等交叉学科专业的师生,以及相关人工智能应用程序的开发人员阅读。
李特丽 康轶文 著
全面介绍LangChain技术
逐步构建自己的LLM应用程序
内容注重高可复用性和可扩展性
实用案例和示例代码助你快速上手
与社区互动,共享经验与解决难题

本书由LangChain中文网联合创始人李特丽与创始人康轶文共同编著!
本书专门为那些对自然语言处理技术感兴趣的读者提供了系统的LLM应用开发指南。全书分为11章,从LLM基础知识开始,通过LangChain这个开源框架为读者解读整个LLM应用开发流程。第1~2章概述LLM技术的发展背景和LangChain框架的设计理念。从第3章开始,分章深入介绍LangChain的6大模块,包括模型I/O、数据增强、链、记忆等,通过大量代码示例让读者了解其原理和用法。第9章通过构建PDF问答程序,帮助读者将之前学习的知识应用于实践。第10章则介绍集成,可拓宽LangChain的用途。第11章为初学者简要解析LLM的基础理论,如Transformer模型等。
本书以LangChain这个让人熟悉的框架为主线,引导读者一步一步掌握LLM应用开发流程,适合对大语言模型感兴趣的开发者、AI应用程序开发者阅读。
这些 LLM大模型书 有些已经帮大家打包好PDF了!扫描即可拿到 ↓↓↓↓
