解构大语言模型

预约

解构大语言模型

索取号 TP391/0010

副题名从线性回归到通用人工智能

作者唐亘著

出版项北京电子工业出版社 2024

标准编号 978-7-121-47740-9

载体信息 XVIII, 414页 24cm

论题主题自然语言处理

版本及来源 5

文献类型中文图书

一般附注博文视点·IT出版旗舰品牌技术凝聚实力·专业创新出版

内容提要本书从模型的结构和数据基础两个方面解构大语言模型，以便帮助读者理解和搭建类似ChatGPT的系统。在模型的结构方面，大语言模型属于深度神经网络，其设计核心是注意力机制，因此，本书涵盖了多层感知器、卷积神经网络和循环神经网络等经典模型。在模型的数据基础方面，本书既涉及模型训练的工程基础，如反向传播，又涉及数据的使用方式，如迁移学习、强化学习，以及传统的监督学习和无监督学习。此外，本书还阐述了如何从计量经济学和经典机器学习模型中汲取灵感，以提高模型的稳定性和可解释性。

复本数 1

在馆情况 1

预约情况无

引文唐亘著. 解构大语言模型[M]. 北京电子工业出版社 2024.

点此复制

馆藏地址

条形码	目前状态	卷册号	馆藏地址	架位信息
H411707	在馆		徐汇中文书库	书库3楼 24排4列2层