深度学习的数学原理
arxiv.org/pdf/2407.18384
“本书旨在介绍深度学习数学分析中的核心思想,帮助学生和研究人员快速熟悉该领域,并为大学深度学习数学课程的开发奠定基础。
作为深度学习的数学导论,本书并不试图全面涵盖这一快速发展的领域,部分重要研究方向未被收录。我们侧重数学理论成果而非实证研究,尽管完整的深度学习理论需要两者的结合。
本书主要面向数学及相关领域的研究人员和学生。虽然我们相信每位勤奋的读者都能理解本书内容,但建议具备数学分析、线性代数、概率论和基础泛函分析知识以获得最佳阅读体验。附录中提供了概率论和泛函分析的核心概念回顾。
全书内容围绕深度学习理论的三大支柱展开:
逼近理论(第2-9章)
优化理论(第10-13章)
统计学习理论(第14-16章)”