标签：后端开发

共 2 篇文章

从零理解Transformer：自注意力机制核心原理深度剖析

以通俗易懂的方式拆解Transformer架构的核心——自注意力机制（Self-Attention），从QKV矩阵运算到多头注意力、位置编码、残差连接，逐步揭示这一革命性架构为何能横扫NLP、CV乃至多模态领域。附完整代码示例与可视化图解，零基础也能看懂。

机器学习深度学习 NLP Transformer

2026-06-24 76 阅读

自然语言处理技术全景：从Word2Vec到大模型时代

梳理NLP领域从词向量到预训练大模型的技术发展脉络。涵盖Word2Vec、ELMo、BERT、GPT系列等里程碑式工作，详解注意力机制、预训练-微调范式和指令微调的核心思想，为理解大模型时代奠定坚实基础。

深度学习 NLP Transformer GPT

2026-06-24 186 阅读