SOGO論壇

標題: 大語言模型的第一篇論文 [列印本頁]

作者: lionking0809    時間: 5 天前     標題: 大語言模型的第一篇論文

本文最後由 lionking0809 於 2025-11-16 17:47 編輯

《Attention Is All You Need》是一篇2017年由Google發表的開創性論文,它提出了Transformer模型,一種完全基於注意力機制(Attention Mechanism)的新架構,徹底取代了以往序列模型(如RNN、CNN)的主流地位。此模型大幅提高了平行計算能力,降低了訓練時間,並在多項任務上(如機器翻譯)取得了當時的頂尖成果,是現代大型語言模型(如BERT)的基礎。

主要貢獻與特色



[youtube]https://youtu.be/_VaEjGnHgOI?si=g6k6zGPeL-KfS99Q[/youtube]







歡迎光臨 SOGO論壇 (https://oursogo.com/) Powered by OURSOGO.COM