关于 LLaMA 1

2023 年 11 月 23 日

这篇博文提供了对Meta AI发布的LLaMA 1论文的深入分析，强调了LLaMA在开源大型语言模型中的重要性。文中详细介绍了LLaMA的基本信息、优化代码、模型结构和数据集处理，并对其在不同任务上的表现进行了评估。作者指出，尽管LLaMA在创新方面不突出，但作为一个高效、开源的基础模型，在当前ChatGPT闭源的情况下，它满足了大众的需求。[ChatGPT 4]

阅读全文

关于 C4 数据集

2022 年 8 月 22 日

C4 数据集速览。

阅读全文

Constituency Parsing with a Self-Attensive Encoder 论文解读

2020 年 11 月 16 日

之前没咋涉略过 parsing 部分，最近有用到，遇到一个实现的很不错的库：benepar，无论是速度、代码还是性能上，伯克利出品。而本文要讲的论文就是 benepar 的参考论文：Constituency Parsing with a Self-Attensive Encoder，代码和论文作者都是一个人：Nikita Kitaev，论文发表于 ACL 2018。代码还参考了作者的另一篇论文：Multilingual Constituency Parsing with Self-Attention and Pre-Training。
阅读全文

关于 LLaMA 1

关于 C4 数据集

Constituency Parsing with a Self-Attensive Encoder 论文解读

Alan Lee