论文阅读 - CASIE: Extracting Cybersecurity Event Information from Text

本文是我在《自然语言处理》课程上完成的论文阅读作业之一。CASIE聚焦于网络安全文本领域的命名实体识别和事件抽取,针对网络安全领域的关注点,对事件和类别做了针对性的特征工程。采用 BIO 标注体系,Bi-LSTM + Attention 作为基础模型,并对比了多种 Embedding 模型对效果的影响,具备很高的实用价值。作者来自马里兰大学,文章发表在 AAAI 2020。
阅读更多

论文阅读 - Toolformer: Language Models Can Teach Themselves to Use Tools

本文是我在《自然语言处理》课程上完成的论文阅读作业之一。Toolformer 聚焦于提升 LLM 通过 API 调用外部工具的能力,提出了 Toolformer。通过对 API 文档和示例的自监督学习,模型可以在问题中有效地决定何时调用、调用何种工具、传入的参数、最优的结果。作者来自 Meta 公司和 Universitat Pompeu Fabra,发表在 NIPS 2023。
阅读更多