AI Box | 研究方向
大语言模型

以ChatGPT和GPT-4为首的大语言模型是近年来最有影响力的技术之一,其强大的语言能力与推理能力为通用人工智能的实现带来曙光。AI Box目前致力于探究大语言模型的现有不足与能力边界,并进一步提升大模型的能力。

自然语言处理

自然语言处理领域关注计算机与人类自然语言之间的相互作用,使计算机既能理解自然语言的意义,也能以自然语言来表达给定的意图、思想等。AI Box目前着眼于具有挑战性的NLP研究方向,包括文本生成、知识与推理、文档检索和模型压缩等,并将自然语言处理技术与实际应用结合。

推荐系统

推荐系统致力于理解用户偏好,为用户推荐心仪的商品、视频、音乐、工作岗位等。在当今信息爆炸的背景下,推荐系统被广泛应用于电商、短视频、新闻等平台,成为我们每个人生活中密不可分的一部分。AI Box 目前致力于结合自然语言技术和生成模型开发下一代推荐系统,使推荐系统“更懂用户”。

作为一个拥有从数据处理、模型开发、算法训练到科学评测的一站式全流程托管框架,RecBole (中文名称:"伯乐",意取"世有伯乐,然后有千里马")实现了百余种推荐系统模型,涵盖四种常见推荐任务和 RecBole 2.0 的八个基准工具包,包括通用推荐、序列推荐、基于内容的推荐、基于知识的推荐、元学习、数据增强、去偏、公平性、跨域推荐、基于Transformer的模型、基于图神经网络的模型和人岗匹配。

TextBox是一个统一、灵活、标准化的代码库,支持基于预训练语言模型的文本生成,只需一个简短的命令行即可实现端到端的数据装载、模型训练和评测分析。我们支持47种预训练语言模型,13种文本生成任务和83种数据集,17种评测指标,以及4种预训练目标和4种高效稳健的训练策略。

CRSLab是第一个用于构建对话推荐系统的开源工具包,具备通用和可扩展的结构,全面的基准模型和数据集以及多样的标准化评测方法。它目前支持多达6个数据集、18个模型和10个评测指标,均可通过修改配置文件和一句简短的命令行命令实现一键调用。