课题二:通过外部工具增强大语言模型
大语言模型(LLM)在生成人类化文本方面表现出色,但面对数值计算、实时信息等非文本任务时存在局限性。为了克服这些限制,本赛题旨在通过整合外部工具(external tools)和技术来增强LLM的能力。通过集成如计算器、搜索引擎和其他 API插件,LLM可以利用外部资源和功能,拓展其任务范围。然而,LLM与外部工具整合也面临着诸多挑战,包括工具选择、兼容性、训练数据限制、处理工具错误以及适应新工具的灵活性。通过精心的训练、数据选择和持续监控,人们可以教导LLM有效使用外部工具,从而增强其文本生成能力,使其能够进行准确的数值计算、获取实时信息并与外部应用程序进行交互。总结来说,本赛题的目标是通过外部工具整合提升LLM的能力,使其在各个领域和问题解决场景中更加灵活多样。
课题三:探索不同数据预处理和选择方法对预训练语言学习模型的有效性
本赛题致力于深入分析并比较不同的数据选择和预处理方式对预训练语言学习模型(LLMs)性能的影响。在人工智能和机器学习领域,LLMs已经成为一个重要的研究对象,它们在诸如机器翻译、自然语言理解、语音识别等任务中都有着广泛的应用。然而,如何有效地预训练这些模型,以提高其在各种任务上的性能,一直是一个重要且具有挑战性的问题。其中,预训练数据的选择和预处理方法是影响模型性能的重要因素。我们认识到,预训练LLMs的数据的质量和性质是决定其性能的关键因素。因此,我们将实施不同的数据选择策略,重点关注质量、多样性和代表性。例如,我们可以开发多个预处理流程。预处理步骤包括文本规范化、标记化、重复项移除、噪音减少和数据洗牌。具体而言,我们将尝试不同的文本规范化和标记化方法,以适应不同的语言和任务需求。我们也将尝试在数据预处理中引入一些新的技术,例如,使用训练分类器的方法来识别并去除噪声数据。我们将通过预训练多个LLMs,每个模型使用不同组合的数据选择和预处理方法,然后比较它们在各种下游任务上的性能,以评估这些策略的有效性。
课题四:探索不同机制下人工反馈强化学习(RLHF)在训练大语言模型的影响
大型语言模型(LLMs)在理解和生成类人文本方面表现出了显著的能力,但与人类价值观的对齐往往带来挑战。人工反馈强化学习(RLHF)旨在通过人工反馈磨练LLMs,以增强诸如有用性、诚实性和无害性等对齐人类价值观。RLHF的常见设置包括从人类注释者那里收集示范数据,进行监督性微调,基于反馈训练奖励模型,并使用强化学习进行进一步微调。这个迭代过程旨在创建更好对齐的LLM。本赛题的目标是探索各种反馈机制 - 基于排名的、基于问题的和基于规则的 - 在通过RLHF改善LLMs微调和对齐方面的有效性。基于排名的方法将探索Elo评级系统的改进,以解决被忽视的对齐标准和被忽略的样本。基于问题的方法将制定一套全面的问题,以捕获细致的反馈,解决对齐标准和额外的约束。基于规则的方法将细化预定义的规则,以提供更详细和有效的反馈。该项目希望深入理解这些反馈机制对RLHF有效性的影响,指导更对齐、更高效的LLMs的开发。
课题五:大语言模型生成文本的识别
随着大语言模型(如OpenAI的GPT系列模型)的应用日益普遍,生成的文本质量也越来越高,与人类撰写的内容几乎无法区分。这带来了一些潜在问题。例如,大语言模型生成的内容可能会被用于进行网络水军行动、舆论控制等不当活动。因此,我们有必要能够识别出哪些内容是机器生成的,以防止大模型被滥用。本课题目标是探索大语言模型文本生成的机制,并对其特点进行分析,进而开发一种能够有效检测一段文本是否由大语言模型生成的算法。
课题六:大语言模型的情境适应性
尽管大语言模型已经在理解和生成文本方面取得了重要的突破,但它们的表现仍然受限于他们对特定情境的理解和适应能力。例如,模型可能在面对某些特定文化、地域或领域的语言时表现不佳。也可能存在某些地区的法律、法规与其训练语料发生冲突的情况。本课题目标是设计一种高效的算法,让大语言模型能够在各种情境中都能提供准确、适应的回应。这可能包括对特定文化或领域的敏感性,或者是对特定的对话情境的适应能力。
▌关于DeeCamp人工智能训练营
DeeCamp 的名字来自历史上由 O' Reilly 组织的 Foo Camp(一个完全由与会者设计流程、议题、内容的 unconference)。DeeCamp 用类似的命名方式,希望建立一个为学生服务、充分发挥学生自主精神的 Deep Learning Summer Camp,既有统一的课程和项目安排,也借鉴 unconference,放手让学生自我组织、自我管理、自我表现。
创新工场董事长兼 CEO 李开复博士在
DeeCamp2019 致辞
DeeCamp是一个旨在提升高校 AI 人才在行业应用中的实践案例经验、推进产学研深度结合的公益性质 AI 训练。自2017年由创新工场发起以来,DeeCamp已收到来自全球1000余所高校超过20000份报名申请,已有1300余名学员顺利结业。
DeeCamp 人工智能训练营已初步建立了以创造性的团队工程实践项目为主干,以打通学术、产业边界的系统性知识培训为支撑,聚焦未来科技变革与商业发展,成规模、可复制的人工智能应用型人才培养体系。
DeeCamp 独创的“知识授课+实践项目”模式,让学员们既可以近距离与科研及产业领域大师沟通交流,也可以与志同道合的小伙伴结队,亲身体验 AI 技术如何转化为产业应用、积累实践案例经验。 返回搜狐,查看更多