谷歌为人工智能助手提供了一个开源数据集 以了解人类水平

发布时间:2023-06-02 05:40:01 栏目:生活

    导读 谷歌今天开放了引导对话偏好集合(CCPE)和模仿大师-1两个人之间的对话数据集的开源。谷歌人工智能研究人员正在共享这两个数据集,为用人类水...

    谷歌今天开放了引导对话偏好集合(CCPE)和模仿大师-1两个人之间的对话数据集的开源。谷歌人工智能研究人员正在共享这两个数据集,为用人类水平的性能建模自然语言系统提供培训材料。

    谷歌研究人员称CCPE是一种收集语音数据的新方法。它包括500个关于人们电影偏好的对话——总共10,000个对话,涉及12,000个演讲。

    选择电影偏好作为主题是因为元数据的价值,例如演员和导演的名字。

    一篇关于CCPE的论文发表了:“我们没有将工作人员限制在详细的脚本或小的知识库中,因此我们观察到,与现有的数据集相比,我们的数据集包含了更现实和多样化的对话。

    模仿大师一号数据集由13,200多个对话样本组成。它和CCPE都是用“绿野仙踪”的方法制作的,其中一个人扮演代理人的角色,临时工作人员网站上的工作人员刻画普通的数字助理用户。

    模仿大师-1包含六类对话:订购披萨、预约汽车维修、设置公交服务、订购电影票、订购咖啡饮料和预订餐厅。

    在谷歌对话式AI的其他新闻中,谷歌的“大音王计划”引入了对话式AI,以提高对带有口音和ALS的人的声音的识别,谷歌DeepMind研究人员与其他AI社区利益相关者合作推出SuperGLUE benchmark,以实现更强大的对话式AI。

免责声明:本文由用户上传,如有侵权请联系删除!