您的位置:首页 >邮票收藏 > 邮票资讯 >

有了这个标准和你对话的AI是啥水平一目了然

2022-07-04 10:38:14 来源:

  小爱,小爱,明天北京天气如何?当前,AI对话系统已经深刻融入人们日常生活的方方面面,技术架构和路线更是百花齐放。

  然而,作为前沿技术,AI对话系统标准缺失,造成其评价体系不一、在应用中呈现出水平参差不齐等问题。针对这种状况,清华大学智能技术与系统实验室副主任黄民烈教授联合学界和业界科研机构共同制定了全球首个《AI对话系统分级定义》(以下简称《分级定义》),并于近日正式发布。《分级定义》旨在更好地评估AI对话系统的能力水平,推动AI对话系统在虚拟个人助理、智能家居、智能汽车(车载语音)、情感陪护和心理健康等领域的应用有据可依。

  起源于图灵测试的AI对话系统,是人工智能领域最重要的研究方向之一。如果说自然语言处理是人工智能‘皇冠上的明珠’,那么AI对话系统则是自然语言处理中最难、最核心的任务之一,是‘明珠中最亮的那颗’。黄民烈说。

  黄民烈表示,近年来,随着深度学习技术的不断发展,AI对话系统已经从基于规则的第一代和以传统机器学习为核心的第二代,发展到以大数据和大模型为显著特征的第三代,对话能力产生了革命性变化,在开放话题上展现了惊人的对话能力,对进一步推动人工智能产业发展具有巨大意义和价值。

  考虑到AI对话系统任务繁多、评价维度多样、技术路线丰富,撰写小组在制定《分级定义》时仅关注完全由机器主导的对话系统,人机混合的对话系统不在考虑范围内。黄民烈说。

  黄民烈介绍,同时,为了在实际应用中发挥价值,《分级定义》的制定是从用户可感知、可观察、可测量、可度量的角度出发,不考虑系统的具体技术实现方式,也不区分助理类任务、闲聊、知识对话等,均以场景进行表述。

  在上述原则之下,《分级定义》从自动对话能力、对话质量高低、单一/多个场景、跨场景的上下文依赖和自然切换能力、拟人化程度、主动和持续学习能力、多模态感知与表达能力等角度出发,将AI对话系统划分为L0—L5共6个等级,等级越高,AI对话系统水平越高。

  从上述标准看,当前AI对话系统水平最高已发展至L2到L3之间,如常见的‘小爱同学’等AI智能助理就处于这个水平。黄民烈说。

  与国外相比,我国AI对话系统水平如何?对此,小米技术委员会主席、AI实验室主任王斌表示,从目前的工业应用看,我国的AI对话系统与国外的AI对话系统没有明显差异,总体处在同一级别。

  现在AI对话系统整体处在向L3、L4发展的路上,距离理想还有一定的距离,还需要一到两年甚至更长时间的持续努力。黄民烈说,要向L4、L5迈进,需要破解记忆、联想、推理、自学习能力等方面的很多关键技术,要做出高表现力的语音合成,如果运用到元宇宙中,还需要做出动作和表情细粒度的表达,都极具挑战性。

  在华为诺亚方舟实验室语音语义首席科学家刘群看来,AI对话系统最高级别的应用为复杂情感任务,《分级定义》的发布将促进AI对话系统在情感任务中体现更高水平的智能,从而促进人工智能未来在情感陪伴、心理健康、虚拟人、元宇宙等方面的应用,大大降低人力和物力成本,促进前沿科技走进大众日常生活。

  小爱,小爱,明天北京天气如何?当前,AI对话系统已经深刻融入人们日常生活的方方面面,技术架构和路线更是百花齐放。

  然而,作为前沿技术,AI对话系统标准缺失,造成其评价体系不一、在应用中呈现出水平参差不齐等问题。针对这种状况,清华大学智能技术与系统实验室副主任黄民烈教授联合学界和业界科研机构共同制定了全球首个《AI对话系统分级定义》(以下简称《分级定义》),并于近日正式发布。《分级定义》旨在更好地评估AI对话系统的能力水平,推动AI对话系统在虚拟个人助理、智能家居、智能汽车(车载语音)、情感陪护和心理健康等领域的应用有据可依。

  起源于图灵测试的AI对话系统,是人工智能领域最重要的研究方向之一。如果说自然语言处理是人工智能‘皇冠上的明珠’,那么AI对话系统则是自然语言处理中最难、最核心的任务之一,是‘明珠中最亮的那颗’。黄民烈说。

  黄民烈表示,近年来,随着深度学习技术的不断发展,AI对话系统已经从基于规则的第一代和以传统机器学习为核心的第二代,发展到以大数据和大模型为显著特征的第三代,对话能力产生了革命性变化,在开放话题上展现了惊人的对话能力,对进一步推动人工智能产业发展具有巨大意义和价值。

  考虑到AI对话系统任务繁多、评价维度多样、技术路线丰富,撰写小组在制定《分级定义》时仅关注完全由机器主导的对话系统,人机混合的对话系统不在考虑范围内。黄民烈说。

  黄民烈介绍,同时,为了在实际应用中发挥价值,《分级定义》的制定是从用户可感知、可观察、可测量、可度量的角度出发,不考虑系统的具体技术实现方式,也不区分助理类任务、闲聊、知识对话等,均以场景进行表述。

  在上述原则之下,《分级定义》从自动对话能力、对话质量高低、单一/多个场景、跨场景的上下文依赖和自然切换能力、拟人化程度、主动和持续学习能力、多模态感知与表达能力等角度出发,将AI对话系统划分为L0—L5共6个等级,等级越高,AI对话系统水平越高。

  从上述标准看,当前AI对话系统水平最高已发展至L2到L3之间,如常见的‘小爱同学’等AI智能助理就处于这个水平。黄民烈说。

  与国外相比,我国AI对话系统水平如何?对此,小米技术委员会主席、AI实验室主任王斌表示,从目前的工业应用看,我国的AI对话系统与国外的AI对话系统没有明显差异,总体处在同一级别。

  现在AI对话系统整体处在向L3、L4发展的路上,距离理想还有一定的距离,还需要一到两年甚至更长时间的持续努力。黄民烈说,要向L4、L5迈进,需要破解记忆、联想、推理、自学习能力等方面的很多关键技术,要做出高表现力的语音合成,如果运用到元宇宙中,还需要做出动作和表情细粒度的表达,都极具挑战性。

  在华为诺亚方舟实验室语音语义首席科学家刘群看来,AI对话系统最高级别的应用为复杂情感任务,《分级定义》的发布将促进AI对话系统在情感任务中体现更高水平的智能,从而促进人工智能未来在情感陪伴、心理健康、虚拟人、元宇宙等方面的应用,大大降低人力和物力成本,促进前沿科技走进大众日常生活。

相关阅读
热门新闻
高颜值速度快轻便携的移动固态硬盘开箱评测

高颜值速度快轻便携的移动固态硬盘开箱评测

  (原标题:高颜值速度快轻便携的移动固态硬盘开箱评测)     大多数工作文件因涉及商业机密,采用在线传输,存有一定的安全风险。因

2022-07-04 03:00
Model3预定量达到27.6万辆可产能仍是个大问题

Model3预定量达到27.6万辆可产能仍是个大问题

16 分享到 易信 LOFTER 新浪微博 腾讯空间 人人网 有道云笔记 科技图片中心 查看图集   美国时间3月31日晚,特斯拉公司向全

2022-07-03 16:20
2022(第七届)思维实验室论坛举行,Testin云测试获“年度智能测试解决方案”大奖

2022(第七届)思维实验室论坛举行,Testin云测试获“年度智能测

  (原标题:2022(第七届)思维实验室论坛举行,Testin云测试获年度智能测试解决方案大奖)   近日,中国科学院《互联网周刊》和中国社

2022-07-03 12:45
知识图谱赋能,国双自主可控知识智能平台入选胖鲸智库Top50产品榜单

知识图谱赋能,国双自主可控知识智能平台入选胖鲸智库Top50产品

  (原标题:知识图谱赋能,国双自主可控知识智能平台入选胖鲸智库Top50产品榜单)  近日,由胖鲸智库主办的Digital π首席数字官峰会

2022-07-03 09:17
人气飙升,用户口碑折射ColorOS12正式版成业界体验标杆

人气飙升,用户口碑折射ColorOS12正式版成业界体验标杆

  (原标题:人气飙升,用户口碑折射ColorOS 12正式版成业界体验标杆)   近日,ColorOS 12 × Android 12正式版已正式发布,

2022-07-03 03:40
折叠屏手机迎抢购热潮,ColorOS自由悬停体验引关注

折叠屏手机迎抢购热潮,ColorOS自由悬停体验引关注

  (原标题:折叠屏手机迎抢购热潮,ColorOS自由悬停体验引关注)  OPPO首款折叠屏手机Find N于12月23日上午10点正式首销,开售5分钟线上

2022-07-03 01:22