中国信息协会量子信息分会

会员动态

十三连冠!2018科大讯飞摘得国际语音合成大赛“全能冠军”

来源:新华网安徽频道    作者:admin    时间:2018-07-17

如果说全世界最没有悬念的冠军有哪些,Blizzard Challenge对于科大讯飞也许就是其中之一;科大讯飞对于这项比赛亦是。
      从2005年比赛诞生以来,尚无第二家机构可以拿下13连冠,也没有一家可以超越科大讯飞拥有的测评项目第一的数量。
      在近日结束的Blizzard Challenge 2018国际语音合成大赛的比赛中,科大讯飞报送的参赛系统摘得10个测评打分项目中的9项第一,成为“最全能的冠军”。
      面对这项再熟悉不过的比赛,面对自身拥有的、在全球唯一在英语合成上超过真人发音水平的系统,科大讯飞保持的是“顺便”的平常心。“因为对核心技术发自内心的热爱,因为自始至终全身心的投入,冠军是自然而然的事,我们也还会有更多的冠军。”

      全世界“最会说”的人工智能“嘴巴”
      Blizzard Challenge,这项语音合成最具权威性和影响力的国际比赛近日结束了2018年的任务。
     “包括‘自然录音’在内,共有14个参赛系统,科大讯飞和中国科学技术大学组建了联合团队参赛。”
      据悉,任务的评测项目共有4个,分别是:相似度、自然度、错误率、段落总体感觉;其中段落总体感觉又分为6个分项:愉悦感、停顿节奏、重读、声调、情感、耐听性。
      对于其中最重要的评测项目,科大讯飞的参赛系统显示了较为明显的领先优势。在相似度和自然度的评测中,科大讯飞分别得到3.9分和4分,均领先第二名0.3分。这两个项目均为5分制,对比原始句、得分越高说明表现越好。段落总体感觉的6个分项中,科大讯飞还囊括各个“单项冠军”,统计得分达38分、领先第二名系统4分。


Blizzard Challenge 2018十项评测,科大讯飞九项第一

     “让机器像人一样开口说话”,这就是语音合成的使命。涉及声学、语言学、数字信号处理、计算机科学等多个学科技术的它解决的主要问题就是将文字信息转化为可听的声音信息。
      从评分标准而言,一般5分代表中央电视台播音员的水平,4分是普通人的说话水平,要很标准和流畅。科大讯飞此次在英文任务中获相似度4分是唯一达到真人水平的;综合过往成绩,科大讯飞的语音合成是该项赛事中全球唯一在中文和英文合成上均超过真人发音水平的系统。
      顶天立地,民族科技引领中国创新
      回看Blizzard Challenge国际语音合成大赛,站在这一平台上的著名大学和研究机构包括:美国卡耐基-梅隆大学、英国爱丁堡大学、日本名古屋工业大学、IBM研究院、微软亚洲研究院等,代表了当今语音技术领域的世界一流水平。
      1999年创立的科大讯飞于2006年首次参赛,彼时他们已在国家863中文语音合成评测中囊括所有指标第一。当年,首次亮相国际赛场的他们便获得错误率和自然度两个指标双料第一。此后至今的13年间,他们成为获得评测项目第一最多的机构,这其中不仅有英语还有印地语的任务。

2017年,科大讯飞多次在国际比赛中刷新全球纪录

     “2017年我们拿到7个比赛的世界冠军,但这些都是‘顺便赢得’。”2018年初,科大讯飞董事长刘庆峰曾在年会上表示,对于夺冠,讯飞保持着平常心,因为冠军不是目标,“做自己喜欢的事业、专注于喜爱的研究,时间精力许可才顺便参加一下比赛,获奖也许就是水到渠成的事;我们真正全身心地投入,用技术改变世界,得到冠军一定是自然而然的事情,我们还会有更多的世界冠军。”
      掌握核心技术的国际制高点,科大讯飞也在不断推进应用落地。“技术顶天、产品立地”,遵循这样的路径,在智能语音和人工智能产品方面也赢得了广阔的市场空间和高度的市场赞誉。

2018博鳌亚洲论坛,讯飞翻译机2.0成为指定翻译机

     “善行者究其难”,作为一家在智能语音和人工智能道路上坚守了19年的民族科技创新企业,方有继续顶天立地的前行,才能不负信任和重托,才能和合作伙伴一起让中国人工智能越来越好、赢得更大未来,最终实现用人工智能建设美好世界的愿景。

copyright © 版权所有 中国信息协会量子信息分会    网站备案号:京ICP备17020758号-1