当前位置: > 91科技资讯站 > 合作 > > 正文

捷通华声领军智能语音 推出最新灵云语音合成

伴随灵云全方位人工智能开放平台(hcicloud.com)在2014年的高速成长,2月3日,灵云平台完成了大规模升级部署。在此次灵云平台升级部署中,捷通华声与清华灵云人工智能研究中心对灵云平台各项人工智能能力也进行了全面升级,……

伴随灵云全方位人工智能开放平台(hcicloud.com)在2014年的高速成长,2月3日,灵云平台完成了大规模升级部署。在此次灵云平台升级部署中,捷通华声与清华灵云人工智能研究中心对灵云平台各项人工智能能力也进行了全面升级,其中最为引人注目的是,推出了声音更为流畅、自然度更高的灵云语音合成(TTS)技术6.3.0版,这也继灵云平台相继推出领域内位居识别率领先水平的灵云语音识别、最新灵云声纹识别技术能力以来,灵云平台在提升并完善灵云智能语音交互技术能力上的又一次重大举措。

灵云语音合成(TTS)6.3.0版本全面提高了整体语音合成效果的自然度,使语音朗读更加流畅自然;提升了多音字标音的正确率,让不同播报内容中出现的多音字发音更加准确;提升了多层韵律结构分析和断句能力,使文字信息朗读过程中断词、断句更家精准;提高了对人名智能辨识的准确性,使包含多音字的人名发音更加亲切;优化了基本模式下对数字符号的读法,如“二”与“两”的读音;优化了调整音高、语速后的效果,使之在听感体验上更加舒适,几乎达到“真人”说话的水平。同时,为满足国际市场与越来越多用户的需求,6.0版新增对64位全平台的支持,提高了稳定性与兼容性,并完善了标记语言体系,完成了与国际标准接轨的目标。

目前,灵云平台(hcicloud.com)体验中心已经挂接了灵云语音合成6.3.0版,广大合作伙伴、新老用户均可直接在灵云体验馆进行体验。捷通华声灵云开发团队,升级了国内在PC端普及率最高、语音应用最多样化,一直应用灵云语音合成技术能力的PC端软件VoiceReader,不仅使语音播报流畅度大幅度提升,并增加了语音导出等新功能;移动互联网开发者,更可以直接通过灵云开发者社区,免费获取最新灵云语音合成技术能力,升级换代自身语音应用,使语音播报更加流畅自然。受到上千万用户喜爱的“天行听书”已率先应用新版语音,并实现一键开启云端听书功能,采用最新灵云语音的“天行听书”一经推出,近乎完美的语音合成效果得到了无数用户的惊叹与好评!

捷通华声:中国智能语音产业领军企业

语音合成即TTS(Text to Speech)技术,又称文语转换技术,能将任意文本信息实时转化为标准流畅的语音朗读,简单讲就是让“机器开口讲话”。TTS技术涉及声学、语言学、数字信号处理、计算机科学等多个学科技术,是语言信息处理领域的一项前沿技术。通过TTS技术,计算机可以在任何时候将任意文本“轻松”转换成具有高自然度的语音,从而真正实现让机器“像人一样开口说话”,我国自上世纪80年代,开始研究中文TTS技术,因为起步晚,技术门槛高,早期国内只有一两家企业从事语音合成技术的研究与商品化工作。

创建于2000年的北京捷通华声语音技术公司,是国内最早从事中文TTS研究与应用的企业。十几年来,捷通华声始终坚持自主研究语音合成(TTS)、语音识别(ASR)等智能语音技术,并不断在语音合成(TTS)、语音识别(ASR)等智能语音技术领域取得突破,中文语音合成(TTS)技术始终在国内处于绝对领先地位,也为保证我国中文智能语音技术始终处于世界领先地位做出了主要贡献。

如今,捷通华声经过长期与国内金融、电信、交通、能源及CTI等各领域企业保持良好的合作伙伴关系,凭借为合作企业提供周到细致的技术服务,捷通华声智能语音技术市场占有率超过50%,语音服务从北京奥运会到上海世博会;从纵贯中国的高铁到各大飞机场;从建行、农行等各大银行声讯服务到各领域呼叫中心服务;从各个医院语音叫号到各地长途汽车站。。。可以说,从2000年到今天,捷通华声无时无刻、无处不在地为中国亿万大众提供最先进的智能语音服务。

2014年,捷通华声凭借在智能语音产业界所做出的贡献与绝对领先的语音技术能力,在“第六届中国行业信息化奖项评选活动”上一举夺得“2014年度中国智能语音产业领军企业大奖”,成为智能语音产业中第一个获得此项殊荣的企业。

创建灵云服务中国13亿大众  引领中国人工智能产业进入云服务时代

2011年,捷通华声创造性推出了全球第一个最大、最全的人工智能技术开放平台 — 灵云(www.hcicloud.com)。灵云是一种可以用语音、手写、拍照、手势,将来甚至可使用脑波识别等智能手段来操作、感知手机、计算机等数字设备的网络云服务。自灵云平台推出以来,灵云语音合成技术已成为灵云平台影响力最大、服务范围最广的核心技术能力之一。

灵云平台不仅能够同时提供维吾尔语、蒙古语、粤语(广东话)等少数民族语言及地方方言的语音合成技术服务,并于2013年实现多语种语音合成技术能力服务,全面支持中文、英语、法语、俄语、西班牙语、阿拉伯语、德语、葡萄牙语、日语、韩语、泰语等11种语言,覆盖全球90%以上的国家和地区。值得骄傲的是,灵云平台也是唯一一个能够提供维吾尔语语音识别和语音合成技术能力的开放平台。

顺应产业发展,灵云平台面向产业全面开放,并以“云 + 端”方式,为产业界提供语音合成(TTS)、语音识别(ASR)、声纹识别(VPR)、手写识别(HWR)、光学字符识别(OCR)、指纹识别(FPR)、机器翻译(MT)、自然语言理解(NLU)等全方位人工智能能力。灵云平台通过服务百度导航、搜狗导航、导航犬、嘀嘀打车、快的打车、汉字英雄、天行听书、天行输入法、触宝输入法等“家喻户晓”移动应用服务,及服务京东商城、携程网、去哪儿网等大型互联网平台,使中国13亿社会大众群体充分感受并体验到智能语音等人工智能技术为现代生活所带来的轻松与便捷。秉持开放、分享、合作共赢之发展理念,灵云平台成功引领中国人工智能产业全面进入云服务时代,2014年,被产业内评为“最具影响力人工智能云服务平台”。

2013年,捷通华声与清华大学建立起战略合作伙伴关系,为灵云平台继续引领人工智能产业发展奠定了更为坚实的基础。清华校训“行胜于言”也是捷通华声发展过程中一直坚持的企业风格,新年伊始,灵云语音合成技术的全面升级,不仅将通过数千家合作伙伴在各个领域为社会大众提供国内最好听、最舒适的智能语音服务,也将通过为蓬勃发展的智能手机、智能家电、智能家居、车联网、可穿戴式设备提供体积最小、最清晰的智能语音技术,让13亿中国大众共同分享“灵云科技 源自清华 服务全球”的自信与自豪!

来源:91门户
信息也是生产力,精简才是硬道理!情报猎手带你突破信息迷雾,每日独家为您锁定最有价值的IT行业新鲜事。打开微信,扫描关注,赢取每月粉丝奖!