当前位置: > 91科技资讯站 > 合作 > > 正文

捷通华声灵云种子展现最强语音合成

近日,捷通华声最新灵云嵌入式语音合成技术,iHear 7.0正式登陆灵云平台。全面向产业开放。iHear 7.0版在语音合成效果、资源占用、产品功能等多方面全面超越目前市场的同类产品,达到国内嵌入式语音合成技术的最高水平。……

近日,捷通华声最新灵云嵌入式语音合成技术,iHear 7.0正式登陆灵云平台。全面向产业开放。iHear 7.0版在语音合成效果、资源占用、产品功能等多方面全面超越目前市场的同类产品,达到国内嵌入式语音合成技术的最高水平。捷通华声面向智能车载、智能家电、智能家居、穿戴式设备等领域专门开发的全方位解决方案——灵云种子也因此全面升级,并开始为国内智能终端领域提供最清新的语音合成技术。  回顾2014年以来,众多设备商、制造商、互联网+公司在内的各领域厂商都在机器人、智能车载、穿戴式设备智能硬件领域积极投入。业内分析人士认为,除了市场前景广阔外,智能硬件市场极有可能成为继移动互联网后下一个入口的新兴行业。

进入2015年,智能硬件厂商更是如雨后春笋般冒芽而出,从智能手环到智能手表、从智能车机到智能后视镜、从智能插座到智能灯泡、从智能电视到智能空调。然而在硬件大军的浪潮中,相对应的软件却少之又少,虽然各种“云”也有所冒头,但是,却鲜有能够一套方案能解决智能硬件所需所有功能的云服务。在现在推出的语音云中,大多数仅固步在“声”的方向,如语音合成、语音识别等语音交互能力,对于用户的图像需求,如人脸识别、指纹识别、手写识别、光学字符识别等能力则无法实现。

在此种形式下,捷通华声推出了新一代“灵云种子”一体式解决方案。“灵云种子”融合了灵云(hcicloud.com)平台语音识别(ASR)、语音合成(TTS)、声纹识别(VPR)、语义理解(NLU)、手写识别(HWR)和图像识别(OCR、指纹识别、人脸识别等)等多项灵云核心技术能力,可实现智能语音交互、智能语音导航、智能语音控制、声纹安全锁、智能手写/手势输入、智能图像识别、身份认证等功能。涵盖了智能车载、智能家电、智能家居及可穿戴式设备等行业。可广泛应用在以下几种场景中:

语音检索:支持包括路况导航类、家居菜单智能导航类、周边服务类、生活服务类、娱乐类等多种语音检索服务;

消息提醒:人性化定制推送类别:来电提醒、短信提醒、应用提醒,并可将设置在云端;

通讯娱乐:支持短信发送,电话通讯,多媒体播放,手机操控;

健康服务:支持传感器,提供传感器数据分析,为用户提供健康图表,并结合云端服务提供定制健康指导等现有及正在研发的能力;

云平台:基于灵云平台,提供多设备数据同步,私人信息云存储,智能推荐;

智能支付:结合智能终端特点,提供更便捷、更多样的智能支付方式。

虚拟现实扩展:将AR技术与LBS技术整合,为用户提供包括周边景点商圈实景展示,路线提示,为O2O服务提供优秀体验;

灵云(hcicloud.com)平台将这些特定领域和场景的智能交互方案经过设计和优化后,打造出一体化的全智能人机交互解决方案——“灵云种子”。合作伙伴开发应用时可直接应用“灵云种子”配置的技术服务和内容服务,即可完全满足各行业智能终端的服务需求。

灵云种子自推出以来,为满足用户需求,不断升级以满足智能车载、智能家电等智能终端设备的快速发展,灵云种子此次升级,采用了最新的灵云嵌入式语音合成——iHear7.0 Embedded 7.0.0技术,此项技术创造性采用最新一代高音质合成器,音质效果更加真实、干净、细腻;利用模型优化了算法,大大提高音色的逼真度和音质的细腻度,克服机器味底噪;增加了数据训练流程,比传统训练方法稳定性更高;优化了音高算法,使朗读更加抑扬顿挫;优化了计算效率,默认情况下比旧版快2.5倍,资源消耗大幅降低;更全面的地名词库,精心裁剪,可辨认全国常见地名、机构名;支持用户定制化需求:针对用户特定词汇、语句保证读音正确、韵律自然;丰富的语种与发音人:语种可支持中文普通话、粤语、英语、北方语系方言、台湾腔调国语等;已发布十余种发音人音色,性别涵盖男声、女声、童声,涵盖正式、闲适、可爱、激昂、稳重、柔美等各类风格,尤其值得一提的是,最新语音合成技术为汽车导航等特殊领域专门定制,可清晰流畅朗读全国常见地名、机构名。

2011年,捷通华声率先推出全球第一个全方位人工智能开放平台-灵云平台(hcicloud.com)。灵云平台是一种可以用语音、手写、拍照,手势,将来甚至可使用脑波识别等智能手段来操作、感知手机、计算机等数字设备的网络云服务,目标是让人机交互像人与人沟通一样的简单自然。灵云平台自全面向产业开放以来,灵云语音识别、语音合成、语义理解等人工智能技术能力通过百度导航、搜狗导航、导航犬、嘀嘀打车、快的打车、天行听书、灵云输入法等“家喻户晓”的经典应用服务中国13亿社会大众,使大众群体充分感受并体验到智能语音等人工智能技术为现代生活所带来的轻松与便捷。2015年,捷通华声与清华大学共同创建清华灵云人工智能研究中心,共同致力于“灵云科技 源自清华 服务全球”的战略发展目标,更为灵云平台发展奠定更加坚实的基础,

灵云平台作为国内外最大的全方位人工智能开放平台,为促进机器人、智能车载、智能家电、智能家居、穿戴式设备等产业发展,将灵云智能语音交互(TTS、ASR、VPR)、智能图像识别(OCR证照识别、文档识别、名片识别、手写识别)、生物特征识别(指纹识别、人脸识别)、自然语言理解(NLU)、语义分析、机器翻译(MT)等人工智能技术能力全面向产业开放,此举不但得到了数千家企业的支持,更直接推动了人工智能技术在车载、家电、家居、穿戴式设备的发展与进步。

灵云平台面向产业全面开放,并积极布局全国,在中国华南地区,尤其广州、深圳地区经济发达、创新力强,在机器人、智能车载、智能家电、智能家居、穿戴式设备拥有独特优势。为了向华南地区广大客户提供更加直接的支持与帮助,捷通华声在2015年初成立了深圳捷通华声分公司,旨在依托灵云平台,利用灵云平台智能语音、智能图像、语义理解等全方位人工智能技术能力和丰富完善的智能终端交互解决方案,与华南地区硬件厂商加强合作关系,发挥华南地区智能终端设备研发和生产的优势,以推动智能终端产业长足的进步,携手智能硬件厂商互惠共赢,共同推动中国人工智能产业的发展。

来源:互联网
信息也是生产力,精简才是硬道理!情报猎手带你突破信息迷雾,每日独家为您锁定最有价值的IT行业新鲜事。打开微信,扫描关注,赢取每月粉丝奖!