有道智云实时语音翻译服务全新上线+语言实时翻译!

2024-08-30 18:42

  有道智云·AI开放平台新上线的实时语音翻译接口,可广泛用于会议同传、多语种直播字幕、视频字幕翻译等场景,支持实时返回识别结果,达到一边输入音频流,一边获得翻译后的文字内容。

  该技术是通过Websocket API的方式给开发者提供一个通用的接口,开放给公众使用。Websocket API具备流式传输能力,识别速度更快,识别效率更高。目前可完美支持英、日、韩、法、西班牙、葡萄牙文等86种语言(含口音)实时准确翻译,针对不同地区的口音和方言也可精准识别,覆盖200多个国家和地区。

  实时语音翻译的逻辑主要分为两步:将实时语音转成文字;再将文字翻译成另一种语言的文字。这是目前主流的技术路线,在实际应用场景中,受到口音,方言,噪音环境,专业领域的翻译效果、翻译的实时性等因素阻碍,语音翻译技术尚未能达到完美的效果。

  有道语音翻译技术综合了高准确率、口音噪声鲁棒的高性能语音识别引擎及在自动翻译和机器学习等多领域的成果,通过强大的机器学习,应用海量语料,进行深层网络训练,准确率可达95%,响应速度可达秒级。目前已经成功用于多个产品线,如有道翻译王硬件、有道会议同传系统、有道视频翻译等。

  倘若互联网发展的底层逻辑是将全人类更好地连接在一起,形成一个巨大村落,那么语言也许就是最后一个技术障碍。当然,实时语音翻译技术作为一项不断优化的技术,受到语言的变化等诸多因素的影响(如方言、口音、俚语等),系统对识别和翻译的准确率还需不断完善,而有道AI团队一直在推进语音到文本的技术,以便为用户提供更精准的实时语音翻译服务。