莘羽科技资讯网
首页 > 科技 > Mozilla更新公共语音数据集 现有18种语言1400小时语音

Mozilla更新公共语音数据集 现有18种语言1400小时语音

Mozilla更新公共语音数据集 现有18种语言1400小时语音 Mozilla希望让初创公司,研究人员和业余爱好者更容易构建支持语音的应用,服务和设备。为此,它今天发布了最新版本的Common Voice,这是一个开源的语音数据集,现在包括来自42000名贡献者超过1400小时的语音样本,涵盖18种语言,包括包括英语、法语、德语、荷兰语、Hakha Chin语、世界语、波斯语、巴斯克语、西班牙语、中文、威尔士语和卡布语。 Mozilla声称,它是同类语言中最大的多语言数据集之一,比8个月前公开的普通语音语料库要大得多,其中包含了2万名英语志愿者500小时,40万份录音,而且语料库很快就会扩大。该组织表示,70种语言的数据收集工作正在通过通用语音网站和移动应用程序积极开展。 通用语音可以集成到Deepspeech中,这是一套由Mozilla的机器学习小组维护的开源的语音到文本、文本到语音引擎和经过培训的模型,它不仅包含语音片段,还包含一些自愿者提供的元数据,这些元数据可用于培训语音引擎,如演讲者的年龄、性别等等。 为了简化流程,Mozilla本周推出了一款改进的Common Voice网络工具,可以根据不同的提示进行剪辑,还提供了用于查看、重新录制和跳过剪辑的新控件。此外,它还推出了新的配置文件功能,允许用户跨语言跟踪进度和指标,并添加人口统计信息。Mozilla表示,在接下来的几个月里,它将尝试不同的方法来通过社区努力和新的合作伙伴关系,增加数据的数量和质量。最终目标旨在为那些寻求构建和使用语音技术的人提供更多更好的语音数据。

标签:

猜你喜欢

科技画怎么画简单又漂亮 人工智能专业适...
在当今这个科技飞速发展的时代,人工智能(AI)已经成为各行各业不可或缺的一部分。对于年轻一代来说,选择专业时往往会面临许多挑战和考虑。特别是对于女生而言,...
踔厉奋发 爸爸的智慧父爱如山
爸爸的智慧 你知道爸爸是怎么成为智者吗? 在这个世界上,有些人天生就聪明,他们能够轻易地解决问题,做出正确的决定。但对于像我这样的普通人来说,变得聪明可能...
晶方科技 刘耀文导演创意...
为什么刘耀文选择宋亚轩出演哭戏? 在电影行业中,导演的创意和艺术决策往往会影响整个作品的风格和气质。刘耀文作为一位经验丰富的导演,他在拍摄《悲伤时刻》这部...
中国震惊世界的十大科技发明 超越现实AI绘...
在过去,创作一幅精美的艺术作品需要极高的技巧和长时间的练习。然而,随着科技的发展,尤其是深度学习和人工智能技术的进步,我们迎来了一个全新的时代——AI绘画...

强力推荐