YouTube未来可能会配备实时翻译器
将PaLM2的AI功能无缝集成到包括Bard在内的整个Google生态系统中,一直是GoogleI/O2023活动的一大主题。尽管谷歌认为有些功能不应该立即发布。
在GoogleI/O主题演讲期间,该公司负责技术和社会的高级副总裁JamesManyika对错误信息与某些人工智能功能(即深度造假背后的技术)之间潜在的紧张关系表示担忧。
他指的是Deepfakes用于在视频中配音的语言模型-你知道这些模型,其中最好的电视节目或最好的电影之一的著名演员的独白突然被替换为合成声音,从而改变了原始声音脚本说。
由于谷歌看到了不良行为者滥用这项技术的可能性,因此它正在采取一些措施来建立所谓的“护栏”。为了防止滥用其中一些新功能,该公司正在将人工制品集成到照片和视频中,例如水印和元数据。
谷歌的通用翻译器是一项实验性人工智能视频配音服务,可以实时翻译语音,让您在观看视频时立即看到并阅读某人用另一种语言所说的内容。
该原型在活动期间通过测试视频进行了展示,该测试是与亚利桑那州立大学合作创建的在线大学课程的一部分。谷歌表示,早期结果令人鼓舞,该研究中的大学生显示出更高的课程完成率。
该模型分四个阶段进行。在第一阶段,模型将视频中的嘴唇动作与其识别的单词进行匹配。第二步触发提供即时语音生成的算法。该模型的第三阶段使用语调来帮助翻译,语调测量某人说话的自然节奏的升降。最后,一旦它复制了风格并匹配了说话者嘴唇动作的语气,它就会将所有这些结合在一起生成翻译。
万能翻译器将在哪里发挥作用?
虽然通用翻译功能尚未在小型测试组之外使用,但一旦谷歌测试了众多安全措施,它可能会将其推广到YouTube及其视频会议服务GoogleMeet等服务。
毕竟,能够将实时视频实时翻译成多种语言可能是一个非常有用的工具。通用翻译器不仅可以扩大YouTube频道的全球收视率,还可以实现更多的跨国家合作项目。
我们肯定会关注并等待听到有关此功能以及它可以在Google生态系统中使用的更多信息。
想了解更多有关GoogleI/O大会的重大新闻吗?请查看我们的GoogleI/O2023实时博客,详细了解此次活动中宣布的内容。
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时候联系我们修改或删除,多谢。