Android生动字幕:让屏幕内容更加生动易读
2024-12-06 / 阅读约4分钟
来源:CNET
Google推出生动字幕功能,使字幕更加生动,能够反映说话人的语气和背景声音。该功能集成在Android系统中,适用于视频、直播等,无需网络连接。

生动字幕,以全大写形式展现激动情绪。Google出品

Google于周四推出了一项创新功能,旨在让字幕更加贴近真实情境。这项功能被称为“生动字幕”,它不仅能准确传达视频或直播中的对话内容,还能捕捉说话者的情绪与方式。

比如,当有人兴奋地大喊“生日快乐!”时,字幕将以全大写形式呈现,完美捕捉那份喜悦。此外,您还能在字幕中看到掌声、音乐等环境音效的描述,仿佛身临其境。

生动字幕作为实时字幕功能的一部分,能够自动为视频、电话和音频消息等媒体内容生成实时字幕。它内置于Android操作系统中,适用于手机上的各类应用,意味着您在观看社交媒体直播、视频消息等内容时,都能享受到这一便捷服务。更令人欣喜的是,由于字幕是在设备上即时生成的,即使在飞行模式或无网络连接的情况下,也能正常使用。

生动字幕,为您呈现视频内容的完整画面。Google/Jeffrey Hazelwood/CNET

传统上,字幕主要用于帮助听力障碍者观看电视节目。然而,随着人们越来越多地在地铁等嘈杂环境中选择无声观看视频,或希望更清晰地理解电影、电视节目中的对话,字幕的使用范围已大大拓宽,深受各年龄段用户的喜爱。据在线语言辅导网站Preply的数据显示,70%的Z世代用户会定期观看带字幕的电视节目。但遗憾的是,许多直播、社交内容及朋友和家人分享的视频往往没有预加载字幕。

Android与Google DeepMind团队携手打造了生动字幕功能,它利用多个AI模型创建能够捕捉更广泛声音元素的风格化字幕,旨在模拟人类动态聆听音频的体验。

“这只是我们为改善残障人士生活体验所迈出的一小步,同时也是利用AI技术惠及所有人的一个缩影。”Android产品管理总监Angana Ghosh在博客文章中如是说道。

从周四起,生动字幕功能将在美国面向所有运行Android 14及更高版本、并支持实时字幕的Android设备推出英文版。这只是Google为Android和Pixel设备宣布的众多更新之一。

此外,Google还对其Lookout应用进行了升级,该应用旨在帮助视障和低视力用户识别物体并获取更多周围环境信息。如今,Lookout已支持包括阿拉伯语在内的数十种语言,并引入了Gemini AI模型来支持图像描述和问答模式,让用户能够对图像提出后续问题。同时,该应用还具备自动语言检测和更自然的语音功能。

Gemini将为Lookout的图像描述功能提供强大支持。Google/Jeffrey Hazelwood/CNET

Google还在Android上为Utilities、Spotify、Messaging和Calling等应用添加了更多Gemini扩展,使其更加便于通过Google虚拟助手进行访问。

Pixel设备用户还将享受到其他新功能带来的便利。例如,Gemini Saved Info功能允许用户要求Gemini记住自己的兴趣和偏好,以便获得更加有用和相关的回复。此外,还有一项更新允许用户在使用Circle进行搜索时快速点击以将内容保存到Pixel Screenshots中,从而便于后续查找。用户还可以将已截图的信用卡或门票添加到钱包中,而Pixel Screenshots将自动对截图进行分类整理,让一切井然有序。

最后,Pixel上的简易视图功能通过增大手机字体大小和提高触摸灵敏度,让查看和导航控件、应用及小组件变得更加轻松自如。它还展示了一个简化的主屏幕布局,包含一组预先选定的基本应用,并将应用网格扩展至4x4显示。简易视图适用于Pixel 6及更新版本的手机。

生动字幕的加入,无疑将使那些无法或不愿开启音频的内容观看体验对听障人士以及偏好静音观看内容的用户来说更加友好和吸引人。