在2025年CES展会上,VLC媒体播放器背后的非营利组织VideoLAN宣布了一个令人振奋的消息:这款广受欢迎的开源多媒体工具下载量已经突破了60亿次大关。不过,这个数字可能并不完全准确,因为公司可能没有将第三方来源的下载量计算在内。与此同时,VideoLAN的开发团队还展示了他们未来的一大计划——一项支持100种语言的AI字幕和实时翻译功能。目前,该功能正在紧锣密鼓地开发中,其目的是利用开源人工智能模型来实时生成字幕。
VLC即将推出的AI字幕功能似乎借鉴了像OpenAI的Whisper这样的技术成果。Whisper是一种自动语音识别系统,能够将音频转换成文本。它之所以受到好评,是因为它能够利用大规模的数据集进行训练,从而处理各种口音和方言。与之不同的是,VLC的AI字幕功能将采用离线运行的方式,直接内置到VLC应用程序中。这一点特别值得关注,因为它避免了对互联网连接的依赖,也不需要借助云服务,这对于注重隐私的用户来说无疑是一个巨大的优势。
VideoLAN的总裁让 - 巴蒂斯特·肯普夫(Jean - Baptiste Kempf)谈到这项新功能时表示:“我们不仅有自动翻译功能,可以将字幕翻译成用户自己的语言,而且这一切都是在用户的本地机器上离线运行的,完全不依赖任何云服务。它直接在应用程序的可执行文件内运行。”
此外,AI字幕功能还能够兼容多种媒体格式,这对于那些希望在不同语言的内容之间无缝切换的用户来说,是一个非常实用的工具。据公司介绍,AI将能够为超过100种语言的视频生成字幕和翻译,这无疑将使VLC对全球观众更加友好。
尽管这项新功能为VLC带来了巨大的进步,但人们仍然对一些问题感到好奇。例如,开发者将如何解决AI生成字幕不准确的问题,这可能会对用户体验产生负面影响。此外,人们还想知道VLC将采用哪些开源AI模型,以及这项功能的系统要求是否会消耗大量资源。很可能,用户需要一台配备有专用神经处理单元(NPU)的电脑才能充分利用这一功能。
目前,VideoLAN尚未公布新功能的具体发布日期,但预计不久后会作为免费更新推出。