尽管云端人工智能解决方案风头正劲,但本地人工智能工具的能力也达到了前所未有的高度。你的游戏电脑能借助人工智能完成的任务,远不止在LM Studio中运行大型语言模型或用Stable Diffusion生成图像……而且与云端人工智能工具不同,你对自己的数据拥有完全的控制权,隐私也得到了充分保障。

Cover Image

以下是一些你现在就能在台式电脑上体验的酷炫人工智能应用。顺便提一下,这些大多是社区创建的业余爱好者项目,所以请务必调整好心理预期。

注意:许多本地人工智能工具是开源软件,因此你可以免费下载并使用,效果也相当不错,但它们可能不具备专有软件那种完善度或用户友好性。

语音转文字转录

Whisper Desktop

OpenAI的Whisper语音转文字模型是开源的,你可以通过Whisper Desktop这类工具在自己的电脑上运行它。Whisper Desktop会利用你电脑的GPU来运行Whisper模型,从而实现快速转录。

这是一个将音频转换为文本的有效方案。你可以直接对着麦克风说话,也可以提供音频文件。虽然Whisper并不完美——没有任何人工智能工具是完美的——但它确实超越了仅仅几年前你还需付费购买的专业转录软件。

图像放大

Upscayl

如今,许多公司都纷纷推出了云端图像编辑和放大工具。Adobe Photoshop甚至也具备此功能,但Photoshop是在Adobe的云端服务器上完成处理的。

如果你想利用自己的电脑提高图像分辨率,Upscayl是一款用户友好的工具,它通过本地人工智能将低分辨率图像放大至高分辨率。

基于云端的人工智能图像编辑工具固然方便,但如果你拥有一台足够强大的设备,你完全可以在自己的电脑上完成这类操作,而无需将图像上传到云端服务器。

实时摄像头与麦克风特效

Nvidia Broadcast

微软正大力推广其Windows Studio Effects,作为其Copilot+ PC人工智能功能套件的一部分,而且我评测的许多最新笔记本电脑都预装了“人工智能摄像头特效”软件包。如果你拥有Copilot+ PC笔记本电脑,不妨试试Windows Studio Effects。如果你用的是一台较新的笔记本电脑,也可以在开始菜单里找找摄像头滤镜工具。

但如果你拥有一台配备Nvidia RTX GPU的强大游戏电脑(无论是台式机还是笔记本),就可以使用免费的Nvidia Broadcast应用程序来解锁人工智能摄像头和麦克风特效,例如背景移除、模拟眼神接触,甚至在顶级GPU上还能实现“演播室级灯光效果”这类高端功能。这一切都是实时处理的,因此你可以在直播游戏或视频会议时使用。

视频放大与编辑

Topaz Labs

你也可以利用电脑自身的硬件进行人工智能视频放大和编辑。Topaz Labs提供了广受欢迎的付费专业应用程序,用于人工智能视频和图像编辑工作,所有处理都在你电脑的本地硬件上完成。这是一个针对专业工作流程设计的昂贵解决方案,但它展示了本地人工智能的可能性。

至于免费开源的选择,可以看看Video2X。这是一款用于人工智能放大视频文件的工具,其用户友好程度出人意料。

这些工具是“最后一公里”挑战的典型例子。虽然市面上有许多强大的本地人工智能模型,但最完善、最易于使用的用户界面往往属于付费工具。业余爱好者和研究人员可以开发出强大的软件,但他们通常不会花太多时间将其打磨成面向最终用户的精美产品。

语音克隆

GPT-SoVITS

你知道吗?你可以利用自己电脑的硬件克隆声音。这类工具目前还不太完善——就像本地人工智能领域的许多工具一样——你通常会看到一个网页用户界面,并且需要下载一些大文件。你可以使用GPT-SoVITSRVC来实现,但要做好面对一些粗糙体验的准备。

然而,这是一个很好的例子,展示了可能性所在:你已经可以使用消费级硬件和一些开源软件来克隆声音。目前唯一缺失的拼图就是一个易于使用的用户界面。

音乐生成

YuE

如果你在社交媒体上看到过人工智能生成的歌曲,它们很可能是使用基于云端的音乐生成工具Suno创作的。

用于生成音乐的本地人工智能解决方案确实存在,但大多处于开发早期,仍不完善。YuE是一款开源工具,看起来有朝一日可能与Suno竞争。你可以下载YuE并在自己的硬件上运行,但在YuE这类工具变得更加用户友好之前,你可能还是想继续使用Suno

正如本地人工智能解决方案的常见情况一样,YuE正在让过去只能通过云端服务器公司才能使用的功能变得更易于获取。据YuE称,在一台配备RTX 4090 GPU的电脑上,生成30秒音频大约需要360秒(6分钟)。这相当不错!再过几年,你或许就能在自己的游戏电脑上生成完整的歌曲了。

音乐人声移除

Ultimate Vocal Remover

如果你喜欢跟着伴奏带唱卡拉OK,或者你只是更喜欢听器乐音乐,你可能会希望有一个工具可以移除任何歌曲中的人声。人们很久以前就能做到这一点,但一直是一个耗时费力的艰苦过程——直到现在,多亏了Ultimate Voice Remover

这款免费应用程序简单、用户友好,只需几分钟而非几小时甚至几天就能完成任务。只需提供一个MP3、FLAC或WAV文件,它就能输出一个剥离了人声的版本。

本地人工智能强大但尚不完善

如果你对过去几年人工智能的过度炒作感到失望,我完全理解。尽管关于本地人工智能的讨论天花乱坠,但微软Windows和消费级软件包在集成有用的人工智能工具方面做得很少。

最有趣的事情正在开源软件社区发生,那里出现了能力惊人强大的本地人工智能模型,但不出所料地伴随着粗糙且业余的用户界面。幸运的是,未来几年很有可能会出现更多用户友好的解决方案,更好地利用强大的电脑硬件。

就目前而言,如果你愿意亲自动手、忍受陡峭的学习曲线,并配备一些相对强大的硬件(例如RTX GPU),你其实已经可以用本地人工智能做很多事情了。遗憾的是,目前NPU还无法帮助你运行本地人工智能工具。

想了解更多电脑相关的精彩内容?请订阅克里斯的新闻通讯《The Windows ReadMe》。它总是由真人撰写,即使内容是关于人工智能的。


文章标签: #人工智能 #本地应用 #开源软件 #数据隐私 #电脑硬件

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。