本地AI已实用，七项功能即刻在个人电脑上实现

PCWorld网站探讨了七种可在个人电脑上本地运行的实用人工智能应用，涵盖语音转录、图像超分辨率、音乐生成及视频特效等领域。相较于云端方案，这些工具在隐私保护和数据控制方面更具优势，但通常需要配备高性能RTX系列显卡，且用户界面往往不够精致。核心应用包括用于转录的Whisper Desktop、用于图像增强的Upscayl，以及视频通话时实现实时摄像头特效的英伟达广播套件（Nvidia Broadcast）。

Cover Image

当云端人工智能解决方案风头正劲时，本地人工智能工具也展现出前所未有的强大能力。您的游戏电脑能借助人工智能实现的功能远不止在LM Studio中运行大型语言模型或用Stable Diffusion生成图像……与云端工具不同，您能完全掌控自己的数据并享有绝对隐私。

以下将介绍当前在台式电脑上可体验的酷炫人工智能应用。需要说明的是，这些多为社区开发的爱好者项目，请务必以合理预期对待。

注：许多本地人工智能工具属于开源软件，可免费下载且运行良好，但其精致度和易用性通常不及商业软件。

语音转文字转录

Whisper Desktop

OpenAI开源的Whisper语音转文字模型可通过Whisper Desktop等工具在个人电脑上运行。该工具会调用电脑显卡加速Whisper模型，实现快速转录。

这是将音频转换为文字的高效方案，支持直接麦克风输入或导入音频文件。虽然Whisper并非完美——毕竟没有人工智能工具是完美的——但其表现已超越几年前需要付费购买的专业转录软件。

图像超分辨率

Upscayl

如今众多公司已提供云端图像编辑与超分辨率工具。Adobe Photoshop甚至内置此功能，但其处理过程依赖Adobe的云端服务器。

若想通过本地硬件提升图像分辨率，Upscayl是一款用户友好的工具，可通过本地人工智能将低分辨率图像转换为高分辨率版本。

云端人工智能图像编辑工具固然便捷，但若您拥有足够强大的硬件配置，完全可以在不上传图像至云端服务器的情况下，直接在电脑上完成此类处理。

实时摄像头与麦克风特效

英伟达广播套件（Nvidia Broadcast）

微软正大力推广作为Copilot+电脑人工智能功能套件组成部分的Windows Studio Effects，我评测的许多新款笔记本电脑都预装了“人工智能摄像头特效”套件。如果您使用的是Copilot+笔记本电脑，可尝试Windows Studio Effects；若您使用的是近年推出的普通笔记本电脑，不妨在开始菜单中搜索摄像头滤镜工具。

但如果您拥有配备英伟达RTX显卡的高性能游戏电脑（无论是台式机还是笔记本），则可使用免费的英伟达广播套件解锁人工智能摄像头与麦克风特效，例如背景消除、模拟眼神接触，甚至在高端显卡上实现“影棚级灯光”等高级功能。所有处理均实时完成，因此您可在游戏直播或视频会议中直接使用。

视频超分辨率与编辑

Topaz Labs

您同样可以利用电脑本地硬件进行人工智能视频超分辨率与编辑。Topaz Labs提供广受欢迎的专业级付费应用程序，所有视频与图像的人工智能编辑处理均在电脑本地硬件上完成。这款面向专业工作流程的解决方案价格不菲，但它展现了本地人工智能的潜力。

若需免费开源方案，可关注Video2X。这款工具能通过人工智能提升视频文件分辨率，其用户友好程度令人惊喜。

这些工具是“最后一公里”挑战的典型例证。虽然市面上存在大量强大的本地人工智能模型，但最精致易用的用户界面往往属于付费工具。爱好者与研究人员能开发出功能强大的软件，却常缺乏精力将其打磨成面向终端用户的成熟产品。

声音克隆

GPT-SoVITS

您知道吗？利用电脑硬件即可克隆自己的声音。此类工具目前尚不成熟——本地人工智能领域普遍如此——您通常会接触到网页界面，且需要下载大型文件。可通过GPT-SoVITS或RVC实现此功能，但请预期操作过程可能不够流畅。

不过这充分展示了技术可能性：您已能利用消费级硬件和开源软件克隆声音。目前唯一缺失的环节是便捷的用户界面。

音乐生成

YuE

如果您在社交媒体上见过人工智能生成的歌曲，它们很可能来自云端音乐生成工具Suno。

用于生成音乐的本地人工智能解决方案确实存在，但大多处于开发早期且不够完善。YuE是一款开源工具，未来或许能与Suno竞争。您可以下载YuE在本地硬件上运行，但在类似工具变得更易用之前，可能仍需依赖Suno。

正如本地人工智能解决方案的常见情况，YuE正让那些过去只能通过云端服务器公司获取的功能变得更易触及。据YuE介绍，在配备RTX 4090显卡的电脑上生成30秒音频约需360秒（6分钟）。这表现相当不错！假以时日，您或许就能在游戏电脑上生成完整歌曲。

音乐人声消除

Ultimate Vocal Remover

如果您喜欢跟着伴奏带唱卡拉OK，或单纯偏爱纯器乐演奏，可能一直希望能有工具消除任意歌曲中的人声。长久以来这虽可实现，却是耗时费力的艰辛过程——直到Ultimate Vocal Remover的出现。

这款免费应用程序简单易用，能在几分钟而非数小时甚至数天内完成任务。只需提供MP3、FLAC或WAV格式文件，它就能输出去除人声的版本。

本地人工智能强大但欠精致

如果您对过去几年人工智能的过度炒作感到失望，我深表理解。尽管关于本地人工智能的讨论沸沸扬扬，微软Windows系统和消费级软件套装对实用人工智能工具的整合却进展甚微。

最有趣的进展发生在开源软件社区，那里诞生的本地人工智能模型功能强大得令人惊喜，但其用户界面粗糙业余却也在意料之中。幸运的是，未来几年很可能出现更多用户友好型解决方案，以更好地发挥高性能电脑硬件的潜力。

目前，只要您愿意亲自动手、克服陡峭的学习曲线，并配备相对强大的硬件（例如RTX系列显卡），本地人工智能已能实现诸多功能。遗憾的是，神经处理单元目前尚无法帮助运行本地人工智能工具。

搜索结果如下

阅读全文

本地AI已实用，七项功能即刻在个人电脑上实现

语音转文字转录

图像超分辨率

实时摄像头与麦克风特效

视频超分辨率与编辑

声音克隆

音乐生成

音乐人声消除

本地人工智能强大但欠精致

也可以看看

《血源诅咒》“狂人知识”戒指揭晓，哥特美学点缀指尖

阅读全文

《超级少女》致敬原版超人斗篷，DCU传承经典再启航

阅读全文

《行尸走肉》官方新作《生存街头》获赞，复古清版动作唤醒昔日辉煌

阅读全文