PCWorld网站探讨了七种可在个人电脑上本地运行的实用人工智能应用,涵盖语音转录、图像超分辨率、音乐生成及视频特效等领域。相较于云端方案,这些工具在隐私保护和数据控制方面更具优势,但通常需要配备高性能RTX系列显卡,且用户界面往往不够精致。核心应用包括用于转录的Whisper Desktop、用于图像增强的Upscayl,以及视频通话时实现实时摄像头特效的英伟达广播套件(Nvidia Broadcast)。

当云端人工智能解决方案风头正劲时,本地人工智能工具也展现出前所未有的强大能力。您的游戏电脑能借助人工智能实现的功能远不止在LM Studio中运行大型语言模型或用Stable Diffusion生成图像……与云端工具不同,您能完全掌控自己的数据并享有绝对隐私。
以下将介绍当前在台式电脑上可体验的酷炫人工智能应用。需要说明的是,这些多为社区开发的爱好者项目,请务必以合理预期对待。
注:许多本地人工智能工具属于开源软件,可免费下载且运行良好,但其精致度和易用性通常不及商业软件。
语音转文字转录
Whisper Desktop
OpenAI开源的Whisper语音转文字模型可通过Whisper Desktop等工具在个人电脑上运行。该工具会调用电脑显卡加速Whisper模型,实现快速转录。
这是将音频转换为文字的高效方案,支持直接麦克风输入或导入音频文件。虽然Whisper并非完美——毕竟没有人工智能工具是完美的——但其表现已超越几年前需要付费购买的专业转录软件。
图像超分辨率
Upscayl
如今众多公司已提供云端图像编辑与超分辨率工具。Adobe Photoshop甚至内置此功能,但其处理过程依赖Adobe的云端服务器。
若想通过本地硬件提升图像分辨率,Upscayl是一款用户友好的工具,可通过本地人工智能将低分辨率图像转换为高分辨率版本。
云端人工智能图像编辑工具固然便捷,但若您拥有足够强大的硬件配置,完全可以在不上传图像至云端服务器的情况下,直接在电脑上完成此类处理。
实时摄像头与麦克风特效
英伟达广播套件(Nvidia Broadcast)
微软正大力推广作为Copilot+电脑人工智能功能套件组成部分的Windows Studio Effects,我评测的许多新款笔记本电脑都预装了“人工智能摄像头特效”套件。如果您使用的是Copilot+笔记本电脑,可尝试Windows Studio Effects;若您使用的是近年推出的普通笔记本电脑,不妨在开始菜单中搜索摄像头滤镜工具。
但如果您拥有配备英伟达RTX显卡的高性能游戏电脑(无论是台式机还是笔记本),则可使用免费的英伟达广播套件解锁人工智能摄像头与麦克风特效,例如背景消除、模拟眼神接触,甚至在高端显卡上实现“影棚级灯光”等高级功能。所有处理均实时完成,因此您可在游戏直播或视频会议中直接使用。
视频超分辨率与编辑
Topaz Labs
您同样可以利用电脑本地硬件进行人工智能视频超分辨率与编辑。Topaz Labs提供广受欢迎的专业级付费应用程序,所有视频与图像的人工智能编辑处理均在电脑本地硬件上完成。这款面向专业工作流程的解决方案价格不菲,但它展现了本地人工智能的潜力。
若需免费开源方案,可关注Video2X。这款工具能通过人工智能提升视频文件分辨率,其用户友好程度令人惊喜。
这些工具是“最后一公里”挑战的典型例证。虽然市面上存在大量强大的本地人工智能模型,但最精致易用的用户界面往往属于付费工具。爱好者与研究人员能开发出功能强大的软件,却常缺乏精力将其打磨成面向终端用户的成熟产品。
声音克隆
GPT-SoVITS
您知道吗?利用电脑硬件即可克隆自己的声音。此类工具目前尚不成熟——本地人工智能领域普遍如此——您通常会接触到网页界面,且需要下载大型文件。可通过GPT-SoVITS或RVC实现此功能,但请预期操作过程可能不够流畅。
不过这充分展示了技术可能性:您已能利用消费级硬件和开源软件克隆声音。目前唯一缺失的环节是便捷的用户界面。
音乐生成
YuE
如果您在社交媒体上见过人工智能生成的歌曲,它们很可能来自云端音乐生成工具Suno。
用于生成音乐的本地人工智能解决方案确实存在,但大多处于开发早期且不够完善。YuE是一款开源工具,未来或许能与Suno竞争。您可以下载YuE在本地硬件上运行,但在类似工具变得更易用之前,可能仍需依赖Suno。
正如本地人工智能解决方案的常见情况,YuE正让那些过去只能通过云端服务器公司获取的功能变得更易触及。据YuE介绍,在配备RTX 4090显卡的电脑上生成30秒音频约需360秒(6分钟)。这表现相当不错!假以时日,您或许就能在游戏电脑上生成完整歌曲。
音乐人声消除
Ultimate Vocal Remover
如果您喜欢跟着伴奏带唱卡拉OK,或单纯偏爱纯器乐演奏,可能一直希望能有工具消除任意歌曲中的人声。长久以来这虽可实现,却是耗时费力的艰辛过程——直到Ultimate Vocal Remover的出现。
这款免费应用程序简单易用,能在几分钟而非数小时甚至数天内完成任务。只需提供MP3、FLAC或WAV格式文件,它就能输出去除人声的版本。
本地人工智能强大但欠精致
如果您对过去几年人工智能的过度炒作感到失望,我深表理解。尽管关于本地人工智能的讨论沸沸扬扬,微软Windows系统和消费级软件套装对实用人工智能工具的整合却进展甚微。
最有趣的进展发生在开源软件社区,那里诞生的本地人工智能模型功能强大得令人惊喜,但其用户界面粗糙业余却也在意料之中。幸运的是,未来几年很可能出现更多用户友好型解决方案,以更好地发挥高性能电脑硬件的潜力。
目前,只要您愿意亲自动手、克服陡峭的学习曲线,并配备相对强大的硬件(例如RTX系列显卡),本地人工智能已能实现诸多功能。遗憾的是,神经处理单元目前尚无法帮助运行本地人工智能工具。



