xAI公司开发的Grok聊天机器人近日新增视觉识别功能,用户可通过智能手机摄像头实时识别视野内物体并获取解答。这项名为Grok Vision的技术与谷歌Gemini及ChatGPT的视觉功能处于同类赛道。根据官方公告,使用者只需将手机对准商品、标志或文件等物品,系统即可结合场景内容提供即时反馈。目前该功能已登陆iOS版应用,安卓版本尚未开放。
本次更新还同步上线了两项重要升级:多语言音频处理模块与实时语音搜索模式。值得注意的是,安卓用户需购买每月216元人民币(约30美元)的SuperGrok套餐才能解锁这些高级功能。
Grok近期持续进行技术迭代,本月初发布的“记忆”系统可调用用户过往对话记录优化交互质量。此外,团队还推出了支持创建文档与应用程序的画布式工具,进一步拓展了人工智能助手的应用场景。