谷歌旗下的云端笔记本工具 Google Colab 一直是编程、数据科学和人工智能领域的热门工具。最近,它又迎来了一项新功能——“数据科学助手”,这是一款全新的“AI 代理”工具,旨在帮助 Colab 用户更快速地清理数据、可视化趋势以及获取上传数据集的深度洞察。
数据科学助手最早在去年年初的谷歌 I/O 开发者大会上首次亮相,当时它是一个独立的项目。然而,谷歌最终决定将其整合到 Colab 中,让用户能够直接在 Colab 笔记本中使用这一工具。谷歌实验室的产品总监凯西·科雷韦克(Kathy Korevec)在接受采访时表示,这种整合是为了让用户更便捷地使用数据科学助手。
目前,数据科学助手在 Colab 中免费提供,但需要注意的是,Colab 对免费用户的计算资源有一定限制。不过,谷歌也提供了多种付费计划,起价为 9.99 美元,付费用户可以享受更高的计算资源上限。
数据科学助手主要面向数据科学家和人工智能应用场景,但它并不局限于这些领域。它还可以帮助用户发现 API 异常、分析客户数据,甚至编写 SQL 代码。用户只需上传数据并提出问题,数据科学助手就能提供相应的解决方案。
在技术层面,数据科学助手采用了谷歌的 Gemini 2.0 AI 模型家族作为后端支持,并配备了“推理”工具,用于帮助用户完成特征工程和数据清理等任务。凯西·科雷韦克(Kathy Korevec)还透露,谷歌正在不断改进这一工具,通过强化学习等技术以及用户反馈,持续提升数据科学助手的性能。
目前,数据科学助手支持的文件格式包括小于 1GB 的 CSV、JSON 或 .txt 文件。它可以分析单次提示中的约 12 万个标记,相当于约 48 万字的内容。
科雷韦克还表示,数据科学助手未来可能会扩展到谷歌的其他开发工具和服务中。她指出:“我们目前只是刚刚挖掘了这个工具潜力的冰山一角。因为它是一个代理工具,我们可以将其整合到许多不同的工具中。我们并不希望强迫那些对代码不太熟悉的人去使用 Colab,而是希望让这个工具更加普及和易用。”