微软否认退出Xbox硬件业务,强调持续投资研发
阅读全文

锤刻创思寰宇网
在周一的开发者大会上,OpenAI发布了新版应用程序接口更新,推出其最新语言模型GPT-5 Pro、新一代视频生成模型Sora 2以及一款更小巧经济的语音模型。
这些更新旨在吸引开发者加入OpenAI的生态系统,包括推出智能体构建工具及在ChatGPT中开发应用的功能。OpenAI首席执行官萨姆·奥尔特曼(Sam Altman)指出,GPT-5 Pro将吸引金融、法律和医疗保健领域的应用开发者——这些行业需要“高精度和深度推理能力”。
奥尔特曼同时强调,语音功能正快速成为人机交互的主要方式之一,未来将至关重要。为此,OpenAI推出支持低延迟音频流交互的轻量化语音模型“gpt-realtime mini”,其应用程序接口调用成本较此前的高级语音模型降低70%,同时保证“同等音质与表现力”。
目前,OpenAI开发生态系统的创作者可通过应用程序接口预览版体验Sora 2。该最新音视频生成模型于上周与Sora应用同步发布,这款对标TikTok的应用充斥着人工智能生成的短视频,用户可根据提示生成自己、朋友或任何主题的视频,并通过算法信息流进行分享。
奥尔特曼表示:“开发者现在可以直接在自家应用中调用驱动Sora 2惊艳视频输出的同款模型。”新一代Sora 2在实现更逼真、物理一致性场景的基础上,新增同步音效功能并强化创作控制——从精细运镜到风格化视觉呈现皆可驾驭。
“例如,你可以拍摄iPhone视角的画面,提示Sora将其扩展为电影级广角镜头。”奥尔特曼解释道,“但最令人振奋的是新模型实现了音画精准契合,不仅是语音,还包括沉浸式环境音效、与画面内容同步的声效设计。”
Sora 2被定位为概念开发工具,既能根据产品调性生成广告创意视觉初稿,也能将设计草图转化为玩具概念——奥尔特曼在开发者大会现场展示了美泰公司(Mattel)设计师的实操案例,这揭示了OpenAI与这家芭比制造商正将生成式人工智能融入玩具生产流程。