开放人工智能:公司 已提交是多模态生成人工智能(AI)的新模型,GPT-4o,其名称“o”的意思是全能(omni)。新模型中改进了文本处理和图像分析功能,并增加了实时识别和处理语音的能力。新模型将在未来几周内在面向开发者和消费者的解决方案中推出,并且免费提供。
Open AI技术总监Muri Murati表示,新模型的认知能力远高于GPT-4,尤其是在编程领域。此外,新模型理解并拥有50种语言,包括亚美尼亚语。我们将在未来几周内了解它对亚美尼亚语这样复杂的语言的理解程度,以及它是否已经超越了 ChatGPT-3.5。
还有多语言语音助手,可以即时翻译语音并具有人类语音功能;它可以开玩笑和“笑”。正如他所写 TechCrunchGPT-4o 的主要创新之一是能够直接实时理解来自相机的照片,这使得与 AB 的交互更加直观和自然。以前,聊天机器人只能看到上传的图像。
新车型的发布将分阶段进行。一些用户已经收到,而其他用户将在未来几周内收到。
对于免费用户,对 GPT-4o 的请求会有一些限制。该金额将取决于当前的使用情况和需求。如果 GPT-4o 不可用,免费版本的用户将被重定向到 GPT-3.5。
还值得注意的是,免费用户也将获得对数据分析、文件下载等高级工具的有限访问。