在Epochai的数学参考边界上,O3解决了25.2%的问题,而没有其他模型超过2%,与先前的模型相比,数学推理能力的增加之后。

基准与世界的真实价值

理想情况下,在博士学位上进行真实AI模型的潜在应用将包括对医学研究数据的分析,支持气候建模并管理研究工作的常规方面。

如果正确的话,信息报告的高价表明,Optai认为这些系统可以为公司提供巨大的价值。该出版物指出,OpenAI投资者Softbank致力于今年为OpenAI代理产品花费30亿美元,这表明尽管费用很高,但仍有很大的商业利益。

同时,Openai面临可能影响其高价策略的财务压力。去年,该公司将损失约50亿美元,涵盖与其服务管理有关的运营成本和其他费用。

经过多年的相对可负担的AI服务,OpenAI的平流层价格的消息传来,该服务使用户期望具有相对较低成本的强大能力。 Chatgpt Plus仍然每月20美元,Claude Pro每月费用为30美元,这些业务水平的两个小部分。与提供的新费用相比,即使是200美元的Chatgpt Pro/月订阅 /月也相对较低。这些级别之间的性能差异是否将与其价格差一千次相对应的问题是一个悬而未决的问题。

尽管具有参考性能,但这些模拟的推理模型仍然与构型战斗 – 它们产生了合理但实际上不正确的信息。对于精确性和可靠性至关重要的研究应用程序,这仍然是一个关键问题。每月投资20,000美元提出了有关组织是否可以信任这些系统的问题,以免在高问题研究中引入微妙的错误。

为了回应新闻,几个人开玩笑说,公司可以聘请真正的博士生来便宜得多。 “如果你忘记了,” 开发人员Xai Hieu Pham在病毒推文中,“大多数博士生,包括最聪明的明星,他们可以比目前的LLM好得多 – 没有支付20,000美元。”

尽管这些系统在特定基准上具有稳固的能力,但“博士学位”标签在很大程度上仍然是一个营销术语。这些模型可以以令人印象深刻的速度处理和综合信息,但是关于创造性思想的有效性,智力怀疑和定义了真正的博士学位的原始研究的有效性。另一方面,他们永远不会疲倦或需要健康保险,并且随着时间的推移,它们可能会继续提高能力并降低成本。

来源链接