OpenAl采用智谱标准评测GPT-4.1系列大模型

数码

TIME

2025-04-17 11:18

通信世界网

OpenAI发布的最新GPT-4.1系列大模型，其中在评测函数调用能力时采用了ComplexFuncBench。

ComplexFuncBench是由智谱团队提出的专用于评估大模型复杂函数调用能力的测试基准。

据悉，ComplexFuncBench主要评测大模型在128K的长上下文下进行多步带约束的函数调用的能力。相比于现有函数调用测试基准，ComplexFuncBench要求大模型对真实场景下的用户需求进行细粒度理解，并在此基础上进行多步带推理的函数调用，这对模型的函数调用能力提出了更高的挑战。

THE END

免责声明：本文系转载，版权归原作者所有；刊载之目的为传播更多信息，如内容不适请及时通知我们。

　　有消息称，苹果公司正在开发一款全新的头显设备“Vision Air”。采用更轻薄的机身设计，电池外壳及部分内部结构替换为钛金属，进一步减轻设备重量，但外部仍保留铝合金材...

智能AI

　　京东外卖并非临时决策，而是整合京东物流、达达即时配送、实体店资源后的系统性进攻‌。通过“0佣金+品质商家”策略，将京东在3C领域的“正品低价”优势平移至外卖战...

电商