OpenAI劲敌出手！Claude 3正式发布，超越GPT-4，一口气读15万单词

业界

TIME

2024-03-05 10:10

36氪

　　OpenAI创始人奥特曼都还没来得及和马斯克掰扯完新仇旧恨，没关系，还有其他人会悄悄出手——

　　北京时间3月4日晚间，Anthropic，毫无预警地发布了最新一代大模型Claude 3，距离上一代的Claude 2发布，仅相隔8个月。

　　Anthropic是OpenAI的劲敌，其核心团队同样是OpenAI的创业原班人马。团队因为与OpenAI理念不合而分家，于2021年成立了新公司Anthropic。

　　仅在2023年，Anthropic就连续获得五轮，共计73亿美元的融资。在大模型训练上，Anthropic可以说是业内第一梯队，同样备受硅谷关注。

　　这次，毫无疑问，Claude 3直接对标OpenAI当前最强大的模型GPT-4，多模态能力配齐，并且直接甩出超过46页的技术报告，自豪表示：

全面超越GPT-4！

　　△来源：Claude来源：

　　新一代的Claude 3分为三个版本，分别为Haiku、Sonnet、Opus三款模型。从模型尺寸来看，可以理解为模型的中杯、大杯、超大杯。

　　虽然Anthropic并没有给出模型的具体参数，不过给出了三款模型所适用的场景：

Haiku：是相应速度最快的模型，也是成本最低的选项，在大多数纯文本任务上的表现仍然相当出色，也同时包含多模态能力（比如视觉）
Sonnet：适用于需要平衡性能和成本的场景，它在纯文本任务上的表现与后面的Opus相当，但在成本上更为经济，适合于那些需要性能稍微好点，但预算有限的企业和个人用户
Opus：具有强大的推理、数学和编码能力，接近人类的理解能力，适用于需要高度智能和复杂任务处理的场景，如企业自动化、复杂金融预测、研究和开发等。

　　从本周开始，Claude会向159个国家开放。其中，Opus和Sonnet模型的API均已上线，开发者已经可以直接使用。经济性能兼顾的Sonnet，就在官网上提供免费体验，Opus则可供Claude Pro订阅者使用。

　　尽管OpenAI凭借Sora在文生视频领域打了一场漂亮的翻身仗，但视频赛道所在的发展阶段更早。如今的主战场仍在大语言模型（LLM）上，离产品化也更近。

　　圈内人也看热闹不嫌事大。近期不少报道显示，马斯克将OpenAI告上法庭，让OpenAI不得不内部推迟有关GPT-5的发布——GPT-5被认为能够实现AGI（通用人工智能）。著名AI圈网红、英伟达的首席AI科学家Jim Fan就表示：

Claude 3刚刚发布了，坐等几个小时后OpenAI精心安排的GPT-5发布。

　　△来源：Twitter（X）

　　2024年才刚刚过去两个月，我们就已经见证谷歌Gemini Pro、OpenAI的Sora，再到如今的Claude发布……巨头混战再度拉开序幕，大有愈演愈烈之势。

一口气读15万单词，还能自己拆解复杂问题

　　如果是OpenAI是大模型领域的“六边形战士”，无论是模型视频、商业化综合水平一骑绝尘，那么Anthropic从风格上看更为低调，也更强调专才，但这次的能力提升确实巨大。

　　有看客甚至表示：

Claude 3终结了GPT-4时代。

　　这次Claude 3的两大更新亮点，一个是长文本，二是多模态能力。

　　长文本就是Anthropic的一个显著优势，体现为在读论文、小说等字数更多的文本时，Anthropic更擅长理解和回答用户的相关问题。

　　这次，Claude 3大大提升了上下文对话窗口，达到200k——可以理解为单次和模型对话能够输入的文本。

　　具体而言，Claude 3 200k的对话长度，相当于能够单次处理超过15万英文单词，而GPT-4 Turbo的上下文窗口为128k，大约是9.6万个英文单词。

　　并且，Claude 3也第一次允许图像和文档上传。和ChatGPT一样，Claude 3能够“认”出来图里的是什么东西，直接描述，回答用户的问题。

　　而更令人印象深刻的还是，Claude 3在分析一些复杂问题时，已经能够和人一样，先拆解问题，并且交由子模型来进行调度。

　　在Anthropic的演示视频里，就举了一个需要用python模拟经济形势走向的例子。当把“分析美国十年GDP未来趋势”的任务交给Claude 3之后，Claude就默默地做了这些事：

先打开一个名为“webview”的工具，跳到这个问题相关的资料网址里
因为有多模态能力，所以能够把“看到”的信息，无论是文字还是图表，都扒拉下来，用来解决问题
然后自己写python程序、渲染趋势图，让人类看是否正确

　　最有趣的就是，网页中如果看到一个数据图表，没有明确数据的，Claude 3甚至能通过识别图像，来估算每个阶段大概数据是多少，进行还原。

　　△搜索引擎中的数据图表

　　△Claude 3还原的折线图，估算了每个时间节点的具体GDP

　　AI安全也是Anthropic区别于OpenAI的一点。在OpenAI和Anthropic团队分家的时候，其最重要分歧正是包含对AI安全的考虑，Anthropic希望建立一个“更可信”的模型，而OpenAI显然希望用商业化驱动模型更快地前进，路线上更为激进。

　　对此，Anthropic采取的措施包括但不限于：制定了一套框架，用于评估和减轻 AI 模型可能带来的潜在灾难性风险，比如继续拧自动化评估和红队测试，以确保AI不会发展出可能造成伤害的能力。

　　2023年4月，Anthropic甚至开源宪法人工智能（Constitutional AI）引起了圈内轰动，这是一个限制模型行为遵守特定宪法原则的AI。

　　以及2024年也是美国大选年， Anthropic 也在准备开发和执行关于在政治和选举背景下使用工具的政策，评估模型对选举错误信息、偏见和其他滥用的反应，确保用户能够在选定国家获得准确和最新的投票信息。

　　不过，Anthropic也因为太过重视AI安全，很多问题的评估上很谨慎，甚至直接不回答，惹来一片用户吐槽。这次，Anthropic表示，Claude 3在这个问题上大有改进。

　　比如，Claude 3的对无害信息的拒绝回复率，普遍来到了10%附近，比Claude2.1和2.0都有进步。

　　△来源：Anthropic

　　据CNBC，Anthropic拒绝透露训练 Claude 3 到底花了多少时间和多少钱，但表示 Airtable 和 Asana 等知名SaaS公司有帮忙对模型进行了A/B测试，让模型的可控性也有所改善。

技术以外，Anthropic商业化还要再提速

　　尽管Anthropic技术上又一次拿出了看家实力，但大模型领域如今已经走过了一年多时间的技术竞争。如何从模型走向实际的产品落地，创造更大的商业价值，是悬在所有厂商头上的剑。

　　如今Anthropic背后站着谷歌云、亚马逊，已经和OpenAI（背靠微软）形成鲜明的阵营对比。但从商业化角度，当前Anthropic远赶不上OpenAI，这意味着Anthropic在2024年会面临更大压力。

　　和ChatGPT一样，Anthropic也是To B和To C两条腿走路。在企业侧，Anthropic已经服务了包括 Slack、Notion 和 Quora等用户。

　　而据The Information 2023年12月报道， Anthropic预计到2024年底将产生超过8.5亿美元的年化收入。相比起来，同样截至2023年底，OpenAI由于ChatGPT的强劲增长，年化收入从10月中旬的13亿美元就增至16亿美元。

　　往后，随着OpenAI商业化提速，差距还可能越来越大。The Information援引一些 OpenAI 领导者的观点，到 2024 年底，他们预计OpenAI年化收入可以达到50亿美元，而其他人则认为可以达到更高的数字。

　　技术上的军备竞赛远未结束。在2023年12月，Anthropic还在进行新一轮高达7.5亿美元的融资，估值为184亿美元，相比2023年初41亿美元的估值，涨了4.5倍。

THE END

免责声明：本文系转载，版权归原作者所有；刊载之目的为传播更多信息，如内容不适请及时通知我们。

OpenAI劲敌出手！Claude 3正式发布，超越GPT-4，一口气读15万单词

相关热点

最新文章

相关推荐

东京奥运会中国第13金由游泳健将张雨霏斩获，一天斩获两枚金牌

两名航天员成功出舱航天员刘伯明成功开启天和核心舱节点舱出舱舱门

微信显示“正在输入”，其实不是在回复消息，背后原因挺“伤人”

关注我们

OpenAI劲敌出手！Claude 3正式发布，超越GPT-4，一口气读15万单词

相关热点

最新文章

相关推荐

东京奥运会中国第13金由游泳健将张雨霏斩获，一天斩获两枚金牌

两名航天员成功出舱 航天员刘伯明成功开启天和核心舱节点舱出舱舱门

微信显示“正在输入”，其实不是在回复消息，背后原因挺“伤人”

关注我们

两名航天员成功出舱航天员刘伯明成功开启天和核心舱节点舱出舱舱门