变天了？Anthropic发布宇宙最强系列模型：Claude 3

莹周
Mar 5, 2024
4 min read

3月5日，OpenAI劲敌Anthropic发布新一代系列模型—Claude 3。

Claude 3系列模型主要包括三种最先进的型号：

Claude 3 Haiku（中杯）、Claude 3 Sonnet（大杯）与Claude 3 Opus（超大杯），能力从低到高，其中Opus是最强大的，Haiku是市场上最快、最具成本效益的模型。

用户可根据智能程度、速度和成本，选择适合的特定模型。

全面碾压GPT-4，Claude 3到底有多强？

Anthropic发布新一代模型的消息，令整个投资圈和科技圈为之沸腾。

Anthropic表示：“Claude 3 Opus拥有人类本科生水平的知识，也已经跃升成为全球最强大的AI大模型。”

据悉，Claude 3系列模型在性能基准、实时结果、视觉能力、长上下文、多语言、工作负载、使用体验等方面都有重要的突破进展，尤其单词处理能力是ChatGPT的近50倍。

具体来看下Claude 3系列模型的优势：

l 在上下文方面，Claude 3全系列大模型可提供200k上下文窗口，相当于15万个单词，单词处理能力是ChatGPT接近50倍，大约是英文版《白鲸》或《哈利・波特与死亡圣器》的长度。用户可以输入大量数据集，并要求其以备忘录、信件或故事的形式进行摘要。

l 性能基准方面，Claude 3 Opus在本科水平专家知识 (MMLU)、研究生水平专家推理(GPQA)、基础数学(GSM8K) 等多个测试中都优于同行业模型。例如，在MMLU方面，Claude 3 Opus达到86.8%，超越了GPT、Gemini等一众模型；在研究生水平专家推理（GPQA）得分是50.4%，优于GPT-4的35.7%，在基础数学(GSM8K)上Claude 3 Opus得分是95.0%，优于GPT-4的92.0%。而且，Claude 3 Haiku甚至可以与Gemini 1.0 Pro相抗衡。

l 视觉能力方面，Claude 3系列模型具备与其他领先模型相媲美的高级视觉识别能力。它们能够处理各种视觉格式，包括照片、图表、图形和技术绘图等。在部分视觉能力上Claude 3系列模型性能刷新SOTA。如在技术图表（AI2D）上，Claude 3 Opus得分为88.1%，远超GPT-4V的78.2%。另外，Anthropic称，这将为企业客户提供这种新的能力，支持高达50%用PDF、流程图或演示文稿等多种格式存储的企业知识库。

l 多语言方面，Claude 3系列模型增强了西班牙语、日语和法语等非英语语言对话方面的能力。

l 实时结果和工作负载方面，对于绝大多数场景，Haiku市场上速度最快且最具成本效益的模型，它可以在不到三秒的时间内阅读arXiv上包含图表和图形的信息和数据密集的研究论文；Sonnet的速度比Claude 2和Claude 2.1快2倍，且智能水平更高，它擅长执行需要快速响应的任务，如知识检索或销售自动化等；最强大的Opus模型的速度与 Claude 2和2.1相似，但智能水平更高。

Anthropic还在Claude 3系列模型论文中表示，这些模型都是使用亚马逊AWS和谷歌云的硬件进行训练的。目前，Claude3已在AWS模型库Bedrock和谷歌的VertexAI中上线。此外，在负责任能力、使用体验等方面，Anthropic表示，Claude 3系列模型不仅功能强大，而且值得信赖。

不过，Anthropic也坦言，虽然与之前的模型相比，Claude 3模型系列在生物知识、网络相关知识和自主性的关键指标方面取得了进步，但根据其负责任的扩展政策，它仍处于AI安全级别2 (ASL-2) ，低于美国白宫的超强大AI模型标准的阈值界限。

整体来看，Anthropic长文本能力、多个性能指标都非常强大，与GPT-4一较高下也不为过。

Dario Amodei近期公开表示，2023年是专家级AI，到了2025-2026年，Anthropic模型技术将成功超越人类，届时AI将能够真正帮助人类工作，大大加速产业发展。

Anthropic是谁？

实际上，这家刚刚超越ChatGPT-4的大模型公司，成立时间还不到3年。

Anthropic AI成立于2021年，由OpenA前研究副总裁Dario Amodei、曾核心参与研发GPT-2与GPT-3的前OpenAI员工Jared Kaplan、Sam McCandlish、Tom Brown等人建立。因此，Anthropic当时就被视为是最有潜力超越OpenAI的团队。

据说是由于理念不合，Dario Amodei领导的研究人员担心微软对OpenAI的投资会使其走上更加商业化的道路，偏离公司最初想法，因此选择离开了OpenAI。

2022年12月，在ChatGPT发布不久，Anthropic团队在发布了一篇题为《Constitutional AI: Harmlessness from AI Feedback》论文，描述了一个基于无监督方式训练、520亿参数的模型 AnthropicLM v4-s3，直接挑战OpenAI的GPT-3模型。

2023年1月，Anthropic发布基于Anthropic LM v4-s3、AI聊天机器人模型产品Claude，被认为是ChatGPT的有力竞争者。

在整个2023年，Anthropic共完成五笔融资，总融资额高达73亿美元，投资方包括谷歌、Salesforce、亚马逊以及韩国SK Telecom等。其中，亚马逊向Anthropic投资高达40亿美元、谷歌投资超20亿美元，均持有Anthropic的少数股权。

在2023年12月，Anthropic还在进行新一轮高达7.5亿美元的融资，估值为184亿美元，相比2023年初41亿美元的估值上涨了4.5倍。

这一数字不仅标志着AI初创公司的融资纪录被打破，更是市场对Anthropic及其Claude 3模型的信心和期待的鲜明印证。投资者们深刻认识到了AI市场未来的巨大潜力，而Claude 3则成为了这一潜力的最佳典范，Claude 3的推出，在多个领域树立了行业新标准，同时，为AI技术的未来发展树立了新标杆。

变天了？Anthropic发布宇宙最强系列模型：Claude 3

全面碾压GPT-4，Claude 3到底有多强？

Anthropic是谁？

Recent Posts

Comments