top of page
Search

变天了?Anthropic发布宇宙最强系列模型:Claude 3

  • Writer: 莹 周
    莹 周
  • Mar 5, 2024
  • 4 min read

3月5日,OpenAI劲敌Anthropic发布新一代系列模型—Claude 3。

 

Claude 3系列模型主要包括三种最先进的型号:

 

Claude 3 Haiku(中杯)、Claude 3 Sonnet(大杯)与Claude 3 Opus(超大杯),能力从低到高,其中Opus是最强大的,Haiku是市场上最快、最具成本效益的模型。

 

用户可根据智能程度、速度和成本,选择适合的特定模型。

 


全面碾压GPT-4,Claude 3到底有多强?

 

Anthropic发布新一代模型的消息,令整个投资圈和科技圈为之沸腾。

 

Anthropic表示:“Claude 3 Opus拥有人类本科生水平的知识,也已经跃升成为全球最强大的AI大模型。”

 

据悉,Claude 3系列模型在性能基准、实时结果、视觉能力、长上下文、多语言、工作负载、使用体验等方面都有重要的突破进展,尤其单词处理能力是ChatGPT的近50倍

 

具体来看下Claude 3系列模型的优势:

 

l 在上下文方面,Claude 3全系列大模型可提供200k上下文窗口,相当于15万个单词,单词处理能力是ChatGPT接近50倍,大约是英文版《白鲸》或《哈利・波特与死亡圣器》的长度。用户可以输入大量数据集,并要求其以备忘录、信件或故事的形式进行摘要。

 

l 性能基准方面,Claude 3 Opus在本科水平专家知识 (MMLU)、研究生水平专家推理(GPQA)、基础数学(GSM8K) 等多个测试中都优于同行业模型。例如,在MMLU方面,Claude 3 Opus达到86.8%,超越了GPT、Gemini等一众模型;在研究生水平专家推理(GPQA)得分是50.4%,优于GPT-4的35.7%,在基础数学(GSM8K)上Claude 3 Opus得分是95.0%,优于GPT-4的92.0%。而且,Claude 3 Haiku甚至可以与Gemini 1.0 Pro相抗衡。

 

l 视觉能力方面,Claude 3系列模型具备与其他领先模型相媲美的高级视觉识别能力。它们能够处理各种视觉格式,包括照片、图表、图形和技术绘图等。在部分视觉能力上Claude 3系列模型性能刷新SOTA。如在技术图表(AI2D)上,Claude 3 Opus得分为88.1%,远超GPT-4V的78.2%。另外,Anthropic称,这将为企业客户提供这种新的能力,支持高达50%用PDF、流程图或演示文稿等多种格式存储的企业知识库。

 

l 多语言方面,Claude 3系列模型增强了西班牙语、日语和法语等非英语语言对话方面的能力。

 

l 实时结果和工作负载方面,对于绝大多数场景,Haiku市场上速度最快且最具成本效益的模型,它可以在不到三秒的时间内阅读arXiv上包含图表和图形的信息和数据密集的研究论文;Sonnet的速度比Claude 2和Claude 2.1快2倍,且智能水平更高,它擅长执行需要快速响应的任务,如知识检索或销售自动化等;最强大的Opus模型的速度与 Claude 2和2.1相似,但智能水平更高。

 

Anthropic还在Claude 3系列模型论文中表示,这些模型都是使用亚马逊AWS和谷歌云的硬件进行训练的。目前,Claude3已在AWS模型库Bedrock和谷歌的VertexAI中上线。此外,在负责任能力、使用体验等方面,Anthropic表示,Claude 3系列模型不仅功能强大,而且值得信赖。

 

不过,Anthropic也坦言,虽然与之前的模型相比,Claude 3模型系列在生物知识、网络相关知识和自主性的关键指标方面取得了进步,但根据其负责任的扩展政策,它仍处于AI安全级别2 (ASL-2) ,低于美国白宫的超强大AI模型标准的阈值界限。

 

整体来看,Anthropic长文本能力、多个性能指标都非常强大,与GPT-4一较高下也不为过。

Dario Amodei近期公开表示,2023年是专家级AI,到了2025-2026年,Anthropic模型技术将成功超越人类,届时AI将能够真正帮助人类工作,大大加速产业发展。

 



Anthropic是谁?

 

实际上,这家刚刚超越ChatGPT-4的大模型公司,成立时间还不到3年。

 

Anthropic AI成立于2021年,由OpenA前研究副总裁Dario Amodei、曾核心参与研发GPT-2与GPT-3的前OpenAI员工Jared Kaplan、Sam McCandlish、Tom Brown等人建立。因此,Anthropic当时就被视为是最有潜力超越OpenAI的团队。

 

据说是由于理念不合,Dario Amodei领导的研究人员担心微软对OpenAI的投资会使其走上更加商业化的道路,偏离公司最初想法,因此选择离开了OpenAI。

 

2022年12月,在ChatGPT发布不久,Anthropic团队在发布了一篇题为《Constitutional AI: Harmlessness from AI Feedback》论文,描述了一个基于无监督方式训练、520亿参数的模型 AnthropicLM v4-s3,直接挑战OpenAI的GPT-3模型。

 

2023年1月,Anthropic发布基于Anthropic LM v4-s3、AI聊天机器人模型产品Claude,被认为是ChatGPT的有力竞争者。



在整个2023年,Anthropic共完成五笔融资,总融资额高达73亿美元,投资方包括谷歌、Salesforce、亚马逊以及韩国SK Telecom等。其中,亚马逊向Anthropic投资高达40亿美元、谷歌投资超20亿美元,均持有Anthropic的少数股权。

 

在2023年12月,Anthropic还在进行新一轮高达7.5亿美元的融资,估值为184亿美元,相比2023年初41亿美元的估值上涨了4.5倍。

 

这一数字不仅标志着AI初创公司的融资纪录被打破,更是市场对Anthropic及其Claude 3模型的信心和期待的鲜明印证。投资者们深刻认识到了AI市场未来的巨大潜力,而Claude 3则成为了这一潜力的最佳典范,Claude 3的推出,在多个领域树立了行业新标准,同时,为AI技术的未来发展树立了新标杆


 
 
 

Comments


1250 Broadway

New York, NY 10001

17th Floor, 33 Canton Road

Tsim Sha Tsui, Kowloon, Hong Kong 

ininfinfo

Send Us a Message

Thanks for submitting!

©2023 by MX Technology LLC.

bottom of page