claude - 搜索 News

资讯

o3视觉推理，暴打了Gemini 2.5 Pro和Claude 3.7 Thinking

今天凌晨，OpenAI 发布了 o3 满血版和 o4‑mini。奥特曼亲自为新模型站台，称 o3 的智能达到和接近天才水平。而且还有人说，OpenAI 这次又重回王座。当然，从官方放出来的榜单结果看，在编码 SWE-Bench 和 ...

22 天

最近，Claude 大模型团队发布了一篇名为《Tracing the thoughts of a large language model》（追踪大型语言模型的思维）的文章，深入探索大模型在回答问题时的内部机制，带我们了解它是如何 “思考”、推理的，以及为何偶尔会给出与事实不符的答案。这一研究就像是给大模型做了一次 “开盒”，让我们得以窥探其神秘的 “大脑” 运作方式。

腾讯网13 小时

AI玩《毁灭战士》集体翻车：GPT-4o、Claude、Gemini在第一关全军覆没

作者 | Alex Zhang、Ofir Press 翻译 | 苏宓出品 | CSDN（ID：CSDNnews）让 GPT-4o、Claude Sonnet 3.7、Gemini 2.5 Pro 和 Gemini 2.0 Flash ...

5 天

AI 席卷校园：百万条对话揭秘“Claude 是代码救星还是作弊工具”

学生使用 AI 主要是为了创造新知识和进行分析，如创建编程项目或分析法律概念。这与布鲁姆分类法中的高阶认知功能相契合。不过，这也引发了人们的担忧：如何防止学生过度依赖 AI，而放弃自身关键认知能力的锻炼？

2 天

【安索普】携手帕朗提尔推出Claude应用于政府市场

Claude应用将托管在谷歌云（Google Cloud）上，并采用多云战略，能够使用包括亚马逊（Amazon）Bedrock和谷歌云的Vertex ...

16 天

Claude 3.5首战复现21%顶会论文，人类博士无法取代，OpenAI：AI全是草台 ...

AI若能自主复现顶尖科研论文，未来科研将被掀翻天。OpenAI最新框架PaperBench正为此生，让AI智能体从头开始复现ICML 2024 20篇优秀论文，只有Claude 3.5 Sonnet拔得头筹，但仍无法超越ML博士水平。

16 天

OpenAI的AI复现论文新基准，Claude拿了第一名

4 月 3 日，OpenAI 推出了 PaperBench（论文基准测试），这是一个用于评估 AI 智能体自主复现前沿人工智能研究能力的基准测试系统。如果大模型智能体具备了自动写 AI / 机器学习研究论文的能力，既可能加速机器学习领域的发展，同时也需要审慎评估以确保 AI 能力的安全发展。

16 天

Claude团队发布完整Prompt Engineering指南，助力无代码开发热潮

Claude团队此次发布的Prompt Engineering指南，正值人工智能技术快速发展的关键时期。随着生成式AI工具的普及，如何高效地与这些模型沟通成为用户面临的核心挑战之一。这份指南的问世，不仅展示了Claude在技术上的领先地位，也体现了Anthropic致力于让AI更易用、更普惠的愿景。

3 天on MSN

Claude Research功能上线：AI 驾驭复杂任务，打造成你的工作神器

IT之家 4 月 16 日消息，Anthropic 昨日（4 月 15 日）发布博文，宣布为其 Claude 推出“Research”功能，并支持 Google Workspace 集成。 Claude 的 Research 功能类似 ChatGPT ...

36氪29 天

Claude突获「超能力」，Anthropic上线实时网络搜索，逆袭OpenAI和谷歌？

Anthropic终于为Claude解锁了网络搜索功能，这一姗姗来迟的升级让它从「数据截止」的限制中解放出来，网友泪目欢呼雀跃！现在，Claude不仅能实时 ...

品玩 on MSN3 天

Claude Research 上线，深度整合 Google

品玩4月17日讯，据爱范儿报道，Anthropic 宣布 Claude 将上线 Research 功能和 Google Workspace 深度集成。 Claude 本次新增的 Research 功能，与此前 OpenAI 在 ChatGPT ...

1 个月

Anthropic 正为 Claude 聊天机器人开发语音功能，已和多方商讨合作

IT之家 3 月 19 日消息，人工智能初创公司 Anthropic 正在为其 AI 驱动的聊天机器人 Claude 开发语音功能。该公司首席产品官迈克・克里格（Mike Krieger）向英国《金融时报》透露，Anthropic 计划推出一系列让用户能够与公司 AI 模型进行语音交流的体验。

当前正在显示可能无法访问的结果。

隐藏无法访问的结果