资讯

在大语言模型(LLMs)广泛应用的当下,其与人类及其他主体的交互行为备受关注。研究人员运用行为博弈论,让 LLMs 参与重复博弈。结果显示,LLMs 在自利博弈中表现出色,但在协调博弈中欠佳。该研究为理解 LLMs 社交行为提供新视角,推动相关理论发展。
对于此次更新,AI编程工具Cursor CEO Michael Truell评价道:「我们对最新的Gemini 2.5 ...
BrowseComp-ZH是一项由港科大(广州)、北大、浙大、阿里、字节跳动、NIO等机构联合发布的新基准测试集,让20多个中外主流大模型集体“挂科”: ...
OpenAI迄今已发布数种模型,每种模型都有所更新或特定的功能,上周OpenAI更新其ChatGPT Enterprise的模型介绍,好好地列出了每个模型的强项及所适合的任务。 OpenAI提供许多订阅方案,免费版的ChatGPT ...
人人都是产品经理 on MSN4 天
GPT-4.1 已经改变世界与数据交互的方式
最近发布的 GPT-4.1 不仅在性能上超越了前代,更在数据交互领域引发了变革。本文深入探讨了 GPT-4.1 的技术特点,尤其是在 SQL 查询生成方面的强大能力,以及它对数据分析师工作方式的深远影响。 当一个名为“Quasar ...
许多遗传疾病在儿科研究较多,成年阶段的研究存在空白。研究人员评估 Llama-2-70b-chat 和 GPT-3.5 在 282 种遗传疾病中的表现。结果显示,大语言模型(LLMs)在生成医学 vignettes 等方面表现良好,但管理计划生成存在局限。这为 LLMs 临床应用提供参考。