当前标签：

GPT4

GPT-4 整治学术不端：人大 / 浙大团队实测 7000 篇论文，撤稿预测与人类 95% 一致

人大与浙大学者发现，GPT-4 对于论文给出的撤稿预测结果，竟然和人类审稿人有将近 95% 的相似性。看来大模型虽然有可能引发学术不端，但也有办法维护科研诚信啊。

Tags：GPT4

04月15日
融合视觉能力，OpenAI 向开发人员提供 GPT-4 Turbo with Vision

OpenAI 宣布，具有视觉能力的最新 GPT-4 Turbo 模型 GPT-4 Turbo with Vision 现已通过 OpenAI API 向开发人员普遍提供。

Tags：GPT4，OpenAI，ChatGPT

04月10日
OpenAI 创始大神手搓千行 C 代码训练 GPT，附 PyTorch 迁移教程

大神卡帕西（Andrej Karpathy）刚“复工”，立马带来神作：纯 C 语言训练 GPT，1000 行代码搞定！，不用现成的深度学习框架，纯手搓。发布仅几个小时，已经揽星 2.3k。

Tags：GPT4，LLM.C

04月09日
GPT-4 推理能力为 0？开发者悬赏 1 万美金被打脸，神秘提示正确率直冲 100%

小孩子都会的脑筋急转弯推理题，GPT-4 和 Claude 3 做不出？国外一位开发者小哥坚称这一观点，认为 GPT 模型在训练集外毫无推理能力，无法实现 AGI，甚至悬赏 1 万美元，发起比赛。然而，他当天就被光速打脸了！网友用高能的 prompt，让 GPT-4 和 Claude 3 几乎达到百分百的正确率。

Tags：OpenAI，GPT4，ChatGPT

04月08日
报告称 OpenAI 采集了超一百万小时的 YouTube 视频来训练 GPT-4

《纽约时报》报道提到，OpenAI 在 2021 年耗尽了有用的数据供应，并在耗尽其他资源后讨论了转录 YouTube 视频、播客和有声读物的可行性。

Tags：OpenAI，GPT4，YouTube

04月07日
苹果研究人员称其设备端模型 ReALM 性能优于 GPT-4，可大幅提升 Siri 智能程度

虽然目前 Siri 可以尝试描述信息中的图像，但效果并不稳定。不过，苹果公司并没有放弃人工智能领域的探索。在最近的一篇研究论文中，苹果的人工智能团队描述了一种可以显著提升 Siri 智能的模型，而且他们认为这个名为 ReALM 的模型在测试中优于 OpenAI 的知名语言模型 GPT-4.0。

Tags：人工智能，苹果，GPT4

04月02日
和 GPT-4 并列第一，LMSYS 基准测试显示 Claude-3 模型表现优异

根据 LMSYS Org 公布的最新基准测试报告，Claude-3 已经超越 GPT-4，成为该平台“最佳”大语言模型。

Tags：AI，Claude3，GPT4

03月28日
OpenAI 的 GPT 商店审核失控：被指充斥侵权和垃圾内容

旨在提供从编程辅助到健身建议等各种功能的 GPT 模型的 OpenAI GPT 商店正面临质量和合规性问题。据 TechCrunch 调查，该商店存在大量涉嫌侵犯版权的 GPT 模型，例如未经授权生成迪士尼和漫威角色内容的“钢铁侠”GPT 或 “米奇老鼠”GPT。

Tags：GPT4，OpenAI，ChatGPT

03月21日
OpenAI CEO 阿尔特曼：GPT-4“有点糟糕”，今年将推出新模型

OpenAI 首席执行官萨姆・阿尔特曼 (Sam Altman) 在周一发布的与列克斯・弗里德曼 (Lex Fridman) 的访谈中表示，他们公司的人工智能模型 GPT-4 其实“有点糟糕”，阿尔特曼更期待即将到来的 GPT-5 能够真正配得上大家的期待。

Tags：GPT4，OpenAI，ChatGPT

03月19日
OpenAI 官方博客提前泄露 GPT-4.5 Turbo，有望今年夏天发布

OpenAI 近期可能意外泄露了旗下即将发布的 GPT-4.5 Turbo 大型语言模型信息。网友发现，OpenAI 博客上疑似上线了一篇有关 GPT-4.5 Turbo 的文章，但该页面目前已被撤回，搜索引擎也无法再检索到相关信息。

Tags：GPT4.5，GPT4，OpenAI

03月13日
万物皆可《毁灭战士》，专家利用 GPT-4V 模型运行该游戏

英国约克大学研究员 Adrian de Wynter 近日发表研究论文《Will GPT-4 Run DOOM?》，探讨了如何让 GPT-4 模型来玩《毁灭战士》游戏。

Tags：毁灭战士，GPT4

03月13日
Claude 3 成功破解未公开算法？智商测试 101 分碾压 GPT-4

网友测试 Claude 之后惊呼：实测比跑分厉害多了！智商测试中碾压 GPT-4，得分高达 101。而且能发现量子物理学家还未发表的量子算法。

Tags：人工智能，GPT4，Claude 3

03月06日
新王 Claude 3 实测！各项能力给跪，打麻将也会，确实比 GPT-4 好用

随着 Claude 3（支持中文）一夜登陆，榜单性能跑分全面超越 GPT-4，成为首个全面超越 GPT-4 的产品，也坐上了全球最强大模型新王座。

Tags：Claude 3，GPT4，Claude

03月05日
打脸奥特曼，GPT-4 今年比去年还懒！网友在线实测出炉

GPT-4 变懒的问题，又有新进展。就在今天凌晨，奥特曼发推称，GPT-4 这个毛病在新的一年应该好多了！

Tags：GPT4，OpenAI，ChatGPT

02月05日
谷歌 Gemini 大逆转？斯坦福 Meta 华人证明其推理性能强于 GPT-3.5

谷歌放出的 Gemini，在对标 GPT 的道路上似乎一直处于劣势，Gemini 真的比 GPT-4 弱吗？最近，斯坦福和 Meta 的学者发文为 Gemini 正名。

Tags：Gemini，GPT4，人工智能

01月02日
GPT-4 抽象推理 PK 人类差距巨大！多模态远不如纯文本，AGI 火花难以独立燃烧

圣达菲研究所的科研人员用非常严谨的定量研究方法，测试出了 GPT-4 在推理和抽象方面与人类水平还有较大差距。要想从 GPT-4 的水平发展出 AGI，还任重道远！

Tags：GPT4，人工智能，大模型

01月01日
GPT-4 API 曝出重大漏洞：15 个样本微调，一句 prompt 秒生恶意代码供出私人信息

来自美国加州实验室 FAR AI 的团队从这三大方向，对 GPT-4 API 开启「红队」攻击测试。没想到，GPT-4 竟能成功越狱。

Tags：Assistants，GPT4

2023年12月27日
GPT-4 搞科研登 Nature！布洛芬配方轻松拿捏，诺奖得主提出的复杂反应也能完成

Coscientist 由卡内基梅隆大学的研究团队开发，是一个基于 GPT-4 等大模型的 AI 系统，可快速准确地自主完成检索信息、规划及设计实验、编写程序、远程操控自动化系统做实验、分析数据的一整套流程。

Tags：GPT4，Nature，科研

2023年12月21日
谷歌 Gemini Pro 实测不如 GPT-3.5，CMU 深入对比研究：保证公平透明可重复

谷歌 Gemini 实力到底如何？卡耐基梅隆大学来了场专业客观第三方比较。为保证公平，所有模型使用相同的提示和生成参数，并且提供可重复的代码和完全透明的结果。

Tags：谷歌，OpenAI，GPT4，cmu，Gemini Ultra，Gemini Pro

2023年12月20日
GPT-4 化身邪恶化学家！中国科大、微软研究院发布首个“科学风险”基准和 SciGuard 大模型

来自中科大等机构的联合团队提出了一种全新的方法 ——SciGuard，可以保护 AI for Science 模型，防止生物、化学、药物等领域模型不会被不当使用。

Tags：科普，科学，GPT4，风险模型，OPenAi

2023年12月18日

加载更多...

软媒产品
常用资源