语言模型

消息称 Meta 将发布商用版 LLaMA 大模型

据英国《金融时报》，Meta准备发布其人工智能模型的商用版本，允许初创公司和企业在该技术的基础上构建定制软件。

Tags：Meta，语言模型，LLaMA

2023年07月13日
ICML 征稿禁止使用大型语言模型，LeCun 转发：中小型模型可以用吗

AI 顶会 ICML 征稿日在即，关于道德准则的新政策却引来网友不满！规则要求作者不能使用大型语言模型，网友评论区刷屏询问：为什么？昨天，国际机器学习会议（ICML）发布了 2023 论文征稿公告。

Tags：语言模型，ICML

2023年01月04日
算力就这么点，为了提升语言模型性能，谷歌想了个新点子

近年来，语言模型（LM）在自然语言处理（NLP）研究中变得更加突出，在实践中也越来越有影响力。一般来说，扩大模型的规模已被证明可以提升在一系列 NLP 任务中的性能。不过，扩大模型规模的挑战也是显而易见的：训练新的、更大的模型需要大量的计算资源。此外，新的模型往往是从头开始训练的，无法利用以前的模型的训练权重。对于这个问题，谷歌的研究人员探讨了两种互补的方法，在不额外消耗大量计算资源的情况下，大幅提高现有语言模型的性能。首先，在「Transcending Scaling Laws with 0.1% Extra Compute」一文中，研究人员介绍了 UL2R，这是一个轻量级的第二阶段预训练模型，使用一个混合 enoisers 目标。UL2R 提高了一系列任务的性能，甚至在以前具有接近随机性能的任务上释放出突发性能。

Tags：谷歌，语言模型

2022年12月13日
Meta 发布支持 128 种语言的新语音模型：指向元宇宙跨语种交流，可在线试玩

Facebook AI，更准确地说是 Meta AI，刚刚发布了自监督语音处理模型 XLS-R，共支持 128 种语言

Tags：Facebook，Meta，元宇宙，语言模型

2021年11月22日
魔改 GPT 自动写网文：一秒十字不带停，还能给太监作品无限续更

如果一个人只看网文，那会写出来怎样的文字？看了 100G 网文后，这个 AI 模型帮你试了一下。

Tags：文字，语言模型，开发者

2021年11月06日
放话挑战 GPT-3：以色列推出参数多 30 亿、词条多 5 倍的新语言模型

以色列公司 AI21 Labs 推出的 Jurassic-1 (侏罗纪-1) 模型有 1780 亿个参数， 25 万个 token

Tags：人工智能，语言模型，AI，自然语言

2021年08月15日
阿里达摩院发布中文领域最大规模语言模型，AI 可仿写任意小说

阿里巴巴达摩院发布超大规模语言模型 PLUG，该模型参数规模达 270 亿，是目前全球规模最大的中文纯文本预训练语言模型

Tags：阿里巴巴，达摩院，AI，PLUG，语言模型

2021年04月19日
日产 45 亿词，“地表最强语言模型”GPT-3 已落地 300 多个应用

OpenAI 最近宣布，其人工智能文本生成器 GPT-3 现已被数万开发者用于 300 多个不同的应用程序，每天输出 45 亿词之多

Tags：语言模型，人工智能

2021年04月03日