IT之家 2 月 25 日消息,Meta 在当地时间周五宣布,它将推出一种针对研究社区的基于人工智能 (AI) 的新型大型语言模型,与微软、谷歌等一众受到 ChatGPT 刺激的公司一同加入人工智能竞赛。
(资料图片仅供参考)
Meta 的 LLaMA 是“大型语言模型 Meta AI” (Large Language Model Meta AI)的缩写,它可以在非商业许可下提供给政府、社区和学术界的研究人员和实体工作者。
该公司将提供底层代码供用户使用,因此用户可以自行调整模型,并将其用于与研究相关的用例。Meta 表示,该模型对算力的要求“低得多”。
据介绍,该公司正在开发多种参数(7B、13B、33B 和 65B)的 LLaMA。其中,LLaMA 65B 和 LLaMA 33B 在 1.4 万亿个 tokens 上训练,而最小的模型 LLaMA 7B 也经过了 1 万亿个 tokens 的训练。
与其他大型语言模型一样,LLaMA 的工作原理是将一系列单词作为“输入”并预测下一个单词以递归生成文本。为了这套模型,Meta 从使用人数最多的 20 种语言中选择文本进行训练,重点是拉丁语和西里尔字母。
当然,与其他模型一样,LLaMA 也面临着偏见、有毒评论和幻觉的挑战,Meta 还需要做更多的研究来解决这类语言模型中的不足。
Meta 表示,LLaMA 作为一个基础模型被设计成多功能的,可以应用于许多不同的用例,而不是为特定任务设计的微调模型。通过开源 LLaMA 的代码,其他研究人员可以更轻松地找到限制或消除这些问题的新方法。Meta 还在本文中提供了一组评估模型偏差和毒性的基准评估标准,以显示模型的局限性并支持研究人员在这一关键领域的进一步研究。
值得一提的是,Meta 在去年 5 月也曾推出过大型语言模型 OPT-175B。该项目同样也是针对研究人员的,这构成了其聊天机器人 blenterbot 新迭代的基础。
后来,该公司还推出了一款名为“卡拉狄加”(Galactica) 的模型,据称它可以撰写科学文章和解决数学问题,但其演示版本后来被下架,因为它反复生成“听起来很权威”的内容。
IT之家附官方链接:
上一篇:乐亭县新寨镇褚庄子村志愿服务队
偷拍的图片和视频都去哪儿了?供人免费浏览引流或网上打包售卖●偷拍获
1、查卷在业内还算准确,最重要的是严格。2、去查的时候,所有引用的内
,你们好,今天0471房产来聊聊一篇暖,暖简述的文章,网友们对这件事情
1—8月平均,工业生产者出厂价格比上年同期下降3 2%,工业生产者购进价
亚洲最大的电子游戏展览会东京电玩展(TGS)将于9月21日至24日举行,为
国乒女队太强了!4朵金花晋级半决赛,孙颖莎“复仇”平野美宇
一、地板用什么擦又干净又亮可以用肥皂削成碎屑,与清水搅拌均匀,制做
每经AI快讯,有投资者在投资者互动平台提问:请问公司2023年半年报销售
(以下内容从东海证券《医药生物行业上市公司2023年中报综述:分化中成
5天3板华力创通9月8日发布异动公告,公司股票于2023年9月6日、2023年9
关于鸡蛋的各个部分对人体有什么好处的内容,包含鸡蛋对人体有什么好处
9月8日,乘用车市场信息联席会发布数据显示,今年8月乘用车市场零售量
自优化营商环境工作开展以来,鹤壁市市场监管局开发区分局积极引导企业
本文转自【中国海警】;9月8日,菲律宾2艘运补船和2艘海警船未经中国政
惊不惊喜,王炸来的就是这么快。没错,今天最新消息就是华为matex5也上
森之国度宝箱怪是什么森之国度宝箱怪信息介绍,
周四(9月7日),美国主要股指收盘涨跌不一,道指涨0 17%,标普500指数
3级地质灾害气象风险预警为黄色预警,表示气象因素致地质灾害的风险较
今日(9月7日),解谜游戏《VladCircus:DescendintoMadness》在Steam平
新京报贝壳财经讯(记者王琳琳)8月31日,新京报贝壳财经记者从中国一
9月1日,生意社甲酸基准价为3825 00元 吨,与上月初(3875 00元 吨)相比
华泰证券研报指出,2023年起,个税加大抵扣力度,3岁以下婴幼儿照护、
来为大家解答以上问题,长沙苹果手机维修哪里最好,长沙苹果手机维修很
1、真三国无双5ps3版秘籍如下:2、左摇杆角色移动;右摇杆视角调整;方
74岁的田美珍家住南京市秦淮区,不久前不慎骨折,子女们白天又无暇照顾
X 关闭
X 关闭