盘点2023,大模型产业狂奔的365天4万亿摄氏度(345MeV),是美国纽约布鲁克黑文国家实验室在2010年利用相对论性重离子对撞机进行金离子对撞实验时创造的,人类迄...

贴文 2个月前
830 0

盘点2023,大模型产业狂奔的365天

4万亿摄氏度(345MeV),是美国纽约布鲁克黑文国家实验室在2010年利用相对论性重离子对撞机进行金离子对撞实验时创造的,人类迄今为止所能制造的最高温度,是太阳核心温度的26万倍。

如果说2023年有一项技术能够达到如此空前的“热度”,毫无疑问,那就是生成式大语言模型。

但是不同于那不足十亿分之一秒的、转瞬即逝的4万亿度高温,大模型对各行各业的深远影响,在2023年既如“春雷万钧”,又似“润物无声”。所以,如果要用两个关键词形容2023年的大模型产业,除了“热”,还有“卷”。

2022年11月,ChatGPT横空出世,在仅仅两个月过后,ChatGPT月活跃用户就成功破亿,并成为史上月活用户最快破亿的消费级应用。初出茅庐的ChatGPT像个全能战士,能聊天、会写代码、写论文…。在人们感慨这款对话应用功能强大的同时,其背后的大模型——GPT,第一次真正意义上被推进了所有公众的视野。

现代AI技术主要是通过构建深度神经网络来模拟人脑的学习过程,通过学习大量数据“沉淀”出AI模型,用来完成诸如图像分类、目标检测、机器翻译、语言理解等特定任务。但这一次的大模型不一样了,超大规模的数据量、算力和神经网络规模使得模型产生了“智能涌现”。

目前,“智能涌现”最通俗的解释,可能来自于百度创始人李彦宏,他认为,过去的人工智能是,想让机器学会什么技能,就教它什么技能。教过的,有可能会;没教过的,就不会。大模型出现“智能涌现”之后,以前没教过的技能,它也有可能会了。

2023年,大模型领域的研究与创新在国内外“两翼齐飞”。全球科技大厂与众多创业公司、学术机构纷纷投身这场技术浪潮。粗略统计,目前全球已经发布了数百个大模型,可谓是在一年时间里,把一项通用技术“卷”上了天。

但是要在千行百业里种下大模型的“花”,除了模型本身,还需要针对大模型升级云计算基础设施、配套相应的平台与工程化能力、配套面向上层应用的全新范式开发工具

卷模型:全球已发布几百个基础大模型,2024进入大规模淘汰赛
作为大模型技术研究的全球领导者,OpenAI背靠微软这位“金主爸爸”,在2023年3月、9月和11月,相继推出GPT-4、GPT-4V、GPT-4 Turbo,在基础大模型表现方面被公认为遥遥领先,被全球同行玩家视作追赶对象和比较基准。

但是在11月,OpenAI上演了一出联合创始人、CEO——Sam Altman,被董事会闪电解雇,到加入微软、最终回归的“宫斗”闹剧后,不少人也对OpenAI未来前景产生了一定担忧。

作为OpenAI最强有力的竞争对手,Anthropic由前OpenAI高管创立。

23年3月和7月,Anthropic陆续发布了旗下大模型产品Claude和Claude 2,并且推出了直接与ChatGPT竞争的对话机器人应用,强调打造“安全且负责任的AI”。值得一提的是,Claude 2刚推出时支持100k上下文窗口,11月升级2.1版本,支持200k“超大杯”上下文窗口,分别对GPT-4和GPT-4 Turbo实现了碾压。Anthropic优异的表现也在23年下半年吸引了来自亚马逊的40亿美元、谷歌的20亿美元新投资。

如果说OpenAI赋予了GPT灵魂,那么这具“躯壳”在早年间可以说是Google给的 网页链接

暂无评论

暂无评论...