ChatGPT浅析ChatGPT是近期最火的概念了,和之前的AlphaGo不同,GPT让AI和普通大众如此接近,让大家可以亲自接触到AI带来的全新体验。不过,AI并不是魔法,ChatGP...

贴文 1个月前
990 0

ChatGPT浅析

ChatGPT是近期最火的概念了,和之前的AlphaGo不同,GPT让AI和普通大众如此接近,让大家可以亲自接触到AI带来的全新体验。

不过,AI并不是魔法,ChatGPT也不是革命性的新技术。
目前我个人来看,ChatGPT要取代人类的工作还言之过早,不过,辅助人类提高工作效率却已经绰绰有余。

ChatGPT如此热门,相信很多人都对它能力的来源充满好奇,本文是我个人查阅一些资料后对其原理的粗浅理解。
不足之处,还望不吝指正。

1. 核心概念
ChatGPT的背后肯定会涉及很多AI相关技术和概念。
其中,理解ChatGPT技术最核心的几个概念是:

1.1. GPT
GPT是Generative Pre-trained Transformer的缩写,是一种基于神经网络训练AI模型的方法。
硬翻译成中文的话叫生成式预训练转换器,很别扭,不如直接用简称GPT。

ChatGPT之所以对话起来如此自然,与GPT技术密切相关。
GPT在训练时使用了大量的数据,但不是简单的在数据上建立规则,模板之类的,而是考虑了上下文信息,通过分析输入的文本,来生成回答的内容,这也是神经网络擅长的地方。

而且,GPT还有自我纠错的能力,当生成的内容出现错误时,GPT可以自动进行调整和改进。
这使得GPT生成的内容越来越可靠和正确。

1.2. LLM
LLM是Large Language Model的缩写,中文叫大语言模型。
这个模型可以理解成一个拟合函数,这个函数的参数非常之多,据说GPT-3就已经有大约 1750亿参数。
可见语言模型有多么复杂 网页链接

暂无评论

暂无评论...