AI天才杨植麟交卷大模型产品,特点:长长长长长千亿参数大模型,支持输入的长文本首次达20万x字!在任何规模的大模型产品化队伍中,这个长度堪称目前的全球最长...

贴文 2个月前
1.3K 0

AI天才杨植麟交卷大模型产品,特点:长长长长长

千亿参数大模型,支持输入的长文本首次达20万x字!

在任何规模的大模型产品化队伍中,这个长度堪称目前的全球最长。

用数据说话:目前Claude支持最大长文本为100k(约8万字),而GPT-4则是32k(约2.5万字)。20万字,分别是它们的2.5倍和8倍。

这便是清华叉院助理教授杨植麟,创业大模型后拿出的第一份成绩单。

就在10月9日下午,杨植麟创业AI公司月之暗面(Moonshot AI)推出了首款大模型产品智能助手Kimi Chat。

核心被强调的亮点是:其背后虽是体量为千亿参数的“庞然大物”,但却可以hold住输入20万汉字,不管是《三体》还是《马斯克传》都能随便读。

据介绍,拓展上下文窗口长度,只是月之暗面“登月计划”的第一步;这一步的落实,实则是为下一步落子多模态提供基础——该公司预计在明年对外开放多模态版本产品。

而公司的最终目标,是在大模型领域做To C超级应用。

杨植麟身上的光环很多。

除了是清华叉院助理教授外,还有FAIR、Google Brain的工作履历,是Transformer-XL和XLNet工作一作,发明的算法曾在30多项AI标准任务取得SOTA,师从苹果公司AI负责人Ruslan Salakhutdinov、清华唐杰……

种种光环加持下,3月被曝创业后,月之暗面就自带一层神秘面纱。而后,红杉孵化式支持,循序完成两轮共计近20亿元融资,更是让公司获得了格外多的注目。

如今,这家公司首次公开亮相,回应了更多外界的议论。

“参数和上下文窗口长度共同决定模型效果”
现场演示时,量子位关注到,由于支持20万字长文本,月之暗面智能助手Kimi Chat有几点新花样网页链接

暂无评论

暂无评论...