Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

一口气读完甄嬛传剧本、大部头医书:月之暗面200万字上下文Kimi开启内测

半年时间,月之暗面把 AI 模型支持的上下文长度提升了一个数量级,实现了 200 万字上下文的「无损压缩」。

一个能读 200 万字的 AI 助手是什么概念?这意味着,它可以一口气读完整个《甄嬛传》剧本,然后和你讨论剧情。或者一口气读完一本厚厚的中医诊疗手册,给你提出诊疗建议。对于人类来说,成为某个领域的专家可能需要 10000 个小时的学习,但对于这个 AI 来说,只需要 10 分钟就够了。

将甄嬛传全集几十万字的剧本传给 AI 助手,然后提问剧本中有哪些细节表明甄嬛的孩子是果郡王的。它能在不同时间段、各个场景的故事情节中,深入挖掘甄嬛、果郡王的情感线以及他们孩子的真相,堪比一个看了好几十遍电视剧的「甄」学家。图片

                               上传一份完整的近百万字中医诊疗手册,这个 AI 助手可以针对用户问题给出诊疗建议。

这是国内大模型创业公司月之暗面(Moonshot AI)刚刚官宣的新突破。他们打造的 Kimi 智能助手目前已经支持 200 万字超长无损上下文,并于即日起开启产品「内测」。

图片

Kimi 智能助手于去年 10 月份正式亮相,那时就已经能够支持 20 万字的上下文窗口,是当时全球市场上能够产品化使用的大模型服务中所能支持的最长上下文输入长度(参见《大模型开启「长」时代,杨植麟的新公司把对话框容量做到了世界第一》)。但令人没想到的是,仅仅过了半年,月之暗面就将这一数字提升了 10 倍。

为什么要死磕超长无损上下文这件事?创始人杨植麟曾经解释说,「通往通用人工智能(AGI)的路上,无损的长上下文将会是一个很关键的基础技术。从 word2vec 到 RNN、LSTM,再到 Transformer,历史上所有的模型架构演进,本质上都是在提升有效的、无损的上下文长度…… 上下文长度可能存在摩尔定律,但需要同时优化长度和无损压缩水平两个指标,才是有意义的规模化。

在实际使用场景中,超长无损上下文带来的好处也是显而易见的。在支持 20 万字的时候,你就已经能够用它进行专业学术论文的翻译和理解、辅助分析法律问题、一次性整理几十张发票、快速理解 API 开发文档…… 如今,这个数字提升了一个数量级,你能拿它做的事情就更多了。

在媒体沟通会现场,月之暗面展示了一些超长无损上下文的使用场景示例。例如,你可以上传几十万字的经典德州扑克长篇教程后,让 Kimi 扮演德扑专家为自己提供出牌策略的指导。

图片

上传英伟达过去几年的完整财报,让 Kimi 成为英伟达财务研究专家,帮你分析、总结英伟达历史上的重要发展节点。

图片

上传一个代码仓库里的源代码,可以询问 Kimi 关于代码库的所有细节,即便是毫无注释的陈年老代码也能帮助你快速梳理出代码的结构。

图片

也就是说,如果你有一份想要快读学习的资料,你可以把它上传给 Kimi,让它帮助你练习专业技能,或者启发新的想法。如此一来,快速学习任何一个新领域都会变得更加轻松。

不过,有时,这些文本是分布在不同的文档中的,这就需要 AI 助手具备跨文档处理的能力。据悉,Kimi 现在能够一口气精读 500 个,甚至更多数量的文档,帮助你快速分析所有文档的内容,并且支持通过自然语言进行信息查询和筛选,大大提高了信息处理效率。例如,公司 HR 可以基于业务需求,让 Kimi 快速从最近的 500 份简历中找出有某个行业从业经历,同时从计算机类专业毕业的求职者,更加高效地筛选和识别合适的候选人。

图片

在技术上,由于没有采用常规的渐进式提升路线,月之暗面团队遇到的技术难度也是指数级增加的。为了达到更好的长窗口无损压缩性能,月之暗面的研发和技术团队从模型预训练到对齐、推理环节均进行了原生的重新设计和开发,不走「滑动窗口」、「降采样」等技术捷径,攻克了很多底层技术难点,才取得了新的突破。

基于这些突破,Kimi 在智能搜索场景也展现出了优于传统搜索引擎的能力。比如,你可以让 Kimi 主动去搜索和对比两家同领域上市公司的最新财报数据,它会根据你的问题,分析和总结最相关的多个页面,生成更直接、更准确的答案。这离不开其背后大模型的无损长上下文能力。具体来说,对于主动搜索得到的多篇资料,Kimi 会作为上下文的一部分交给模型去推理。正是因为 Kimi 大模型支持的上下文窗口足够长,窗口内的信息损失足够低,Kimi 智能助手才能输出高质量的结果,为用户带来截然不同的搜索体验。而传统的搜索引擎通常只能根据用户的问题,返回一些参杂着广告信息网页链接。

另一项与大模型的无损上下文能力息息相关的指标是指令遵循(Instruction Following)能力。指令遵循能力主要体现在两个方面:第一,模型在多轮对话中是否能够始终遵循用户的指令,理解用户的需求;第二,模型是否能够遵循复杂指令,有时候复杂指令可能长达几千、上万字。从产品推出以来的用户反馈来看,Kimi 智能助手的多轮交互和超长指令遵循能力,也同样具备显著优势。

「我们相信,大模型无损上下文长度的数量级提升,也会进一步帮助大家打开对 AI 应用场景的想象力,包括完整代码库的分析理解、可以自主帮我们完成多步骤复杂任务的智能体 Agent、不会遗忘关键信息的终身助理、真正统一架构的多模态模型等等。」月之暗面工程副总裁许欣然在媒体沟通会上表示,「无论是内存、算力还是网络带宽,历史上每一次基础技术的升级,都会解锁新的产品形态和应用场景。我们对 200 万无损上下文的 Kimi 可以带来哪些超出想象力的创新机遇充满期待。」

据 AI 产品榜(aicpb.com)的统计数据,Kimi 智能助手 2 月份的访问量已经突破 300 万。月之暗面也刚刚收获 10 亿美元的融资,成为估值 25 亿美元的 AI 独角兽。

如果你也有对超长无损上下文能力的需求,可到 Kimi 智能助手网页版 kimi.ai 首页申请抢先体验。

产业Kimi 智能助手月之暗面
相关数据
降采样技术

降采样是数位信号处理领域中的一种多速频数字信号处理(multi-rate digital signal processing)系统中采样率转换(sample rate conversion)技术的一种,或指代用来降低信号采样率的过程,与插值相反——插值用来增加取样频率——降采样通常用于降低数据传输速率或者数据大小。因为降采样会有混叠的情形发生,系统中具有降采样功能的部分称为降频器(decimator)。

查询技术

一般来说,查询是询问的一种形式。它在不同的学科里涵义有所不同。在信息检索领域,查询指的是数据库和信息系统对信息检索的精确要求

word2vec技术

Word2vec,为一群用来产生词向量的相关模型。这些模型为浅而双层的神经网络,用来训练以重新建构语言学之词文本。网络以词表现,并且需猜测相邻位置的输入词,在word2vec中词袋模型假设下,词的顺序是不重要的。 训练完成之后,word2vec模型可用来映射每个词到一个向量,可用来表示词对词之间的关系。该向量为神经网络之隐藏层。 Word2vec依赖skip-grams或连续词袋(CBOW)来建立神经词嵌入。Word2vec为托马斯·米科洛夫(Tomas Mikolov)在Google带领的研究团队创造。该算法渐渐被其他人所分析和解释。

摩尔定律技术

摩尔定律是由英特尔创始人之一戈登·摩尔提出来的。其内容为:积体电路上可容纳的电晶体数目,约每隔两年便会增加一倍;经常被引用的“18个月”,是由英特尔首席执行官大卫·豪斯所说:预计18个月会将芯片的性能提高一倍。

通用人工智能技术

通用人工智能(AGI)是具有一般人类智慧,可以执行人类能够执行的任何智力任务的机器智能。通用人工智能是一些人工智能研究的主要目标,也是科幻小说和未来研究中的共同话题。一些研究人员将通用人工智能称为强AI(strong AI)或者完全AI(full AI),或称机器具有执行通用智能行为(general intelligent action)的能力。与弱AI(weak AI)相比,强AI可以尝试执行全方位的人类认知能力。

推荐文章
暂无评论
暂无评论~