Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

上热搜、全网在求邀请码的首个通用AI智能体Manus,真能复刻DeepSeek吗?

 AI好好用报道

机器之心编辑部
基准测试更是全方位超越OpenAI的同类智能体产品Deep Research。

一觉醒来,大家被一款名为 Manus 的 AI 智能体刷屏了。

官方 X 表示:Manus 是第一个通用 AI 智能体,代表了人机协作的未来。

image.png

发布之后,这款智能体得到了大家的一致好评。

有人称赞其是「智能体的 ChatGPT 时刻」,还有人表示,这是继 DeepSeek 之后,又一个爆款研究。

Manus 甚至火上了知乎和微博热搜。

image.png

image.png

既然号称首个通用 AI 智能体,Manus 能够处理哪些现实世界的任务呢?

image.png

具体来说,Manus 不仅能思考,它还能提供结果。当你休息时,完全可以把事情交给它做,妥妥的工作好帮手。

以前需要人工完成的数据收集与分析、股票市场分析、搜索、找资料、写代码等等它都能帮你,甚至还能直接给你生成一个网页展示。

image.png

官网:https://manus.im

由于目前只能通过邀请注册,因此我们也就只能看看官方和早期用户分享的示例了。

首先,让 Manus 分析一下英伟达的营收报告:

图片

又或者,上传一个包含多份简历的 zip 压缩包,让 Manus 帮忙筛选简历,帮助公司招募一位强化学习算法工程师:

图片

官网还提供了更多示例,涉及科研、生活、数据分析、教育、生产力等多个方面,感兴趣但没有邀请码的读者可以先去观摩一下。

image.png

用户 Guanghua Li 也分享了一个使用 Manus 分析 Salesforce 智能体产品的示例:

图片

看完了运行速度超快、任务多样化的用例,我们接下来看 Manus 的基准测试结果。这里用到 GAIA,它是一个用于评估通用 AI 助手解决现实世界难题的测试基准

结果显示,Manus 在 Level 1、Level 2 和 Level 3 三个难度级别上均取得了 SOTA 表现,不同程度超越了 OpenAI 此前推出的研究型 AI 智能体 Deep Research。团队表示,Manus 是在使用与其生产版本相同的配置下进行的评估,以确保复现性。

image.png

不过遗憾的是,目前 Manus 还没有完全开放注册,新用户还需要邀请码。

image.png

也因此,相关推文下方一大堆人在求邀请码。

image.png

不过,也有人质疑这波宣传太过了,尤其是铺天盖地的饥饿营销(求邀请码)。至于实际效果,还是要看后续的更多评测和横向比较。

微信图片_20250306105955.png

微信图片_20250306110317.png

创始团队介绍

我们了解到,Manus 背后的创始人是一位年轻的(90 后)连续创业者肖弘,他本科毕业于华中科技大学软件工程专业。

2022 年,肖弘抓住了大模型发展的机遇,创建了主攻海外市场的一站式助手 Monica。该助手利用包括 OpenAI、Anthropic、谷歌、DeepSeek 等开发的前沿 AI 模型,帮助用户提升聊天、搜索、写作和编程体验。

此外,Monica 还可以作为 Chrome 和 Edge 浏览器扩展使用,同时提供有桌面端和移动端应用程序。

image.png

截至目前,Monica 在 Chrome 插件商店中的安装量已经突破了 300 万,在 Edege 插件应用商店中的安装量也有 70 多万。

image.png

image.png

同时,Manus 宣传视频中出镜的 Yichao Peak Ji(季逸超)为联合创始人兼首席科学家,也是一位 90 后程序员和创业者。根据网上搜到的资料,他是 Peak Labs 创始人、Magi 智能搜索引擎的开发者,还曾创建过一个名为 Steiner 的推理模型,用以复现 OpenAI o1。

image.png

GitHub 项目主页:https://github.com/peakji

参考链接:
https://www.aibase.com/news/15987

以后我们会带来更多的AI话题,也欢迎大家进群交流。


图片
产业智能体Manus基准测试
相关数据
数据分析技术

数据分析是一类统计方法,其主要特点是多维性和描述性。有些几何方法有助于揭示不同的数据之间存在的关系,并绘制出统计信息图,以更简洁的解释这些数据中包含的主要信息。其他一些用于收集数据,以便弄清哪些是同质的,从而更好地了解数据。 数据分析可以处理大量数据,并确定这些数据最有用的部分。

基准技术

一种简单的模型或启发法,用作比较模型效果时的参考点。基准有助于模型开发者针对特定问题量化最低预期效果。

强化学习技术

强化学习是一种试错方法,其目标是让软件智能体在特定环境中能够采取回报最大化的行为。强化学习在马尔可夫决策过程环境中主要使用的技术是动态规划(Dynamic Programming)。流行的强化学习方法包括自适应动态规划(ADP)、时间差分(TD)学习、状态-动作-回报-状态-动作(SARSA)算法、Q 学习、深度强化学习(DQN);其应用包括下棋类游戏、机器人控制和工作调度等。

知乎机构

知乎,中文互联网综合性内容平台,自 2010 年成立以来,知乎凭借认真、专业、友善的社区氛围,独特的产品机制,以及结构化、易获得的优质内容,聚集了中文互联网科技、商业、影视、时尚、文化等领域最具创造力的人群,已成为综合性、全品类,在诸多领域具有关键影响力的内容平台。知乎将AI广泛应用与社区,构建了人、内容之间的多元连接,提升了社区的运转效率和用户体验。知乎通过内容生产、分发,社区治理等领域的AI应用,也创造了独有的技术优势和社区AI创新样本。

zhihu.com
机器之心机构

机器之心,成立于2014年,是国内最具影响力、最专业、唯一用于国际品牌的人工智能信息服务与产业服务平台。目前机器之心已经建立起涵盖媒体、数据、活动、研究及咨询、线下物理空间于一体的业务体系,为各类人工智能从业者提供综合信息服务和产业服务。

https://www.jiqizhixin.com/
推荐文章
暂无评论
暂无评论~