租用 H100 的钱只需 233 美元。
Auto Byte
专注未来出行及智能汽车科技
微信扫一扫获取更多资讯
Science AI
关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展
微信扫一扫获取更多资讯
Week 46 · AI 竞赛进入推理阶段:扩展测试时间计算是万能的吗?Scaling What 成为关键
11.16本周,外媒曝 OpenAI 调整技术策略引热议;MIT 和哈佛分别发文探讨 Scaling Law 局限与改进机会。
Week 45 · 「压缩即智能」,成就 LLM 的 Transformer 未必是终极解?
11.08本周,零一万物宣布战略转向 toB 市场;知乎、昆仑万维、夸克均推出AI搜索功能。
Week 44 · 从文本到屏幕:「Project Jarvis」们能实现 AGI 吗?
11.01本周,OpenAI 推出 ChatGPT Search;MIT 新作发现 LLM 可能具有类似人脑的分层结构。
Week 43 · 微调失格?持续反向传播算法将解锁新的训练范式吗?
10.25本周,Yoshua Bengio 团队提出强化学习新策略;Anthropic 升级版 Claude 3.5 Sonnet 解锁「计算机使用」能力。
Week 42 · OpenAI 的 MLE-bench 被当成「奇点触发器」了?
10.18本周,OpenAI 开源多智能体框架「Swarm」被指控剽窃;李飞飞提出面向机器人策略训练的「数字表亲」概念。
Week 41 · 解锁具身 Scaling Law 需要先搞定异构数据吗?
10.11本周,特斯拉发布 Cybercab 及人形机器人等一系列进展;OpenAI 完成 66 亿美元融资,Sora负责人与 o1 作者离职;上交大发布 o1 复现项目进展报告。
分层 or 端到端,哪位具身智能练习生能打到下一轮?
11.16具身智能在 2022 年被李飞飞比喻成视觉领域的一颗「北极星」,而后被认为是通往 AGI 的有效路径。以大语言模型的突破为契机,通过赋予 AI 身体,使其能够和世界交互,再将大脑升级为世界模型,让机器人能够灵活应对未见过的任务,适应工业、居家生活、医疗、养老等不同场景。这样的概念佐以技术进展让具身智能的市场规模不断膨胀,并涌现了大量的创业团队。这些具身智能「练习生」或是在机器人领域长期深耕,具有丰富的技术储备,或者在浪潮中入局,以深厚的学术背景和创新的技术成果吸引大量资本。
AI 进入推理竞赛:扩展测试时间计算是万能的吗?「Scaling What」成为关键
11.15近日,外媒 The Information 的一篇报道引发了关于「模型 Scaling Laws 范式是否已经达到极限」的争议。OpenAI o1 模型的推出将 Scaling Laws 范式从预训练带向了推理层,模型推理层的开发和规模增长成为 AI 大模型玩家们新一轮「竞赛」的重点。涉及复杂计算和决策,缓慢逻辑思考的「System 2」思维成为主导。
「压缩即智能」,成就LLM的Transformer 未必是终极解?
11.09Ilya Sutskever 2023 年向黄仁勋描述的「AI 预测下一个单词可以实现真正的理解」的理念在一系列 LLM 进展中被验证,其带来的「压缩即智能」的观点进而得到了大量关注和认可。GPT 的训练过程被描述为对知识的无损压缩,但当前最流行的 Transfomer 架构却未必是这一路径下的最优选择。
控制器 HOVER、模型π0...实现通用机器人控制的最终形态会是什么?
11.08近日,英伟达提出人形机器人通用全身控制器「HOVER」,将多种控制模式整合到一个统一的策略中;强化学习领域大牛 Sergey Levine 的创企 Physical Intelligence 近期也推出了用于通用机器人控制的模型「π0」。
WEKA 深度报告:从 1500+从业者看法剖析 2024 AI 趋势
11.08WEKA 数据平台公司于 2024 年 8 月发布了《2024 全球人工智能趋势报告》,该报告通过对全球 AI/ML 决策者 / 影响者的「实地」经验和意见来评估 AI 领域的发展与挑战。
从文本到屏幕:「Project Jarvis」们能实现 AGI 吗?
11.01近期,微软、谷歌、Anthropic 等公司扎堆推出 AI Agent 及相关功能,使用 AI Agent 自主操控计算机、手机等智能设备成为趋势。
租用 H100 的钱只需 233 美元。
近日,DeepMind 团队将水印技术和投机采样(speculative sampling)结合,在为大语言模型加入水印的同时,提升其推理效率,降低推理成本,因此适合用于大规模生产环境。
7 月 5 日首更,4 个月时间仅发了 82 篇帖子,粉丝量就从 0 飙升到近 14 万!
大模型的执行力从哪里来?
最新的Qwen2.5-Turbo已在阿里云百炼上线,该模型支持100万超长上下文,相当于100万个英文单词或150万个汉字,在多个长文本评测集上的性能表现超越GPT-4
微软团队最新发布的基础模型BiomedParse,开创性地通过文本驱动图像解析将九种成像模式整合于一个统一的模型中,通过联合预训练处理对象识别、检测与分割任务,实现了生物医学图像解析的新突破。
中国科学技术大学认知智能全国重点实验室刘淇教授指导的博士生张载熙,与哈佛大学医学院 Marinka Zitnik 教授课题组合作,开发了深度生成算法 PocketGen。
算起来,距离 5 月 14 日 OpenAI 发布 GPT-4o 高级语音模式已经过去了半年时间。
曾经是超导领域耀眼的明星,但近两年却深陷学术不端丑闻。
意识是一种模拟状态,它只能存在于梦中,而不是在物理世界中。
如何解决模型生成幻觉一直是人工智能(AI)领域的一个悬而未解的问题。
腾讯Angel机器学习平台凭借其卓越的技术积累、创新的关键技术和广泛的应用场景,荣获本年度领先科技奖。
最热文章