还记得「威尔・史密斯吃意大利面」的 AI 鬼畜视频吗?在这些视频里,威尔・史密斯的面部表情、动作都非常夸张,还充满了扭曲、变形。
Auto Byte
专注未来出行及智能汽车科技
微信扫一扫获取更多资讯
Science AI
关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展
微信扫一扫获取更多资讯
Week 41 · 解锁具身 Scaling Law 需要先搞定异构数据吗?
10.11本周,特斯拉发布 Cybercab 及人形机器人等一系列进展;OpenAI 完成 66 亿美元融资,Sora负责人与 o1 作者离职;上交大发布 o1 复现项目进展报告。
Week 39 · LLM 之后,AI 的下个关键词会是 LWM 吗?
09.28本周,OpenAI 高层再次发生剧变;Meta 推出 Llama 3.2;传高通计划收购英特尔
Week 38 · TLDR,o1 技术细节推测汇总了解一下?
09.20本周,苹果提出 sigmoid 注意力机制;李飞飞正式宣布创立「World Labs」;1X 发布其世界模型 demo。
Week 37 · Scaling 范式变了?Self-Play 还值得 All In 吗?
09.13本周,OpenAI 发布新模型 o1 引起热议;DeepSeek 提出万卡计算集群架构 Fire-Flyer 2 。
Week 36 · 用 Test Time 换 Training Time 能让 LLM 更强吗?
09.06本周,李飞飞团队发布空间之能新成果 ReKep;Ilya Sutskever 创企 SSI 完成 10 亿美元融资。
Week 35 · Cross-Embodiment/数据集/VLA,具身智能今年的研究重点在哪?
08.30本周,Meta 提出结合Transformer 与扩散模型的多模态训练方法 Transfusion;外媒称 OpenAI 正在进行 10 亿美元的新一轮融资。
解锁具身 Scaling Law 需要先搞定异构数据吗?
10.12清华叉院助理教授、博导赵行曾在访谈中指出,在尝试使用 AI 技术开发机器人时,我们面临的最大挑战是缺乏一个在泛化性和通用性上表现出色的高性能模型[17] 。业内许多工作尝试改进/调整模型架构、学习策略和数据类型等方式探求这种 Foundation Model。近期的部分工作显示出机器人数据的异构特质似乎是一个重要问题。
OpenAI 已破解多数据中心分布式训练?美科技巨头比拼 AI 基础设施能力
10.11近日,SemiAnalysis 的创始人 Dylan Patel 在一档播客中透露,微软和 OpenAI 已经实现了多数据中心训练。
Alexandr Wang:数据是新一代 AI 的发展核心
10.11近日,Scale AI 创始人兼首席执行官 Alexandr Wang 与 a16z 普通合伙人 David George 对话,Wang 就 AI 数据、语言模型开发阶段等话题分享了其看法,包括 AI 三大支柱、语言模型训练的数据问题以及 AI 技术对于企业的影响等。
LLM 之后,AI 的下个关键词会是 LWM 吗?
09.28李飞飞最近正式启动创业公司 World Labs,明确了要开发“大世界模型(LWM)”,实现空间之能的愿景,让业界又一次将视野投入世界模型。
人形是做通用机器人最合适的形态吗?
09.28也许通用机器人的形态并不重要,未来也可能是其他形态机器人。找到大脑、小脑的 Scaling Laws 才是通用机器人面临的真正难点。
Sundar Pichai 演讲:AI Platfrom 在经历最深刻的变革,但不会取代程序员
09.28近日,谷歌的 CEO Sundar Pichai 在卡内基梅隆大学发表演讲,围绕 AI 对程序员及编程行业的影响、清洁能源在数据中心及 AI 能源需求中的应用、AI 与人类创造力的关系等方面分享了其观点。
还记得「威尔・史密斯吃意大利面」的 AI 鬼畜视频吗?在这些视频里,威尔・史密斯的面部表情、动作都非常夸张,还充满了扭曲、变形。
英伟达不仅要做显卡领域的领先者,还要在大模型领域逐渐建立起自己的优势。
如何全模态大模型与人类的意图相对齐,已成为一个极具前瞻性且至关重要的挑战。
在数字人领域,形象的生成需要依赖于基础的表征学习。
天呐,要被这群AI小机器人萌化了。
多项改进实现规模空前的连续时间一致性模型。
中山大学的研究团队提出了 GraphEC,这是一个基于几何图学习的 EC 数量预测器,使用 ESMFold 预测结构和预训练的蛋白质语言模型。同时,GraphEC 能够从蛋白质结构中提取功能信息。
上海交通大学的研究团队构建了一个多语言医学语料库,包含约 255 亿个 token,涵盖 6 种主要语言,称为 MMedC,可实现一般 LLM 的自回归领域自适应。
真正的史诗级「3A」大作——AI作图、AI配乐、AI配音。
火山引擎在视频云大会上发布了基于历史古建三维实景重建的「虚拟直播间」场景
火山引擎在上海举办飞连新品发布会,推出行业首个大模型IT赋能平台。
本期机器之心《智者访谈》邀请到清华大学聂再清教授,探讨他在将先进的自然语言处理技术应用于生物医药数据分析的创新实践。
最热文章