Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

在机器人顶会 RSS 2024 上,中国的人形机器人研究斩获最佳论文奖

近日,机器人领域著名会议 RSS(Robotics: Science and Systems) 2024 在荷兰代尔夫特理工大学圆满落幕。

尽管会议规模与 NeurIPS、CVPR 等 AI 顶会无法比肩,但 RSS 在过去几年中取得了长足的发展,今年的参会人数接近 900 人。图片

在大会的最后一天,最佳论文、最佳学生论文、最佳系统论文、最佳 Demo 论文等多个奖项同时出炉。此外,大会还评选出了「早期职业 Spotlight 奖」和「时间检验奖」。

值得注意的是,来自清华大学和北京星动纪元科技有限公司的人形机器人研究获得了最佳论文奖,华人学者 Ji Zhang 获得了本次时间检验奖。

以下是获奖论文信息介绍:

最佳 Demo 论文奖

图片

  • 论文标题:Demonstrating CropFollow++: Robust Under-Canopy Navigation with Keypoints

  • 作者:Arun Narenthiran Sivakumar, Mateus Valverde Gasparino, Michael McGuire, Vitor Akihiro Hisano Higuti, M. Ugur Akcal, Girish Chowdhary

  • 机构:UIUC、Earth Sense

  • 论文链接:https://enriquecoronadozu.github.io/rssproceedings2024/rss20/p023.pdf

在这篇论文中,研究者提出了一种基于经验的鲁棒性视觉导航系统,用于使用语义关键点的作物冠下农业机器人。

由于作物行间距较小(∼ 0.75 米)、多径误差导致 RTK-GPS 精度下降以及杂波过多导致激光雷达测量产生噪声,作物冠下的自主导航具有挑战性。早期名为 CropFollow 的工作通过提出一种基于学习的端到端感知视觉导航系统来应对这些挑战。然而,这种方法存在以下局限性:缺乏可解释的表征,以及由于置信度不够缺乏在遮挡期间对离群预测的敏感性。

本文系统 CropFollow++ 引入了模块化感知架构和学习的语义关键点表示法。与 CropFollow 相比,CropFollow++ 的模块化程度更高、可解释性更强,并提供了检测闭塞的置信度。CropFollow++ 在具有挑战性的晚季田间测试中的表现明显优于 CropFollow,每个田间测试跨度达 1.9 千米,所需的碰撞次数为 13 次对 33 次。研究者还在不同的田间条件下,将 CropFollow++ 大规模部署在多个作物冠下覆盖作物种植机器人中(总长 25 公里),并讨论了从中汲取的主要经验教训。

图片

  • 论文标题:Demonstrating Agile Flight from Pixels without State Estimation

  • 作者:smail Geles, Leonard Bauersfeld, Angel Romero, Jiaxu Xing, Davide Scaramuzza

  • 论文链接:https://enriquecoronadozu.github.io/rssproceedings2024/rss20/p082.pdf

四旋翼无人机是最敏捷的飞行机器人之一。尽管最近的一些研究在基于学习的控制和计算机视觉方面取得了进步,但自主无人机仍然依赖于明确的状态估计。另一方面,人类飞行员只能依靠无人机机载摄像头提供的第一人称视角的视频流将平台推向极限,并在看不见的环境中稳健飞行。

本文展示了首个基于视觉的四旋翼无人机系统,该系统可在直接将像素映射到控制指令的同时,自主高速通过一连串门。与专业的无人机赛车手一样,该系统不使用明确的状态估计,而是利用与人类相同的控制指令(集体推力和身体速率)。研究者展示了速度高达 40km/h 且加速度高达 2g 的敏捷飞行。这是通过强化学习(RL)训练基于视觉的策略实现的。使用非对称的 Actor-Critic 可以获取特权信息,为训练提供便利。为了克服基于图像的 RL 训练过程中的计算复杂性,研究者使用门的内边缘作为传感器抽象。在训练过程中,无需渲染图像就能模拟这种简单而强大的任务相关表示法。在部署过程中,研究者使用了基于 Swin Transformer 的门检测器。

本文方法可以利用标准的、现成的硬件实现自主敏捷飞行。虽然演示侧重于无人机竞赛,但该方法的影响已经超出了竞赛范围,可以作为未来研究结构化环境中真实世界应用的基础。

最佳系统论文奖

图片

  • 论文标题:Universal Manipulation Interface: In-The-Wild Robot Teaching Without In-The-Wild Robots

  • Cheng Chi, Zhenjia Xu, Chuer Pan, Eric Cousineau, Benjamin Burchfiel, Siyuan Feng, Russ Tedrake, Shuran Song

  • 机构:斯坦福大学、哥伦比亚大学、丰田研究院

  • 论文链接:https://arxiv.org/pdf/2402.10329

本文介绍了通用操纵界面(UMI),一种数据收集和策略学习框架,可将野外人类演示的技能直接转移到可部署的机器人策略中。UMI 采用手持式抓手和精心的界面设计,可为具有挑战性的双臂和动态操纵演示提供便携式、低成本和信息丰富的数据收集。为了促进可部署的策略学习,UMI 采用了精心设计的策略界面,具有推理时间延迟匹配和相对轨迹动作表示功能。学习到的策略与硬件无关,可在多个机器人平台上部署。有了这些功能,UMI 框架就能释放新的机器人操纵能力,只需改变每个任务的训练数据,就能实现零样本泛化动态、双臂、精确和长视野行为。研究者通过全面的真实世界实验证明了 UMI 的多功能性和有效性,在这些实验中,通过 UMI 零射频学习到的策略在不同的人类演示训练中可泛化到新的环境和物体。

图片

  • 论文标题:Khronos: A Unified Approach for Spatio-Temporal Metric-Semantic SLAM in Dynamic Environments

  • 作者:Lukas Schmid, Marcus Abate, Yun Chang, Luca Carlone

  • 论文链接:https://arxiv.org/pdf/2402.13817

感知和理解高度动态和不断变化的环境是机器人自主性的关键能力。虽然在开发能准确估计机器人姿态的动态 SLAM 方法方面取得了长足进步,但在构建密集的机器人环境时空表征方面却重视不够。详细了解场景及其随时间的演变对于机器人的长期自主性至关重要,对于需要长期推理的任务也至关重要,例如在与人类和其他 Agent 共享的环境中有效运行,因此会受到短期和长期动态变化的影响。

为了应对这一挑战,这项研究定义了时空度量 - 语义 SLAM(SMS)问题,并提出了一个有效分解和解决该问题的框架。研究表明,所提出的因子化建议了一种时空感知系统的自然组织形式,其中一个快速进程跟踪活动时间窗口中的短期动态,而另一个慢速进程则利用因子图表述对环境中的长期变化进行推理。研究者提供了一种高效的时空感知方法 Khronos,并证明它统一了对短期和长期动态的现有解释,能够实时构建密集的时空地图。

论文提供的模拟和实际结果表明,Khronos 构建的时空地图能够准确反映三维场景的时间变化,而且 Khronos 在多个指标上都优于基线。

最佳学生论文奖

图片

  • 论文标题:Dynamic On-Palm Manipulation via Controlled Sliding

  • 作者:William Yang, Michael Posa

  • 机构:宾夕法尼亚大学

  • 论文链接:https://arxiv.org/pdf/2405.08731

当前,对机器人执行非抓取性动作的研究主要集中在静态接触上,以规避滑动可能带来的问题。但是,如果根本上消除了「手滑」的问题,即能控制接触时的滑动,这将为机器人能做的动作开辟新领域。

在这篇论文中,研究者提出了一项挑战性的动态非抓取操作任务,该任务需要综合考虑各种混合接触模式。研究者采用了最新的隐式接触模型预测控制(MPC)技术,帮助机器人进行多模式规划,以完成各项任务。论文详细探讨了如何将用于 MPC 的简化模型与低级跟踪控制器相整合,以及如何使隐式接触 MPC 适应于动态任务的需求。

图片

令人印象深刻的是,尽管众所周知,摩擦和刚性接触模型往往不准确,但这篇论文的方法能够对这些不准确性做出灵敏反应,同时快速完成任务。而且,研究者没有使用于常见的辅助工具,例如参考轨迹或运动基元辅助机器人完成任务,这进一步凸显了该方法的通用性。这是隐式接触 MPC 技术首次被应用于三维空间中的动态操作任务。

图片

  • 论文标题:Agile But Safe: Learning Collision-Free High-Speed Legged Locomotion

  • 作者:Tairan He, Chong Zhang, Wenli Xiao, Guanqi He, Changliu Liu, Guanya Shi

  • 机构:CMU、瑞士苏黎世联邦理工学院

  • 论文链接:https://arxiv.org/pdf/2401.17583

四足机器人在杂乱的环境中穿行时,需要同时具备灵活性和安全性。它们需要既能够敏捷地完成任务,又要避免与人或障碍物相撞。不过,现有的研究往往只注重其中一方面:要么是为了安全而设计速度不超过 1.0 米 / 秒的保守控制器,要么是追求灵活性却忽视了可能致命的碰撞问题。

这篇论文提出了一种名为「既敏捷又安全」的控制框架。这个框架让四足机器人在保持灵活性的同时,也能安全地避开障碍物和人,实现无碰撞的行走。

ABS 包括两套策略:一套是教机器人如何在障碍物之间灵活敏捷地穿梭,另一套则是万一遇到问题,如何快速恢复,保证机器人不会摔倒或者撞到东西。两套策略互相配合。

在 ABS 系统中,策略的切换由一个基于学习型控制理论的避碰价值网络来控制。这个网络不仅决定了何时切换策略,还为恢复策略提供了一个目标函数,确保机器人在闭环控制系统中始终保持安全。通过这种方式,机器人能够在复杂环境中灵活应对各种情况。

为了训练这些策略和网络,研究者们在模拟环境中进行了大量训练,包括敏捷策略、避碰价值网络、恢复策略,以及外部感知表示网络等等。这些经过训练的模块可以直接应用到现实世界中,配合机器人自身的感知和计算能力,无论机器人是在室内还是受限的室外空间,无论是面对不会动的还是能动的障碍物,都能在 ABS 框架下快速、安全地行动。

想了解更多细节,可以参考此前机器之心对这篇论文的介绍。

图片

  • 论文标题:ScrewMimic: Bimanual Imitation from Human Videos with Screw Space Projection

  • 作者:Arpit Bahety, Priyanka Mandikal, Ben Abbatematteo, Roberto Martín-Martín

  • 机构:得克萨斯大学奥斯汀分校

  • 论文链接:https://arxiv.org/pdf/2405.03666

如果要教一个机器人如何用两只手同时做某件事情,比如同时打开一个盒子,实际上很困难。因为机器人需要同时控制很多关节,还要确保两只手的动作协调一致。对于人类,人们会通过观察别人,学会新的动作,再自己尝试并不断改进。在这篇论文中,研究者参考人类学习的方法,让机器人也能通过看视频学习新技能,并且在实践中提高。

研究者们从心理学和生物力学的研究中得到灵感,他们把两只手的动作想象成一种特殊的链条,这种链条可以像螺丝一样旋转,称之为「螺旋动作」。基于此,他们开发了一个名为 ScrewMimic 的系统。这个系统可以帮助机器人更好地理解人类的演示,并通过自我监督来改进动作。通过实验,研究者们发现 ScrewMimic 系统能帮助机器人从一段视频中学习到复杂的双手操作技能,并在性能上超越了那些直接在原始动作空间中进行学习和改进的系统。

图片

                            ScrewMimic 的方法示意图

最佳论文奖

图片

  • 论文标题:Advancing Humanoid Locomotion: Mastering Challenging Terrains with Denoising World Model Learning

  • 作者:Xinyang Gu, Yen-Jen Wang, Xiang Zhu, Chengming Shi, Yanjiang Guo, Yichen Liu, Jianyu Chen

  • 机构:北京星动纪元科技有限公司、清华大学

  • 论文链接:https://enriquecoronadozu.github.io/rssproceedings2024/rss20/p058.pdf

当前技术只能让人形机器人在平坦地面,此类简单的地形上行走。然而,让它们在复杂环境,如真实的户外场景中自如行动,仍很困难。在这篇论文中,研究者们提出了一种名为去噪世界模型学习(DWL)的新方法。

DWL 是一个用于人形机器人的运动控制的端到端的强化学习框架。这一框架使机器人能够适应各种不平坦且具有挑战性的地形,例如雪地、斜坡和楼梯。值得一提的是,这些机器人仅需一次学习过程,无需额外的特别训练,便能在现实世界中自如应对多样化的地形挑战。

图片

这项研究由北京星动纪元科技有限公司和清华大学联合完成。星动纪元成立于 2023 年,是一家由清华大学交叉信息研究院孵化,研发具身智能以及通用人形机器人技术和产品的科技公司,创始人为清华大学交叉信息研究院助理教授、博导陈建宇,聚焦于通用人工智能 (AGI) 前沿应用,致力于研发适应宽领域、多情景、高智能的通用人形机器人。

图片

  • 论文标题:Real-Time Anomaly Detection and Reactive Planning with Large Language Models

  • 作者:Rohan Sinha, Amine Elhafsi, Christopher Agia, Matt Foutter, Edward Schmerling, Marco Pavone

  • 机构:斯坦福大学

  • 论文链接:https://arxiv.org/pdf/2407.08735

大型语言模型(LLM),具有零样本的泛化能力,这使得它们有希望成为检测和排除机器人系统分布外故障的技术。然而,想让大型语言模型真正发挥作用,需要解决两个难题:首先,LLM 需要很多计算资源才能在线应用;其次,需要让 LLM 的判断能够融入到机器人的安全控制系统中。

在这篇论文中,研究者提出了一个两阶段的推理框架:对于第一阶段,他们设计了一个快速的异常检测器,它能在 LLM 的理解空间里迅速分析对机器人的观察结果;如果发现问题,就会进入下一个备选选择阶段。在这个阶段,将采用 LLM 的推理能力,进行更深入的分析。

进入哪个阶段对应于模型预测控制策略中的分支点,这个策略能够同时跟踪并评估不同的备选计划,以解决慢速推理器的延迟问题。一旦系统检测到任何异常或问题,这个策略会立即启动,确保机器人的行动是安全的。

这篇论文中的快速异常分类器在性能上超越了使用最先进的 GPT 模型的自回归推理,即使在使用相对较小的语言模型时也是如此。这使得论文中提出的实时监控器能够在有限的资源和时间下,例如四旋翼无人机和无人驾驶汽车中,提高动态机器人的可靠性。

图片

图片

  • 论文题目:Configuration Space Distance Fields for Manipulation Planning

  • 作者:Yiming Li, Xuemin Chi, Amirreza Razmjoo, Sylvain Calinon

  • 机构:瑞士 IDIAP 研究所、瑞士洛桑联邦理工学院、浙江大学

  • 论文链接:https://arxiv.org/pdf/2406.01137

符号距离场(SDF)是机器人学中一种流行的隐式形状表示,它提供了关于物体和障碍物的几何信息,并且可以很容易地与控制、优化和学习技术结合起来。SDF 一般被用于表示任务空间中的距离,这与人类在 3D 世界中感知的距离概念相对应。

在机器人领域中,SDF 往往用来表示机器人每个关节的角度。研究者通常知道在机器人的关节角度空间中,哪些区域是安全的,也就是说,机器人的各个关节可以转动到这些区域而不会发生碰撞。但是,他们不经常用距离场的形式来表达这些安全区域。

在这篇论文中,研究者们提出了用 SDF 优化机器人配置空间的潜力,他们称之为配置空间距离场(简称为 CDF)。与使用 SDF 类似,CDF 提供了高效的关节角度距离查询和直接访问导数(关节角速度)。通常,机器人规划会分成两步:先在任务空间里看看动作离目标有多远,再用逆运动学算出关节怎么转。但 CDF 让这两步合成一步,直接在机器人的关节空间里解决问题,这样更简单,效率也更高。研究者在论文中提出了一种高效的算法来计算和融合 CDF,可以推广到任意场景。

他们还提出了一种使用多层感知器(MLPs)的相应神经 CDF 表示,用以获得紧凑且连续的表示,提高了计算效率。论文中提供了一些具体示例来展示 CDF 的效果,比如让机器人避开平面上的障碍物,一级让一个 7 轴的机器人 Franka 完成一些动作规划任务。这些示例都说明了 CDF 的有效性。

图片

                              应用 CDF 方法的机械臂做抬盒子任务

早期职业 Spotlight

大会还评选出了早期职业 Spotlight 奖,本次获奖者为 Stefan Leutenegger,他的研究重点是机器人在潜在未知环境中的导航。

图片

Stefan Leutenegger 是慕尼黑工业大学(TUM)计算、信息与技术学院(CIT)助理教授(终身教职),并与慕尼黑机器人与机器智能研究所(MIRMI)、慕尼黑数据科学研究所(MDSI)和慕尼黑机器学习中心(MCML)有所关联,曾是戴森机器人实验室的成员。他领导的智能机器人实验室(SRL)致力于感知移动机器人无人机机器学习的交叉研究。此外,Stefan 还是伦敦帝国理工学院计算机系的客座讲师。

他参与创办了 SLAMcore 公司,这是一家以机器人和无人机的定位和绘图解决方案的商业化为目标的衍生公司。Stefan 获得了苏黎世联邦理工学院机械工程学士学位和硕士学位,并在 2014 年获得了博士学位,学位论文主题为《无人太阳能飞机:高效稳健自主运行的设计与算法》。

时间检验奖

RSS 时间考验奖授予至少十年前在 RSS 上发表的影响力最大的论文(也可能是其期刊版本)。影响力可以从三个方面理解:比如改变了人们对问题或机器人设计的思考方式,使新问题引起了社区的注意,或者是开创了机器人设计或问题解决的新方法。

通过这个奖项,RSS 希望促进对本领域长期发展的讨论。今年的时间检验奖颁给了 Ji Zhang 和 Sanjiv Singh 的研究《LOAM:激光雷达测距和实时测绘》。

图片

论文链接:https://www.ri.cmu.edu/pub_files/2014/7/Ji_LidarMapping_RSS2014_v8.pdf

这篇十年前的论文提出了一种利用以 6-DOF 运动的双轴激光雷达的测距数据进行里程测量和绘图的实时方法。这个问题难以解决的原因是测距数据是在不同时间接收到的,而运动估计中的误差会导致所得到的点云的错误配准。相干的三维地图可以通过离线批处理方法建立,通常使用闭环来校正随时间的漂移。而本文方法无需高精度测距或惯性测量,即可实现低漂移和低计算复杂度。

获得这种性能水平的关键在于将复杂的同步定位和测绘问题分为两种算法,以同时优化大量变量。一种算法以高频率但低保真的方式进行测距,以估算激光雷达的速度;另一种算法以低一个数量级的频率运行,用于点云的精细匹配和注册。这两种算法的结合使该方法能够实时绘图。研究者通过大量实验以及 KITTI 测速基准进行了评估,结果表明该方法可以达到离线批量方法的 SOTA 精度水平。

更多大会及奖项信息,可参考官网内容:https://roboticsconference.org/

产业RSS 2024
相关数据
清华大学机构

清华大学(Tsinghua University),简称“清华”,由中华人民共和国教育部直属,中央直管副部级建制,位列“211工程”、“985工程”、“世界一流大学和一流学科”,入选“基础学科拔尖学生培养试验计划”、“高等学校创新能力提升计划”、“高等学校学科创新引智计划”,为九校联盟、中国大学校长联谊会、东亚研究型大学协会、亚洲大学联盟、环太平洋大学联盟、清华—剑桥—MIT低碳大学联盟成员,被誉为“红色工程师的摇篮”。 清华大学的前身清华学堂始建于1911年,因水木清华而得名,是清政府设立的留美预备学校,其建校的资金源于1908年美国退还的部分庚子赔款。1912年更名为清华学校。1928年更名为国立清华大学。1937年抗日战争全面爆发后南迁长沙,与北京大学、南开大学组建国立长沙临时大学,1938年迁至昆明改名为国立西南联合大学。1946年迁回清华园。1949年中华人民共和国成立,清华大学进入了新的发展阶段。1952年全国高等学校院系调整后成为多科性工业大学。1978年以来逐步恢复和发展为综合性的研究型大学。

http://www.tsinghua.edu.cn/
相关技术
激光雷达技术

自动驾驶车辆传感器的一种,采用激光扫描和测距来建立车辆周围环境的详细三维模型。Lidar 图像具有高度准确性,这使得它可以与摄像头、超声波探测器和雷达等常规传感器相提并论。然而激光传感器面临体积过大的问题,同时,它的机械结构非常复杂。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

基准技术

一种简单的模型或启发法,用作比较模型效果时的参考点。基准有助于模型开发者针对特定问题量化最低预期效果。

控制理论技术

控制理论是工程学与数学的跨领域分支,主要处理在有输入信号的动力系统的行为。系统的外部输入称为“参考值”,系统中的一个或多个变数需随着参考值变化,控制器处理系统的输入,使系统输出得到预期的效果。 控制理论一般的目的是借由控制器的动作让系统稳定,也就是系统维持在设定值,而且不会在设定值附近晃动。

数据科学技术

数据科学,又称资料科学,是一门利用数据学习知识的学科,其目标是通过从数据中提取出有价值的部分来生产数据产品。它结合了诸多领域中的理论和技术,包括应用数学、统计、模式识别、机器学习、数据可视化、数据仓库以及高性能计算。数据科学通过运用各种相关的数据来帮助非专业人士理解问题。

辅助机器人技术

辅助机器人是一种能够感知,处理感官信息并执行动作的自动化设备/机器。这种机器人用于辅助或扩展一般人类的运动和/或认知能力。面向对象可以是老年人和重度残疾人,或者单纯性辅助一般人的体力/脑力。 这种机器人设备一般强调智能化和鲁棒性维持系统的安全和灵活性,通过集成远程信息处理,机电一体化和其他技术设备(例如先进的人机界面)与人进行物理或者其他感官接触。

异常检测技术

在数据挖掘中,异常检测(英语:anomaly detection)对不符合预期模式或数据集中其他项目的项目、事件或观测值的识别。 通常异常项目会转变成银行欺诈、结构缺陷、医疗问题、文本错误等类型的问题。 异常也被称为离群值、新奇、噪声、偏差和例外。

规划技术

人工智能领域的「规划」通常是指智能体执行的任务/动作的自动规划和调度,其目的是进行资源的优化。常见的规划方法包括经典规划(Classical Planning)、分层任务网络(HTN)和 logistics 规划。

生物力学技术

生物力学是采用力学理论来研究生物体内物质运动的学科。人体力学是其中的一个分支。 生物力学的研究主题可以概括为以下三方面: 生物结构与功能的关系; 生物体的调节与控制机制; 生物的应力-生长关系。 目前在生物力学研究方面较为瞩目的研究领域包括骨组织的结构与受力分析、血液在血管及毛细血管网络中的流动规律、心脏的瓣膜运动、生物材料的制备、细胞乃至分子层次的生物力学问题等等。 运动生物力学:是研究人体运动力学规律的科学,它是体育科学的重要组成部分。

导数技术

导数(Derivative)是微积分中的重要基础概念。当函数y=f(x)的自变量x在一点x_0上产生一个增量Δx时,函数输出值的增量Δy与自变量增量Δx的比值在Δx趋于0时的极限a如果存在,a即为在x0处的导数,记作f'(x_0) 或 df(x_0)/dx。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

映射技术

映射指的是具有某种特殊结构的函数,或泛指类函数思想的范畴论中的态射。 逻辑和图论中也有一些不太常规的用法。其数学定义为:两个非空集合A与B间存在着对应关系f,而且对于A中的每一个元素x,B中总有有唯一的一个元素y与它对应,就这种对应为从A到B的映射,记作f:A→B。其中,y称为元素x在映射f下的象,记作:y=f(x)。x称为y关于映射f的原象*。*集合A中所有元素的象的集合称为映射f的值域,记作f(A)。同样的,在机器学习中,映射就是输入与输出之间的对应关系。

目标函数技术

目标函数f(x)就是用设计变量来表示的所追求的目标形式,所以目标函数就是设计变量的函数,是一个标量。从工程意义讲,目标函数是系统的性能标准,比如,一个结构的最轻重量、最低造价、最合理形式;一件产品的最短生产时间、最小能量消耗;一个实验的最佳配方等等,建立目标函数的过程就是寻找设计变量与目标的关系的过程,目标函数和设计变量的关系可用曲线、曲面或超曲面表示。

无人机技术

无人机(Uncrewed vehicle、Unmanned vehicle、Drone)或称无人载具是一种无搭载人员的载具。通常使用遥控、导引或自动驾驶来控制。可在科学研究、军事、休闲娱乐用途上使用。

查询技术

一般来说,查询是询问的一种形式。它在不同的学科里涵义有所不同。在信息检索领域,查询指的是数据库和信息系统对信息检索的精确要求

强化学习技术

强化学习是一种试错方法,其目标是让软件智能体在特定环境中能够采取回报最大化的行为。强化学习在马尔可夫决策过程环境中主要使用的技术是动态规划(Dynamic Programming)。流行的强化学习方法包括自适应动态规划(ADP)、时间差分(TD)学习、状态-动作-回报-状态-动作(SARSA)算法、Q 学习、深度强化学习(DQN);其应用包括下棋类游戏、机器人控制和工作调度等。

移动机器人技术

移动机器人是一种能够移动的自动机器。移动机器人具有在其环境中移动的能力,并且不固定到一个物理位置。移动机器人可以“自动”主要是指它们能够在没有物理或机电引导装置的情况下导航非受控环境。相比之下,传统的工业机器人或多或少都是固定的(stationary)机械臂或抓取组件。

语言模型技术

语言模型经常使用在许多自然语言处理方面的应用,如语音识别,机器翻译,词性标注,句法分析和资讯检索。由于字词与句子都是任意组合的长度,因此在训练过的语言模型中会出现未曾出现的字串(资料稀疏的问题),也使得在语料库中估算字串的机率变得很困难,这也是要使用近似的平滑n元语法(N-gram)模型之原因。

通用人工智能技术

通用人工智能(AGI)是具有一般人类智慧,可以执行人类能够执行的任何智力任务的机器智能。通用人工智能是一些人工智能研究的主要目标,也是科幻小说和未来研究中的共同话题。一些研究人员将通用人工智能称为强AI(strong AI)或者完全AI(full AI),或称机器具有执行通用智能行为(general intelligent action)的能力。与弱AI(weak AI)相比,强AI可以尝试执行全方位的人类认知能力。

机器之心机构

机器之心,成立于2014年,是国内最具影响力、最专业、唯一用于国际品牌的人工智能信息服务与产业服务平台。目前机器之心已经建立起涵盖媒体、数据、活动、研究及咨询、线下物理空间于一体的业务体系,为各类人工智能从业者提供综合信息服务和产业服务。

https://www.jiqizhixin.com/
暂无评论
暂无评论~