影视聚合站 科技 文章内容

雷军家的「铁蛋」亮相:一只9999元会打滚、空翻的机器狗(未来将开源)

发布时间:2021-08-11 14:05:53来源:机器之心

机器之心报道

编辑:蛋酱

小米进军仿生四足机器人了,中文名「铁蛋」,英文名「CyberDog」。

这是谁家的狗?时尚、动感,还有些许威风凛凛。

在昨晚MIX4发布会的结尾,雷军突然公布了小米家族的新成员——「铁蛋」。

「铁蛋」是它在小米内部的昵称,据说如此取名一般都会「命硬」,预示着开发容易成功。中文名主要负责接地气,英文名还得兼顾国际范儿,「CyberDog」在气质这一块拿捏得死死的。

仔细一看,从外型上还挺像《黑镜》里的机器狗:

据雷军介绍,CyberDog仿生四足机器人拥有仿生的运动步态,还拥有仿生的视觉和听觉交互体验,让它可以听从指令、识别主人甚至自动跟随主人运动。

现场,雷军还展示了「铁蛋」听人话、翻跟头等技能:

「铁蛋,站起来跟大家打个招呼!」

「听说你会翻跟斗,现场给大家演示一下?」

关键在于,和B家机器狗50多万元的价格相比,CyberDog工程探索版的购入价格仅为9999元,小米表示将先拿出700台进行小范围限量发售。

「铁蛋」的身体构造

CyberDog内置小米自研的伺服马达,提供32N·m最大输出扭矩、220rpm最大转速以及3.2m/s的最快移动速度。这是它完成诸多复杂动作的基础:奔跑、跳跑、左右转体、前倾后仰、作揖、握手、打滚、后空翻。

左右转体。

打滚。

搭配运动控制算法,CyberDog能够适应多种复杂地形,即使受到外力干扰也能快速恢复平衡。

CyberDog的大脑是英伟达的JetsonXavierTMNX平台,这是一台用于嵌入式和边缘系统的AI超级计算机,包括384个CUDA核心、48个张量核心、6个CarmelARMCPU、2个深度学习加速引擎。这保证了CyberDog可以毫无障碍地处理从传感器系统捕获的大量数据,准确领会主人的意图。

为了完全模拟生物体,CyberDog搭载了高精度环境感知系统,全身11个高精度传感器向AI大脑实时传输信息,包括触摸传感器、摄像头、超声波传感器、GPS模块等,可以感知图像、光线、距离、速度、声音等环境信息,通过即时反馈来引导自身运动。

在CyberDog的设计上,小米工程师特别注重增强其感知周围环境的能力。机器狗嵌入了一系列摄像头传感器,包括人工智能交互式摄像机,双目超广角鱼眼摄像机,以及IntelRealSenseTMD450深度模块,并且可以通过计算机视觉算法进行训练。

建立在这个视觉传感器系统上的是自主的目标跟踪、SLAM和厘米级的避障及导航。这意味着CyberDog可以实时分析周围环境,创建导航地图、标出目的地、避开障碍物。结合人体姿势和人脸识别跟踪,CyberDog能够跟随主人并绕过障碍物。

用户可以通过语音助手设置唤醒词来命令和控制CyberDog,也可以用附带的远程和智能手机应用程序。此外,CyberDog提供了丰富的外部接口,包括3个C型端口和1个HDMI端口,开发者可以自由探索和集成各种创新的硬件附加组件或软件系统,比如搜索灯、全景摄像机、动态摄像机、LiDAR或其他。

最后,CyberDog重量为3kg,比体重5.2kg的Spot机器狗更加轻盈。

机器狗家族

成熟的业界仿生四足机器人,是由波士顿动力创始的。后续追随者所打造的产品总有「大同小异」的味道,不过硬件价格一直在下降,这或许会带来更多的落地应用契机。

斯坦福学生机器人俱乐部曾经开源了,所有代码和设计图都能免费获得,DIY成本不高于3000美元。Doggo能完成走路、慢跑、跳舞、跳跃等动作,偶尔也能表演一下后空翻。

今年6月,国内的宇树科技发布了UnitreeGO1,共有三个版本:售价2700美元的G01Airbase型号、售价3500美元的G01和售价8500美元的G01Edu。

也就是说,UnitreeGO1起步价仅需1.6万元人民币,然而这个价格纪录目前已被小米的「铁蛋」打破了。

一位「铁蛋」诞生过程的参与者,在知乎平台分享了项目开发的经历:

十个月前我们的狗子只是个构想,连个电机都没有。一路来从第一台样机到几台到几十台到几百台,人员也从几个人壮大到几十,从一两个部门到十几个部门参与。

在不到一年的时间里,小米工程师们是怎么打造出「铁蛋」的?

雷军在演讲中提到,CyberDog是基于MITMiniCheetah以及ROS2的开源平台打造的。MIT的MiniCheetah算是后空翻机器人界的首位选手,同时拥有横向移动、跳跃、自动从摔倒中爬起等技能。

小米此次也承诺,仿生四足机器人研发成果将向全球开源。一位参与铁蛋研发的小米工程师在知乎表示,「未来会进行项目的一期开源,并且会陆续把从嵌入式(电机,传感器,外设),Linux内核,定制后的rootfs,裁过的ROS2的repos,还有我们写的基于ROS2的代码,以及基于MiniCheetah改过的代码等等都开源出来。」

之后,大家也许能够做出自己的机器狗来!

NVIDIA对话式AI开发工具NeMo的应用

开源工具包NeMo是一个集成自动语音识别(ASR)、自然语言处理(NLP)和语音合成(TTS)的对话式AI工具包,便于开发者开箱即用,仅用几行代码便可以方便快速的完成对话式AI场景中的相关任务。

8月12日开始,英伟达专家将带来三期直播分享,通过理论解读和实战演示,展示如何使用NeMo快速完成文本分类任务、快速构建智能问答系统、构建智能对话机器人。

直播链接:https://jmq.h5.xeknow.com/s/how4w(点击阅读原文直达)

报名方式:进入直播间——移动端点击底部「观看直播」、PC端点击「立即学习」——填写报名表单后即可进入直播间观看。

交流答疑群:直播间详情页扫码即可加入。

©THEEND

转载请联系本公众号获得授权

投稿或寻求报道:content@jiqizhixin.com

© 2016-2017 ysjhz.com Inc.

站点统计| 举报| Archiver| 手机版| 小黑屋| 影视聚合站 ( 皖ICP备16004362号-2 )