满足云边端部署需求
以brain 作为基础设施,旷视开发了可部署于云端、边缘端和终端等计算平台的先进深度神经网络算法模型,助力旷视的全栈式nhà cái k8的解决方案优化计算能力及数据存储的分配,从而提升表现及效率。
云端算法 resnet加强版
- 突破网络模型深度限制,深度学习里程碑
- 得到业界广泛使用并成为ai行业基础模型
- 适用于云端视觉计算处理
边缘端算法 dorefa-net
- 首个可同时对权重、激活、梯度进行量化的模型
- 加速云端ai芯片和终端 ai 芯片的开发和完善
- 适用于cpu、gpu、fpga 及 asic 等平台
终端算法 shufflenet
- 已于github开源的高效的轻量化卷积神经网络
- 大幅降低模型计算复杂度实现高精度识别
- 可用于移动端人像美颜、图像美化、直播互动等
覆盖主流ai应用场景
在具体应用中,旷视将核心的深度学习算法分为感知、控制、优化三类,致力于实现从人脸、环境到万物全目标的认知与决策,而这些核心的算法已经在旷视各个业务场景中得到不同程度的应用。
视觉
感知
人脸/人体/车辆/物体检测
检测并定位图像及视频中的人脸、人体、车辆或物体,并返回高精度的坐标框。
人脸/人体/车辆/物体比对
分析两张图片中的脸属于同一个人或两张图片中的物体为同一个物体的可能性,并给出置信度分数,以供评估相似度。
稠密人脸关键点
对脸部轮廓、眼睛、眉毛、嘴唇及鼻子轮廓等脸部特征进行精确定位并生成数百个关键点信息。
人脸属性
进行一系列人脸相关的属性分析,包括年龄、性别、笑容程度、头部朝向、眼睛状态、情绪、颜值、视线、唇部状态、皮肤状态、人脸图像质量和模糊程度等属性。
情绪识别
分析并识别检测到的人脸的情绪,每个检测到的人脸分析结果包括几种情绪的置信度分数。
对象实例/场景分割
将单独的对象实例或语义区域与图像和视频中的背景分开,并返回高精度对象╱区域边界。
手势/动作识别
检测并识别手部及身体动作,并生成高精度的置信度分数。
大规模相册聚类与检索
识别大规模相册中不同相片的人脸和物体,然后将同一人或物体的相片自动聚类,以便于检索。
传感
控制
深度和地标感应
使用一对摄像头或一对摄像头和投影仪或单个摄像头来计算深度或定位机器人所在环境的地标,或者要操纵的对象。与传统方法不同,深度或界标是通过深度学习方法计算的,其直接从大量训练示例中学习感测能力。
深度slam
使用机器人创建地图的过程,该机器人在使用其生成的地图时导航该环境,类似于一辆在陌生环境中找路的汽车。在本地化中,深度学习全局视觉特征用于鲁棒性,深度学习本地视觉特征用于准确性。在映像中,整个系统集成了多个输入以实时构建地图。
6d物体检测和姿态估计
检测和估算待抓取或操纵的物体的6d姿态(3d位置 3d方向)。采用摄像头输入和深度感知相结合的方法,利用端到端学习估算器对不同的目标和姿态变化进行脱机训练,获得精确的目标姿态。
运动规划
找到将机器人或机械臂从源状态移动到目标状态的一系列运动或有效配置。通过使用基于抽样的方法来获得快速可靠的初始解,并通过一种可以从经验中学习并随着时间的推移提高性能的强化学习方法来不断改进规划策略。
协同
优化
多机器人交通调度
提供统一的交通指挥系统,允许多个移动机器人在统一区域内有序移动,避免拥塞,优化整个机器人群的交通效率。
作业调度和资源负载平衡
通过批量调度和调度不同任务来优化各种资源的负载平衡,以提高整体任务完成效率。
存储优化
使用运营研究算法优化货物的存储和存储区域,并改善整体运营的延迟和吞吐量。
全局调度
根据当前机器人状态,项目状态,订单状态和订单预测动态配置整体操作节奏和各种优化。