• 基于图像处理的人工智能应用开发平台eAI5000 产品型号:eAI5000
    人工智能平台软件系统提供从底层硬件驱动、接口到顶层业务模式的全套解决方案。顶层业务与人工智能相关组件复用统一的存储计算框架,高度可拓展。基于应用业务层,老师或学生可根据个人需求利用平台资源进行算法开发与推演;同时可以通过模型使用业务层, 利用平台资源将人工智能算法在实际场景中展开应用。
详细内容

平台服务器
 
GPU卡
 
加强版图像处理卡
 

开发软件
(一)基本要求
       RBuilder是一款专为深度学习设计的End-to-End开发套件,旨在为深度学习算法提供高效且简单易用的底层硬件解决方案。
       RBuilder由RbRuntime和RbCompiler两部分构成,用户在TensorFlow、Caffe等深度学习框架下开发的算法模型,通过RBuilder Compiler(下文称为RbCompiler)进行全自动算法模型编译优化,并提取数据流中间表达式SG Ir。模型编译过程中自动进行数据量化、节点融合、软硬件分割等操作。
       RBuilder Runtime(RbRuntime)负责根据SG IR自动生成C/C++ API接口,算法开发者调用API接口加速人工智能计算模块后,可迅速进行拓展开发、完成完整的人工智能应用开发。Runtime支持性能模块分析、性能量化分析、软件调度等自动化优化模块。
       Rbuilder Driver是底层CAISA架构的相关驱动模块,支持CAISA硬件架构驱动、硬件模块计算调度、以及硬件模型分析。对于应用开发者透明,自动进行细粒度性能优化及调度。
(二)RBCOMPILER模块
1、RbCompiler模块相关功能
      SG:Streaming Graph, Plumber使用的数据结构, 每个SG图由一系列SGNodes组成。
      SG IR:将SG串行组合链接得到的结果称为SR IR, SR Ir文件使用protobuf文件格式,由模型结构文件(.pbtxt)和模型数据文件(.bin)组成。
      SGNode:SGNode 描述了在Plumber模型中的一系列计算方式,举例来说,一个卷积计算可以代表一个SGNode。
      freeze:冻结模型,将算法模型的图结构和该模型权重固化到一起。
      生成SG:生成数据流图的中间表达式。
      量化SG:对SG Ir进行8bit量化,精度损失可以接受的情况下进行位宽压缩,从而减少计算资源的消耗。
      优化SG:根据FPGA加速卡的计算资源配置,进行算子的融合和SG节点的硬件分配。
      导出:导出SG IR模型和模型参数,导出的参数数据类型(32bit,16bit或8bit)根据*.pbtxt模型文件中节点数据类型不同而不同,导出的参数将以*.bin文件保存。
2、RbCompiler支持的TensorFlow API和神经网络层
RbCompiler可支持解析的TensorFlow算子与API列表如下:
     (1)Input:tf.placeholder
     (2)Convolution:slim.conv2d  slim.convolution 2d_transpose
     (3)Pooling:slim.max_pool2dtf.layers.average_pooling2d
     (4)BatchNormal:slim.batch_norm
     (5)FullyConnected:slim.fully_connected
     (6)Activation:tf.nn.relutf.nn.leaky_relu
     (7)Reshape:tf.reshape
     (8)Flatten:tf.layers.flattenslim.flattentf.reshape
     (9)ArgMax:tf.argmax
     (10)Softmax:tf.nn.softmax
     (11)Pad:tf.pad
     (12)Split:tf.split
     (13)Unstack:tf.unstack
     (14)Shortcut:tf.add
     (15)Concat:tf.concat
     (16)Global average pooling:tf.reduce_mean
     (17)Upsample:tf.image.resize_bilineartf.image.resize_nearest_neighbor
3、RbRuntime模块
       RbRuntime又称(Runtime)是运行在图像加速卡上的计算图运行时和卷积神经网络计算库。它接收compiler输出的SG描述和权值文件,根据SG描述部署计算过程并执行计算,通过权值文件初始化计算节点所依赖的数据。
       RbRuntime可以根据SG描述所提供的每个节点的信息,给不同的节点分配不同的计算函数、数据类型、计算设备。同时runtime也提供了简洁的调用接口,仅需几行代码即可将runtime的计算功能整合到目标应用中。

工业相机
1、摄像机
     1) 最小照度:0.005Lux @(F1.2,AGC ON) ,0 Lux with IR;
     2) 慢快门:支持;
     3) 镜头接口类型:M12;
     4) 镜头:4mm,水平视场角79°(6mm,8mm可选);
     5) 传感器类型:1/2.7" Progressive Scan CMOS ;
     6) 快门:1/3秒至1/100,000秒;
     7) 调整角度水平:0°~360°;垂直:0°~ 75°;旋转:0°~360°;
     8) 日夜转换模式:ICR红外滤片式;
     9) 宽动态范围:120dB;
     10) 数字降噪:3D数字降噪。
2、压缩标准
     1) 视频压缩标准:H.265 / H.264 / MJPEG ;
     2) H.265编码类型:Main Profile;
     3) 视频压缩码率:32Kbps~8Mbps。
3、图像
     1) 最大图像尺寸:2560×1920(500万像素);
     2) 帧率:50Hz: 25fps (2560 × 1440,1920 × 1080 ,1280 × 720);
     3) 第三码流分辨率与帧率:独立于主码流设置,最高支持: 50Hz : 1fps(704×576);
     4) 图像设置:走廊模式,饱和度,亮度,对比度,锐度,AGC,白平衡通过客户端或者浏览器可调;
     5) 背光补偿:支持,可选择区域;
     6) 日夜转换方式:自动,定时;
     7) 感兴趣区域:ROI支持三码流分别设置1个固定区域。
4、SMART侦测
     1) 行为分析:越界侦测,区域入侵侦测,进入/离开区域侦测,徘徊侦测,人员聚集侦测,快速运动侦测,停车侦测,物品遗留/拿取侦测;
     2) 异常侦测:场景变更侦测,虚焦侦测;
     3) 识别检测:支持人脸侦测。
5、网络功能
     1) 接口协议:ONVIF(PROFILE S,PROFILE G) ,CGI,ISAPI, GB28181,Ehome;
     2) 存储功能:支持Micro SD/SDHC/SDXC卡(128G)断网本地存储,NAS(NFS,SMB/CIFS均支持)  ;
     3) 智能报警:移动侦测,遮挡报警,网线断,IP地址冲突,非法登录;
     4) 通用功能:一键恢复,防闪烁,三码流,心跳,镜像,密码保护,视频遮盖,水印;
     5) 支持协议:TCP/IP,ICM,HTTP,HTTPS,FT,DHC,DNS,DDNS,RTP,RTSP,RTCP,PPPoE,NTP,UPnP,SMTP,SNMP,IGMP,802.1X,QoS,IPv6,UDP,Bonjour。
6、接口及功能
     通讯接口:1个RJ45 10M / 100M 自适应以太网口。
7、一般规范
     1) 电源接口类型:圆头电源接口;
     2) 工作温度和湿度:-30℃~60℃,湿度小于95%(无凝结);
     3) 电源供应:DC12V±25% / PoE(802.3af);带D型号不支持PoE;
     4) 防护等级:IP67;
     5) 红外照射距离:最远可达30米。

图像处理卡



应用开发案例
1、机器学习基础
     1) 人工智能问题定义
     2) 人工智能问题数学化表达
     3) 人工智能训练过程
     4) 人工智能训练方法
2、深度学习介绍
     1) 深度学习核心价值
     2) 深度学习算法基础模块
     3) 深度学习常用算法
3、深度学习通用优化方法
     1) 数据预处理
     2) 架构优化
     3) 训练优化
4、深度学习应用:图像识别
     1) 图像识别应用场景
     2) 图像识别核心模块
     3) 图像识别常用架构
5、深度学习应用:目标检测
     1) 目标检测应用场景
     2) 目标检测核心模块
     3) 双阶段目标检测架构
6、深度学习应用:目标检测
     1) 单阶段目标检测介绍
     2) 单阶段目标检测算法优劣分析
     3) 阶段目标检测算法架构
7、人工智能计算架构模型
     1) 性能分析模型
     2) 计算受限分析
     3) 通信受限分析
     4) 架构效率分析
8、 人工智能计算架构
     1) SIMD 架构
     2) Tensor 架构
     3) 定制化架构
9、 数据流定制架构
     1) 现有架构效率分析
     2) 数据流定制架构介绍
     3) 数据流定制架构优化参数
10、硬件架构实现
     1) FPGA 实现
     2) ASIC 实现
     3) IP、FPGA、ASIC 在人工智能计算中的定位
11、人工智能算法开发框架
     1) Caffe 框架介绍
     2) Tensorflow 框架介绍
     3) 新框架发展
12、编译器基础
     1) 编译器基本模块
     2) 编译器中间表达
     3) 编译器应用
13、人工智能编译器
     1) 人工智能编译器需求分析
     2) 人工智能编译器前端:对接开发框架
     3) 人工智能编译器中端:自动优化
     4) 人工智能编译器后端:底层架构支持
14、人工智能编译器RBuilder
     1) RBuilder 架构介绍
     2) Rbuilder使用案例
     3) RBuilder 拓展
15、算法框架环境搭建与前端图像处理卡功能验证
     1) 搭建 TensorFlow 算法框架与运行环境
     2) 搭建图像处理卡硬件环境与运行环境
     3) 图像处理卡初步功能验证
16、CIFAR10识别算法基于TensorFlow的实现
     1) 学习 TensorFlow 搭建神经网络的基本函数
     2) 分步骤搭建分类神经网络并进行神经网络训练
     3) 进行算法模型性能评估并提供 CIFAR10 验证结果 
17、SSD人脸检测加速
     1) 基于TensorFlow学习SSD目标检测框架前处理与后处理
     2) SSD框架基本概念(BBbox, Anchor, IOU, 分类网络)的实现
     3) 基于SSD目标检测算法神经网络搭建
     4) 实现人脸检测功能与人脸方案验证
18、SSD算法拓展及加速
     1) 人脸检测算法在图像处理卡部署并加速
     2) 基于图像处理 运行时人脸算及前后处理实现
     3) 行人检测算法在图像处理卡的部署与加速
19、8-bit精度优化及加速
     1) 验证量化精度对神经网络图像检测算法的精度与速度的影响
     2) 人脸检测8-bit优化算法在图像处理卡上的实现
     3) 8-bit与16-bit在图像处理卡上的性能对比

  • 关于我们 企业简介 企业文化 战略合作 人才培养
  • 解决方案 工业机器人实训基地方案 创客教育与创客空间方案 电子工艺实训基地方案 无人机技术实训基地方案
  • 慕课平台 工业机器人 电子信息工程 嵌入式与物联网 智能硬件
  • 快速链接 做中学APP 科瑞迪教育 moocdo课程 信息报备
  • 关注官方微信
©2004-2019 湖南科瑞特科技有限公司    湘ICP备10001081号-10