1.8万字!或许是全网较全面的机器人视觉传感器行业分析

B站影视 2025-01-02 22:30 2

摘要:视觉传感器,也称为机器视觉,它能够模仿人类视觉系统,赋予机器“观看”和“认知”的能力,在识别、测量、定位和检测等多个领域替代人眼的功能。作为现代工业和技术发展的重要推动力,机器视觉在提升生产效率、保障作业安全以及推进智能制造等方面发挥着显著的作用并拥有巨大的发

视觉传感器,也称为机器视觉,它能够模仿人类视觉系统,赋予机器“观看”和“认知”的能力,在识别、测量、定位和检测等多个领域替代人眼的功能。作为现代工业和技术发展的重要推动力,机器视觉在提升生产效率、保障作业安全以及推进智能制造等方面发挥着显著的作用并拥有巨大的发展潜力。当前,3D视觉技术正在用于提升人形机器人的环境感知和交互能力。随着未来人形机器人出货量的增加以及技术的不断迭代升级,视觉解决方案也将逐步优化并定型,机器视觉行业市场规模也将更加广阔。

传感器专家网

专注于传感器技术领域,致力于对全球前沿市场动态、技术趋势与产品选型进行专业垂直的服务,是国内领先的传感器产品查询与媒体信息服务平台。基于传感器产品与技术,对广大电子制造从业者与传感器制造者提供精准的匹配与对接

本文将探讨机器视觉这一领域,详细介绍其主要功能、技术原理等基础知识,并梳理推动机器视觉发展的相关政策。接下来,我们将深入分析机器视觉的主流技术分类,并对产业链的关键环节进行详细梳理,探讨产品价格。此外,我们还将整理不同人形机器人所采用的视觉方案。文章最后,将列举相关企业,以期这些内容能够增进大家对机器视觉的认识和理解。

视觉传感器,即机器视觉,是由计算机或图像处理器以及相关设备来模拟人的视觉行为,完成得到人的视觉系统所得到的信息。在工业生产中,机器视觉的引入旨在提升效率、减少误差、降低成本,并从繁重或危险的工作环境中解放人力。

该技术的运作机制主要包括以下几个步骤:首先,利用工业相机和镜头等视觉设备捕获待检测物品的图像。接着,这些图像信息被转换成图像信号,并送入图像处理系统。在图像处理系统中,物品的亮度、颜色、尺寸等属性被转换成数字信号。最终,机器视觉系统通过对这些信号进行分析和处理,提取出关键特征,并根据这些特征来控制现场的设备运作。

根据图像数据的维度,机器视觉的应用可分为二维(2D)和三维(3D)两大类。2D技术能够获取平面图像,并在二维空间内定位目标,但其无法提供物体的三维信息,如高度和体积,且易受光照变化和物体运动的影响。相比之下,3D技术能够提供更全面的物体信息,并在三维空间内定位目标,从而实现更为复杂的功能,如人脸识别和3D建模。尽管3D技术在数据处理和存储方面仍存在挑战,但它在许多应用场景中展现出独特的优势。

机器视觉技术是一个跨学科的领域,它融合了图像处理、机械工程、光源照明、光学、传感技术、算法开发以及计算机科学等多方面的技术和知识。通过这些技术的结合,机器视觉能够实现对复杂场景的高效识别和处理,为自动化和智能化生产提供强有力的技术支持。

机器视觉的主要功能包括识别、测量、定位检测

1)识别功能:基于目标物的特征进行甄别,包括外形、颜色、字符、条码等。识别的准确度和速度是评估识别性能的关键指标。通过机器视觉,可以快速且准确地识别出目标物,提高生产效率。

2)测量功能:将获取的图像像素信息转换为常用的度量衡单位,从而精确计算出目标物的几何尺寸。机器视觉在高精度以及复杂形态的测量方面具有显著优势,能够提供更准确、更可靠的测量结果。

3)定位功能:用于获取目标物体的位置信息,可以是二维或三维的位置信息。定位的精度和速度是定位功能的主要评价标准。机器视觉能够实时、准确地获取目标物体的位置信息,为自动化生产提供有力支持。

4)检测功能:外观检测,其种类繁多。例如,产品装配后的完整性检测可以确保元器件被正确安装在印刷电路板上;外观缺陷检测则可以检测产品表面是否有划痕、凹凸不平等问题。机器视觉在检测领域的应用能够及时发现并处理潜在问题,提高产品质量和生产效率。

机器视觉应用广泛,目前主要应用在智能制造的工业场景,医学、智能交通等场景也有应用。

未来的人形机器人将会拥有语音感知交互能力(“嘴巴”和“耳朵”)、视觉感知交互能力(“眼睛”),以及各种AI决策分析能力(“大脑”)。人类约80%的信息是通过人眼感知获取的,未来的机器人也将和人类一样,大量信息都将通过视觉感知获取。现实物理世界是三维的,发展多年的2D成像技术难以完整重现各类三维场景,3D视觉感知技术则可以让终端获取更多精准的三维信息,助力各类终端更好地看懂三维世界。

从人形机器人来看,机器视觉技术的主要用途是实现视觉感知和交互。

视觉感知层面,人形机器人需要通过摄像头等传感器获取周围的环境信息,例如障碍物、人和物品等,以此做出相应的行动。机器视觉技术可以通过识别图像和视频中的目标,如人脸、手势、表情等,实现智能化的感知。

人机交互领域,人形机器人需要与人类进行交互,使其具有更加人性化的功能和行为表现。机器视觉技术可以通过识别人类的面部表情、手势等,来实现人机交互和情感交流,从而增加其交互体验和智能化的感知。

4、机器视觉和人类视觉对比

机器视觉技术在人形机器人发展中的优势在于其具有精确性强、速度快、适应性强、客观性高、重复性强、检测效果稳定可靠、效率高、方便信息集成等特点,可以使人形机器人更加能够感知周围环境,并根据所获取的信息做出相应的动作和反应,从而增加其更加人性化的功能与表现,这将会提高人形机器人在各个领域中的应用价值和前景。但其需要满足高精度、大数据量和实时性等多个方面的要求,同时还需要具备更高的安全性、智能化和可靠性等技术挑战。

02政策利好机器视觉

国家出台多项政策利好机器视觉行业发展。政策从拓展产业链应用场景、发展机器视觉底层技术等方向促进中国机器视觉产业的发展,同时AI+机器视觉技术与设备在“十四五”规划中受到高度重视,2021年底《“十四五”数字经济发展规划》中重点推进机器视觉、机器学习等技术应用,良好的政策环境有利于为行业的可持续发展奠定良好的政策支持,为机器视觉行业的健康发展保驾护航。

03机器视觉主流技术分析

不同应用领域或场景对视觉的测量范围、测量精度、尺寸和功耗等性能要求均不同。视觉技术按照成像维度的不同,可以划分为2D和3D两大类别。

1、2D视觉技术

2D视觉技术在过去几十年里经历了显著的进步,分辨率从最初的数十万像素提升至现今的数亿像素,图像的色彩还原变得更加真实,图像质量也得到了显著提升。尽管如此,2D成像技术使用到的传统RGB相机,仅能捕捉到物体表面的纹理信息,没有物体到相机的距离信息,无法提供对于精确的识别、追踪等功能所需的空间形态、几何尺寸和位姿信息等。

2、3D视觉感知技术

3D视觉相对于2D应用场景更加复杂、精度更高、视觉信息获取量更加丰富。3D视觉成像技术可分为光学和非光学成像方法。目前应用最多的还是光学方法,包括:飞行时间(ToF)法(包括dToF、iToF)、双目视觉法、结构光法、激光扫描法、激光散斑法、干涉法、照相测量法、激光跟踪法等等,常用的为前三种方法。

目前机器人视觉由于人形机器人的与外界复杂环境交互需求的提升,同样也需要使用3D视觉系统。机器人视觉相比传统机器视觉更加3D化、高度集成化、场景复杂化。作为机器人感知的前沿和核心手段,3D视觉通过使用相关仪器来获取物体的图像数据信息,然后再对获取的数据信息进行分析处理,利用三维重建的相关理论重建出真实环境中物体表面的轮廓信息,让机器人感知周围环境中物体的轮廓和距离,为后续执行指令动作参考使用。

双目视觉(Stereo)法的工作原理来源于人类的双目视觉系统,也就是说从不同的视角通过两个相同的相机捕获同一个位置下的左右两侧图像进行匹配,然后再利用三角测量原理获取物体的深度信息,通过这些深度信息重建出物体的三维模型。此外基于类似原理还衍生出多目视觉法,是在双目视觉的基础上,增加一台或者多台摄像机作为辅助进行测量,从而获得不同角度下同一物体的多对图像。多目视觉法大多数的理论与双目视觉法是相同的,唯一不同的是,多目视觉采用了三个或三个以上的摄像头进行环境中目标物体的获取,使得当测量物体的表面倾斜的角度太大导致其中的一个或两个摄像机不能接收到漫反射光时,其他的摄像机可继续工作。

双目立体视觉法优点在于具有高3D成像分辨率、高精度、高抗强光干扰等优势,且可以保持较低成本。缺点主要有二,一是需要通过大量的CPU/ASIC演算取得它的深度和幅度信息其算法极为复杂较难实现,同时该技术易受环境因素干扰,对环境光照强度比较敏感,且比较依赖图像本身的特征,因而拍摄暗光场景时表现差;其二是过度的依赖于被拍摄物体的表面纹理,如果被摄物体表面没有明显的纹理,使用双目立体视觉法会无法匹配与之对应的像素。

(2)结构光法

结构光法(Structured Light)是一种主动双目视觉技术,其基本原理是通过近红外激光器,将具有已知的结构特征(比如离散光斑、条纹光、编码结构光等)的光线投射到被拍摄物体上,再由专门的红外摄像头进行采集三维物体物理表面成像的畸变情况,最后通过观测图案与原始图案之前发生的形变由此来得到图案上的各个像素的视差。这个技术通过光学手段获取被拍摄物体的三维结构,再将获取到的信息进行更深入的应用。其工作原理可看作是另一种双目法,红外激光器和红外摄像头可当做是双目立体视觉法中的左右双目的观测原理。

结构光技术相较于双目技术的优势在于:

(1)在场景较暗的场景下也可以运作正常结构光的红外激光器是主动发射光的光源,可以照亮被扫描物体,所以结构光并不像双目结构一样依赖于光源;

(2)在表面较平整、没有明显图案纹理的物体表面也可以实现深度扫描,从而测算出物体的三维深度。

(3)飞行时间法

飞行时间法(ToF,Time of Flight)是一种3D测量方法,其原理是通过给目标连续发送光脉冲,然后用传感器接收从物体返回的光,通过探测这些发射和接收光脉冲的飞行(往返)时间来得到目标物距离。传感器通过计算光线发射和反射时间差或相位差,来换算被拍摄景物的距离,以产生深度信息,此外再结合传统的相机拍摄,就能将物体的三维轮廓以不同颜色代表不同距离的地形图方式呈现出来。

ToF技术具有以下的优点:1)软件复杂性低,设计与应用简单;2)在暗光与强光环境下表现不错;3)功耗不高;4)有较远的探测距离;5)成本低;6)响应速度快。缺点则在于室外受自然光红外线影响大、远距离无法保证精度。

ToF又分为两种,一是直接飞行时间(Direct ToF即dToF),其原理比较简单,即直接发射一个光脉冲,之后测量反射光脉冲和发射光脉冲之间的时间间隔,就可以得到光的飞行时间。探测器系统在发射光脉冲产生的同时启动一个高精度的秒表,当探测到目标发出的光回波时,秒表停止并直接存储往返时间。

dToF通常用于单点测距系统,但由于像素级亚纳秒电子秒表的实现困难,dToF的成本以及技术难度相较于iToF更高。目前主流方案是采用SPAD(一种高灵敏度的半导体光电检测器,被广泛运用于弱光信号检测领域)结合dToF技术,来精确检测记录光子的时间和空间信息,从而进行场景的三维重构。dToF的原理看起来虽然简单,但实际上很难达到较高的精度,主要原因是过程中对于秒表和脉冲信号的精度都有很高要求,且dToF中核心组件SPAD制作工艺复杂,综合成本对比iToF高很多,故目前多数厂家都在推进iToF的研究。

二是间接飞行时间(Indirect ToF即iToF)。iToF的原理要复杂一些,其发射的并非一个光脉冲,而是调制过的光。接收到的反射调制光和发射的调制光之间存在一个相位差,通过检测该相位差就能测量出飞行时间,从而估计出距离。其中,往返行程时间是从光强度的时间选通测量中间接外推的。在这种情况下,不需要精确的秒表,而是需要时间选通光子计数器或电荷积分器,它们只需较少的计算工作和硅面积,就可以在像素级实现。

3、常见的3D视觉产品(1)激光雷达

激光雷达(LiDAR)全称为Light Detectionand Ranging激光探测和测距,是发射激光束探测目标的位置、速度等特征量的雷达系统。其工作原理是向目标发射探测信号(激光束),然后将接收到的从目标反射回来的信号(目标回波)与发射信号进行比较,经运算处理后,获得目标距离、位置、速度、形状等信息,从而对被测物体进行探测、跟踪和识别。激光雷达包括四大要素:测距原理、光束操纵方法、光源和探测器。激光雷达的测距原理包含ToF和FWCW(相干测距法)。目前,ToF型激光雷达在产业链成熟度上更为领先,是当前市场上的主流技术路径。

(2)深度相机

深度相机,又称为3D相机,通过该相机能拍摄出空间景深距离,这也是与普通摄像头(2D)的最大区别。通过3D相机获取到的数据,能准确知道图像中每个点离摄像头的距离,这样加上该点在2D图像中的(x,y)坐标,就能获取图像中每个点的三维空间坐标。目前常用的RGB-D(Depth)相机即为能够结合传统2DRGB相机图像与距离信息的一种深度相机。3D相机按照成像即结构光、双目视觉、光飞行时间(ToF)。

04产业链分析

机器视觉的产业链中,工业视觉上游主要有光源、镜头、工业相机、工控机(包含图像采集卡)、图像处理软件等机器视觉组件设备。用于消费领域的3D视觉主要由红外光发射器、红外光摄像头、可见光摄像头、图像处理芯片构成。产业中游包括基于视觉应用软件的应用系统(如检测、测量、定位、识别系统/定位引导系统等)以及各类视觉设备;产业链下游主要为各行业的产线综合解决方案供应商终端行业,如3C电子、汽车与零部件、新能源、半导体、医疗制药等。

工业相机是机器视觉系统的核心部件,其本质是一个光电转换器件,主要功能是将收到的光信号转变成有序的电信号,然后再通过模数转换并送到处理器以合成图像,并进一步进行处理、识别和分析。工业相机按传感器的结构特性分为线阵相机和面阵相机;按照输出信号的方式分为模拟相机和数字相机;按照响应频率的范围分为可见光(普通)相机、红外相机和紫外相机等。

工业相机性能指标包括分辨率、动态范围、最大行/率、最大信噪比、光时间、功耗。

工业相机可以分为2D工业相机、3D工业相机等品类,我国2D工业相机市场稳步发展,3D工业相机市场仍处于早期发展阶段。

2023年我国2D工业相机市场规模达37.9亿元。从市场规模来看,GGII数据显示,2023年我国2D工业相机市场规模为37.90亿元,同比增长8.12%。伴随下游行业迎来恢复性增长,据GGII预计,2028年2D工业相机市场规模将超过70亿元,2024-2028年复合增长率超过14%。

国产化进程加速,国产品牌主导地位初步形成。全球2D工业相机行业由国外知名企业如德国Basler、加拿大DALSA、美国康耐视等主导。我国对于工业相机的研究起步较晚,最初主要由大恒图像等几家老牌相机公司代理国外品牌。近些年我国也逐步发展出一批自主研发工业相机的国产品牌,如大恒图像、海康机器人、华睿科技和维视图像等。目前我国工业相机行业主要布局于中低端市场,逐步实现进口替代;而在高分辨率、高速的高端工业相机领域仍以进口品牌为主。据GGII数据,从市场竞争格局看,2023年海康机器人、华睿科技两家头部企业出货量合计占比超过60%,我国2D工业相机市场的国产化进程将持续深入。

我国3D工业相机发展迅速,成长空间广阔。据GGII数据显示,2023年我国3D工业相机市场规模23.62亿元,同比增长28.35%。从整体来看,虽然市场增速出现下滑,但3D视觉确定性趋势已形成,据GGII预计,2024年3D工业相机市场仍将延续增长态势,2028年市场规模将接近80亿元,2024-2028年复合增长率约29%。整体来看,目前我国3D工业相机市场仍处于早期市场发展阶段,市场竞争激烈,尚未出现明显市场格局。

从硬件构成来看,工业相机主要由图像传感器、驱动器、时序发生器以及传输接口组成。

图像传感器按照半导体感光元器件类型的差异主要分为两大类:CCD和CMOS。CCD(charge coupled device)和CMOS(complementary metal oxide semiconductor)都基于光电效应将光信号转换为电信号。CCD是电荷耦合器件的简称,在感光像点接受光照之后,感光元件产生对应的电流,电流大小与光强对应,因此感光元件直接输出的电信号是模拟的。CMOS是互补金属氧化物半导体的简称,CMOS传感器中每一个感光元件都直接整合了放大器和模数转换逻辑,当感光二极管接受光照、产生模拟的电信号之后,电信号首先被该感光元件中的放大器放大,然后直接转换成对应的数字信号。

CCD和CMOS有各自的优缺点,根据其特点应用于不同的场合。随着CMOS传感器在消费电子设备上的大量应用推动了CMOS技术的发展,其性能已显著提高,而制造成本大幅下降。CMOS传感器的分辨率和图像质量正在逼近CCD传感器。凭借高速度(帧速率)、高分辨率(像素数)、低功耗以及最新改良的噪声指数、量子效率及色彩观念等各方面优势,CMOS芯片逐渐在CCD芯片主导的领域里占据了一席之地,在工业图像处理的众多领域正逐步取代CCD传感器。

据中商产业研究院数据,2023年索尼占据全球CIS市场最高份额,达到42%;三星位居第二,市场份额19%;中国厂商豪威科技(韦尔股份)市场份额11%,居于第三;出货前三企业市场份额合计超过70%。中国厂商正加速突破,除了豪威科技,格科微和思特微在全球CIS市场份额都已进入前十,其份额分别为4%和2%,中国本土厂商占有全球CIS市场份额超过17%。

图像采集卡是构建完整的机器视觉系统的一个重要部件,其功能是建立和前端相机中的连接,管理相机控制信号,从相机中获取数据,并将其转换成计算机能处理的信息。

图像采集卡与工业相机在数量、帧率、接口等方面均需要匹配。从工业相机和图像采集卡的数量配套关系来看,通常情况下,1张图像采集卡适配1台工业相机,但也存在1张图像采集卡适配2台及以上工业相机的情形。从帧率匹配关系来看,由于图像采集卡的每一个通道都有吞吐量限制,因此单通道和多通道对相机最高率的支持是不同的。从接口匹配来看,不同类型的图像采集卡适配于不同接口类型的工业相机。目前机器视觉系统中较常见的包括CameraLink、CoaXPress、GigE、USB3.0接口,其中Camera Link特点为高速率、高可靠性、实时性强,CoaXPress特点为高速率、吞吐量大、传输距离长,而GigE和USB3.0一般为中小幅面相机设计采用。埃科光电产品涵盖基于PCIe接口的Camera Link、CoaXPress和10GigE Vision三大类图像采集卡。

高速图像采集卡依赖进口。在机器视觉产业联盟统计的2021年中国机器视觉行业销售额排名前九的企业中,仅有四家主营产品涉及图像采集卡,分别为凌云光技术股份有限公司、中国大恒集团有限公司北京图像视觉技术分公司、宝视纳视觉技术(北京)有限公司及埃科光电;同时,凌云光尚未批量自产图像采集卡,中国大恒集团有限公司北京图像视觉技术分公司主要以代理其他品牌为主,宝视纳视觉技术(北京)有限公司为德国Basler在中国的资子公司。另外,据埃科光电招股说明书可知,我国机器视觉设备厂商使用的高速图像采集卡主要依赖进口,国产化率很低。

镜头是机器视觉图像采集部分重要的成像部件。镜头的主要作用是将目标成像在图像传感器的光敏面上,分辨率、对比度、景深以及像差等指标对成像质量具有关键性影响。在机器视觉系统中,镜头的主要功能是将成像目标对准图像传感器的光敏表面。机器视觉系统处理的所有图像信息均通过镜头得到,镜头的质量直接影响到视觉系统的整体性能。按功能分类,镜头可分为定焦镜头、变焦镜头、变光圈镜头;按视角可分为普通镜头、广角镜头和远摄镜头;其他特殊用途的镜头有远心镜头、显微镜头、微距镜头、紫外镜头和红外镜头等。

2023年我国光学镜头市场规模达161.3亿元。随着光电子技术快速发展,作为光电子领域重要信息输入端口的光学镜头应用范围也从最初的光学显微镜、望远镜、胶片相机等领域不断向安防视频监控、数码相机、摄像机、智能手机等领域渗透。随着移动互联网、物联网、人工智能等技术快速发展,光学镜头的应用领域进一步拓宽,智能驾驶、智能家居、全景/运动相机、VR/AR设备、无人机、3DSensing、机器视觉等新兴领域层出不穷,为光学镜头及摄像模组行业的持续发展注入了新的动力。据中商产业研究院,2023年中国光学镜头市场规模达到161.3亿元,较上年增长3.9%;2024年中国光学镜头市场规模将达到173.90亿元。

国内优质厂商从中低端市场开始布局、逐步向高端产品拓展,实现国产替代,未来将迎来高速发展。海外机器视觉工业镜头细分领域发展较早,德国、日本品牌占据着全球主要市场份额。国内厂商在工业镜头领域目前体量较小,但许多企业依托高性价比优势布局中低端市场,且发展迅速,如东莞普密斯。同时,也有以深圳东正光学、江苏慕藤光为主的部分企业通过整合制造设备和多种技术平台,已经能够提供全系列工业镜头,进军高端产品领域。

光源对于机器视觉中的图像采集部分具有重要影响,为后续图像识别与分析奠定必要的基础。光源是影响成像质量的重要因素,它的作用是突出物体的特点,抑制不相关特征,提高被探测区域和未探测区域的反差,并保证光源有足够的亮度和稳定性,从而保证图像的成像质量。由于光源种类繁多,为了获得最佳的使用效果,需要根据实际情况选择适当光源。在选择光源时,选择不同的光源以达到反射的目的,并吸收不必要的光。

奥普特是国内光源环节最具竞争力的公司之一。机器视觉光源在照度、均匀性和稳定性三个核心指标上有较高的要求,按照类别区分,光源可分为LED光源、卤素灯以及高频荧光灯;按照形状区分,光源也可分为环形、条形、平面、线等形状。全球的视觉照明市场早期由海外企业占据大部分市场,如日本的CCS、美国的AI。近年来中国厂家逐步崛起,出现了奥普特、沃德普、锐视光电、纬朗光电等专业的机器视觉光源制造商,其技术足以与国际厂商竞争。从市场竞争梯队来看,以代表企业占据全球市场份额为依据进行分类,第一梯队主要为市场份额大于5%的企业,其中以日本CCS为代表,其全球市场份额达到10%以上;随着中国市场在全球市场占比的不断提升,中国龙头企业奥普特也位于全球市场第一梯队。第二梯队的代表企业主要包括美国AI、中国锐视光电、中国康视达、中国嘉励等企业,其市场份额位于1%-5%之间。第三梯队主要为机器视觉光源业务占比较小或企业整体市场规模较小的企业,以日本Moritex、中国沃德普和中国纬朗光电等企业为代表,机器视觉光源市场规模不足1%。

机器视觉系统的视觉处理使用算法来分析传感器产生的数字图像。视觉处理涉及一系列步骤,在外部(通过计算机)或在内部(对于独立机器视觉系统)执行。首先,数字图像从图像传感器中提取出来并传送到计算机。接下来,通过突出图像上的必要特征来准备用于分析的数字图像。然后分析图像以定位需要观察和测量的特定特征。完成对特征的观察和测量后,会将它们与定义和预编程的规范和标准进行比较。最后,做出决定,并传达结果。具体说,机器视觉软件类似人的“大脑”,通过图像处理算法完成对目标物的识别、定位、测量、检测等功能。机器视觉软件分为底层算法和二次开发的软件包两类。前者是包含大量处理算法的工具库,用以开发特定应用,主要使用者为集成商与设备商。后者是封装好的、用以实现某些功能的应用软件,主要供最终用户使用。

机器视觉软件以自主研发或开源平台的二次开发为主。据GGII数据显示,2023年我国机器视觉软件品牌销售规模22.05亿元,同比增长5.25%;预计至2028年,该市场规模将超过40亿元,同时品牌销售的占比有望超过45%。从竞争格局看,MVTec的Halcon和海康机器人的VisionMaster占据前两位,康耐视的VisionPro位居第三。从整体来看,由于中国市场大部分视觉应用厂商都是基于自主研发软件或开源平台的二次开发为主,因此目前真正对外采购品牌软件的占比相对较小。

3D视觉成像方案是在2D相机基础上进行的结构及软件重构,相机多作为零部件进行外购。3D视觉通常由红外光发射器发射红外光到物体表面,红外光传感器采集物体的深度图像(Z轴信息),可见光传感器采集物体平面图像(X、Y轴信息),经过图像处理芯片得到三维位置信息。红外摄像头需要特制的窄带滤色片,结构光方案还需要在发射端添加光学棱镜与光栅,双目立体成像多一颗红外光摄像头。

在3D相机中,光源是红外激光发射器,其发射图像的质量对整个识别效果至关重要,VCSEL是近红外光源最佳方案。红外线的主要波长是700nm~2500nm。目前的摄像头图像传感器对900nm以上的红外光感应差,需要更强的光才能感测到,这就要求红外发射器有更大的电流,更多的功耗。而800nm以下的波长,太靠近可见光,极其容易受到太阳光的干扰,所以一般红外的波长选择在800nm~900nm。可以提供800-1000nm波段的近红外光源主要有三种:红外LED、红外LD-EEL(边发射激光二极管)和VCSEL(垂直腔面发射激光器)。早期3D传感系统一般都使用LED作为红外光源,但由于LED不具有谐振器,导致光束更加发散,在耦合性方面也不如VCSEL,因此演变成了从LED向VCSEL的转变。

VCSEL厂商布局众多。全球主要的VCSEL供应商包括Finsar、Lumentum、Princeton Optronics、ⅡⅥ、ams和Osram等,它们在移动端VCSEL处于前沿的研发角色。国内厂商:武汉光迅、山东太平洋、深圳源国、国星光电、华工科技、光迅科技、三安光电、乾照光电、华灿光电以及睿熙科技等具备中低端VCSEL的设计和生产能力,长春光机所在VCSEL技术研发方面有一定竞争力。结构光需要采用pattern图像进行空间标识,因此需要定制DOE衍射光学元件(苹果、奇景光电、福晶科技、驭光科技等)和WLO晶圆级光学原件(AMS、奇景光电、采钰、晶方科技等)。

红外传感器是距离传感器的高配版,主要由AMS/Heptagon和意法半导体两大厂商主导。Heptagon一直致力于小型化TOF传感器开发,2016年被AMS收购。TI和infineon也在这一领域有所布局。

红外光摄像头主要包括:光学镜头、红外窄带干涉滤色片、红外CMOS传感器。以手机摄像头成本构成做参考,CIS是价值量占比最大的部分,模组封装占比20%,光学镜头占比19%。

红外摄像头对光学镜头的要求不如可见光摄像头的要求高,对光线的通光量、畸变矫正等指标容忍度高,多采用成熟的普通镜头。可见光摄像头,采用普通镜头模组,用于2D彩色图片拍摄。厂商主要有德国施耐德、卡尔蔡司、美国Navitar、日本KOWA、CBCComputar、Moritex、意大利Opto等,基本垄断国内高端市场领域。

滤光片在近红外识别系统中以窄带滤光片为主。对于3D视觉而言,IR红外摄像头与RGB可见光摄像头在滤色片方面存在较大的差异。传统的RGB可见光摄像头,需要采用高通红外滤色片,将不必要的低频近红外光过滤掉,以免红外光线对可见光部分造成影响,产生伪色或波纹,同时可以提高有效分辨率和彩色还原性。但是红外摄像头,为了不受到环境光线的干扰,需要使用窄带滤色片,只允许特定波段的近红外光通过,目前近红外窄带滤色片主要采用干涉原理,需要几十层光学镀膜构成,相比于RGB吸收型滤色片具有更高的技术难度和产品价格。全球范围内窄带滤光片主要厂商包括美国的Viavi、水晶光电。其他厂商还有布勒莱宝光学(Buhler)、美题隆精密光学(Materion)、波长科技(Wavelength)等。

05机器视觉产品价格水平

机器视觉产品按照下游应用场景的性能要求,可以大致分为消费级和工业级两类。工业级机器视觉对于技术、精度、稳定性等的要求相对更高,而且取决于应用场景及需求不同,整体定制化程度较高,主要通过国外品牌采购上游核心零部件,因此整体成本较高。消费级视觉方案对于精度的要求相对较低,市场参与者更多竞争更为激烈,故而对于成本控制的需求更为严苛。

工业级机器视觉产品的价格水平来看:以主营工业相机的埃科光电为例,根据其招股书中的信息,其上游零部件如图像传感器、处理器等,主要使用国外知名品牌如Sony(索尼)、AMS(艾迈斯)、ON(安森美)、Altera(阿特拉)、Xilinx(赛灵思)等,图像传感器均价近3000元,处理器均价约550元。埃科光电的主营产品工业线/面扫描相机平均单价为6626.54、36695.15元。

消费级3D视觉方案产品的价格水平来看:以供货给优必选的奥比中光为例,根据其招股书中的信息,感光芯片供应商有索尼、三星、韦尔股份、思特威等;滤光片供应商有Viavi、五方光电等,光学镜头供应商有大立光、玉晶光电、新旭光学等;激光发射器供应商有Lumentum、菲尼萨(Finisar)、艾迈斯半导体(AMS)等,衍射光学元件供应商有CDA、AMS、驭光科技等。

现阶段人形机器人进入规模量产阶段,对视觉方案的需求更关注于产能供应和成本控制两方面,推测消费级3D视觉产品有望成为需求主流。但随着未来人形机器人应用场景的复杂化及多元化之后,也不排除需求工业级机器视觉产品的可能性。

随着工业自动化技术的不断发展,机器视觉在工业领域的应用越来越多,市场规模不断扩大。据Marketsand Markets及中商产业,2022年全球机器视觉市场规模约为879.17亿元,同比增长9.35%。GGII预计至2025年该市场规模将超过1200亿元,2022-2025年CAGR为13.22%,增长稳健。全球机器视觉市场的高端市场主要被美、德、日品牌占据,以美国康耐视(Cognex)、德国巴斯勒(Basler)、日本基恩士(Keyence)和欧姆龙(Omron)等为主。其中康耐视和基恩士作为全球机器视觉行业的两大巨头,垄断了超过50%的全球市场份额,2023财年,康耐视和基恩士的营收分别为8.38亿美元和61.67亿美元,市场份额分别为6%左右和48%左右。

随着全球制造中心向中国转移,中国已成为国际机器视觉厂商的重要目标市场。2021年,国内3C电子、新能源、快递物流等行业的蓬勃发展拉动了相关企业的扩产需求,机器视觉需求增长明显。GGII数据显示,2021年中国机器视觉市场规模138.16亿元(该数据未包含自动化集成设备规模),同比增长46.79%。其中,2D视觉市场规模约为126.65亿元,3D视觉市场约为11.51亿元。2022年受宏观环境影响增速略有降低,但仍保持23.51%的同比增长,约为170.65亿元。根据GGII预测,至2027年我国机器视觉市场规模将达到565.65亿元。

机器视觉下游应用广泛。随着国内机器视觉技术与产品的不断完善,机器视觉技术已经在消费电子、汽车、锂电池、半导体、医药行业、食品包装等领域,实现了较为广泛的应用。中国机器视觉细分应用市场中,3C电子占比25%,位列第一;其次是汽车、锂电池和半导体,占比依次为10.9%、10.3%、10%;医药、食品包装和物流仓储占比分别为8.2%、5.8%、5.1%。

我国机器视觉市场规模将持续高增。随着机器视觉硬件方案的不断成熟和运算能力的提升,以及软件在各种应用解决方案、3D算法、深度学习能力的不断完善,机器视觉在电子产业(如PCB、FPC、面板、半导体等领域)应用的广度和深度都在提高,并加快向新能源锂电、光伏等其他领域渗透,在AI、自动驾驶、人脸识别等新兴技术兴起的带动下,我国机器视觉市场规模将继续保持较高的增速。据GGII数据统计,2022年中国3C电子、半导体、新能源锂电、汽车、医药医疗、快递物流行业的机器视觉市场规模分别为42.74/17.15/17.50/18.59/13.97/8.63亿元,分别同比增长5.22%/30.32%/53.64%/30.82%/34.84%/14.91%,预计2027年将超70/70/75/(达到近)60/38/20亿元,整体呈稳定上升态势,机器视觉需求增长明显。

近年来我国机器视觉企业的竞争力持续提升,以海康机器人、奥普特、凌云光等为代表的本土企业已掌握核心部件技术及独立软件算法能力。GGII统计显示,伴随中国机器视觉技术升级迭代,中国本土品牌市场规模占比逐年上升,于2020年达到51%,首次超过海外品牌,并保持逐年增长。伴随着中国制造业的蓬勃发展,机器视觉产业在中国也已进入快速成长期,具体表现为市场容量快速增长、应用领域逐渐扩大,企业数量也快速增加。随着国产品牌在自动化领域的深耕,机器视觉领域中,国产工业机器视觉企业有望凭借优质的产品设计、工艺水平和质量控制经验,逐渐实现进口替代,成为工业智能化改造的首选,市场空间广阔。

07人形机器人主要视觉方案

在视觉方案上,每家人形机器人主机厂选择的方案有所差异,整体来看算法基础强的厂商会采用更为简单的传感器方案,而算法相对薄弱的厂商会选择更为核心的传感器,随着未来人形机器人出货量的增长,技术的迭代升级,未来视觉方案也将会逐步优化定型。下面主要对核心厂商人形机器人视觉方案进行梳理:

特斯拉Optimus的纯视觉传感器方案的实现,离不开多任务学习HydraNets神经网络架构。特斯拉Optimus搭载了与特斯拉车辆相同的FSD技术以及Autopilot相关神经网络技术,其大脑使用的是自研的AI训练Dojo D1芯片和超级计算机Dojo。特斯拉FSD系统已可以实现每1.5毫秒2500次搜索的超高效率,预测可能出现的各种情况,并在其中找到最安全、最舒适、最快速的自动驾驶路径。在经过完全自动驾驶能力系统的实际应用验证后,特斯拉强大的FSD计算机视觉技术已可直接应用于机器人。

小米CyberOne的Mi-Sense视觉系统采用iToF+RGB方案。iToF无法获取物体的颜色纹理信息,RGB相机可获取物体丰富的颜色纹理信息,将RGB与iToF相结合既能得到物体的深度信息,又可获取物体的颜色纹理信息,这可大大拓展其应用领域。RGB信息可用于物体检测识别,深度信息可用于建图避障等,RGB+iToF在诸多领域可实现1+1>2的作用。

优必选WALKERX的视觉模块创新升级四目系统及双RGBD传感器,采用胸部四目视觉,头部+腰部双RGBD,以及腰部4*毫米波雷达避障。SLAM视觉导航自主路径规划:基于多目视觉传感器的三维立体视觉定位采用Coarse-to-fine的多层规划算法,第一视角实景AR导航交互及2.5D立体避障技术实现动态场景下全局最优路径自主导航。实现定位精度10cm,导航精度20cm,精定位精度1cm。基于深度学习的物体检测与识别算法、人脸识别算法和跨风格人脸数据生成技术,可在复杂环境中识别人脸、手势、物体等信息,丰富准确地理解和感知外部环境。

人形机器人视觉方案目前主要以结构光、双目或多目RGB、TOF等的组合方案为主。国外大厂已经较早的布局和应用,国内市场还在逐步打开市场空间。

08相关公司1、奥比中光

奥比中光专注于3D视觉感知技术,其应用领域广泛,包括生物识别、AIoT、工业、消费电子和汽车等。奥比中光在硬件开发上与科技巨头英伟达和微软联手,成功打造并推出了3D iToF相机FemtoMega,产品已面向全球市场,标志着公司在全球3D传感技术领域迈出了重要一步。同时,公司在构建生态系统方面也取得了显著进展,与NVIDIA Omniverse建立了深度合作关系,共同研发了3D开发套件PerseeN1。这一合作使得奥比中光的多款3D相机得以无缝集成至英伟达的机器人仿真开发平台,为开发者提供了更为广阔的应用场景和开发可能性;在与微软的合作框架下,双方共同研发的Femto系列iToF相机已经推出了三款不同型号的产品。这些产品的推出,极大地促进了全球开发者利用奥比中光的3D相机技术,在微软Azure云计算平台上进行创新,开发出多样化的3D视觉深度感知应用。这些应用覆盖了从工业自动化到消费电子产品的广泛领域,为用户带来了更加丰富和高效的技术解决方案。

目前,奥比中光已与多家机器人客户如优必选、斯坦德、云迹科技、高仙机器人等建立了业务合作关系,根据GGII数据,其在国内服务机器人视觉传感器市场的占有率超70%;奥比中光与合作伙伴共同投资建立了深圳国创具身智能机器人有限公司;利用AI大模型技术+Gemini2系列深度相机,奥比中光成功打造了能够理解和执行语音任务的机械臂1.0,实现了多模态大模型在机械臂上的应用部署,并初步完成了大模型与硬件终端的适配结合。

2024年2月24日,英伟达宣布成立GEAR项目,将机器人技术带入现实世界,其愿景是在未来所有可移动的机器都将实现自主化,机器人和模拟智能体将如同智能手机一般普及。奥比中光作为英伟达机器人业务的关键合作伙伴,通过与行业巨头的紧密合作和在视觉算力领域的战略布局,预计将在机器人技术快速发展的年份中获得显著利益。

2、奥普特

奥普特是我国国内较早进入机器视觉领域的企业之一。在成立之初,以机器视觉核心部件中的光源产品为突破口,奥普特进入了当时主要为国际品牌所垄断的机器视觉市场。在十几年的发展过程中,公司坚持“深耕优势、以点带面、以面促点、逐个突破”的发展路径,将产品线逐步拓展至其他机器视觉部件。奥普特拥有完整的机器视觉核心软硬件产品,自主产品线已全面覆盖视觉算法库、智能视觉平台、深度学习(工业AI)、光源、光源控制器、工业镜头、工业相机、智能读码器、3D传感器、一键测量传感器、工业传感器产品。同时,奥普特以核心光学技术为基础,加大在先进工业传感器领域的研发投入,持续推出多品类工业传感器;结合资本优势,在运动产品领域进行布局,拟并购成熟协同企业,拓展产品线。以此为基础,公司能够向下游客户提供各种视觉、传感器及运动部件等自动化核心产品及解决方案,提升客户粘性及公司竞争力。当前公司产品和解决方案目前已全面应用于20多个国家和地区,并在全球范围内设立超过30个服务网点,服务超过15000家客户。

奥普特营收近期承压,未来增长可期。2017-2022年,奥普特营收从3.03亿元增长至11.41亿元,CAGR为30.4%;归母净利润从0.76亿元快速增长至3.25亿元,CAGR为33.8%。2023年公司营收9.44亿元,同比下滑17.27%,归母净利1.94亿元,同比下滑40.37%;2024Q1-Q3营收7.33亿元,同比下滑13.32%,归母净利1.32亿元,同比下滑35.58%,系下游主要行业产线投入需求放缓,而公司为未来发展持续投入的费用维持高位。未来随着下游行业的需求好转,公司业绩有望受益。

3、凌云光

凌云光深耕机器视觉二十余年,是行业领先的可配置视觉系统、智能视觉装备和核心视觉器件的产品与解决方案提供商,聚焦机器视觉主营业务方向,以“AI+视觉”技术创新为基础,致力于成为视觉人工智能与光电信息领域的全球领导者。面向消费电子、新能源、印刷包装、新型显示等领域,为客户提供智能制造与质量检测的多元化产品与解决方案,通过产品持续创新助力行业智能制造的转型升级;面向传媒、影视、游戏、动漫、直播等领域,提供运动捕捉、数字建模等内容制作工具及AIGC智能内容创作服务。

公司坚持以客户为中心,以推动行业发展为己任,积极把握人工智能时代的战略机遇,基于“光、机、电、算、软”底层通用技术形成四大技术平台,为客户提供差异化、高质量、高性价比的多元化产品和解决方案。经过二十余年的行业深耕,积累了苹果、富士康、华为、小米、宁德时代、京东方、央视总台、咪咕等各行业的龙头客户。凌云光将利用在机器视觉行业形成的先发优势,继续夯实底层技术,积极开拓新的应用领域。

凌云光营收整体增长稳健,24Q1-Q3有所下滑。2018-2022年,凌云光营收从14.06亿元增长至27.49亿元,CAGR为18.25%;归母净利润从0.55亿元快速增长至1.88亿元,CAGR为35.97%。2023年公司营收26.41亿元,同比下滑3.92%,但机器视觉收入同比增长2.96%,机器视觉营收占比由66.42%提升至71.18%,业务结构持续优化;归母净利1.64亿元,同比下滑12.59%,主要受研发投入力度加大、境外市场开拓、汇率波动等因素影响。2024Q1-Q3营收15.84亿元,同比下滑17.70%,归母净利1.12亿元,同比下滑18.74%。

4、天准科技

天准科技致力于以领先技术推动工业数字化智能化发展,致力打造卓越视觉装备平台企业,主要产品包括视觉测量装备、视觉检测装备、视觉制程装备和智能驾驶方案等。天准面向精密制造领域,提供视觉测量、检测、制程等高端装备产品,促进制造业向更高效率、更高质量和更高智能化发展。同时在智能驾驶领域,提供域控制器、边缘计算产品与解决方案,推动行业进步,改善人们的生活。经过十多年的深耕与积累,天准累计服务了全球5000余家中高端工业客户。

天准科技营收整体增长稳健,24Q1-Q3略有下滑。2017-2023年,天准科技营收从3.19亿元增长至16.48亿元,CAGR为31.48%;归母净利润从0.52亿元快速增长至2.15亿元,CAGR为26.69%。2024Q1-Q3营收8.51亿元,同比下滑3.15%,归母净利-0.14亿元,同比下滑133.29%,主要受光伏、电子行业客户验收延缓影响,同时期间费用同比增长所致。

5、海康机器人

海康机器人是面向全球的机器视觉和移动机器人产品及解决方案提供商,业务聚焦于工业物联网、智慧物流和智能制造,主要依托公司在相关领域的技术积累,从事机器视觉和移动机器人的硬件产品和软件平台的设计、研发、生产、销售和增值服务。

机器视觉方面,公司持续丰富和优化产品,逐渐从标准工业相机到智能相机,从硬件产品到软件平台,从2D视觉拓展至3D视觉,现已形成软硬件结合、覆盖机器视觉全产品线的布局,在整个行业内占据领先优势。当前公司机器视觉有三大硬件产品线:2D视觉产品线、智能ID产品线和3D视觉产品线;软件方面以VM算法软件平台为核心,同时正在开发3D视觉应用平台,培养国产视觉应用生态。

2019-2022年,公司收入和净利润增长迅速,移动机器人业务占比提升。2019-2022年,公司收入分别为9.41/15.25/27.68/39.42亿元,2020-2022年同比增长61.97%/81.53%/42.43%;2019-2022年,归母净利润分别为0.45/0.65/4.82/6.40亿元,2020-2022年同比增长43.14%/640.71%/32.82%。

从业务结构上看,公司两大主营业务的合计收入占比基本在总收入的90%以上。其中,机器视觉业务是公司最主要的收入来源,2020-2022年收入占比稳定在50%上下。2020年开始,移动机器人业务的收入占比持续提升,已从30%提升到2022年的39%,成为第二大收入来源。

09参考研报

1.中邮证券-机械设备行业深度报告:视觉传感器~人形机器人视觉感知交互硬件

2. 国元证券-机器视觉行业深度报告:机器视觉,智能制造之眼

3. 华安证券-机械行业产业链梳理概况:人形机器人风起云涌

4. 浙商证券-电子行业专题报告:人形机器人专题,视觉传感器

5. 国泰君安-机器人产业深度(四):机器人的眼睛,3D工业视觉

6. 国金证券-24年人形机器人行业策略报告:以T链为锚,寻找短板和高壁垒赛道

7. 德邦证券-电子行业:机器视觉行业长坡厚雪,消费电子有望驱动新一轮需求周期

8. 上海证券-埃科光电-688610-公司深度:机器视觉迎来需求成长及国产替代浪潮,上游高端核心部件领航者充分受益

9. 申万宏源-奥比中光-688322-深耕立体视觉感知,AI时代“机器之眼”(申万机器人系列报告9视觉篇)

来源:传感器专家网一点号

相关推荐