本发明涉及计算机视觉,尤其涉及一种量子多框目标检测方法。
背景技术:
1、近年来,量子计算与经典机器学习模型融合的研究日益增多,研究结果显示量子计算与经典机器学习模型的结合具有广阔的前景。基于这一前景,许多量子神经网络(quantum neural networks, qnns)结构相继提出,如量子卷积神经网络(quantumconvolutional neural networks, qcnns)、量子生成对抗网络(quantum generativeadversarial networks, qgans)和量子长短期记忆网络(quantum long short-termmemory networks, qlstms)等。尽管qcnn在处理量子计算任务时展示了显著潜力,但当前的研究主要集中在小规模问题和理论验证上。qcnn与深度学习大模型的结合尚未得到广泛研究。深度学习大模型,如多框目标检测模型,在处理复杂视觉任务时具有强大的能力。如果能够将qcnn与这些大模型有效结合,将有可能显著提升模型的性能和效率。
2、目前,qcnn与深度学习大模型的结合研究仍处于起步阶段,缺乏系统的理论和实践验证。因此,如何有效地将qcnn与深度学习大模型结合,以充分发挥量子计算的优势,成为一个亟待解决的问题。
技术实现思路
1、发明目的:本发明的目的是提供了一种量子多框目标检测方法,通过构建量子经典混合多框目标检测模型进行训练,实现了量子计算与多框目标检测模型的融合。
2、技术方案:本发明所述的一种量子多框目标检测方法,包括以下步骤:
3、(1)获取voc数据集的数据并进行预处理;
4、(2)构建量子经典混合多框目标检测模型即构建改进的多框目标检测300模型:修改多框目标检测模型的第五个额外的特征提取层;
5、(3)对改进的多框目标检测300模型模型进行训练,通过map指标值评估量子经典混合多框目标检测模型性能。
6、进一步的,步骤(1)具体如下:获取训练集共计21503张图片、测试集10991张图片;对训练集数据进行预处理:设置图像尺寸大小为300×300像素、随机对图像的颜色进行调整、随机水平翻转图像以及更新目标框bounding box、对图像进行标准化处理以及将目标物体与默认default box进行匹配;测试集数据预处理:设置图像大小为300×300像素、对图像进行标准化处理。
7、进一步的,步骤(2)具体如下:利用多通道量子卷积神经模块替换多框目标检测模型的卷积层;第五个额外的特征提取层包括:4个卷积模块和1个多通道量子卷积神经模块;其中,每一个卷积块都由一个卷积层、一个bn层、一个sigmoid函数组成。
8、进一步的,多通道量子卷积神经模块由量子卷积层组成; 其中,量子卷积层包括:量子态的初始化、量子比特作用层、数据解码层。
9、进一步的,量子态的初始化具体如下:利用振幅编码的方法将输入数据x编码为有n个量子比特的量子态,其中,,x=;其中,为经典输入数据的元素即图像像素值;i为索引,代表数据的索引位置;n是输入向量的维度,决定了量子态的总数。
10、进一步的,量子比特作用层具体如下:使用n个结构相同的变分量子电路即vqc电路;每个电路负责卷积特征图的一个通道,每一个通道上的数据都是由同一个vqc电路计算得到;其中,通道数由vqc电路的个数决定;vqc电路采用ry、rz门和cnot门的组合作为vqc电路中量子比特之间的纠缠。
11、进一步的,数据解码层用于将测量量子比特的状态并转化为图像的像素值并输出。
12、有益效果:与现有技术相比,本发明具有如下显著优点:通过map对比可以看出,该模型具有明显的性能优势;通过消融实验可以进一步验证量子经典混合多框目标检测模型在减少参数量的同时,依然能够保持甚至提升分类精度;量子计算的引入使得模型在处理数据时能够利用量子叠加和并行计算的优势,大幅降低了计算时间和计算复杂度。
1.一种量子多框目标检测方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种量子多框目标检测方法,其特征在于,步骤(1)具体如下:获取训练集共计21503张图片、测试集10991张图片;对训练集数据进行预处理:设置图像尺寸大小为300×300像素、随机对图像的颜色进行调整、随机水平翻转图像以及更新目标框bounding box、对图像进行标准化处理以及将目标物体与默认default box进行匹配;测试集数据预处理:设置图像大小为300×300像素、对图像进行标准化处理。
3.根据权利要求1所述的一种量子多框目标检测方法,其特征在于,步骤(2)具体如下:利用多通道量子卷积神经模块替换多框目标检测模型的卷积层;第五个额外的特征提取层包括:4个卷积模块和1个多通道量子卷积神经模块;其中,每一个卷积块都由一个卷积层、一个bn层、一个sigmoid函数组成。
4.根据权利要求3所述的一种量子多框目标检测方法,其特征在于,多通道量子卷积神经模块由量子卷积层组成; 其中,量子卷积层包括:量子态的初始化、量子比特作用层、数据解码层。
5.根据权利要求4所述的一种量子多框目标检测方法,其特征在于,量子态的初始化具体如下:利用振幅编码的方法将输入数据x编码为有n个量子比特的量子态,其中,,x=;其中,为经典输入数据的元素即图像像素值;i为索引,代表数据的索引位置;n是输入向量的维度,决定了量子态的总数。
6.根据权利要求4所述的一种量子多框目标检测方法,其特征在于,量子比特作用层具体如下:使用n个结构相同的变分量子电路即vqc电路;每个电路负责卷积特征图的一个通道,每一个通道上的数据都是由同一个vqc电路计算得到;其中,通道数由vqc电路的个数决定;vqc电路采用ry、rz门和cnot门的组合作为vqc电路中量子比特之间的纠缠。
7.根据权利要求4所述的一种量子多框目标检测方法,其特征在于,数据解码层用于将测量量子比特的状态并转化为图像的像素值并输出。