本发明涉及高速通信链路分析领域,特别涉及一种基于transformer解码器的高速通信链路发送器建模方法。
背景技术:
1、随着人工智能(ai)、5g移动网络和汽车技术等新兴数据驱动应用对先进计算能力需求的增加,对高能效和高性能系统的需求也在不断提高。近年来,随着硅制造成本上升与片上集成密度受到限制,基于芯粒的高密度异构集成(hdhi)技术应运而生,并在各种应用中日益普及。
2、高速串行链路是实现低延迟通信、快速数据传输和有效数据处理的关键部分,通常具有高度密集的信号路径,并且具有很高的工作频率和数据速率,最高可达每秒千兆位(gbps),以满足高带宽和高效通信需求。发送器(tx)是高速链路中最关键和资源密集的组件之一,其性能直接影响初始传输信号的质量和整体链路完整性。发送器输出信号的劣化会导致最终接收器处的信号显著失真,导致传输信号的错误恢复。此外,发送器还必须符合诸如转换速率、信号摆幅和均衡等设计指标。
3、现有技术在高速链路中对发送器的建模存在若干不足,主要包括以下几点:1、高速发送器具有强非线性行为,并且由于寄生效应的影响,信号幅度或有效频谱受到显著影响,现有模型如一些深度学习模型如循环神经网络(rnn)、长短期记忆网络(lstm)不能准确捕捉高频下发送器的强非线性特性。2、发送器具有非线性和“记忆”效应,单个比特可以影响后续多个比特。多比特效应无法简单地通过单比特脉冲响应或边缘响应来表述,而是需要直接预测发送器的多比特响应输出序列。
4、基于上述问题,为了对高速通信链路中的发送器电路进行高效建模,提出了一种基于transformer解码器的高速通信链路发送器建模方法。
技术实现思路
1、本发明针对现有技术的不足,提出了一种基于transformer解码器的高速通信链路发送器建模方法,能够高效捕捉非线性发送器电路输出信号内部的长期序列依赖性,实现对高速数据率信号的准确预测。
2、本发明的目的是通过以下技术方案来实现的:
3、一种基于transformer解码器的高速通信链路发送器建模方法,该方法包括以下步骤:
4、步骤1,通过电路仿真采集训练数据:在电路仿真软件中,对发送器电路输入不同信号,采集发送器电路输出信号作为训练数据;
5、步骤2,构建基于transformer解码器的深度学习模型:建立一个采用编码器-解码器架构的深度学习模型,包括一个非序列编码器和一个transformer序列解码器;
6、步骤3,使用随机掩码方式训练,以增强预测掩码位置元素的能力:设定输入信号长度固定,输出序列长度预设为n,不随输入变化;
7、步骤4,使用非自回归解码与滤波的推理:对深度学习模型输入信号参数,通过非自回归解码与滤波预测输出信号。
8、进一步地,所述步骤1具体包括:
9、步骤1.1,输入信号参数化:由“0”和“1”构成的序列的输入信号xs以梯形波方式在链路中进行传输,传输波形使用输入序列xs、最高电平电压vh、信号周期tp以及上升/下降时间相对信号周期占比rrf描述;
10、步骤1.2,获取发送器仿真输出信号:将不同参数下的输入信号序列输入发送器,通过电路仿真软件采集发送端输出信号序列;
11、步骤1.3,将连续输出电压信号序列转化为离散的电压类别序列:将整个输出信号电压范围按步长δv划分为若干电压类别,构建一个字典以将电压值映射到其最近的类别。
12、进一步地,所述步骤1.3的具体包括:
13、步骤1.3.1,对于输出信号,定义其电压范围为[vmin,vmax],根据步长δv划分电压范围,生成一系列离散电压类别,即可构建字典d:
14、
15、电压值vk对应第k+1个类别classk+1,其中第0个类别class0被分配给d中的一个特殊的<mask>元素,代表掩码;
16、步骤1.3.2,映射电压值到电压类别:将每个电压值映射到其最近的电压值vk,再利用字典d映射到类别classk+1,以此把连续的电压信号序列转化为离散的电压类别序列,这些离散类别随后用作模型训练的目标。
17、进一步地,所述非序列编码器用于处理无序的非序列输入,生成上下文向量,传入transformer解码器中,非序列编码器对各输入特征编码方式具体如下:
18、步骤2.1.1,对标量特征vh、tp、rrf的标准化和编码:标量特征vh、tp、rrf首先进行标准化处理,通过从各自的均值中减去并除以其标准差,以此来降低尺度差异并提高模型的收敛速度;标准化后的特征通过多层感知器转换成dmodel维度的向量,dmodel为编码向量的维度,与transformer序列解码器的模型维度相同;每种特征都通过一个具有相同结构但不同参数的多层感知器进行处理,其中每个多层感知器包括两个隐藏层,每层含有16个神经元,使用relu函数作为激活函数,而输出层则采用线性激活函数;
19、步骤2.1.2,输出信号序列编码:传输信号具有2个电平分别代表“0”和“1”,共有2种类型的有方向性电平转换:从“0”到“1”和从“1”到“0”;首先遍历长度为m的输入序列xs,在位置i+1处标记上升边缘(当xi=“0”,xi+1=“1”时),或者在位置i处标记下降边缘(当xi=“1”,xi+1=“0”时),其中i=0,…,m-2;由于信号在传输前后均处于低电平,对于非零的起始位x0=“1”,在位置1处标记一个上升边缘edge0→1;对于非零的结尾位xm-1=“1”,在位置m处标记一个下降边缘edge1→0;0代表无效位置;每类转换在序列中的出现次数不超过m',其中如果m是偶数,m'定义为m/2,如果m是奇数,m'定义为(m+1)/2;为了保持序列长度的一致性,使用0进行填充;按此方法,输入序列xs转换成m'个离散的位置索引,这些索引随后通过两个(m+1)×2m维的嵌入矩阵转化为一系列的2m维连续向量;根据不同的转换类型,这些位置索引的向量通过其对应的2m维多层感知器进行处理;每个mlp配置两层隐藏层,每层含16个神经元,并采用relu函数作为激活函数,输出层则使用线性函数;通过堆叠mlp后输出包括2×m'个向量,每个向量的维度都是dmodel;
20、步骤2.1.3,将编码后的特征向量整合为一个无序的向量组xe,其总长度为3+2*m';这组向量随后被送入transformer解码器,用于与输出序列的相互作用。
21、进一步地,所述transformer解码器用于结合上下文向量与输出类别序列,对每个序列位置产生类别概率分布,具体包括:
22、步骤2.2.1,输入嵌入与位置编码:对输出信号后的类别序列进行嵌入,转换每个类别到固定维度的向量,并添加位置编码,以维持序列位置信息,位置编码由正弦和余弦函数生成:
23、
24、其中dmodel为嵌入维度,i为嵌入维度索引,pos为在序列中的位置,pe(pos,k)表示对位置pos处的第k个维度索引处的位置编码值,位置pos处的偶数维度索引的编码使用正弦函数计算,奇数维度索引的编码使用余弦函数计算;
25、步骤2.2.2,多头自注意力机制:输入向量x通过线性变换分离出查询向量q、键向量k及值向量v:
26、q=xwq,k=xwk,v=xwv
27、其中wq,wk,wv分别代表查询向量q、键向量k和值向量v的线性变换矩阵,用于将输入向量x分别转化为查询向量q、键向量k和值向量v;
28、计算查询向量q和键向量k的点积,除以缩放因子后用softmax函数求得注意力权重:
29、
30、其中dk代表键向量k的维度,attention(q,k,v)表示注意力函数的输出,查询向量q用来与每一个键向量k的转置kt计算点积并除以缩放因子后,得到的分数用于衡量相应值向量v的重要性,通过softmax函数处理后,这些分数转化为权重,然后这些权重与值向量v相乘,得到加权的输出,即注意力集中后的结果,softmax(*)表示softmax函数;softmax函数σ(z)i定义如下:
31、
32、其中,分母是所有的和,确保所有输出值的总和为1,从而构成概率分布;
33、注意力机制被拆分为多头,独立计算后合并结果:
34、multihead(q,k,v)=concat(head1,…,headh)wo,
35、其中
36、其中表示在第i个头中使用的线性变换矩阵,用于分别将原始查询向量q,键向量k和值向量v转换到该头处理的对应空间;head 1,…,headh表示每一个注意力头的输出,concat(head 1,…,headh)wo表示将所有头的输出向量进行拼接,然后再通过一个线性变换wo合并这些不同头的信息,mltihead(q,k,v)为多头注意力机制的输出;并通过残差连接后进行层归一化;
37、步骤2.2.3,多头交叉注意力:输入向量x和来自编码器的编码向量即上下文向量c通过线性变换分别生成查询向量q、键向量k和值向量v:
38、q=xwqc,k=cwkc,v=cwvc
39、其中wqc,wkc,wvc是交叉注意力中的线性变换矩阵,它们将输入向量x和上下文向量c转化为相应的查询向量q、键向量k和值向量v;
40、计算查询向量q和键向量k的点积,除以缩放因子后,使用softmax函数求得注意力权重:
41、
42、其中dk代表键向量k的维度,attention(q,k,v)表示注意力函数的输出,来自输入向量x的查询向量q用来与每一个由上下文向量c转换来的键向量k的转置kt计算点积,并除以缩放因子后,得到的分数用于衡量相应值向量v的重要性;通过softmax函数处理后,这些分数转化为权重,然后这些权重与值向量v相乘,生成加权的输出,即交叉注意力集中后的结果。
43、交叉注意力同样采用多头机制,独立计算后合并结果::
44、multihead(q,k,v)=concat(head1,…,headh)woc,
45、其中
46、其中每个头表示使用不同的线性变换矩阵将查询向量q,键向量k和值向量v转换到该头处理的对应空间;每个注意力头的输出后通过拼接并经过一个线性变换woc合并,形成最终的交叉注意力输出;最后,输出通过残差连接并进行层归一化处理;
47、步骤2.2.4,逐位前馈网络:独立处理每个位置的向量,通过两层线性变换及relu激活函数:
48、ffn(x)=max(0,xw1+b1)w2+b2
49、其中ffn是一个每个位置独立运行的双层网络结构,它对每个位置的编码向量x首先执行一次线性变换xw1+b1,然后通过relu激活函数max(0,z)引入非线性处理,再进行第二次线性变换max(0,xw1+b1)w2+b2;这里的w1、w2是权重矩阵,而b1、b2是偏置项,所有这些参数都是可学习的;
50、步骤2.2.5,线性输出层:将最终输出通过一个线性层,映射到字典大小的维度上,以获取输出序列中每个位置元素的概率分布。
51、进一步地,所述步骤3中具体训练过程包括:
52、步骤3.1,随机选择掩码元素:从1到n的均匀分布采样掩码元素数量nmask,随机选取nmask个元素标记为ymask,值替换为<mask>,即class0;
53、步骤3.2,输入随机掩码序列:transformer解码器接收含掩码的序列及上下文向量,一次解码生成与掩码序列同长度的输出;
54、步骤3.3,训练目标优化:优化预测与ymask元素间的交叉熵损失:
55、
56、其中yi表示在ymask集合中的一个目标元素,这些元素在训练过程中被选定为掩码,即模型需要预测的部分,x是输入特征,z是未掩码的目标元素,p(yi∣x,z)表示深度学习模型对被掩码标记yi真实类别的概率估计,lce是交叉熵损失函数,计算深度学习模型对于掩码后目标元素的预测概率的负对数作为模型预测值和实际目标值之间的差异,深度学习模型通过随机梯度下降算法优化。
57、进一步地,所述步骤4中推力过程包括:
58、步骤4.1,输入完全掩码序列:在推理初始化阶段,向transformer解码器输入一个完全掩码的序列;
59、步骤4.2,并行预测掩码位置的类别:transformer解码器并行处理,为每个掩码位置预测最可能的类别;
60、步骤4.3,重构输出信号:使用已建立的字典,将预测出的类别转换回对应的电压信号值;
61、步骤4.4,应用滤波处理:使用savitzky-golay滤波器处理解码后的信号序列,平滑波形并纠正潜在错误,确保输出信号的平稳性,得到最终波形。
62、本发明的有益效果是:本发明提供了一种基于transformer解码器的高速通信链路发送器建模方法,提出的深度学习模型能够高效描述发送器在通信链路中的非线性特性,使用非序列编码器编码输入信号参数,使用transformer解码器捕捉输出信号的长序列依赖关系。相比传统的电路仿真软件和长短期记忆网络(lstm),本发明的模型对于发送器电路的分析具有很高的准确度和速度,显著提升了电路设计的效率,能够迅速地进行复杂电路的建模与分析。本发明的方法支持电路设计过程,辅助设计师选择合适的设计参数,确保高速串行链路实现预期性能。
1.一种基于transformer解码器的高速通信链路发送器建模方法,其特征在于,该方法包括以下步骤:
2.根据权利要求1所述的一种基于transformer解码器的高速通信链路发送器建模方法,其特征在于,所述步骤1具体包括:
3.根据权利要求2所述的一种基于transformer解码器的高速通信链路发送器建模方法,其特征在于,所述步骤1.3的具体包括:
4.根据权利要求2所述的一种基于transformer解码器的高速通信链路发送器建模方法,其特征在于,所述非序列编码器用于处理无序的非序列输入,生成上下文向量,传入transformer解码器中,非序列编码器对各输入特征编码方式具体如下:
5.根据权利要求1所述的一种基于transformer解码器的高速通信链路发送器建模方法,其特征在于,所述transformer解码器用于结合上下文向量与输出类别序列,对每个序列位置产生类别概率分布,具体包括:
6.根据权利要求1所述的一种基于transformer解码器的高速通信链路发送器建模方法,其特征在于,所述步骤3中具体训练过程包括:
7.根据权利要求1所述的一种基于transformer解码器的高速通信链路发送器建模方法,其特征在于,所述步骤4中推力过程包括: