随着大数据技术的快速发展,现实世界中互相联系的事物构成了海量数据,能高效且抽象地表示实体及其间关系的数据结构图在多个领域得到了广泛应用,然而在现实世界中,图结构数据不仅包含丰富的关系信息,也不可避免地受到噪声干扰.图神经网络对对抗性扰动,尤其是针对图结构的拓扑扰动较敏感,易导致模型性能大幅下降.为此,提出一个基于大语言模型的标签引导图表示学习框架(Label⁃Guided Text⁃Attributed Graphs Representation Learning Frame⁃work with Large Language Models,LGFLLM),能够结合不同的图神经网络模型增强其鲁棒性,在受到拓扑扰动的噪声图场景下学习更优的节点表示.具体地,在文本属性图上,通过大语言模型的外部知识库为图中各节点生成预测标签,再结合节点属性识别删除图中的噪声边,并构建辅助边,在噪声场景下获取一个更可靠的图结构;最后,结合表示学习基座模型学习更鲁棒的节点表示.在三个包含文本属性的引文数据集上的实验结果表明,LGFLLM在噪声场景的节点分类任务上,和先进的方法相比,表现更优.
检索增强生成(Retrieval⁃Augmented Generation,RAG)中的查询改写技术在提升知识密集型任务性能方面已取得显著进展,然而,现有方法通常依赖“原始查询→查询改写→检索→答案生成”这一多模块串行流程,各模块独立运行,推理效率有限且缺乏全局优化能力.提出一种强化学习驱动的一体化查询改写框架,将查询改写、检索决策与答案生成统一集成到单一大语言模型中.模型首先生成改写后的查询并触发检索,将检索结果直接融入上下文,然后在同一模型内完成推理与答案生成.这种一体化设计消除了对独立查询改写模块与答案生成模块的依赖,显著提升了推理效率与模型灵活性.为了实现端到端优化,采用强化学习策略,使模型能够在查询改写与推理生成之间建立直接的性能反馈关联,以自主学习最优的检索与生成策略.在开放域问答任务的实验中,在HotpotQA,MuSiQue和2Wiki数据集上,和当前最优基线相比,该框架的精确匹配和大语言模型评测指标分别提升了4.82%和5.00%,11.50%和6.98%以及15.29%和18.44%,验证了该方法在多领域、多任务场景下的有效性与通用性.
针对石油领域传统气量预测模型在捕捉长时间依赖和刻画气井间非线性、多尺度空间交互方面的不足,提出基于预训练机制的时空图气量预测模型.在预训练阶段,通过Transformer模块构建时间序列掩码自编码器,提取油田生产数据的深层时序特征,生成具备全局上下文感知的段级表征,解决传统模型时序特征提取不充分的问题;在预测阶段,依托时空特征融合机制,将上述时序表征与动态图结构学习模块捕获的气井空间依赖相结合,突破传统方法在长期记忆缺失、预定义图结构不完整场景下的性能瓶颈.实验结果显示,模型预测的平均绝对误差降至0.156,和基准模型相比,误差分别降低6.6%,36.3%,26.9%和67.9%,性能显著提升.该成果为石油勘探中的时空数据建模提供了新的深度学习范式,是时空大模型工程化应用的有益探索.
小样本图像分类因标注样本稀缺而具有挑战性,度量学习作为该领域的主流方法,其通常采用欧几里得距离来衡量查询样本与支持样本之间的差异以实现类别判别.然而,欧几里得距离对极端值高度敏感,易导致模型产生误判.提出一种基于布雷柯蒂斯(Bray–Curtis)距离的优化度量方法,以替代传统的欧几里得距离.布雷柯蒂斯距离具有较强的鲁棒性,不易受极端值干扰,但其在小样本度量学习中的原始计算数值范围较窄,使类别间差异难以得到充分表征,制约了模型的分类性能.针对该问题,引入尺度变换因子,对布雷柯蒂斯距离进行数值调整,以提升其在小样本图像分类中的适用性与判别力.基于这一方法,分别在ProtoNet与Meta DeepBDC框架上构建了ProtoNet_Bray与Meta DeepBDC_Bray两种变体网络.通过在MiniImageNet,TieredImageNet和CUB⁃200⁃2011三个数据集上的广泛实验,证明提出的方法能够有效地提高模型性能.
超图神经网络在处理复杂数据结构和捕捉节点之间的高阶关系方面已经取得了显著成果,然而,现实中的超图结构通常是稀疏的,即超边间公共节点较少,使超边之间的关联性较弱,进而限制了超图神经网络的消息传播性能.针对此问题,提出一种稀疏超图结构下的双视图对比学习算法DCSH(Dual⁃View Contrastive Learning under Sparse Hypergraph Structure),利用节点丰富的属性信息构造属性超图,补充结构超图在特征空间中缺失的语义相似性连接;设计了基于注意力机制的结构超图增强方法,改善结构超图的稀疏性;同时,考虑超边与目标节点语义的一致性,提出了基于注意力机制的方法计算超边对节点嵌入的影响力,以得到不同视图下的节点嵌入;最后,通过一种自适应融合机制对多视图节点嵌入进行融合,以发现各视图对最终节点表示的影响力.为了保持不同视图下超图结构的一致性,DCSH采用增强结构超图与原结构超图、属性超图之间的对比损失来优化模型.在八个标准数据集上与九种经典算法的实验对比,证实了提出方法的有效性.
分子属性预测在新药研发和材料设计等诸多科学领域中具有重要作用.由于分子天然可以表示为图结构,许多基于图的模型被广泛应用于该任务.随着分子空间的迅速扩展,基于图的方法正面临巨大的计算挑战,模型轻量化对于提升预测速度和效率至关重要.然而,现有的解决方案仍然较为有限,难以在保持预测性能的同时显著提高推理效率.提出一种新颖的双层模型轻量化方法LW⁃MPP,首先引入一种新的知识蒸馏框架,将大规模基于图的模型转换为更小更高效的基于SMILES的模型;其次,应用一种训练后剪枝技术,结合掩码搜索和重排序方法,进一步优化模型的推理效率.在大规模PCQM4M⁃LSC数据集上的基准测试结果表明,与传统基于图的模型相比,提出的方法实现了3.82~17倍的推理加速,同时保持了接近最优的性能,并优于大多数基于SMILES⁃Transformer的模型.当应用于MoleculeNet中小规模数据集的特定下游任务时,提出的模型在大多数情况下均实现了最佳的预测准确率.
讽刺检测旨在通过挖掘文本中的语义不协调性,以识别其隐含的讽刺意图,现有方法不能充分利用文本中情感词与其描述对象间的句法依赖关系,导致模型较难捕捉文本中的语义不协调线索,降低了整体性能.针对这一问题,提出一种基于双层级句法依赖增强的讽刺检测模型,从词汇级和短语级两个层面强化模型对句法依赖关系的建模能力.首先在词汇级,构建依存句法图与情感图,使用句法路径关联情感词及其描述对象,从全局层面揭示两者之间的句法依赖关系;其次在短语级,识别文本中的名词,并使用动态权重机制构建由名词及其对应情感词组成的短语,从局部层面建模两者之间的依存关系;最后,通过双仿射注意力实现词汇级与短语级信息的深度交互,增强模型对句法依赖关系的整体感知与建模能力.在公开数据集IAC和Twitter上进行了实验,实验结果验证了提出的模型的有效性.
准确预测股票市场中包括股票价格的运行态势对于经济增长和政府宏观管理至关重要,对风险控制与经济管理也有重要意义.针对股票时间序列显著的非平稳性和高噪声特征,且在实际应用中面临获取延迟和数据缺失的问题,提出一种元深度学习混合模型Meta⁃LSTM (Meta⁃Learning⁃Long Short⁃Term Memory),结合元学习框架和目标股票特征,通过从同类股票任务中快速迁移学习经验,提高了模型对目标股票数据的泛化能力,能有效地应对目标股票数据稀缺的问题.此外,通过将预测误差与目标股票特征输入LSTM模型,并结合SE⁃MHA (Squeeze⁃and⁃Excitation Network⁃Multi⁃Head Attention)注意力机制优化模型内部特征权重的动态分配,更精确地捕捉时间序列中的关键模式.基于上海证券交易所的股票数据,与其他模型进行了实验对比,实验结果证明,Meta⁃LSTM模型的稳定性和泛化能力得到了提升,预测准确率提高了5%~16%.
无人蜂群可以形成柔性阵列,实现灵巧的波束形成,但其性能受蜂群节点定位精度的影响较大.传统蜂群阵列位置估计受到GPS定位精度影响,精度通常在0.1~1 m.当阵列校正载波的半波长小于定位误差时,传统阵列误差校正算法会因相位混叠难以实施.当阵列同时存在通信时延误差和相位误差时,阵列误差更加难以校正.为此,提出一种基于双频法的阵列误差联合校正算法.该算法基于双频差异构建等效低频测量,优选了频差设计方案,突破定位误差建模的半波长限制,可以得到高精度的校正性能.仿真实验结果表明,当位置误差与通信时延误差同时存在时,该算法在不同信噪比条件下均能实现高效的误差联合校正.
萤火虫算法(Firefly Algorithm,FA)是一种用于求解优化问题的启发式算法.由于FA有后期收敛速度慢、寻优精度较低等问题,且寻优过程不具备指导性,因此,结合进化因子与可解释方法,提出了一种改进的萤火虫算法X⁃FA.X⁃FA引入进化因子,将整个寻优过程划分为四个阶段,并在不同的阶段动态计算移动步长,使萤火虫能够在优化初始时尽可能地搜索整个搜索空间,在收敛阶段能够更快地向最优解收敛.同时,引入可解释方法,使萤火虫的随机移动具有指导性.最后,在六个测试函数上进行实验分析,实验结果表明,X⁃FA具有较高的寻优精度和较快的收敛速度.
基于第一性原理计算方法,采用基于密度泛函理论(DFT)的Vienna Ab initio Simulation Package (VASP)软件包,聚焦于纤锌矿衍生氧化物β⁃AMO2(A=Li,Na;M=B,Al,Ga,In)的结构稳定性、电子性质、铁电极化与压电特性.计算结果表明,β⁃AMO2体系的晶格参数随M3+离子半径的增大规律性膨胀;Li基材料因Li⁺离子半径小,其晶格常数
针对汽车路噪有源控制中参考传感配置的优化问题,基于板腔耦合模型系统研究了参考传感器配置对有源控制系统降噪性能的影响.首先,建立板腔耦合数值模型计算板上力源到板/腔各个参考点和误差点的频域传递函数,其次通过该模型分析了参考信号与误差信号的相干性和系统因果性规律,最后在消声室中进行实验.研究结果表明,使用与激励源数量相等的参考传感器可在全频段(除频谱谷点外)实现接近1的相干性.对于系统因果性,COMSOL仿真结果表明腔体声反射显著劣化声参考信号的因果性,导致其维纳滤波降噪量远低于振动参考.增加壁面吸声系数能抑制反射声,使声参考降噪量提升至与振动参考相当.实验结果验证了仿真结论,为车载路噪有源控制系统的传感器布放提供了理论依据.
在不阻碍管道中气流的前提下,有效消除低频噪声是当前噪声控制领域的热点问题.管道内置型的隔声结构设计具有重要的理论研究价值与实际应用需求.以亥姆霍兹共鸣器结构为基础,结合遗传算法,设计并优化出一种新型通风声屏障.首先,对比具有相同表面积的不同形状喉管的声波阻碍性能差异;随后,分析了谐振腔以串联、并联及线性排列等方式构成的结构在传输损失方面的差异,并通过理论计算与仿真结果对比来评估其声学性能,确定了最优结构形式;最后,结合遗传优化算法对并联共鸣器的参数进行联合优化,精确设计喉管与腔体的几何参数,最终形成了两组并联的谐振腔阵列构成的声屏障结构.在亚波长尺寸与通风条件下,该结构可以在低频频段(314~1000 Hz)实现声强透射系数降至0.1.
通过室内模拟试验,系统探究了苏南地区黄龙组、青龙组(泥灰岩、瘤状灰岩)及船山组四类典型碳酸盐岩的溶蚀规律.基于区域地质调查,选取代表性岩样开展不同pH (2~5)的酸性溶液(硫酸/盐酸)及地下水状态(静止/流动)下的溶蚀试验,分析溶蚀量、溶蚀速率及其主控因素.结果表明:青龙组泥灰岩溶蚀量最大(静止6.422 g,流动6.537 g),船山组灰岩溶蚀量最小(静止0.048 g,流动0.078 g),溶蚀量主要受矿物组成、结构及比表面积控制;在低pH (2~3)下,硫酸溶蚀能力普遍优于盐酸,并以黄龙组灰岩和青龙组泥灰岩溶蚀为典型;当pH≥4时,规律不显著;流动状态溶蚀量显著高于静止状态(尤其在低pH时),这是因为水流可清除表面沉淀,维持持续溶蚀;溶蚀速率随pH降低而增大,且流动状态使溶蚀转折点(慢速→快速阶段)提前12~48 h;除瘤状灰岩外,其余岩样在pH=2时均呈现“慢速→快速”两阶段溶蚀,转折时间受酸的类型及方解石含量影响;青龙组瘤状灰岩因结构软弱,溶蚀速率波动显著,流动状态下易发生物理破碎.本研究揭示了苏南地区碳酸盐岩溶蚀的主控机制,为区域岩溶发育预测及工程灾害防控提供了理论依据.
