最新刊期

    2026年第25卷第1期

      人工智能

    • 基于大语言模型的材料科学信息抽取 AI导读

      在材料科学领域,专家通过领域对齐微调提升大语言模型知识抽取效果,为材料科学知识抽取提供新思路。
      时宗彬, 乐小虬
      2026, 25(1): 1-9. DOI: 10.11907/rjdk.241885
      摘要:科学文献因具备特有的专业术语和复杂的语义关系,使得直接利用已有的大语言模型(LLM)从中提取专业领域知识充满挑战。针对LLM在材料科学领域知识抽取性能不足的问题,提出一种通过领域对齐微调提升抽取效果的方法,并展示了如何利用微调后的LLM提取材料文献中的关键信息。首先,通过具备较强语言能力的LLM结合提示工程,辅助人工标注材料领域的数据集。其次,在具有7B参数的LLM上采用QLoRA技术进行指令微调,使模型在微调后能够根据指令从材料科学文献中准确提取信息。微调后的LLM在多个任务上表现优异:材料实体识别的F1值达到0.94,材料类型识别的准确率达到0.91,材料属性数值抽取的准确率达到0.89。实验结果表明,该方法在处理材料科学文献中的复杂术语和语义关系方面表现出色,并展现出较强的泛化能力,为材料科学领域的知识抽取提供了一种新的解决思路。  
      关键词:大语言模型;提示工程;QLoRA;指令微调;信息抽取   
      8
      |
      2
      |
      0
      <HTML>
      <网络PDF><WORD><Enhanced-PDF><Meta-XML>
      <引用本文> <批量引用> 147851675 false
      更新时间:2026-01-27
    • 基于RDEB-FCE模型的西夏文本检测研究 AI导读

      在西夏文检测领域,RDEB-FCE方法通过空洞卷积与注意力引导,显著提升了检测准确率。
      张文静, 史伟, 赵心怡
      2026, 25(1): 10-16. DOI: 10.11907/rjdk.241869
      摘要:针对当前西夏文检测任务中由于文本实例尺度多样、形状不规则造成的漏检、错检等问题,提出一种基于空洞卷积与注意力引导的西夏文检测方法RDEB-FCE。首先,以Resnet50为主干网络,采用FPN结构捕获多尺度特征;其次,利用空洞卷积扩大特征感受野,提高特征信息的多尺度捕获能力,同时采用高效通道注意力机制自适应调整通道特征的权重,以提高模型在处理大尺度、高分辨率西夏文字图像时的表现;最后,在回归损失函数中将Smooth-L1损失替换为Balanced-L1损失,以提升准确样本的梯度,进而提高文本检测的准确性。实验结果表明,该方法在实验室构建的西夏文数据集上的准确率达到92.4%,相较目前主流方法有较明显的提升。  
      关键词:西夏古籍;文本检测;注意力机制;空洞卷积;损失函数   
      3
      |
      0
      |
      0
      <HTML>
      <网络PDF><WORD><Enhanced-PDF><Meta-XML>
      <引用本文> <批量引用> 147851261 false
      更新时间:2026-01-27
    • 基于深度学习的FY-4A降水估计方法 AI导读

      在气象服务领域,基于深度学习的FY-4A降水估计方法,利用注意力机制引导的卷积神经网络对卫星云图进行特征提取,自适应学习卫星云图与地面降水之间的复杂关系,实现降水估计。该方法相比其他降水产品和方法能更好地识别出降水区,为天气预报、气候预测预警等气象服务和技术研究提供了高质量的基础数据支撑。
      张明亮, 吴锡, 解晋, 胡靖, 杨善敏
      2026, 25(1): 17-25. DOI: 10.11907/rjdk.241899
      摘要:传统的降水估计方法主要采用地面站点观测方式,但由于站点分布稀疏不均匀,尤其在“一带一路”、青藏高原等地形复杂地区,地面站点观测数据往往面临缺失、不完整等问题,严重影响了气象服务和技术研究。为此,提出一种基于深度学习的FY-4A降水估计方法。其利用注意力机制引导的卷积神经网络对卫星云图进行特征提取,自适应学习卫星云图与地面降水之间的复杂关系,从而实现降水估计。以最先进的业务再分析产品ERA5为基准数据进行大量实验,结果表明,该方法的均方根误差为0.425 mm/h,相关系数为0.541,CFSV2、GPM降水产品、Unet、Attention-Unet和DLPE-MS深度学习降水估计方法的均方根误差分别降低了25.569%、51.484%、0.932%、4.709%和2.299%,相关系数分别提升了34.577%、73.397%、3.442%、5.458%和5.664%,说明其相比其他降水产品和方法能更好地识别出降水区。该方法为天气预报、气候预测预警等气象服务和技术研究提供了高质量的基础数据支撑,为基于卫星的降水估计提供了一种新的研究思路。  
      关键词:卫星云图;降水估计;深度学习;注意力机制   
      2
      |
      0
      |
      0
      <HTML>
      <网络PDF><WORD><Enhanced-PDF><Meta-XML>
      <引用本文> <批量引用> 147851545 false
      更新时间:2026-01-27
    • 基于路径推理图的文档级关系抽取模型研究 AI导读

      关系抽取研究取得新进展,专家构建文档图模型,聚合信息并推理长距离跨句实体对关系,为文档级关系抽取提供新方案。
      刘军平, 何玉茹, 彭涛, 胡新荣, 朱强
      2026, 25(1): 26-31. DOI: 10.11907/rjdk.241851
      摘要:关系抽取(RE)最近已经从句子级转移到文档级,这需要聚合文档信息,并使用实体和提及加以推理。现有研究忽略了围绕目标实体对的局部上下文信息,且只关注实体级的推理路径,没有考虑文档中跨多个句子的长距离实体之间的复杂交互。为此,提出了一种新的具有信息聚合和长距离跨句推理的文档级关系抽取模型。首先,构造了一个文档图,对文档中的全局信息进行建模;其次,加入了一个新的节点,以聚合目标实体对的局部上下文信息;再次,将目标实体对之间的各种路径集成到一个更简单的推理图结构中以推理长距离跨句实体对的关系,并进行关系推理。在DocRED、CDR和GDA 3个公共数据集上的实验结果表明,路径推理模型在F1上均优于对比模型,验证了该模型的有效性。  
      关键词:文档级关系抽取;路径推理;长距离依赖;文档图;路径推理图   
      2
      |
      6
      |
      0
      <HTML>
      <网络PDF><WORD><Enhanced-PDF><Meta-XML>
      <引用本文> <批量引用> 147850993 false
      更新时间:2026-01-27
    • 融合预训练语言模型的冠心病专病库建设及应用 AI导读

      在冠心病临床研究领域,专家基于Clinical-BERT+Bi-LSTM+CRF模型,优化专病库数据处理,显著提升了效率和准确性,为临床决策提供可靠数据支持。
      薛扬, 侯旭敏
      2026, 25(1): 32-38. DOI: 10.11907/rjdk.241764
      摘要:冠心病专病库的数据处理效率和准确性在临床研究与决策中发挥着至关重要的作用。因此,建设一个高效、准确的专病库是十分必要的,可支持临床研究者快速获取关键信息、优化治疗决策,从而提升患者的整体护理质量。基于Clinical-BERT+Bi-LSTM+CRF模型,结合数据平台与企业服务总线(ESB)对专病库数据处理进行优化。实验结果表明,数据抽取时间平均缩短了36倍(t=115.96,P<0.01),结构化数据的准确率提高了6.9%(χ²=222.41,P<0.01),说明这一优化能够有效提升冠心病专病库数据处理的效率和准确性,为冠心病的临床研究和决策提供了可靠的数据支持。  
      关键词:冠心病;专病库建设;数据处理;预训练模型   
      1
      |
      0
      |
      0
      <HTML>
      <网络PDF><WORD><Enhanced-PDF><Meta-XML>
      <引用本文> <批量引用> 147851414 false
      更新时间:2026-01-27
    • 面向检索增强式私有问答大模型的幻觉检测方法 AI导读

      在人工智能领域,研究者提出了一种新的幻觉检测方法,有效提升了大模型在检索增强问答任务中的性能。
      李铂鑫, 鲁骁, 张霄, 王斌
      2026, 25(1): 39-46. DOI: 10.11907/rjdk.241759
      摘要:大模型幻觉现象的存在严重制约了其在实际场景中的落地,而现有的幻觉检测方法单一,缺乏面向检索增强生成范式下的幻觉检测工作。针对上述问题,提出一种面向检索增强式私有问答大模型的幻觉检测方法,该方法融合了基于不确定性度量指标和基于大模型自动评估两种幻觉检测方法,综合利用了大模型生成过程中的幻觉特征和大模型自动评估能力。为提升开源大模型自动评估效果,提出通过指令微调的方式将自动评估能力由闭源大模型蒸馏到开源大模型。此外,构建了一个面向检索增强生成范式下的幻觉评估集以验证所提方法的有效性。在该数据集上的实验结果表明,该融合方法取得了相对更高的AUC-ROC值,相比于基于不确定性度量指标和基于大模型自动评估两种基线方法,分别显著提升了11.1%和4.3%,验证了上述两种基线方法具有互补性。此外,指令微调后的开源大模型的AUC-ROC指标提升了18.6%,自动评估能力得到显著提升,验证了指令微调方法对提升开源大模型自动评估能力的有效性。  
      关键词:大模型;幻觉检测;检索增强生成;指令微调;大模型自动评估   
      3
      |
      0
      |
      0
      <HTML>
      <网络PDF><WORD><Enhanced-PDF><Meta-XML>
      <引用本文> <批量引用> 147850885 false
      更新时间:2026-01-27
    • 基于伪节点交叉注意力的远程步态情绪识别 AI导读

      情绪识别技术取得新进展,提出了基于伪节点交叉注意力的图卷积网络,准确率达到88.63%。
      卢亮宇, 周成菊
      2026, 25(1): 47-53. DOI: 10.11907/rjdk.241870
      摘要:近年来,情绪识别在心理计算、人机交互和精神状态监测中的应用引起了广泛关注。与面部情绪识别和脑电情绪识别(EEG)等其他方式相比,步态情绪识别所使用的采集无需高精度拍摄,且可以不用佩戴专门的采集设备进行远距离采集。尽管该领域已经开展了一系列研究并取得了相应进展,但目前仍面临两个主要挑战。一是现有大多数基于步态情绪识别的工作都侧重于通过图卷积网络(GCN)从骨骼图像中探索人体关节的局部相关性,而忽略了人体关节的全局相关性;二是使用了人体自然连接关节骨架图,原有的固定连接会限制网络捕捉远距离关节之间相互作用的能力。为了解决这些问题,提出了一种基于伪节点交叉注意力的图卷积网络,通过伪节点的方法有效地实现全局和局部关节节点的信息及时传递,并使用交叉注意力方法捕获有效和高效的步态表示以进行情绪状态识别。将所提出的方法在情绪步态数据集Emotion-Gait上进行评估,准确率达到88.63%,与已有经典先进模型相比性能更优。  
      关键词:步态情绪识别;交叉注意力;图卷积神经网络;关节邻接矩阵   
      1
      |
      0
      |
      0
      <HTML>
      <网络PDF><WORD><Enhanced-PDF><Meta-XML>
      <引用本文> <批量引用> 147851116 false
      更新时间:2026-01-27

      计算机软件与理论

    • 融合多种时间关系的时序图课程推荐算法 AI导读

      在教育技术领域,研究者提出了一种融合多种时间关系的时序图模型,充分利用时序特征提升课程推荐表征精确度,为个性化学习推荐系统提供新方案。
      张维, 周旭宸, 曾鑫耀, 朱诗怡
      2026, 25(1): 54-62. DOI: 10.11907/rjdk.241788
      摘要:在学习者学习过程中,学习记录中的时序特征反映了学习者不断变化的兴趣、学习周期和课程间先后依赖关系等多种重要信息。目前课程推荐只考虑课程顺序关系,并且大多数图神经网络课程推荐算法完全丢弃了时序特征,导致性能降低。提出一种融合多种时间关系的时序图模型,充分利用时序特征提升表征精确度。模型首先将时序特征转换为3种时间关系:绝对时间、顺序时间、间隔时间,以获得细粒度的时间信息。其次,模型依据交互记录构建学习者—课程交互时序图,通过3种时间关系嵌入和注意力机制为邻居节点分配个性化聚合权重,再经过残差连接与多层传播得到学习者和课程表征进行最终预测。在MOOCCourse数据集上的大量实验表明,该模型相比其他推荐模型,在R@5与NDCG@15两个指标上分别提升了6.58%和2.61%,并且融合3种时间关系相比仅考虑课程顺序关系在R@5和NDCG@15指标上提升更多。  
      关键词:课程推荐;图神经网络;时序特征;推荐系统;注意力机制   
      6
      |
      1
      |
      0
      <HTML>
      <网络PDF><WORD><Enhanced-PDF><Meta-XML>
      <引用本文> <批量引用> 147851646 false
      更新时间:2026-01-27
    • 基于改进樽海鞘群算法的无人机高程模型航迹规划 AI导读

      在无人机三维航迹规划领域,专家提出了结合高程数据的凸包策略和改进樽海鞘群算法,有效提升了路径规划能力和优化性能,为解决无人机复杂环境飞行问题提供解决方案。
      赵南南, 吕尚扬, 吴广政, 乔鹏博, 王洪波
      2026, 25(1): 63-74. DOI: 10.11907/rjdk.241888
      摘要:针对启发式算法在无人机不规则复杂地形和多重威胁环境下进行三维航迹规划时,存在路径波动大和优化性能不足的问题,提出结合高程数据的凸包策略以及一种改进的樽海鞘群算法(ISSA)。首先,基于ASTER GDEMV3和Open Street Map数据,构建杭州某处山区和纽约城市区域的高程模型;其次,结合地形高程信息,采用凸包策略编码并通过B样条曲线构建路径;最后,对樽海鞘群算法在个体位置更新公式上加入自适应Alpha稳定分布策略与非线性扰动策略,以平衡算法的全局开发能力与局部探索能力,并引入贪婪策略和鱼类聚集装置策略,提高算法搜索效率和精度。利用CEC2020测试函数对所提算法进行实验对比,验证了改进算法的性能。实验结果表明,凸包策略能有效提升算法规划能力,且与传统算法相比,改进后的算法能够使无人机的寻优精度更高,代价函数更小。  
      关键词:航迹规划;凸包策略;樽海鞘群算法;自适应Alpha稳定分布策略;鱼类聚集装置策略   
      0
      |
      0
      |
      0
      <HTML>
      <网络PDF><WORD><Enhanced-PDF><Meta-XML>
      <引用本文> <批量引用> 147851232 false
      更新时间:2026-01-27
    • 基于代码变更与历史信息的测试用例优先级排序 AI导读

      在软件测试领域,SSH-TCP框架通过结合代码变更和历史信息,有效提升了测试用例优先级排序效果。
      李晋英, 刘峰, 罗远哲, 刘瑞景
      2026, 25(1): 75-82. DOI: 10.11907/rjdk.241811
      摘要:现有测试用例优先级排序方法常依赖单一的数据源或分析技术,无法全面捕捉影响测试用例重要性的潜在因素,限制了排序效果。为此,提出一种基于代码变更与历史信息的测试用例优先级排序框架SSH-TCP。首先,在粗粒度过滤阶段通过信息检索模型得到候选测试用例集;其次,在细粒度排序阶段利用预训练语言模型、基于抽象语法树的中心性分析,分别计算代码变更和测试用例的语义与语法相似度;最后,结合测试用例的平均历史失败率确定最终的排序结果。实验表明,SSH-TCP在考虑成本的平均故障检测率指标上优于所有基线模型,验证了所提框架在提升测试用例优先级排序效果方面的有效性。  
      关键词:测试用例排序;代码变更;语义相似度;语法相似度;历史失败率   
      0
      |
      0
      |
      0
      <HTML>
      <网络PDF><WORD><Enhanced-PDF><Meta-XML>
      <引用本文> <批量引用> 147851257 false
      更新时间:2026-01-27
    • 融合通道注意力与SDFFT的同质多变量时序预测模型 AI导读

      在同质多变量时间序列长期预测领域,HMTS-TI模型通过RGCA和SDFFT模块,有效提取变量间关联信息和跨时间维度依赖特征,提高了预测准确率。
      王凯欣, 杨磊, 赵品杰, 江宇函, 李康顺, 刘启健
      2026, 25(1): 83-94. DOI: 10.11907/rjdk.241803
      摘要:在同质多变量时间序列长期预测任务中,现有模型大多存在着特征提取时未充分利用变量间内在关联信息、对数据的时效性考虑不足、季节性和随机波动信息提取不到位等问题。为此,提出了一种融合多阶段跨时间依赖和拐点信息的同质多变量时间序列预测模型(HMTS-TI),设计了RGCA模块,在变量间通道注意力中引入分组排序的策略,将学习到的关联信息转化为注意权重,增强对多变量时间序列变量间相关信息的提取;构建了SDFFT模块,通过子序列分解与快速傅里叶变换,挖掘长期趋势、短期季节模式及随机波动信息,加强跨时间维度依赖特征提取;将拐点数量统计值作为预测调整因子,提取不同时间序列变量中的波动信息,对模型拟合产生正向调节作用。在Traffic、Solar、PeMS04 3个公共同质多变量时间序列数据集上的实验结果表明,相较于对比实验中的最优模型,HMTS-TI在96、192、336和720共4个预测长度上整体均方误差、平均绝对误差分别下降了12.1%和6.8%,决定系数提升了4.1%,具有较高的预测准确率。此外,在具体应用案例中,该模型对广东省内92个观测点的臭氧数据预测长度为336个时间单位任务上的均方误差相比最优对比模型下降了19.0%。  
      关键词:同质多变量时间序列;长期预测;通道注意力;子序列划分;数据分解;快速傅里叶变换   
      0
      |
      0
      |
      0
      <HTML>
      <网络PDF><WORD><Enhanced-PDF><Meta-XML>
      <引用本文> <批量引用> 147850883 false
      更新时间:2026-01-27
    • Linux进程调度相关功能及性能测试 AI导读

      最新研究提出基于系统调用的进程调度功能测试方案,采用白盒测试方法及判定覆盖准则,有效改善了时延指标的测试结果。
      郭小康, 翟高寿, 寇思旭, 罗琼
      2026, 25(1): 95-102. DOI: 10.11907/rjdk.241836
      摘要:进程调度是操作系统的核心功能,为整个系统的质量保障提供关键支撑作用,开展相关功能及性能测试非常必要。现有进程调度测试主要基于黑盒测试方法和glibc库函数,存在测试用例不够完备及冗余问题,而依托于假想进程创建的性能测试结果也不够精准。鉴于此,提出基于系统调用的进程调度功能测试方案,采用白盒测试方法及判定覆盖准则,综合考虑相关函数调用链中的所有内核函数,并通过功能归类处理和测试用例精简策略,进而在保证测试完备性的同时还减少了测试用例冗余。基于实际进程开展性能测试,系统分析进程状态转换时间节点,利用eBPF的kprobes与tracepoint机制实现了对应内核函数及跟踪点地址的精准探测,从而改善了各类时延指标的测试结果。其中,kworker、gnome、xdg等进程及其子进程的上下文切换时延明显较长,说明相关系统程序代码或系统配置存在一定优化空间。  
      关键词:Linux;进程调度;系统调用;功能测试;性能测试   
      0
      |
      0
      |
      0
      <HTML>
      <网络PDF><WORD><Enhanced-PDF><Meta-XML>
      <引用本文> <批量引用> 147851168 false
      更新时间:2026-01-27

      网络空间安全

    • 基于集成学习与多头注意力机制的海关欺诈检测算法 AI导读

      在海关报关欺诈识别领域,专家提出了深度自注意集成模型,有效提高了识别准确性和鲁棒性,ACC和AUC指标分别达到89.81%和0.814 2。该模型为海关部门发现潜在欺诈行为提供了高效可靠的工具。
      于志文, 施水才, 王洪俊
      2026, 25(1): 103-109. DOI: 10.11907/rjdk.241833
      摘要:针对海关的报关欺诈行为,提出一种深度自注意集成模型,通过结合树结构信息、深度神经网络与注意力机制的优势,从而更准确地识别和应对报关欺诈行为。首先,利用集成学习XGBoost模型将海关数据转化为树形结构的叶子节点,并使用实体嵌入向量表示每个节点;其次,利用深度学习模型计算节点之间以及节点内欺诈风险之间的注意力权重,并得到融合向量;最后,利用线性层和激活函数对融合向量进行变换与分类。在真实海关报关数据集上进行实验,发现与基线模型相比,所提模型在准确性和鲁棒性方面展现出明显优势,ACC和AUC指标分别达到89.81%和0.814 2。该模型为海关部门发现潜在的欺诈行为并采取相应措施提供了高效可靠的工具,适用于分析大规模海关数据集,有助于保护国家利益和国门安全。  
      关键词:海关欺诈检测;注意力机制;深度学习;集成学习   
      0
      |
      0
      |
      0
      <HTML>
      <网络PDF><WORD><Enhanced-PDF><Meta-XML>
      <引用本文> <批量引用> 147851323 false
      更新时间:2026-01-27
    • 在智能交通领域,专家构建了三维驾驶行为特征体系,探索了边缘—云端协同计算架构,为提升交通安全管理能力提供解决方案。
      周嵩琛
      2026, 25(1): 110-118. DOI: 10.11907/rjdk.251611
      摘要:随着大数据分析与车联网技术的深度应用,海量驾驶行为数据为交通安全管理提供了全新路径。针对车联网环境下驾驶行为风险评估中多源异构数据融合效率低、风险预警实时性不足的问题,提出了驾驶行为多维画像构建与动态风险预警方法,旨在提升交通安全管理的主动防控能力。基于车辆运动指标、环境交互特征及驾驶操作时序特征,构建了一个三维驾驶行为特征体系。同时,设计了一种边缘—云端协同计算架构:在边缘端由LSTM网络处理高频时序数据,而云端则采用随机森林模型融合多源特征,并引入动态阈值调整机制以优化风险判定规则。所构建的特征体系与融合模型显著提升了驾驶行为分析的精细化程度,边缘—云端协同机制有效保障了风险预警的实时性与准确性,为智能交通系统提供了可落地的主动安全解决方案。  
      关键词:大数据分析;车联网;行为画像;风险预警;数据处理   
      2
      |
      0
      |
      0
      <HTML>
      <网络PDF><WORD><Enhanced-PDF><Meta-XML>
      <引用本文> <批量引用> 147851455 false
      更新时间:2026-01-27

      图形图像处理

    • 在图像修复领域,研究者提出了一种结合CSWin-Transformer与可形变卷积残差密集网络的新方法,有效提升了修复效果并降低了计算资源消耗。
      刘海洋, 胡永
      2026, 25(1): 119-126. DOI: 10.11907/rjdk.241952
      摘要:针对现有图像修复模型修复大面积不规则缺损图像效果不佳、计算资源消耗大的问题,提出了一种CSWin-Transformer与可形变卷积残差密集网络相结合的图像修复方法。首先,构建一个由全局层网络和局部层网络组成的生成模型,利用全局层CSWin-Transformer模块的条纹窗口在较低的计算复杂度下获取更大的感受野,增强其图像特征提取能力;其次,在CSWin-Transformer中加入一种新的门控深度卷积前馈网络,其能够进行有选择性的特征转换,即过滤掉信息量不足的特征,仅保留有价值的信息继续在网络的层级结构中流动;再次,通过并行局部层的可形变卷积残差密集块灵活对图像进行采样,增强结构纹理修复的精确度,同时,在上述并行生成模型之间,构建共享的注意力机制来促进全局和局部特征之间的信息交流;最终,采用谱归一化的马尔科夫判别模型进行对抗性训练。实验结果表明,提出的方法相较于其他方法在PSNR和SSIM指标上分别提升了2.47dB和0.075 2,在LPIPS指标上下降了0.092 4。  
      关键词:深度学习;CSWin-Transformer;门控深度卷积前馈网络;可形变卷积残差密集网络   
      1
      |
      0
      |
      0
      <HTML>
      <网络PDF><WORD><Enhanced-PDF><Meta-XML>
      <引用本文> <批量引用> 147850831 false
      更新时间:2026-01-27
    • 在城市场景重建领域,专家提出了一种端到端的注意力引导框架,有效解决了无人机航拍场景中不均匀分割效率低下和高保真渲染问题,为城市场景重建研究开辟了新方向。
      梁书凝, 谭诗瀚, 戈文一, 钟娟, 王录涛
      2026, 25(1): 127-134. DOI: 10.11907/rjdk.241892
      摘要:基于城市神经辐射场(NeRF)场景重建的主流方法是将整个场景分割为多个区域,但在无人机航拍场景中,一旦飞行轨迹变化导致场景分布不均时,现有方法的分割效率低下,难以处理同一场景不同高度拍摄的图像细节,导致渲染质量不佳。为此,提出一种端到端的注意力引导框架。首先,利用相机位姿进行自适应空间划分,解决不均匀场景分割的效率问题;其次,从不同高度图像中提取、融合目标视图最相关的特征来增强细节,解决航拍场景高保真渲染问题。实验表明,所提模型在城市场景数据集56Leonardv、SCUTic上均取得了最佳性能,执行渲染的速度相较于目前最高效的方法提升了65%以上。  
      关键词:自适应空间划分;特征融合;注意力引导;NeRF模型;城市场景   
      0
      |
      0
      |
      0
      <HTML>
      <网络PDF><WORD><Enhanced-PDF><Meta-XML>
      <引用本文> <批量引用> 147850834 false
      更新时间:2026-01-27
    • 自动聚焦前景人像的抠图模型 AI导读

      在自动人像抠图领域,FFPN模型利用语义信息聚焦前景人像,数据利用效率高,泛化能力强,实验效果优于多个基准测试。
      刘洋, 董莉霞
      2026, 25(1): 135-141. DOI: 10.11907/rjdk.241889
      摘要:自动人像抠图在许多实际应用中具有广泛的需求。由于人像抠图方法在语义分割中未能正确识别人像时的抠图效果不理想,提出一种利用语义信息聚焦前景人像的自动抠图模型FFPN。该模型由共享编码器、抠图解码器和分割解码器组成,利用CGRSeg作为分割解码器,旨在使模型聚焦前景人像。FFPN相较于以往工作的不同之处在于:数据利用效率高,只需较少的训练数据即可实现较好的抠图效果,不仅降低了模型对大规模数据集的依赖,还提升了泛化能力。实验表明,FFPN经过约20 000张分割图像和9 000张抠图图像训练后,能很好地适应真实世界数据,在多个基准测试中效果较优。  
      关键词:人像抠图;语义分割;多尺度;注意力机制;特征增强   
      0
      |
      0
      |
      0
      <HTML>
      <网络PDF><WORD><Enhanced-PDF><Meta-XML>
      <引用本文> <批量引用> 147850832 false
      更新时间:2026-01-27
    • 基于改进YOLOv7的输电线路外破隐患检测算法 AI导读

      在输电线路外破隐患检测领域,专家提出了基于YOLOv7的改进算法,提升了检测精度和实时性,为输电线路安全运行提供保障。
      孟军英, 杨佳莉, 王建超, 赵晓东, 苏鹤
      2026, 25(1): 142-148. DOI: 10.11907/rjdk.241800
      摘要:针对现有输电线路外破隐患检测模型存在的检测精度、实时性较差等问题,提出一种基于YOLOv7的输电线路外破隐患目标检测算法。首先,使用特征提取网络UniRepLKNet模块替换Backbone的E-ELAN模块,增大感受野、实现模型轻量化;其次,在Backbone后增加多尺度轴向注意力机制(MCA),使改进后的模型能全局识别目标区域的模糊边界;最后,结合归一化损失函数(NWD)与CIoU作为定位回归损失函数,在不下降中大型目标检测精度的同时提升小目标检测精度。实验表明,所提方法在输电线路外破隐患目标识别中的物体总类别平均检测精度为94%,相较于YOLOv7算法提升3.2%,模型参数量、大小分别减少15.8%、15.4%,有利于部署到输电线路系统中。  
      关键词:目标检测;输电线路;YOLOv7;轻量化   
      0
      |
      0
      |
      0
      <HTML>
      <网络PDF><WORD><Enhanced-PDF><Meta-XML>
      <引用本文> <批量引用> 147851263 false
      更新时间:2026-01-27
    • 面向中医诊疗的一种深度学习舌像分割模型 AI导读

      在舌诊智能化领域,专家提出了基于DeepLabv3+的轻量化舌像分割模型,精确率达到97.67%、MIoU达到96.87%,为解决舌像分割难题提供新方案。
      卢程, 张锦, 王小菊, 徐新艳, 文建全
      2026, 25(1): 149-157. DOI: 10.11907/rjdk.241816
      摘要:舌像分割一直是舌诊智能化的难点之一,特别是开放环境带来的复杂背景、不同类拍摄设备以及光照干扰,增加了舌像分割高精度与高稳定性的实现难度。针对上述问题,提出了一种基于DeepLabv3+网络架构的轻量化舌像分割模型。首先,采用轻量级的MobileNetv2作为骨干特征提取网络,并嵌入了翻译变体卷积降低模型计算复杂度,同时提升模型处理舌像的实时性;其次,通过坐标注意力机制增强对舌像特征的语义理解,从而实现对舌体区域的更精确定位;再次,通过在空洞卷积金字塔池化模块中嵌入条纹池化,以更高效地捕获舌体边缘的关键信息;最后,通过融合多尺度跨轴注意力机制,使模型能够更好地聚合局部特征,以适应不同形态的舌体图像。实验结果表明,与DeepLabv3+等算法相比,所提模型精确率达到97.67%、MIoU达到96.87%,综合考虑精确率、MIoU、推理速度、分割精度、参数量等指标,所提模型具有良好的性能。  
      关键词:智能舌诊;舌像分割;轻量化;注意力机制;条纹池化   
      1
      |
      0
      |
      0
      <HTML>
      <网络PDF><WORD><Enhanced-PDF><Meta-XML>
      <引用本文> <批量引用> 147851336 false
      更新时间:2026-01-27
    • 状态空间结合注意力的高光谱—LiDAR协同分类 AI导读

      Mamba深度学习架构融合多模态状态空间高光谱遥感图像分类网络,在地物目标分类领域取得突破,总体分类精度达99.33%以上。
      罗天, 戴元杰, 万煌, 朱甜甜, 赵敏慧, 马思奇, 赵林, 吴健辉
      2026, 25(1): 158-165. DOI: 10.11907/rjdk.241930
      摘要:多源遥感数据为地物目标分类提供了丰富的高程信息支持,但现有分类方法常忽略单源与跨源数据间的样本关联。鉴于状态空间模型在多种复杂场景下的数据处理能力,Mamba深度学习架构近年来受到广泛关注。为缓解多源遥感数据异质性问题,提高基于高光谱图像的地物分类性能,提出一种融合Mamba结构的多模态状态空间高光谱遥感图像分类网络。该网络利用三维卷积和二维卷积初步提取高光谱图像的光谱与空间特征,构建光谱—空间Mamba模块增强特征表示。针对视觉Transformer中随机初始化造成的分类标签泛化能力不足问题,采用LiDAR数据特征作为分类标签向量与高光谱图像特征进行拼接,通过交叉注意力机制实现多源数据特征融合。实验结果表明,该模型在高光谱图像分类任务中表现出色,在Houston2013和Trento数据集上分别达到99.46%和99.33%的总体分类精度。  
      关键词:高光谱图像分类;多模态;特征标记化;状态空间模型;Mamba;Transformer   
      0
      |
      0
      |
      0
      <HTML>
      <网络PDF><WORD><Enhanced-PDF><Meta-XML>
      <引用本文> <批量引用> 147850833 false
      更新时间:2026-01-27
    • 基于改进YOLOv8s的排水管道缺陷检测算法 AI导读

      在城市排水管道缺陷检测领域,研究人员提出了基于改进YOLOv8s的检测算法,有效提升了模型性能。
      吴德华, 陈礼洪, 黄淑萍, 马世斌
      2026, 25(1): 166-171. DOI: 10.11907/rjdk.241860
      摘要:针对城市排水管道缺陷检测算法参数量和计算量大、管道内部环境复杂导致缺陷检测困难的问题,提出一种基于改进YOLOv8s的排水管道缺陷检测算法。首先,使用MobileNetV3特征提取网络作为主干,并引入ECA注意力模块改进倒残差结构,增强了模型的特征提取能力;其次,利用Slim-Neck架构改进原有颈部结构,进一步提高了网络的轻量化水平;最后,结合自适应空间特征融合方式改进检测头,有效过滤冲突信息,增强了尺度不变性。实验结果表明,与原始YOLOv8s模型相比,改进后的YOLOv8s模型在管道缺陷数据集上的mAP@0.5、mAP@50:95分别提升了4.7%、3.6%,整体性能有所提高。  
      关键词:YOLOv8s;排水管道;缺陷检测;目标识别;注意力模块   
      0
      |
      0
      |
      0
      <HTML>
      <网络PDF><WORD><Enhanced-PDF><Meta-XML>
      <引用本文> <批量引用> 147851259 false
      更新时间:2026-01-27
    • 基于改进YOLOv8的安全帽佩戴检测算法 AI导读

      在工地安全帽检测领域,研究者提出了基于改进YOLOv8的实时检测算法,有效识别密集遮挡小目标,具有高应用价值。
      谢敏怡, 蒋作, 万学俊, 赵周洲, 潘文林
      2026, 25(1): 172-183. DOI: 10.11907/rjdk.241907
      摘要:针对工地安全帽检测中难以识别被遮挡目标和存在密集小目标的问题,提出一种基于改进YOLOv8的工地安全帽实时检测算法。首先,在特征提取网络中使用RVBS模块替换部分Conv模块,通过多分支结构和无信息损失的下采样操作提升了网络的特征提取能力,有助于密集小目标的检测;其次,采用RepNCSPELAN4模块代替特征融合网络中所有的C2f模块,使模型能更有效地融合浅层与深层特征,从而改善被遮挡目标的检测效果;再次,新增小目标检测层以进一步融合多尺度特征,提升对小目标的检测能力;最后,使用WIoU v1损失函数代替原始的CIoU损失函数,加速模型收敛并提高回归精度。实验结果表明,改进后的YOLOv8算法在SHWD数据集上的mAP@0.5和mAP@0.5: 0.95分别比原算法提高了2.8%和3.2%,每张图片检测用时为25.7 ms。与其他主流算法相比,改进算法的mAP@0.5最高。所提算法能有效检测密集遮挡小目标,具有较高的应用价值。  
      关键词:YOLOv8;安全帽;目标检测;RVBS;小目标检测层;RepNCSPELAN4;WIoU v1   
      0
      |
      0
      |
      0
      <HTML>
      <网络PDF><WORD><Enhanced-PDF><Meta-XML>
      <引用本文> <批量引用> 147851457 false
      更新时间:2026-01-27
    • 基于深度先验引导的神经动态场景渲染重建 AI导读

      在动态场景渲染领域,专家提出了基于深度先验引导的四维时空高斯场景表示方法,有效提升了渲染质量、速度和模型紧凑性。
      李璋林, 孙益辉, 李煜, 姚献艺, 兰世儒
      2026, 25(1): 184-190. DOI: 10.11907/rjdk.241796
      摘要:目前要实现实时且高质量的动态场景渲染是一项具有挑战性的任务。为此,提出一种基于深度先验引导的四维时空高斯场景表示方法。首先,通过在三维高斯中引入时间相关的不透明度以及可参数化的运动与旋转,使得模型能够同时刻画静态结构与瞬态动态内容。其次,利用深度信息对渲染过程进行约束与指导,从而进一步提升细节恢复能力与几何一致性。最后,结合训练误差与粗略深度的联合引导策略,实现对场景中稀疏区域的有效补充与建模。相比现有的其他先进方法,该方法在渲染质量、渲染速度以及模型紧凑性方面均具有明显优势。在高分辨率场景下,该方法能够在常规图形处理平台NVIDIA RTX 4090 GPU上实现每秒160帧的实时渲染。  
      关键词:动态场景渲染;3DGS;深度引导;场景重建   
      4
      |
      0
      |
      0
      <HTML>
      <网络PDF><WORD><Enhanced-PDF><Meta-XML>
      <引用本文> <批量引用> 147851673 false
      更新时间:2026-01-27

      研究综述

    • 面向三维点云的深度学习分类方法综述 AI导读

      在三维视觉领域,点云分类研究取得新进展,专家全面综述了基于深度学习的点云分类方法,为自动驾驶等领域提供解决方案。
      程春旭, 任爽
      2026, 25(1): 191-201. DOI: 10.11907/rjdk.241831
      摘要:随着三维点云在自动驾驶、地图测绘等领域的广泛应用以及深度学习的快速发展,点云分类已成为三维视觉领域的研究热点。从三维点云表示方式出发,对基于深度学习的点云分类方法进行全面的分类与综述。首先,介绍点云分类常用的数据集及评价指标;其次,着重论述了具有代表性的分类方法,并梳理了近年来的最新研究工作,并对不同分类方法的性能进行了分析与对比;最后,分析现存的问题和挑战,并探索了未来可能的研究方向。  
      关键词:点云分类;深度学习;三维视觉;特征提取   
      0
      |
      0
      |
      0
      <HTML>
      <网络PDF><WORD><Enhanced-PDF><Meta-XML>
      <引用本文> <批量引用> 147851613 false
      更新时间:2026-01-27
    • 文本主题分割任务中的深度学习研究综述 AI导读

      在文本主题分割领域,专家系统梳理了基于深度学习的技术进展,分析了不同模型的优缺点,并指出了未来发展方向。
      周日飞, 文勇, 黄文旭
      2026, 25(1): 202-212. DOI: 10.11907/rjdk.241967
      摘要:深入探讨文本主题分割任务,系统梳理并提炼现有文献,开展针对基于深度学习的文本主题分割技术的多维度分析。首先,回顾了文本主题分割技术的发展历程,分析了基于语篇结构理论、统计学习和深度学习的分割方法,并考察文本主题分割任务常用的数据集及评价指标;其次,进一步比较了卷积神经网络、循环神经网络和Transformer网络等深度学习技术在文本主题分割任务中的应用和优缺点分析,并对比采用各模型方法在相同数据集上的实验结果;最后,指出了当前文本主题分割任务面临的挑战和潜在发展方向,为文本主题分割任务的进一步研究提供了参考。  
      关键词:文本主题分割;深度学习;自然语言处理;数据集;评价指标   
      0
      |
      0
      |
      0
      <HTML>
      <网络PDF><WORD><Enhanced-PDF><Meta-XML>
      <引用本文> <批量引用> 147851222 false
      更新时间:2026-01-27
    • 基于提示的小样本情感分析综述 AI导读

      在多媒体和语言模型发展背景下,基于提示的小样本情感分析研究取得进展,为文本分类和提示学习提供参考。
      姜鑫, 马宏伟, 张展峰
      2026, 25(1): 213-220. DOI: 10.11907/rjdk.241771
      摘要:随着多媒体平台和大规模语言模型的迅猛发展,采用基于提示的方法实现小样本情感分析,对用户需求分析和系统服务改进具有重要意义。基于提示的小样本情感分析研究,致力于在不同应用场景中合理利用预训练语言模型理解分类任务,推理情感类别。首先,阐述了小样本情感分析的问题背景;其次,介绍了使用提示—微调、提示调优和上下文学习的方法步骤;再次,系统对比了近来基于提示的小样本情感分析的主流技术,归纳总结了相关语料库、预训练语言模型与提示模板;最后,对基于提示的小样本情感分析未来可能的研究方向进行展望,为句子级文本分类和提示学习相关领域的研究提供参考。  
      关键词:小样本情感分析;预训练语言模型;提示—微调;提示调优;上下文学习   
      0
      |
      0
      |
      0
      <HTML>
      <网络PDF><WORD><Enhanced-PDF><Meta-XML>
      <引用本文> <批量引用> 147850835 false
      更新时间:2026-01-27
    0