最新刊期

    2025年第24卷第1期

      人工智能

    • 在会话推荐领域,SDGI方法结合序列依赖与全局信息,有效提高推荐性能。
      曹家伟, 段汶君, 孙倩, 袁卫华
      2025, 24(1): 1-8. DOI: 10.11907/rjdk.241070
      摘要:会话推荐旨在根据当前匿名行为序列预测下一个最可能的交互项目,研究的关键问题之一是如何利用项目的序列信息对匿名用户进行有效推荐。针对现有会话推荐方法未充分考虑序列依赖信息与来自其他会话的全局信息等问题,提出一种结合序列依赖与全局信息的会话推荐方法SDGI。该方法通过卷积时间感知的门控循环单元网络学习项目间的序列依赖关系,借助图神经网络构建局部与全局图以获取全局项目转移信息。为解决偏差与过拟合问题,引入一种结合门控机制的轻量级图卷积网络层获得全局级项目嵌入,并应用焦点损失函数处理正负样本不平衡问题。在Diginetica、Tmall、Yoochoose 3个公共数据集上与12种基线方法进行比较,实验结果表明,SDGI的性能相较基线方法有较大提升,结合序列依赖与全局信息能有效提高会话推荐性能。  
      关键词:推荐系统;会话推荐;图神经网络;序列依赖   
      8
      |
      21
      |
      0
      <HTML>
      <网络PDF><WORD><Enhanced-PDF><Meta-XML>
      <引用本文> <批量引用> 78293911 false
      更新时间:2025-02-10
    • 在公共建筑节能领域,专家提出了一种灰色模型GM(1,1)和BP神经网络的组合预测模型,为合理调控用电提供解决方案。
      宋杨, 顾亦然, 张腾飞
      2025, 24(1): 9-14. DOI: 10.11907/rjdk.232291
      摘要:随着国家“双碳”目标的提出,公共建筑节约能源愈发重要,建筑电力数据短期预测有助于合理调控用电。为此,提出一种结合灰色模型GM(1,1)和BP神经网络的组合预测模型。首先,通过灰色关联筛选数据,根据灰色模型仅需少量样本的优点,预测出短期内的用电数据;其次,将预测结果作为BP神经网络的输入变量,通过网络反向学习原始数据与GM(1,1)预测值的差值,提高模型的预测精度。以高校公共建筑用电数据为研究目标,通过组合模型预测下一阶段用电,并与4种预测模型进行比较。结果表明,该组合模型预测误差最小,准确性最高。  
      关键词:灰色模型;BP神经网络;电力预测;建筑节能   
      6
      |
      20
      |
      0
      <HTML>
      <网络PDF><WORD><Enhanced-PDF><Meta-XML>
      <引用本文> <批量引用> 78294328 false
      更新时间:2025-02-10
    • 在双方博弈策略训练领域,专家提出了基于强化学习的方法,显著提升了智能体决策能力,为模拟复杂环境提供了新方案。
      陈灼, 周翼骅, 普俊松, 张秀山, 张典
      2025, 24(1): 15-20. DOI: 10.11907/rjdk.232304
      摘要:传统强化学习方法泛化性不强,在一些特定任务下直接应用效果往往很差,尤其是在敌我双方博弈的场景下,态势更加复杂。为了解决该问题,提出基于强化学习的双方博弈策略训练方法,并在其基础上提出基于强化学习与规则库增强的双方群体博弈策略训练方法。经过实验验证,该方法显著提升了智能体的行为决策能力,智能体所得到的总奖励值接近14.5。在模拟抓捕任务中,其行为决策得到了有效的优化和改进。同时,通过不同规则库的设置,增加了模拟环境的不确定性,更好地模拟了真实环境的复杂性。  
      关键词:强化学习;规则库;群体博弈策略;智能体决策   
      2
      |
      0
      |
      0
      <HTML>
      <网络PDF><WORD><Enhanced-PDF><Meta-XML>
      <引用本文> <批量引用> 82077197 false
      更新时间:2025-02-10
    • 在地震位移分析领域,基于生成对抗网络的高层剪力墙结构地震位移快速预测方法,为评估建筑物抗震能力提供新方案。
      马浏轩, 徐国愚, 丁松阳, 闫晓龙
      2025, 24(1): 21-28. DOI: 10.11907/rjdk.232318
      摘要:对高层剪力墙类型建筑结构进行地震位移分析,有助于工程师评估建筑物的抗震能力。现有方法多采用有限元进行计算,时间开销大。为此,提出一种基于生成对抗网络的高层剪力墙结构地震位移快速预测方法。该模型基于生成对抗网络结构拟合剪力墙部署与结构地震位移之间的映射函数。为提高模型剪力墙结构地震位移预测准确性与可行性,基于模型对建筑图像进行语义化处理,保留关键结构信息并将其作为输入,输出所预测的结构地震位移,同时在输出结果评估中通过逐像素得分,对训练后的模型性能进行评估。实验结果表明,该模型SSIM、PSNR、LPIPS指标值分别在0.98、32.1、0.02左右,均优于pix2pix模型,同时其LCA值和MAE值也表现良好,该方法能够作为有限元方法的有益补充,并更好地应用于结构优化等。  
      关键词:结构地震位移;高层剪力墙结构;生成对抗网络;机器学习   
      6
      |
      33
      |
      0
      <HTML>
      <网络PDF><WORD><Enhanced-PDF><Meta-XML>
      <引用本文> <批量引用> 78294430 false
      更新时间:2025-02-10
    • 在方面情感分析领域,LPIDA模型通过软提示和词级域分类器,有效提升了跨域分析性能,为解决数据缺乏问题提供新方案。
      刘涛, 冯翱, 高正杰
      2025, 24(1): 29-34. DOI: 10.11907/rjdk.232287
      摘要:方面情感分析是一种细粒度的情感分析任务,旨在从句子中提取方面词并识别其情感。由于方面术语的标注成本高昂,之前的工作通过跨领域转移公共知识来缓解新领域的数据缺乏问题。但这些方法的模型复杂,并且需要昂贵的多级预处理。针对这些问题,提出一种简单且有效的LPIDA模型。首先,从BERT模型的中间层开始,每层插入一组由多个可学习向量组成的软提示,以学习源域和目标域之间的域不变特征。其次,设置一个词级域分类器,将分类器的结果用于实例适应,使模型能更关注目标域中的单词。在4个基准英文数据集上的实验结果表明,所提出的LPIDA模型在10组不同域对上的跨域方面情感分析任务的平均Micro-F1达到47.01%,跨域方面词提取任务的平均Micro-F1达到52.29%。同时在3个中文数据集上进行测试,证明了该方法的有效性。  
      关键词:方面情感分析;后提示;域适应;实例适应;特征适应   
      2
      |
      0
      |
      0
      <HTML>
      <网络PDF><WORD><Enhanced-PDF><Meta-XML>
      <引用本文> <批量引用> 82077124 false
      更新时间:2025-02-10
    • 在地震资料处理领域,基于Swin-Transformer的改进去噪方法有效提升了去噪性能,SNR和SSIM分别最高提升2.33 dB和0.07。
      易玺, 罗仁泽
      2025, 24(1): 35-42. DOI: 10.11907/rjdk.241794
      摘要:随机噪声作为非相干噪声的主要组成部分,一直是地震资料处理的重点和难点。传统随机噪声压制方法在处理地震数据时容易出现伪影、边缘信息模糊等问题,有必要开发一种基于深度学习的随机噪声压制方法,通过直接学习图像的深层特征实现去噪。鉴于Swin-Transformer能够有效挖掘图像的深层信息,提出一种基于Swin-Transformer的改进去噪方法。该方法采用编码器—解码器的Unet框架,采用一长一短双通道并行提取编码器中的多个维度特征,并引入新的特征融合机制来合并这些特征,最终由解码器重现提取到的有用信息。采用实际工区数据进行测试,实验结果表明,与当前主流深度学习模型相比,所提方法的SNR和SSIM分别最高提升2.33 dB和0.07,去噪性能优异。  
      关键词:Swin-Transformer;Unet;图像去噪;地震数据   
      6
      |
      80
      |
      0
      <HTML>
      <网络PDF><WORD><Enhanced-PDF><Meta-XML>
      <引用本文> <批量引用> 78294238 false
      更新时间:2025-02-10
    • 股市波动预测研究取得新进展,专家构建PCA-GARCH-LSTM组合模型,有效提高股价预测准确性。
      姜敏, 张楚沂, 孙德山
      2025, 24(1): 43-48. DOI: 10.11907/rjdk.241669
      摘要:股市波动日益成为社会的焦点话题,如何高效且准确地预测股票价格成为当前热门研究课题。为减少计算量并提高工作效率,在预测前对股票数据采用降维技术,同时考虑股票波动情况,结合主成分分析(PCA)、广义自回归条件异方差(GARCH)和长短期记忆网络(LSTM)3种模型,构建组合模型进行股价预测。为检验模型预测效果,以上证指数和中证500指数为例,对收盘价进行预测。对比实验结果表明,该PCA-GARCH-LSTM组合模型的RMSE、MAE、MAPE值均小于其他对照模型,证明了该模型预测的有效性。  
      关键词:PCA模型;GARCH模型;LSTM模型;组合模型;股价预测   
      5
      |
      135
      |
      0
      <HTML>
      <网络PDF><WORD><Enhanced-PDF><Meta-XML>
      <引用本文> <批量引用> 78294358 false
      更新时间:2025-02-10
    • 在音乐启蒙教育领域,专家设计了一种基于智能手机传感器的音乐教学辅助方法,通过机器学习模型实现95%以上识别准确率,为儿童学习音乐提供新途径。
      林巧民, 燕城成, 张台国
      2025, 24(1): 49-56. DOI: 10.11907/rjdk.231577
      摘要:音乐启蒙教育对于儿童的性格塑造、听力与记忆力锻炼、审美能力提升具有重要作用。为此,设计一种易于儿童学习音乐的教学辅助方法。通过对智能手机自带传感器数据的处理,将不同角度的晃动方式区分为不同音符,再通过连续晃动达到演奏简谱的效果。选取加速度传感器,用于反映出手机在空间中晃动的方向变化。为提高动作识别的准确度与反馈的实时性,使用机器学习训练传感器数据分类模型并进行参数调优。实验结果表明,模型识别准确率可达95%以上。将移动应用接入分类模型后,通过不断设计迭代,尤其是引入人—机—曲三者协同机制后,晃动实验数据反馈及时且100%准确识别,从而使用户轻松晃动手机即可精确演奏出简谱中的音符序列。  
      关键词:传感器;动作识别;机器学习;音乐生成   
      12
      |
      36
      |
      0
      <HTML>
      <网络PDF><WORD><Enhanced-PDF><Meta-XML>
      <引用本文> <批量引用> 78294062 false
      更新时间:2025-02-10
    • 中药材胃病治疗实体识别研究取得进展,提出了BERT-BILSTM-CRF模型,准确率、召回率、F1值分别为85.20%、85.47%、85.33%。
      熊磊
      2025, 24(1): 57-64. DOI: 10.11907/rjdk.232026
      摘要:中药材用于胃病治疗的命名实体识别,是中药材开发领域文本信息挖掘的重要任务,也是构建知识图谱最重要的基础任务。为了更好地实现对中药材治疗胃病实体的提取,实验设计了5个命名实体识别模型进行实验比较,在预训练层、神经网络层,输出层都进行了不同设计,选择了更适合的BERT-BILSTM-CRF模型。首先,通过BERT生成特征提取层BILSTM的词向量;其次,利用BILSTM获取文本前后两个方向的特征得到相关特征向量;最后,利用CRF进行解码、标签预测,并讨论了模型各部分对实验的影响。实验表明,所提模型在自创数据集上的准确率、召回率、F1值分别为85.20%、85.47%、85.33%,相较于现有方法表现较好。  
      关键词:中药材胃病治疗;命名实体识别;深度学习;BERT;BILSTM-CRF   
      6
      |
      25
      |
      0
      <HTML>
      <网络PDF><WORD><Enhanced-PDF><Meta-XML>
      <引用本文> <批量引用> 78294406 false
      更新时间:2025-02-10
    • 在电力电子领域,研究者基于反步法设计了自适应神经网络反步控制方案,有效提升了Buck型降压变换器的输出电压恢复速度和稳定性。
      张逸
      2025, 24(1): 65-70. DOI: 10.11907/rjdk.241035
      摘要:针对Buck型降压变换器在负载投切、输入电压波动等情况下的控制问题,基于反步法设计了一种自适应神经网络反步控制方案。首先,应用径向基神经网络(RBFNN)设计自适应律,在线逼近系统中包含负载电阻项的非线性函数,以提升输出电压的恢复速度和稳定性。然后,引入广义比例积分观测器与神经网络自适应律分工处理系统中存在的不同类型扰动,以增强控制器的抗干扰能力。最后,结合反步控制与神经网络自适应技术,设计了Buck型降压变换器的自适应神经网络反步控制(ANNBC)。实验结果表明,所提方案在负载投切阶段将最大偏离电压从0.87 V减少到0.35 V,验证了该方案的有效性和优越性。  
      关键词:反步控制;神经网络;Buck变换器;自适应控制;观测器   
      8
      |
      21
      |
      0
      <HTML>
      <网络PDF><WORD><Enhanced-PDF><Meta-XML>
      <引用本文> <批量引用> 78293938 false
      更新时间:2025-02-10

      区块链技术及应用

    • 在纺织服装领域,专家提出了基于双链结构和Schnorr门限签名的溯源方案,有效提升了数据查询效率和安全性。
      史爱武, 李林逸, 袁艳丽, 胡子晗, 张世林
      2025, 24(1): 71-77. DOI: 10.11907/rjdk.232296
      摘要:随着纺织服装行业的不断发展,产品溯源已成为保障服装质量和提升品牌信誉的重要环节。传统的溯源方案存在信息不对称、透明度不足以及易篡改等问题。为此,提出一种基于双链结构和Schnorr门限签名的纺织服装溯源方案。该方案通过智能合约建立私有链和联盟链之间的映射关系,简化了数据交互,有效提高了溯源数据的查询效率。引入Schnorr门限签名技术,有效应对数据篡改风险,确保溯源数据的安全上链。实验结果显示,采用Schnorr门限签名技术能够缩短私有链交易完成时间约5.13%,并且当数据量足够大时,该方案查询效率提升了87.5%,效果显著。  
      关键词:区块链;溯源;门限签名;数据安全;双链结构   
      18
      |
      46
      |
      0
      <HTML>
      <网络PDF><WORD><Enhanced-PDF><Meta-XML>
      <引用本文> <批量引用> 78294034 false
      更新时间:2025-02-10
    • 在区块链领域,专家提出了NE-Gossip广播算法,优化了底层P2P消息广播网络,提高了广播覆盖率。
      黄春霖, 何晋, 周迅
      2025, 24(1): 78-85. DOI: 10.11907/rjdk.232159
      摘要:与传统中心化架构的系统相比,去中心化的区块链网络吞吐量仍处于较低水平。为此,许多研究从共识机制、分片机制等对区块链的可扩展性进行了探索。然而,随着吞吐量的提升,区块链系统对底层消息广播网络效率的要求也在不断提高。由此,着眼于底层P2P消息广播网络,在Gossip的算法中引入邻居节点评估机制,提出NE-Gossip广播算法,根据评估结果在消息转发时选择具有更好消息转发能力的节点。实验结果表明,在同样的广播冗余度下,NE-Gossip算法在广播覆盖率上具有更好的表现。  
      关键词:广播算法;P2P网络;Gossip;转发节点选择;区块链   
      9
      |
      22
      |
      0
      <HTML>
      <网络PDF><WORD><Enhanced-PDF><Meta-XML>
      <引用本文> <批量引用> 78293966 false
      更新时间:2025-02-10

      图形图像处理

    • 在藏药材植物识别领域,专家提出了基于改进YOLOv8的轻量级检测算法LTP-YOLO,有效提升了户外环境中藏药材植物的检测精度,为移动设备高精度、低计算部署需求提供了解决方案。
      罗志凌, 李东, 刘晓静
      2025, 24(1): 86-92. DOI: 10.11907/rjdk.241753
      摘要:由于藏药生长环境恶劣,人工识别藏药材植物非常困难,提出一种基于改进YOLOv8的轻量级检测算法LTP-YOLO检测户外环境中的藏药材植物。首先,利用MobileViT替换YOLOv8特征提取网络来减少算法参数量和计算量。其次,引入内容感知特征重组上采样算子CARAFE帮助算法在上采样时感知上下文信息。再次,提出多尺度融合注意力机制MFA建立局部跨通道交互提升算法检测精度。实验表明,所提算法将参数量从3.02 MB减少到1.28 MB,计算量从8.2 GFLOPs减少到5.8 GFLOPs,在自建的藏药植物图像数据集上mAP@.5相较于YOLOv8更优。证明了该算法可满足移动设备的高精度、低计算部署需求,并在各种密集植物检测任务中显示出广阔的应用前景。  
      关键词:藏药材植物;深度学习;目标检测;轻量化算法;YOLOv8   
      10
      |
      26
      |
      0
      <HTML>
      <网络PDF><WORD><Enhanced-PDF><Meta-XML>
      <引用本文> <批量引用> 78294299 false
      更新时间:2025-02-10
    • 在计算机图形学领域,专家提出了一种将非流形曲面转化为二流形拓扑结构的方法,为非流形网格曲面与传统数字几何处理之间构建桥梁。
      孟文龙, 于航, 濮彦博, 史晓晓, 辛士庆
      2025, 24(1): 93-101. DOI: 10.11907/rjdk.241791
      摘要:计算机图形学中的许多建模操作会产生非流形曲面,虽然非流形曲面具有更加复杂的拓扑特性和更强大的几何描述能力,但图形学领域中许多网格处理算法包括骨架提取、网格简化、细分等都要求输入的网格具有二流形的性质。为了确保已生成的非流形曲面能够与现有图形学算法兼容,提出一种方法,利用改进的双链面表数据结构(DLFL)将非流形曲面转化为在几何外观上近似的二流形拓扑结构,以此构建非流形网格曲面与传统数字几何处理之间的桥梁。为了验证算法框架的通用性,将其应用于非流形曲面的3个关键应用场景:测地距离场计算、网格简化和最远点采样。通过对这些应用实例的深入分析,验证了算法在不同场景下的稳健性和准确性。实验结果表明,算法在各应用场景中表现出显著成效,进一步证实了其在实际应用中的潜力。  
      关键词:非流形曲面;双链面表;测地距离场;网格简化;最远点采样   
      2
      |
      0
      |
      0
      <HTML>
      <网络PDF><WORD><Enhanced-PDF><Meta-XML>
      <引用本文> <批量引用> 78378200 false
      更新时间:2025-02-10
    • 在唐卡元素目标检测领域,专家优化YOLOv8模型,提升检测效率和准确率,为唐卡元素识别提供新方案。
      程维龙, 僧冰枫, 刘晓静
      2025, 24(1): 102-108. DOI: 10.11907/rjdk.241837
      摘要:唐卡中的元素绘制复杂且存在的多尺度情况会影响目标检测技术任务的准确度。为此,提出一种优化YOLOv8模型的唐卡元素目标检测方法。首先,采用级联融合网络提取图像特征,并将特征提取参数用于后续的特征融合,以有效增加参数利用效率;其次,借鉴双向特征金字塔网络的思想,在同一层的特征信息传递层中增加一条额外的路径实现跨尺度连接,以提升模型特征融合能力;最后,在检测头的回归损失函数中引入ElOU-Loss和ClOU-Loss,考虑边界框回归的多种因素,结合宽高和宽高比参数来提升模型目标定位效率和准确率。实验表明,优化后的YOLOv8模型相较于原有模型参数量、计算量分别下降7.21%、7.23%,mAP50、mAP50-95分别提升3.72%、4.55%;相较于其他目标检测算法优势明显;消融实验也验证了不同改进模块对模型的积极作用。  
      关键词:唐卡图像目标检测;YOLOv8模型;级联融合网络;跨尺度连接;回归损失函数   
      2
      |
      0
      |
      0
      <HTML>
      <网络PDF><WORD><Enhanced-PDF><Meta-XML>
      <引用本文> <批量引用> 82077312 false
      更新时间:2025-02-10
    • 在高效超分辨率领域,研究者提出了对称视觉注意力网络SVAN,通过分解大核卷积和瓶颈注意力模块,显著提升了图像重建质量,同时降低了模型参数量,为高效超分辨率提供了新思路。
      吴承旭, 胡靖
      2025, 24(1): 109-114. DOI: 10.11907/rjdk.241062
      摘要:高效超分辨率的研究重点是改进深度小核卷积来降低模型复杂度、提升效率,但较小的感受野会限制网络细节重建能力,大核卷积虽能提供更大的感受野、提升图像重建质量,但计算成本过高。为了减少模型参数数量并实现高效超分辨率重建,提出一种对称视觉注意力网络SVAN。首先将大核卷积分解为3种不同的轻量高效卷积,在卷积组合中借助不同卷积的感受野尺寸形成瓶颈结构,并与注意力机制结合成瓶颈注意力模块来增强网络对特征的关注能力;其次,将瓶颈注意力模块对称排布构成对称大核注意力块,以进一步提升网络提取深层特征的能力。实验表明,所提模型相较于其他轻量化超分辨率方法定量指标提升明显,重建的图像纹理细节更丰富,参数量仅为183 K,是一个具有竞争力的轻量化高质量超分辨模型,为高效超分辨率提供了新的解决思路。  
      关键词:图像超分辨率重建;大核卷积;感受野;视觉注意力   
      7
      |
      41
      |
      0
      <HTML>
      <网络PDF><WORD><Enhanced-PDF><Meta-XML>
      <引用本文> <批量引用> 78295049 false
      更新时间:2025-02-10
    • 在医学影像领域,研究者提出了一种U型卷积网络模型,有效提高了肺部CT图像分割精度,为肺癌等疾病分析提供支持。
      全福, 张智高, 王郝日钦, 关强, 王庆虎
      2025, 24(1): 115-122. DOI: 10.11907/rjdk.241823
      摘要:肺部CT图像分割是计算机辅助诊断系统识别肺癌等疾病的基础步骤,但肺部组织的多样性易造成CT图像的肺部区域出现局部噪点,且心脏等器官的介入也易导致肺部边缘模糊。为解决上述问题,提出一种结合局部上下文关系建模与自适应感知学习的U型卷积网络模型。针对肺部区域的局部噪点,模型通过周边信息对肺部特征构建多层次的上下文关系,增强网络对多样肺细胞的识别能力。针对边界难以区分的问题,设计了自适应感知学习模块:模块设计了混合注意力从通道层面与空间层面引导模型赋予肺部区域更多的关注;自适应感知模块之间由下至上的特征融合机制增强了模型识别肺部特征的鲁棒性。该方法在LUNA和SHCXR两个肺部分割数据集上取得了98.58%和97.68%分割精度,较其他分割方法平均提升了0.34%和0.25%,可为进一步的肺部疾病分析提供有力支持。  
      关键词:图像分割;肺部图像分割;U型网络;上下文关系学习;自适应感知学习   
      6
      |
      36
      |
      0
      <HTML>
      <网络PDF><WORD><Enhanced-PDF><Meta-XML>
      <引用本文> <批量引用> 78294460 false
      更新时间:2025-02-10
    • 在扬尘污染源监测领域,基于CenterNet的轻量级目标检测方法mCFP-CenterNet,有效降低了漏检率,满足了轻量化高精度的应用需求。
      蒋方冰, 周围, 田灵娣, 郑娜
      2025, 24(1): 123-128. DOI: 10.11907/rjdk.231930
      摘要:近年来,人工智能、图像识别技术在扬尘污染源的监测和管理上发挥着越来越重要的作用。为实现轻量化高精度的扬尘污染源检测,提出一种基于CenterNet的轻量级扬尘污染源目标检测方法。首先,为解决图像中部分目标漏检问题,提出基于一次性聚集扩张的扬尘污染源检测方法,使用一次性聚集扩张模块替代常规卷积,在扩大感受野的同时获得包含不同接受域的特征,降低了检测的平均漏检率;其次,针对监测网络的轻量化需求,引入MobileNet并加入集中特征金字塔实现特征融合,由此提出基于集中特征金字塔的轻量级污染源检测方法mCFP-CenterNet;最后,构建一个扬尘污染源图像数据集,并在该数据集和PASCAL VOC 2007数据集上进行实验。结果表明,该方法在推理时间、计算量、参数量、平均漏检率等评价指标上与其他方法相比效果更好,可满足轻量级和高精度的应用需求。  
      关键词:目标检测;CenterNet;扬尘污染源;特征融合;轻量化模型   
      15
      |
      19
      |
      0
      <HTML>
      <网络PDF><WORD><Enhanced-PDF><Meta-XML>
      <引用本文> <批量引用> 78294096 false
      更新时间:2025-02-10
    • 在生物医学图像处理领域,专家提出了一种基于密度峰值聚类、自适应优化参数的细胞定位方法,为细胞定位工作提供高准确度自动化方法,具有良好前景。
      谢经辉, 杨昊, 周航, 葛澍
      2025, 24(1): 129-135. DOI: 10.11907/rjdk.232307
      摘要:自动准确地定位生物医学成像图像中的大量细胞对生物医学研究具有重要意义。现有图像处理方法定位分布密集和黏连细胞的精度不高,且参数设置对数据十分敏感。为此,提出一种基于密度峰值聚类、自适应优化参数的细胞定位方法。首先,建立深度学习模型进行细胞分割以提升聚类效果;其次,分析图像前景区域局部密度与较高密度点的最小距离趋势性变化,以自动优化密度阈值和距离阈值参数来选取聚类中心,实现对密集、黏连细胞的自动定位。与常用的5种算法比较发现,所提方法在荧光微光学切片断层扫描成像小鼠数据集中的检出率、准确率分别为0.89和0.81,在更复杂的数据集中相较于比较方法更优,为细胞定位工作提供了一种新的高准确度自动化方法,在生物医学图像处理的计算机应用领域具有良好前景。  
      关键词:密度峰值聚类;细胞定位;自适应;机器学习   
      6
      |
      18
      |
      0
      <HTML>
      <网络PDF><WORD><Enhanced-PDF><Meta-XML>
      <引用本文> <批量引用> 78294989 false
      更新时间:2025-02-10
    • 在计算机视觉领域,3DSC点云配准算法经优化,显著提升配准效率,缩短配准时间。
      董胜, 李曾, 曹振杰
      2025, 24(1): 136-141. DOI: 10.11907/rjdk.231912
      摘要:随着三维扫描技术的发展,大量点云数据被生成,如何有效处理与分析这些数据成为一个重要问题。点云配准是点云处理的一个关键步骤,3DSC是一种基于特征的配准算法,广泛应用于计算机视觉领域。该算法具有较高的配准精度,但对大规模点云数据或噪声干扰严重的数据进行配准时存在配准时间过长的问题,在对精度和配准效率要求较高的场景下不适用。为解决该问题,首先,对3DSC算法进行优化,在其配准时提取体素中心进行降采样处理,将完整的点云数据重复进行八叉树分割,直至达到最大递归深度或者不能再分割;其次,对每8个相邻最小单元内的数据点提取体素中心;最后,将所有体素中心重新构建成新的点云数据并进行配准。相较于传统的3DSC算法,优化后的3DSC具有更高的配准效率,大大缩短了配准时间。  
      关键词:点云配准;八叉树;体素中心;3DSC算法   
      2
      |
      0
      |
      0
      <HTML>
      <网络PDF><WORD><Enhanced-PDF><Meta-XML>
      <引用本文> <批量引用> 78375177 false
      更新时间:2025-02-10
    • 在链轨节缺陷检测领域,研究者提出了FCOS-TCA模型,通过改进特征提取和损失函数,提升了检测精度,为链轨节表面及次表面缺陷检测提供了新方案。
      张畅, 赵正晖, 汪洋
      2025, 24(1): 142-149. DOI: 10.11907/rjdk.232279
      摘要:针对现阶段链轨节生产线上磁粉探伤检测任务中小尺寸裂纹缺陷难以检测,以及复杂背景下缺陷识别准确率不高的问题,提出一种改进的FCOS缺陷检测方法FCOS-TCA。首先,引入Swin Transformer作为特征提取网络,提升对小目标的特征提取能力;其次,基于路径聚合特征金字塔网络与协调注意力机制提出CA-PAFPN模块,以促进高低维多尺度特征信息融合;最后,将边界框回归损失函数优化为EIoU_loss损失函数,以加速模型收敛,提高回归精度。采用自制TL数据集进行验证分析,结果表明,FCOS-TCA模型平均精度为83.7%,与原始FCOS模型相比提升了6.5%,对于推动链轨节表面以及次表面缺陷检测发展具有一定的参考价值。  
      关键词:FCOS;链轨节;目标检测;Swin Transformer;CA-PAFPN   
      6
      |
      21
      |
      0
      <HTML>
      <网络PDF><WORD><Enhanced-PDF><Meta-XML>
      <引用本文> <批量引用> 78293804 false
      更新时间:2025-02-10
    • 在遥感图像变化检测领域,专家提出了改进的BIT网络,通过融合局部与全局信息提升检测精度,为解决复杂场景下变化检测问题提供新方案。
      彭海峰, 傅迎华
      2025, 24(1): 150-157. DOI: 10.11907/rjdk.241001
      摘要:变化检测是通过分析同一地点两个不同阶段的遥感图像来获取地表变化的过程。卷积神经网络难以解决复杂场景下的变化检测任务。BIT网络在卷积后串联Transformer,通过捕获全局信息改善检测效果。然而,直接串联Transformer会削弱局部信息特征表示能力,从而导致漏检现象。为此,在BIT网络的基础上使用残差网络将Transformer前后对应的局部与全局信息融合起来,以弥补直接串联Transformer对局部信息造成的损失,达到提升精度的目的。同时针对遥感图像中变化与不变化类不平衡问题,加入新的损失函数Dice来优化训练。实验结果表明,在公开数据集LEVIR-CD与BCDD上,改进后网络在参数量增加0.02 M的情况下,F1指标分别提升了0.51%与0.69%;召回率分别提升了0.45%与0.50%。  
      关键词:卷积神经网络;变化检测;Transformer;残差网络;遥感图像   
      13
      |
      52
      |
      0
      <HTML>
      <网络PDF><WORD><Enhanced-PDF><Meta-XML>
      <引用本文> <批量引用> 78294008 false
      更新时间:2025-02-10
    • 在滇池湿地水质保护领域,基于GEE平台的Sentinel影像数据,采用3种机器学习方法进行湿地分类,其中RF方法分类性能最优,总体精度达86.81%。
      罗蓉蓉, 董燕
      2025, 24(1): 158-163. DOI: 10.11907/rjdk.232132
      摘要:湿地是维护滇池湖泊水质的重要屏障。快速、准确地获取滇池湿地类型分布对于其水质保护具有重要意义,然而目前关于滇池不同湿地类型的研究存在明显不足。为此,基于GEE平台的Sentinel-1和Sentinel-2影像数据对滇池湿地进行分类,分析比较不同分类特征组合应用3种机器学习方法(SVM、CART和RF)分类的性能。结果表明,RF的分类性能优于CART和SVM;其使用光谱波段、光谱指数、雷达特征、地形特征、纹理特征作为分类依据时的总体分类精度和沼泽湿地分类精度最高,总体精度为86.81%,Kappa系数为0.84%,F得分为85.83%,对木本沼泽和草本沼泽分类的F得分分别为85.71%、78.69%。  
      关键词:湿地分类;机器学习;GEE平台;滇池;Sentinel影像   
      6
      |
      25
      |
      0
      <HTML>
      <网络PDF><WORD><Enhanced-PDF><Meta-XML>
      <引用本文> <批量引用> 78294276 false
      更新时间:2025-02-10

      计算机人才与教育

    • 在新工科背景下,大数据产业快速发展,对数据科学与大数据技术专业实践教育提出更高要求。专家探讨了实践教学现状与问题,并提出创新实践平台建设方案,以提升教学质量。实践表明,该平台优化了教学资源配置,提高了教学效果,为培养高质量大数据人才提供了有力支撑。
      李杰
      2025, 24(1): 164-168. DOI: 10.11907/rjdk.241664
      摘要:新工科背景下大数据产业迅猛发展,对数据科学与大数据技术专业的实践教育提出了更高要求。探讨大数据专业实践教学的现状与问题,并结合实际提出创新实践平台建设方案,以提升实践教学质量。通过对数年办学经验进行梳理,发现实践教学存在与行业发展脱节、体系不完整、软硬件资源不足等问题。为此,构建一个融合虚拟化技术与容器技术的创新实践平台,采用高性能计算资源和大容量存储系统支持虚拟实验环境、项目实训、创新创业和竞赛等多样化实践需求,显著提升了学生的实践能力和创新思维,拓展了其技术视野。实践表明,创新实践平台不仅优化了教学资源配置,提高了大数据专业的实践教学效果,而且为培养符合工程认证理念的高质量大数据人才提供了有力支撑,同时也为相关学科实践教学提供了有益参考。  
      关键词:新工科;大数据;实践教学;创新实践平台   
      2
      |
      0
      |
      0
      <HTML>
      <网络PDF><WORD><Enhanced-PDF><Meta-XML>
      <引用本文> <批量引用> 82076862 false
      更新时间:2025-02-10
    • 在教育数字化转型背景下,移动学习成为新常态。专家提出预训练语言模型和大数据挖掘相结合的教育APP评价技术方案,为数字化语言教学资源科学治理提供解决方案。
      郑明鉴, 徐娟
      2025, 24(1): 169-175. DOI: 10.11907/rjdk.241652
      摘要:在教育数字化转型的背景下,移动学习成为数字学习的新常态。语言学习移动应用程序(APP)已经成为外语学习者学习语言的重要工具。秉持“数据循证”的评价观,提出预训练语言模型和大数据挖掘相结合的教育APP评价技术方案,采集主流应用市场上下载量最高的20款语言学习APP的用户评论数据,并利用预训练语言模型计算出评论文本的情感分值。在文本信息的基础上,通过主题建模等技术分析学习者在使用APP辅助语言学习时的需求和偏好,并尝试从中提取出针对APP评价的多项指标。最后,综合各项分析结果建立一套准确、客观的语言学习APP评价体系,并对已采集评论信息的APP进行实例可视化分析,旨在发挥预训练语言模型和数据要素的价值,助力数字化语言教学资源的科学治理。  
      关键词:APP;语言学习;数据挖掘;预训练语言模型;评价可视化;情感分析   
      2
      |
      0
      |
      0
      <HTML>
      <网络PDF><WORD><Enhanced-PDF><Meta-XML>
      <引用本文> <批量引用> 82077200 false
      更新时间:2025-02-10
    • 在科学计算与可视化教学中,通过数独图像识别与求解案例,综合应用多学科知识,强化学生系统化实践能力,取得良好教学效果。
      张永飞, 曲英勃, 张莉, 刘芳
      2025, 24(1): 176-182. DOI: 10.11907/rjdk.241809
      摘要:科学计算与可视化是科学研究的支撑技术,而案例化教学是重要的教学手段。在对基于MWORKS的科学计算与可视化课程教学案例设计理念简介的基础上,重点介绍数独图像识别与求解这一典型案例。综合应用数字图像处理课程中的图像矫正、分割等图像预处理知识,机器学习导论课程中的分类器、深度学习等知识,算法设计与分析课程中的回溯和剪枝优化等算法,以及MWORKS的科学计算与可视化工具,实现图像预处理、(手写或标准)数字识别、数独求解和可视化展示等整个系统流程,强化了学生综合运用所学知识思考和解决实际问题的系统化实践能力,取得了较好的教学效果,同时具有良好的示范应用价值。  
      关键词:科学计算与可视化;MWORKS平台;系统化实践;数独图像识别与求解   
      2
      |
      0
      |
      0
      <HTML>
      <网络PDF><WORD><Enhanced-PDF><Meta-XML>
      <引用本文> <批量引用> 82077261 false
      更新时间:2025-02-10

      研究综述

    • 在机器学习领域,生成式人工智能取得突破性进展,专家全面回顾最新进展,为行业实践和未来研究提供参考。
      尹义鹏, 施水才, 黄自力
      2025, 24(1): 183-192. DOI: 10.11907/rjdk.232227
      摘要:生成式人工智能一直是机器学习领域的热点话题,在文本生成、计算机视觉等多个领域都有广泛应用。最大似然估计方法确立了生成模型的训练目标,但在满足用户个性化需求方面尚有不足之处。近年来,强化学习通过引入人为定制的评价机制等新的训练信号,在构建高性能模型方面展示出一定潜力,为生成式人工智能模型的设计与应用带来突破性进展。对生成式人工智能领域的最新进展进行全面系统的回顾,从跨领域的视角进行分类总结,梳理各类模型及其应用场景;重点关注快速发展的大模型技术,探讨当前存在的限制及未来的发展方向。通过剖析模型的弱点全面深入地了解生成人工智能的理论基础与实践应用现状,以期有助于指导行业实践,亦为未来研究提供参考。  
      关键词:强化学习;生成式人工智能;最大似然估计   
      45
      |
      108
      |
      0
      <HTML>
      <网络PDF><WORD><Enhanced-PDF><Meta-XML>
      <引用本文> <批量引用> 54043075 false
      更新时间:2025-02-10
    • 在线平台个人意见激增,情感分析领域最新进展为机构提供深入了解用户情感倾向、优化产品服务、市场决策支持,探讨局限性与未来研究方向。
      王钦炀, 施水才, 王洪俊
      2025, 24(1): 193-202. DOI: 10.11907/rjdk.232257
      摘要:随着在线平台个人意见数量激增,情感分析变得至关重要,其能帮助机构深入了解用户的情感倾向,优化产品服务,为市场决策提供有力支持,更精准地理解社会舆论动向。综述情感分析领域的最新进展,包括预处理技术、特征提取方法、分类技术、常用数据集等,探讨该领域的局限性与未来研究方向,以期为相关研究人员与从业人员提供有价值的资源。  
      关键词:情感分析;机器学习;深度学习;集成学习;数据集   
      24
      |
      80
      |
      0
      <HTML>
      <网络PDF><WORD><Enhanced-PDF><Meta-XML>
      <引用本文> <批量引用> 78294131 false
      更新时间:2025-02-10
    • 据最新研究,表情识别技术研究聚焦深度学习、多模态融合及微表情识别,为未来研究提供新方向。
      徐新爱
      2025, 24(1): 203-210. DOI: 10.11907/rjdk.241731
      摘要:表情识别研究是人工智能技术研究的重要研究方向。为此,采用CiteSpace科学知识图谱软件,统计分析2014—2023年中国知网中中文核心期刊和CSSCI期刊收录的表情研究领域的702篇文献,从文献的时间分布、主要期刊来源、核心作者及合作关系、研究机构合作、关键词共现和凸现、关键词聚类等方面,分析该领域的研究者力量、研究热点主题及研究前沿。研究表明,表情研究领域的研究内容主要聚焦在深度学习技术的应用与模型创新、多模态融合与跨领域技术、微表情识别与特殊群体表情识别,基于此提出表情识别下一步需要深入研究与解决的理论与应用问题,既为表情识别领域的学者提供了全面的研究现状和前沿动态,又为未来研究方向提供了参考。  
      关键词:表情识别;CiteSpace;知识图谱;研究热点;研究趋势   
      2
      |
      0
      |
      0
      <HTML>
      <网络PDF><WORD><Enhanced-PDF><Meta-XML>
      <引用本文> <批量引用> 82077314 false
      更新时间:2025-02-10
    • 图像字幕生成技术取得显著进展,深度学习模型和视觉—语言预训练技术发挥重要作用,但仍面临物体虚构等挑战。
      周峻宇, 施水才, 王洪俊
      2025, 24(1): 211-220. DOI: 10.11907/rjdk.232315
      摘要:图像字幕生成是一个重要且充满挑战的研究领域,旨在为静态图像生成自然语言描述,其在深度学习和视觉—语言预训练技术的推动下取得明显进步。阐述深度学习方法在图像字幕生成中的应用,介绍几种基于深度学习的模型和算法,包括循环神经网络、卷积神经网络、对抗生成网络和Transformer等模型,以及最新的视觉—语言预训练技术。这些模型在图像字幕生成任务中发挥了重要作用,通过学习图像与语言之间的关联,能够生成准确且流畅的描述。同时,强调该领域面临的挑战,如物体虚构、缺失上下文、光照条件、语境理解和指代表达等问题,需要模型具备推理能力。未来,将进一步提高图像字幕生成的性能和质量,推动其在实际应用中的应用。  
      关键词:图像字幕生成;深度学习;跨模态;计算机视觉;自然语言处理   
      11
      |
      32
      |
      0
      <HTML>
      <网络PDF><WORD><Enhanced-PDF><Meta-XML>
      <引用本文> <批量引用> 78294554 false
      更新时间:2025-02-10
    0