您当前所在位置: 首页 > 首发论文
动态公开评议须知

1. 评议人本着自愿的原则,秉持科学严谨的态度,从论文的科学性、创新性、表述性等方面给予客观公正的学术评价,亦可对研究提出改进方案或下一步发展的建议。

2. 论文若有勘误表、修改稿等更新的版本,建议评议人针对最新版本的论文进行同行评议。

3. 每位评议人对每篇论文有且仅有一次评议机会,评议结果将完全公示于网站上,一旦发布,不可更改、不可撤回,因此,在给予评议时请慎重考虑,认真对待,准确表述。

4. 同行评议仅限于学术范围内的合理讨论,评议人需承诺此次评议不存在利益往来、同行竞争、学术偏见等行为,不可进行任何人身攻击或恶意评价,一旦发现有不当评议的行为,评议结果将被撤销,并收回评审人的权限,此外,本站将保留追究责任的权利。

5. 论文所展示的星级为综合评定结果,是根据多位评议人的同行评议结果进行综合计算而得出的。

勘误表

上传勘误表说明

  • 1. 请按本站示例的“勘误表格式”要求,在文本框中编写勘误表;
  • 2. 本站只保留一版勘误表,每重新上传一次,即会覆盖之前的版本;
  • 3. 本站只针对原稿进行勘误,修改稿发布后,不可对原稿及修改稿再作勘误。

示例:

勘误表

上传勘误表说明

  • 1. 请按本站示例的“勘误表格式”要求,在文本框中编写勘误表;
  • 2. 本站只保留一版勘误表,每重新上传一次,即会覆盖之前的版本;
  • 3. 本站只针对原稿进行勘误,修改稿发布后,不可对原稿及修改稿再作勘误。

示例:

上传后印本

( 请提交PDF文档 )

* 后印本是指作者提交给期刊的预印本,经过同行评议和期刊的编辑后发表在正式期刊上的论文版本。作者自愿上传,上传前请查询出版商所允许的延缓公示的政策,若因此产生纠纷,本站概不负责。

发邮件给 王小芳 *

收件人:

收件人邮箱:

发件人邮箱:

发送内容:

0/300

论文收录信息

论文编号 202503-245
论文题目 基于特征增强的轻量化高效扩散模型
文献类型
收录
期刊

上传封面

期刊名称(中文)

期刊名称(英文)

年, 卷(

上传封面

书名(中文)

书名(英文)

出版地

出版社

出版年

上传封面

书名(中文)

书名(英文)

出版地

出版社

出版年

上传封面

编者.论文集名称(中文) [c].

出版地 出版社 出版年-

编者.论文集名称(英文) [c].

出版地出版社 出版年-

上传封面

期刊名称(中文)

期刊名称(英文)

日期--

在线地址http://

上传封面

文题(中文)

文题(英文)

出版地

出版社,出版日期--

上传封面

文题(中文)

文题(英文)

出版地

出版社,出版日期--

英文作者写法:

中外文作者均姓前名后,姓大写,名的第一个字母大写,姓全称写出,名可只写第一个字母,其后不加实心圆点“.”,

作者之间用逗号“,”分隔,最后为实心圆点“.”,

示例1:原姓名写法:Albert Einstein,编入参考文献时写法:Einstein A.

示例2:原姓名写法:李时珍;编入参考文献时写法:LI S Z.

示例3:YELLAND R L,JONES S C,EASTON K S,et al.

上传修改稿说明:

1.修改稿的作者顺序及单位须与原文一致;

2.修改稿上传成功后,请勿上传相同内容的论文;

3.修改稿中必须要有相应的修改标记,如高亮修改内容,添加文字说明等,否则将作退稿处理。

4.请选择DOC或Latex中的一种文件格式上传。

上传doc论文  修改稿:下载
请上传模板编辑的DOC文件

上传latex论文

* 上传模板导出的pdf论文文件(须含页眉)

* 上传模板编辑的tex文件

回复成功!


  • 0

基于特征增强的轻量化高效扩散模型

首发时间:2025-03-24

刘晓斌 1   

刘晓斌(2001-),男,现为北方工业大学大学电气与控制工程学院控制科学与工程方向的硕士研究生,导师为张师林教授。研究主要集中在世界模型、自动驾驶以及神经渲染的应用,特别是基于大模型多代理协作的交通场景仿真方法研究。

张师林 1   

张师林(1980-),男,副教授、硕导,计算机视觉

  • 1、北方工业大学电气与控制工程学院,北京市 100144

摘要:扩散模型在图像生成领域取得了显基于特征增强的轻量化高效扩散模型著进展,但其在潜在空间的图像生成质量仍有改进空间。U-DiT作为一种结合 U-Net 和 Transformer 的高效扩散模型,在图像生成任务中表现出色,然而其特征表示能力尚待进一步优化。本文提出了一种基于通道间依赖的特征增强方法Channel-Correlation Adaptive Recalibration (CCAR),通过在Transformers块的自注意力层之前引入这种方法,可以自适应调整通道权重,与U-DiT的下采样自注意力(强调全局低频信息)形成互补,优化特征图的通道维度,增强模型对细节和结构的捕捉能力,从而提升对任务关键特征的表达能力。此外,CCAR的残差连接设计避免了额外的参数开销,提高特征提取能力的同时保证了模型的轻量化。在 ImageNet 数据集上的实验表明,改进后的 U-DiT 模型在Frechet Inception Distance(FID)指标上从 10.08 降低至 8.08,Inception Score(IS)从112.44提升至121.33,生成图像质量显著优于原始模型。本研究为扩散模型的改进提供了新的思路,并突显了通道间依赖建模在提升图像生成性能方面的潜力。

关键词: 人工智能 扩散模型 Transformer 通道注意力 图像生成

For information in English, please click here

Lightweight and Efficient Diffusion Model Based on Feature Enhancement

liuxiaobin 1   

刘晓斌(2001-),男,现为北方工业大学大学电气与控制工程学院控制科学与工程方向的硕士研究生,导师为张师林教授。研究主要集中在世界模型、自动驾驶以及神经渲染的应用,特别是基于大模型多代理协作的交通场景仿真方法研究。

zhangshilin 1   

张师林(1980-),男,副教授、硕导,计算机视觉

  • 1、North China University of Technology, School of Electrical and Control Engineering, Beijing 100144, China

Abstract:Diffusion models have made significant progress in the field of image generation, but there is still room for improvement in the quality of image generation within latent space. U-DiT, an efficient diffusion model that combines U-Net and Transformer architectures, excels in image generation tasks. However, its feature representation capabilities require further enhancement. This paper introduces a feature enhancement method based on inter-channel dependencies named Channel-Correlation Adaptive Recalibration (CCAR). By incorporating CCAR before the self-attention layers within the Transformers blocks, it adaptively adjusts channel-wise weights, complementing the downsampled self-attention mechanism of U-DiT, whiLightweight and Efficient Diffusion Model Based on Feature Enhancementch emphasizes global low-frequency information. This approach optimizes the channel dimensions of feature maps, enhancing the model\'s ability to capture details and structures, thus improving its expression of task-critical features. Moreover, the residual connection design of CCAR avoids additional parameter overhead, enhancing feature extraction capabilities while ensuring the lightweight nature of the model. Experiments on the ImageNet dataset show that the improved U-DiT model reduces the Fréchet Inception Distance (FID) from 10.08 to 8.08 and increases the Inception Score (IS) from 112.44 to 121.33, demonstrating significantly better image generation quality compared to the original model. This study offers new insights into the enhancement of diffusion models and highlights the potential of modeling inter-channel dependencies to boost image generation performance.

Keywords: Artificial Intelligence;Diffusion Models;Transformer;Channel Attention;Image Generation

Click to fold

点击收起

论文图表:

引用

导出参考文献

.txt .ris .doc
刘晓斌,张师林. 基于特征增强的轻量化高效扩散模型[EB/OL]. 北京:中国科技论文在线 [2025-03-24]. https://www.paper.edu.cn/releasepaper/content/202503-245.

No.****

动态公开评议

共计0人参与

动态评论进行中

评论

全部评论

0/1000

勘误表

基于特征增强的轻量化高效扩散模型