- 通过质量多样性数据合成和语言模型的生成设计
通过将优化、约束满足和语言模型结合起来,我们提出了一种新颖的方法来解决工程应用中生成模型面临的两个基本挑战:获取高性能多样的数据集和生成符合精确约束的设计。我们的方法使用品质多样性 (Quality-Diversity, QD) 生成多样化 - 建筑设计的生成式人工智能:文献综述
这篇文章探讨了生成人工智能在建筑设计中的广泛应用,从生成 2D 图像、视频和 3D 模型的基本原理到对建筑设计各个阶段的影响,指出了设计创新的新方向和应用生成人工智能的新轨迹。
- 代码外壳技术报告
CodeShell-Base 是一个七十亿参数的基础模型,具有 8K 上下文长度,通过将 Grouped-Query Attention 和 Rotary Positional Embedding 整合到 GPT-2 中,它集成了 Star - MobileVLM V2:视觉语言模型的更快、更强基准
MobileVLM V2 是在 MobileVLM 的基础上进行显著改进的一系列视觉语言模型,证明了新颖的结构设计、为移动 VLM 量身定制的改进训练方案和优质数据集的精心策划可以显著提高 VLM 的性能。特别是,MobileVLM V2 - Marabou 2.0: 一个多功能的神经网络形式分析工具
这篇论文全面介绍了用于神经网络形式分析的 Marabou 框架 2.0 版本的系统,讨论了自初始发布以来引入的主要特征和组件,并突出了其架构设计。
- 揭示空间:从室内空间图像中获取具有建筑意义的语义描述
该研究论文旨在通过提出的模型从二维场景中提取具有建筑意义的语义描述,通过训练合成生成的图像以及相应的高级建筑结构,使用像素级比较评估,在真实环境中对其性能进行测试和评估。
- 加速 MRI 重建的面向架构无关的未训练网络先验
该研究对未经训练的神经网络在磁共振成像(MRI)重建领域的应用进行了讨论,通过理解网络架构的频率特征,提出了两种与架构无关的改进方法,从而使得不合理设计的模型在性能上能够接近高性能模型。
- UniRepLKNet:通用感知大卷积网络用于音频、视频、点云、时间序列和图像识别
我们提出了四种用于设计大核卷积神经网络的架构指南,并发现大核对于拓展卷积神经网络在非视觉领域具有卓越表现的关键因素。我们的模型在图像识别、时间序列预测和音频识别任务中表现出卓越性能,优于其他竞争模型,并且无需对体系结构进行特定模态的定制化处 - 基于 6D 姿态估计的 Jenga 叠砌在建筑造型寻找过程中的应用
本文对当前最先进的 6D 位姿估计方法进行了综述,并讨论了在两种建筑设计场景中应该使用哪种位姿估计方法。以最新的位姿估计研究 Gen6d 为例,我们从应用级别、预测速度、抗遮挡性、精确度、抗环境干扰等方面对当前的开放集方法进行了定性评估。此 - 增强计算设计:人工智能在生成设计中的系统化应用
在建筑设计中,该研究论述了通过人工智能与生成设计相结合,可以增强决策过程,并在复杂的设计空间中进行地图绘制和导航,从而实现几个感兴趣的结果和性能指标。
- 建筑设计中基于生成式人工智能的参数化建模与 BIM 实验
该研究介绍了一个新的建筑设计框架,利用生成式人工智能工具,包括 ChatGPT 和 Veras,结合参数化建模和建筑信息模型(BIM),提升设计流程。这个框架扩展了 ChatGPT 和生成式人工智能在三维建筑设计中的潜力,不仅限于在文本和二 - 基于结构化注意力的上下文演示规模化
提出了一个用于上下文学习的更好的架构设计 SAICL(Structured Attention for In-Context Learning),该架构通过将全注意力替换为专为上下文学习设计的结构化注意力机制,并消除个体示范之间的不必要依赖 - 利用大型预训练语言模型和建筑信息模型进行交互式设计
本研究探讨了 AI 生成模型,特别是 OpenAI 的生成预训练变压器(GPT)系列,当与建筑信息建模(BIM)工具集成为交互式设计助手时的潜力。研究通过开发和实施三个关键组成部分来完成,最终验证了该方法的有效性。
- 从 4D 建筑设计草图中恢复曲线网络
本文介绍了 Strokes2Surface,它是一个基于 4D Sketching 接口,MR.Sketch 构建的离线几何重建工具,并着重于应用于建筑设计领域。该工具可以从设计师绘制的笔画中恢复出一个曲线网络,从而在建筑设计的概念设计和数 - 上采样中的魔鬼:深度图像先验去噪中的简化架构决策
本研究从频率角度分析了 Deep Image Prior 中未经学习的上采样是 DIP 去噪现象的主要驱动力,因此提出了一种无需耗时搜索即可估算出每张图像适当的网络结构的方法,实验结果表明,估算出的网络结构在去噪和保留纹理细节方面比当前方法 - 利用文本生成图像技术进行建筑设计构思
研究探讨文本到图像生成技术在建筑设计早期阶段支持创意的潜力以及其在设计师教育中的应用,发现生成工具支持探索想法和丰富设计过程,但也存在挑战,需要软件开发者和教育者支持创意和设计师的想象力。
- Architext: 基于语言的生成式建筑设计
Architext 是一个新型的语义生成辅助工具,通过自然语言提示,利用大规模的语言模型进行设计生成,对不同大小的预训练语言模型进行语义准确性和多样性的评估,能在不同的场景下产生高质量的设计结果。
- 探讨语言模型架构的扩展与迁移在机器翻译中的应用
该研究论文探讨了语言模型和编码器 - 解码器模型在机器翻译中的性能影响,结果表明:语言模型在小规模下的表现差,但随着参数数量的增加,其性能逐渐接近于编码器 - 解码器模型,语言建模和原因屏蔽会对翻译质量产生不利影响,而当与全局可视屏蔽相配合 - CVPR基于 Patch 的渐进式 3D 点集上采样
本研究提出了一种基于深度神经网络的点集上采样方法,通过层级渐进式地使用级联的基于 path 的上采样网络训练,优化各级别的细节并提供一系列架构设计改进,以实现对于低分辨率点云输入的高保真细节重建。在定性和定量实验中,本方法在处理低分辨率输入 - 卷积神经网络在检测方面存在哪些问题?
本研究旨在探究卷积神经网络中的设计选择与改进,通过对 R-CNN 检测器的新注释的经验分析,发现现有的最先进的卷积神经网络架构对于不同外观因素不具备不变性,并且不能仅通过增加训练数据来解决问题,需要进行架构变化。在数据增强方面,利用图像渲染