将先验知识注入图像字幕生成
这篇论文关注于为印度城市创建一个智能监控系统,该系统可以实时识别和分析人们的属性。通过使用人工智能和机器学习等先进技术,该系统可以识别上半身颜色、穿着、配饰以及头饰等属性,并通过城市周围安装的摄像头来分析人们的行为。
Jul, 2024
提出了一种使用标准和本体论的信息模型来为自动化系统中的人工智能应用提供清晰和结构化的文档,通过实际示例验证了该模型在改进文档实践并帮助可持续实施人工智能在工业环境中的有效性。
Jul, 2024
本文介绍了建立 MedPix 2.0 数据集的整个工作流程,其主要涉及人工智能在医学领域的应用、多模态医学数据集、CT 或 MR 扫描等。同时,还提出了基于 MedPix 2.0 的 CLIP 模型用于扫描分类任务。
Jul, 2024
基于人工智能的系统能通过视频监控自动诊断城市街道植物的健康状况,结合 YOLOv8 和 DeepSORT 等机器视觉算法进行叶子定位和跟踪,再使用 DeepLabV3Plus 卷积神经网络进行叶片损伤分割与量化分析。该系统可作为非侵入性、高效可伸缩的解决方案,用于城市树木健康管理,支持可持续的城市生态系统。
Jul, 2024
讨论将八个增强技术应用于 GVGP 领域的 MCTS,其中包括渐进式历史、N-Gram 选择技术、树重用、广度优先树初始化、避免损失、基于新颖性的修剪、基于知识的评估和确定性游戏检测,这些增强技术的应用统计上显著提高了胜率,将平均胜率从 31.0% 提高到 48.4%,接近 2015 年 GVG-AI 竞赛中最优秀的代理程序的水平。
Jul, 2024
无线通信与人工智能相互促进发展,尤其在第六代移动网络技术标准中,生成式人工智能(GenAI)通过需求塑造的概念在无线网络中提供了显著的潜力,并能在各种使用场景中提高性能和节约能源和频谱。
Jul, 2024
大语言模型(LLMs)与知识表示学习(KRL)的整合标志着人工智能领域的重要进展,增强了捕捉和利用复杂知识结构的能力,这种协同作用利用了 LLMs 的高级语言和语境理解能力,提高了 KRL 的准确性、适应性和有效性,从而扩大了其应用和潜力。尽管越来越多的研究关注将 LLMs 嵌入知识表示领域,但对这些增强模型的基本组件和过程的全面回顾明显缺失。我们的调查通过对这些模型进行基于三种不同 Transformer 架构的分类,并分析来自各种 KRL 下游任务的实验数据,评估每种方法的优点和缺点。最后,我们确定并探索这个新兴但未充分开发的领域的潜在未来研究方向,提出了持续进展的路径。
Jul, 2024
利用全局稳定优化 YOLO 模型 (GSO-YOLO) 解决复杂施工环境中的安全问题,并通过整合全局优化模块 (GOM) 和稳定捕获模块 (SCM) 以提高全局上下文信息的捕获和检测稳定性,以及创新的 AIoU 损失函数来提高检测精度和效率。实验结果表明,GSO-YOLO 在 SODA、MOCS 和 CIS 等数据集上表现优于现有方法,达到了 SOTA 水平。
Jul, 2024
本研究通过在预训练和微调阶段采用不同的策略,结合知识库和相似提示来构建诊断报告,取得了在全球人工智能技术创新大赛医学影像诊断报告生成赛道中的第一名成绩。
Jul, 2024